9 / 10 / 2015

Un algoritmo relaciona el comportamiento en Twitter con los ingresos

Comparte este artículo

Científicos de la computación de la Universidad de Pennsylvania (EE.UU.) y otros países han diseñado un algoritmo de procesamiento de lenguaje natural que relaciona el comportamiento en línea de más de 5.000 usuarios de Twitter con su nivel de ingresos. Las personas con mayor nivel de ingresos muestran más ira o rabia, mientras que los optimistas tienen menos ingresos.

Daniel Preotiuc-Pietro, investigador post-doctoral del Centro de Psicología de la Universidad de Pennsylvania, dirigió la investigación, colaborando con Svitlana Volkova, de la Universidad Johns Hopkins (Baltimore), Vasileios Lampos y Nikolaos Aletras, del University College de Londres, y Yoram Bachrach, de Microsoft Research.

Para este experimento, señala la nota de la Universidad de Pennsylvania, los investigadores comenzaron observando los trabajos que decían tener los usuarios de Twitter.

En el Reino Unido, los trabajos se dividen oficialmente en nueve tipos. Usando esa jerarquía, los investigadores determinaron el ingreso promedio para cada código, y buscaron una muestra representativa de cada uno. Después de quitar manualmente los perfiles ambiguos -por ejemplo, referencias a la película Quiero ser libre (Coal Miner's Daughter, La hija del minero de carbón, en inglés) como indicativos de que el tuitero es minero-, el equipo terminó con 5.191 usuarios de Twitter y más de 10 millones de tuits para analizar.

A partir de ahí, crearon un algoritmo estadístico de procesamiento del lenguaje natural que extrajo las palabras más distintivas de cada clase. La mayoría de la gente tiende a usar las mismas o parecidas palabras, por lo que el trabajo del algoritmo fue "entender" cuáles eran más predictivas. Los investigadores humanos analizaron estas agrupaciones y les asignaron significados cualitativos.

Algunos de los resultados validaron lo que ya se sabe, por ejemplo, que las palabras de una persona pueden revelar la edad y el género, y que estos están ligados a la renta. Pero Preotiuc-Pietro dice también que hubo algunas sorpresas; por ejemplo, los que ganan más tienden a expresar más miedo e ira en Twitter. Los aparentemente optimistas tienen una renta media inferior.

Los textos de las personas con ingresos más bajos incluyen más palabras malsonantes, mientras que los de ingresos superiores tienden con mayor frecuencia a discutir de política, empresas y ONGs.

"Los usuarios con menores ingresos o un nivel socioeconómico más bajo utilizan Twitter más como medio de comunicación entre ellos", dice Aletras. "La gente de ingresos altos los utiliza más para difundir noticias, de forma más profesional que personal."

Comparte este artículo
Suscríbete a nuestra Newsletter
Suscríbete