la huella del desempleo en las redes sociales

Los datos no mienten: donde se tuitea con más faltas de ortografía, hay más paro

Twitter desvela mucho sobre nosotros, y no solo a nivel personal. Científicos españoles han encontrado una clara relación entre el desempleo y nuestro modo de tuitear

Foto: Los datos no mienten: donde se tuitea con más faltas de ortografía, hay más paro

"La adopción generalizada por parte de la mayoría de la población de tecnologías electrónicas que han penetrado en cada aspecto de sus vidas ha permitido estudiar el comportamiento humano a un nivel sin precedentes hasta ahora, descubriendo patrones subyacentes de actividad, movilidad y comunicación interpersonal". Así comienza un estudio publicado por científicos españoles en el que han utilizado datos de miles de usuarios de Twitter para averiguar la huella que deja el paro en las redes sociales. No se trataba de estudiar a los individuos de uno en uno, sino de coger la información relativa a miles de tuits y extraer patrones.

"Estábamos interesados en saber si se puede descubrir algo relacionado con cuestiones económicas y sociales por cómo utilizamos las redes sociales. Dado el panorama actual, quisimos centrarnos en el paro", explica Esteban Moro, líder del estudio. Para ello, tuvieron que determinar exactamente qué comportamientos resultaban interesantes para sacar conclusiones sobre el empleo. Se fijaron en cuatro grupos de comportamiento:

1. El porcentaje de tuiteros por región. La adopción de Twitter no es uniforme, y el porcentaje de usuarios respecto a la población es mayor en las regiones donde el paro es más alto.

El mapa de España con las 340 regiones determinadas en el estudio
El mapa de España con las 340 regiones determinadas en el estudio

2. La actividad tuitera en la franja que va de 8 a 10 de la mañana. En este caso, la relación es inversa: los lugares donde el desempleo es menos pronunciado presentan un agudo pico de actividad en las horas puntas. "Además, indica que los usuarios tienen acceso a un ordenador o smartphone, o que trabajan con ello, o que utilizan Twitter para trabajar". Esta explosión tuitera tiene su respuesta cuando cae la tarde, momento en la que la actividad se reduce visiblemente.

3. Con cuánta gente distinta interaccionan o a dónde se desplazan. A mayor variedad y movilidad se corresponden con menos desempleo.

4. Las faltas de ortografía al tuitear. Moro explica que no han leído los tuits uno a uno, pero sí han hecho búsquedas de faltas de ortografía "de las gordas", como me hiba o vamos haber. Y la conclusión es lógica: allí donde se cometen más faltas de ortografía graves, hay mayor desempleo. "Es una cuestión del nivel educativo y allí donde es más bajo, el paro se sufre más.

Un mapa en movimiento de los tuits en 24 horas

Aprovechando la información geográfica de los tuits publicados en Twitter por 43.000 usuarios durante un periodo de 55 días, los autores del trabajo han elaborado un mapa que muestra los viajes de esos usuarios a lo largo de las 24 horas del día. "En este trabajo hemos analizado si se pueden extraer conclusiones sobre el estatus socioeconómico de una región a través de las desviaciones de esos patrones universales".

Hemos encontrado que el desempleo tiene correlación con la adopción tecnológica, la actividad diaria, la diversidad en los patrones de movilidad y la corrección en el estilo comunicativo

Su conclusión es que sí se puede. "Hemos encontrado que el desempleo tiene correlación con la adopción tecnológica, la actividad diaria, la diversidad en los patrones de movilidad y la corrección en el estilo comunicativo", explica Moro, director del estudio, en su blog

Las observaciones han sido resumidas en un vídeo de apenas un minuto y medio en el que se dibujan sobre el territorio español los desplazamientos registrados en Twitter gracias a la herramienta de geolocalización: en total, más de 145 millones de mensajes geolocalizados distribuidos por más de 340 regiones distintas, determinadas por su nivel económico. Cada usuario es un punto, y el color de los puntos es proporcional a la velocidad del viaje (azules, viajes rápidos; magentas, viajes lentos. En total, en el vídeo se pueden ver más de 100.000 viajes de usuarios anónimos.

Resulta especialmente interesante comprobar cómo la actividad se dispara durante la hora punta y desciende notablemente cuando cae la tarde, de 9 a 11 de la noche. Moro confirma que Madrid y Barcelona son las zonas donde el bullicio tuitero es mayor. Sin embargo, como ejemplos curiosos de regiones contrapuestas menciona Talavera de la Reina y la zona que cubre el sur de Tarragona y el norte de Castellón. "La primera tiene poca variedad de interacciones y desplazamientos, y poca actividad de 8 a 10 de la mañana. La segunda es tremendamente activa y se relaciona con mucha gente de muchos sitios".

Nuestros resultados demuestran que se pueden elaborar indicadores económicos eficaces basados en conjuntos de datos que están disponibles para el público a través de las redes sociales

Con todos estos parámetros los autores han creado un modelo de predicción del desempleo acertado y fácil de interpretar, basado únicamente en las huellas que dejan los usuarios en las redes sociales. "Nuestros resultados demuestran que se pueden elaborar indicadores económicos eficaces basados en conjuntos de datos que están disponibles para el público a través de las redes sociales". 

El siguiente paso, que Moro reconoce como ambicioso pero que cree factible a medio plazo, es predecir fenómenos en tiempo real. "Sería una buena forma de complementar otros datos estadísticos, como los que se obtienen con los censos o las encuestas de población. Esos son estudios muy complejos y difíciles de hacer, a lo mejor podríamos ayudar con este tipo de modelos". Sin embargo, admite que los datos extraídos de las redes sociales tienen un alcance limitado por el tipo de usuarios que tienen. En este caso, la población menor de 44 años está subrepresentada por este motivo. Tampoco está incluida la comunidad autónoma de Canarias, por motivos técnicos, ya que la herramienta de Twitter para la descarga de datos habría incluido también información de usuarios situados en Marruecos.

Tecnología
Escribe un comentario... Respondiendo al comentario #1
15 comentarios
Por FechaMejor Valorados
Mostrar más comentarios