Con la irrupción de las redes sociales en nuestras vidas, en las de casi todos, hemos tenido que adaptarnos a una nueva realidad: podemos ver desde las uñas de los pies de muchos extraños hasta lo que desayuna alguien en la otra punta del mundo. En un aspecto menos jocoso también hemos sido testigos virtuales de usos desafortunados de las mismas que han acabado con un despido on line.

Tonterías y anécdotas aparte, algo que parece indudable a estas alturas es la enorme potencia de estas nuevas herramientas de comunicación para el estudio de comportamientos humanos. Y es esta circunstancia la que Esteban Moro y sus colegas han aprovechado para encontrar patrones de comportamiento en redes sociales en áreas geográficas concretas y tratar de relacionarlos con aspectos socioeconómicos de la zona en cuestión.

Hoy en día, el que más y el que menos lleva un dispositivo en su bolsillo que permite su localización en todo instante de tiempo. Sí, esto recuerda mucho a lo del gran hermano (el de Orwell) pero es así. También el que más y el que menos pertenece a una red social donde interactúa y deja información de manera casi permanente. Estos dos elementos, aparte de las anécdotas del principio de este artículo, abren la puerta a toda una nueva rama del estudio de comportamiento humano donde se podrá tener información a tiempo casi real de movimientos migratorios, tendencias de moda o cualquier cosa que se nos ocurra.

La idea de nuestros amigos (Esteban Moro y otros) se basa en que el comportamiento humano rutinario está interrelacionado con el estatus socioeconómico de la región a la que pertenece: desde el movimiento por la ciudad hasta las llamadas de teléfono, pasando por nuestro horario, determinarán muchos aspectos de interés sociológico tanto de nuestro vecindario como del propio país al que pertenezcamos. Esto se podía estudiar antes con diferentes métodos como encuestas o censos, pero todos ellos presentaban el problema de no ser inmediatos, de no ser en tiempo real.

Pero ahora disponemos de una herramienta sin precedentes en la historia, las redes sociales, donde estamos permanentemente interactuando y donde podemos codificar información, desde nuestros horarios hasta nuestra ubicación geográfica.

Este trabajo pretende ser un primer paso para ir de los datos individuales que dejamos en las redes sociales a la descripción del nivel económico y social de una determinada región de interés. Aunque se trata de un artículo bastante técnico y, posiblemente, un poco complicado para alógenos en la materia, déjenme que les resalte algunas correlaciones curiosas.

Fijémonos, en primer lugar, en el número de usuarios de Twitter, por ejemplo. Este número nos da una medida indirecta del uso de tecnologías asociadas a las redes sociales como ordenadores personales, tabletas o teléfonos móviles de los llamados 'smart'. Pues bien, aunque se pueden encontrar estudios que muestran un relación directa del uso de Twiiter con el producto interior bruto, lo que han obtenido Moro y sus colegas de los datos de trabajo que han manejado es que cuanto mayor número de usuarios de Twitter hay en una zona, mayor es el nivel de desempleo. Este dato es sorprendente. O no. Ea, ya tienen aquí tema de conversación para la hora del café o del vermú ¿Por qué creen que ocurre esto?

Si nos fijamos en la actividad a lo largo del día en redes sociales encontramos una clara correlación entre el nivel de actividad económica de una región y la actividad en redes sociales en la misma. Cuando en la región el desempleo es bajo hay un pico de actividad a primera hora de la mañana de 8:00am a 11:00am y un progresivo descenso. En regiones con alto índice de desempleo no se aprecia este pico a ninguna hora. Como se ve en la figura, los perfiles para regiones con bajo y alto desempleo son muy diferentes en cada caso.


La gráfica roja corresponde a la actividad en Twitter en un región con poco desempleo y la azul con una regíon sacudida por el paro. Se observa un pico de actividad entre las 8 y las 10 de la mañana de la gráfica roja, asociado, posiblemente, a la hora de desplazamiento, entrada y desayuno de la población activa

Otra correlación curiosa tiene que ver la interacción entre distintas regiones: observan que una región con poca interacción con otras regiones suele tener una alta tasa de desempleo y viceversa, cuanto mayor es la relación de una región con otras, en número y frecuencia, menor es el desempleo. En el artículo, al número y variedad de relaciones de una región con otras lo han denominado 'Entropía1' como se ve en la figura siguiente que es bastante representativa:


En la imagen de la izquierda vemos una población (en rojo) con alto índice de desempleo (más del 20%) y poca relación con otras poblaciones (en azul), menos de 0.5. En la de la derecha tenemos una población con menos desempleo (8,8%) y con una entropía (medida de interacción que toma valores entre 0 y 1) de más de 0.7.

Curioso, ¿no? A mí, al menos, me lo parece y he disfrutado mucho leyendo este artículo que nos muestra que el estudio de las redes sociales puede ser de gran utilidad para mejorar nuestro entendimiento de la sociología, la estadística aplicada a las ciencias humanas...

En este mismo trabajo se trabaja, además, con otros indicadores en las redes sociales que van desde sus patrones de actividad hasta la corrección ortográfica de los mensajes emitidos en las mismas, que pueden ser usados para inferir el nivel de desempleo de una determinada región.

Les dejo, de nuevo, el enlace al estudio completo por si quieren profundizar más sobre el tema desde el punto de vista técnico y les regalo un tema de conversación con el que 'cuñadear' unos días.