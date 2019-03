A partir de un simple diente, un buen arqueólogo es capaz de construir todo un escenario: desde los restos de polen que aportan la época en la que murió el animal, las marcas que muestran que era carnívoro, la morfología que define la especie a la que pertenecía ese incisivo, etc. Del mismo modo, apoyándose en evidencias circunstanciales y en la información que aporta el contexto, una nueva remesa de especialistas en computación, internet y redes sociales está ampliando un interesante campo de investigación: arqueología de la web.

A diario nos encontramos con enlaces rotos, esos links que ya no llevan a ninguna parte. Callejones sin salida de la red que impiden estudiar en toda su dimensión, por ejemplo, movimientos sociales como el de la Primavera Árabe de Egipto, un acontecimiento histórico con estrechos vínculos con la web. En ese contexto, dos especialistas descubrieron el año pasadoque buena parte del legado internáutico de aquella revolución que tuvo lugar en 2011 estaba desapareciendo. A un ritmo acelerado: el 11% de los enlaces desaparecían el primer año y un 7,3% más durante los siguientes años.

En un par de años, más de una cuarta parte de las webs que se compartieron en aquellos históricos momentos habían desaparecido. Dado que analizaron los 18 días siguientes al alzamiento popular, se trata de una pérdida importante para quienes quieran analizar lo que bullía en las redes y en las calles. Por ello, Hany SalahEldeen y y su colega Michael Nelson, de la Universidad Old Dominion, se propusieron averiguar cómo recuperar estos enlaces perdidos. No uno ni dos, sino diseñar un sistema que permitiera saber cómo era esa web que los egipcios compartían aquellos críticos días y que ahora no existe. Como cuando un coger un colmillo y decir: un diente de sable de hace un millón de años.

La primera herramienta que usaron estos nuevos arqueólogos fue una aplicación capaz de aprovechar las entretelas de Twitter para buscar entre los contenidos compartidos por los usuarios, llamada Topsy. Con este pincel, retiraban la arena del ruido de la red social y se quedaban con todos aquellos mensajes que compartieron uno de esos enlaces rotos. Y tratar de reconstruir aquella web a partir de lo que se dijo sobre ellas en Twitter.

SalahEldeen explica cómo plantearon este “intento de sustituir las páginas web que desaparecieron con páginas y contenidos relacionados”. “Recogimos todos los mensajes que se publicaron incluyendo la página web de desaparecida e identificamos su firma, los cinco términos más repetidos en todos los tuits que incluían ese enlace”, relata el investigador. Seguidamente, volcaron eses cinco términos en un buscador de internet. En el 41% de los casos, dan con contenidos muy similares a la web desaparecida y en buena parte de los intentos sirve al menos para esbozar lo que allí había. En el ejemplo de la imagen, es fácil recuperar una página que pretendía recuperar testimonios de los primeros días de estallido social.

“Creemos que estas webs pueden ser un sustituto útil cuando falta el recurso original. También suelen ser útiles otras páginas que se encontraban enlazadas en el mismo tuit que la desaparecida”, asegura SalahEldeen, quien reconoce que su trabajo es aún incipiente. Reconocer sus limitaciones, como depender de terceros (Topsy) o la dificultad de extraer resultados dignos con enlaces poco tuiteados. “Estamos trabajando en todos estos ángulos para llegar a un mejor método”, asegura.

Según explica el investigador, que también estudió en la Universidad Autónoma de Barcelona, se trata de un área de trabajo “muy rica” y con innumerables posibilidades para el descubrimiento de nuevos métodos, en el ámbito de la inteligencia artificial, como el aprendizaje automático y el procesamiento de lenguajes naturales, para crear un modelo que se adapte al tipo de fuente desaparecida y que sea capaz de proporcionar resultados más precisos.

“En la actualidad, se están realizando varios experimentos para definir mejor las características de los tuits, para construir de manera más fiable la firma y comparar los resultados extraídos”, afirma, convencido de que comienza a explorar una disciplina que pueda dar tan buenos resultados en la web, y tan fiables, como los que ofrecen arqueólogos y antropólogos a la hora de reconstruir la historia a partir de un par de colmillos.