El 25 de abril de 2018, la policía arrestó al sospechoso Joseph James DeAngelo, de 72 años y expolicía, por seis cargos de asesinato en primer grado –mató en total a 12 personas– ocurridos entre 1979 y 1986 en California. Antes, este asesino en serie, conocido como el Golden State Killer, había violado a 45 mujeres entre 1976 y 1979, en la mayoría de los casos en sus propias casas en presencia de sus maridos, que habían sido maniatados previamente por el criminal.

Después de varias décadas de búsqueda, las autoridades pudieron detenerle gracias al trabajo de los laboratorios de criminalística y a la evidencia genética a través de las bases de datos de ADN contrastadas con las muestras obtenidas en las escenas de los crímenes. Hasta ahora, se ha utilizado esta técnica forense para resolver 18 casos en EE UU.

El aumento meteórico de las pruebas genéticas vendidas directamente al consumidor, en especial las que ofrecen datos genealógicos genéticos con el hallazgo de familiares a través del ADN compartido, ha hecho que cada vez más equipos forenses usen esta información. En total más de 15 millones de personas se han sometido a estas pruebas. Sin embargo, en los últimos meses se ha planteado un debate ético entre la privacidad genética y la lucha contra el crimen.

“Los familiares lejanos pueden ser utilizados para identificar a la persona. No hay ningún criminal que pueda sentirse seguro. Si tienen tu ADN, en algún momento te atraparán”, advierte a Sinc el investigador Yaniv Erlich, director científico en la empresa MyHeritage.

Junto a la Universidad de Columbia (EE UU) y la Universidad Hebrea de Jerusalén (Israel), Erlich analizó las muestras de ADN anónimo de 1,28 millones de personas de ascendencia europea, que se habían sometido a un test genético vendido directamente al consumidor a través de MyHeritage.

Los resultados, publicados esta semana en Science, revelan que cerca del 60% de estas personas fue identificado a partir del ADN de un familiar, que resultó ser coincidente a través de un primo de tercer grado, y en el 15% a través de un primo segundo.

“Las bases de datos de genealogía genética actúan como un GPS para el ADN anónimo. Los árboles genealógicos establecen un sistema de coordenadas, en el que el ADN de cada individuo en estas bases de datos es como una baliza de los familiares del individuo que no están en la base de datos”, indica Erlich, autor principal del trabajo. Así, aunque una persona concreta no esté en esas bases de datos, un pariente suyo podría estarlo.

El investigador Yaniv Erlich.

Una vez que los investigadores encontraron a un familiar, pudieron dar con otro tipo de información demográfica como la edad y el lugar de residencia, y esto podría usarse para ampliar la identidad de personas concretas.

La privacidad, en entredicho

Para demostrarlo, el equipo utilizó este método para reconstruir la identidad de una mujer anónima de Utah cuya información de ADN estaba disponible públicamente en internet en el Proyecto de 1000 Genomas. Al contrastar la información genética en otra base de datos de genealogía genética llamada GEDmatch, los científicos dieron con dos parientes muy lejanos –del sexto y séptimo grado– en North Dakota y Wyoming. Después, buscaron su ancestro común.

“En una hora de trabajo, identificamos a la pareja ancestral que conectaba a estas personas a través de registros genealógicos disponibles públicamente. A continuación, buscamos los descendientes de esta pareja que coincidían con los datos demográficos de la muestra de los 1000 Genomas. Este paso, realizado manualmente, fue más lento ya que la pareja ancestral tenía diez hijos y cientos de descendientes. Después de un día completo de trabajo, se rastreó la identidad de nuestro objetivo”, explican los autores.

Los expertos pudieron así llegar a la conclusión de que si el 2% de la población se sometiera a este tipo de test genético de consumo privado se podría identificar a cualquier individuo a través de sus familiares.

Estos resultados plantean importantes problemas de privacidad. Los científicos advierten que es necesario volver a evaluar las prácticas actuales de datos de ADN. “La ley de EE UU no proporciona protecciones de privacidad a las muestras de la escena del crimen (o cualquier muestra que haya quedado atrás). Por lo tanto, es totalmente legal obtener información genética de ADN sobrante y cargar los datos a servicios de terceros, como GEDmatch. Algunos servicios de terceros, como MyHeritage, prohíben esta técnica, pero esto se basa en los términos del servicio y no en la ley”, concreta Erlich a Sinc.

Para mitigar el riesgo, los científicos proponen un esquema de firma criptográfica, que podría ser adoptado por las principales compañías como MyHeritage, 23andMe, Ancestry, FTDNA y GEDmatch. “Podemos diseñar políticas y soluciones técnicas como esta para permitir que las personas se beneficien de la revolución genética al tiempo que reducen la posibilidad de un uso incorrecto de sus datos”, concluye el investigador.

Referencia bibliográfica:

Y. Erlich et al. “Identity inference of genomic data using long-range familial searches" Science 11 de octubre de 2018