TecnoXplora » Internet

NO MARQUES ESTO COMO 'SPAM'

Así descubre Google el 99,9% del correo basura que llega a tu bandeja de entrada

Desde los orígenes de Gmail, el gigante de las búsquedas ha recurrido a la cooperación del usuario para mejorar sus herramientas 'antispam'. La idea es que las máquinas aprendan a diferenciar entre un correo valioso y otro prescindible fijándose en las decisiones de los usuarios. Ahora, las redes neuronales artificiales agilizan el proceso y permiten adaptar los filtros a sus preferencias.

¿Qué es lo que entra en el buzón?

¿Qué es lo que entra en el buzón? G M en Flickr CC

Publicidad

El enemigo número uno de cualquier servicio de correo electrónico medianamente popular es el famoso 'spam', que en español podríamos traducir (libremente, porque no tiene traslación directa) como correo basura. Según la firma de seguridad informática Kaspersky, supone el 59,2% de las comunicaciones que pasan por sus filtros. Tremendo porcentaje que volvería completamente inútil una herramienta como Gmail si los expertos de Google no hubieran aprendido a combatirlo.

Dice la multinacional que solo un 0,1% del correo indeseado escapa a sus controles, a pesar de que se enfrentan a una dificultad añadida al hacer limpieza: resulta tan molesto recibir gran cantidad de 'spam' como perder mensajes importantes porque las barreras sean demasiado altas. En este sentido, la herramienta de Google, según sus propios datos, funciona aún mejor: solo un 0,05% de los 'emails' valiosos que recibe un usuario acaban en la carpeta de 'spam' por exceso de celo.

“Los usuarios de Gmail reciben muchos correos relevantes de empresas como bancos y aerolíneas –desde extractos mensuales hasta recibos de compra-, pero a veces se clasifican por error como 'spam' ”, admiten. “Cuando sucede, tienen que bucear por la carpeta de 'spam' para encontrar ese correo importante”.

Es un drama cotidiano al que todos nos hemos enfrentado. Para evitarlo, Google ha desarrollado las Postmaster Tools, un conjunto de herramientas que los grandes emisores podrán utilizar para saber si sus 'emails', enviados de forma masiva, llegan hasta los destinatarios, se pierden por el camino o están siendo etiquetados como 'spam'.

Esta podría ser la solución a parte del problema, pero el misterio sigue revoloteando sobre la otra mitad. Pocos servicios pueden presumir de la efectividad de Gmail, pero ¿qué hace para detectar los correos que sí son basura? ¿Cuál es el secreto de su éxito? La clave ha sido siempre la estadística y, más recientemente, el 'machine learning'.

Desde sus orígenes, el servicio de correo de Google ha recurrido a los propios usuarios para entender lo que es 'spam' y lo que no. La idea es que las máquinas aprendan a diferenciar entre un correo valioso y otro prescindible fijándose en las decisiones de los usuarios, que llevan años dando pautas mediante sus clics en los botones “marcar como 'spam' ” y “no es 'spam' ”.

Ya lo explicaban en el blog oficial de Gmail en 2007. “Cuando nuestros sistemas automatizados ven que mucha gente marca un correo en particular como basura, empiezan a bloquear mensajes similares muy deprisa”, escribía el ingeniero Brad Taylor.

Por aquel entonces, buena parte del proceso todavía se llevaba a cabo de forma manual. “Estamos rodeados de monitores que muestran el estado actual del 'spam' en todo tipo de gráficas e indicadores”, aseguraba. “Cuando un 'spammer' descubre cómo esquivar nuestro sistema, empiezan a llegar muchas denuncias y nos damos cuenta de inmediato”.

Seguro que este tipo de pantallas siguen existiendo en la sede principal de Mountain View, pero las cosas han cambiado desde entonces. Ahora el 'machine learning' y las redes neuronales artificiales agilizan el proceso y permiten adaptar los filtros 'antispam' a las preferencias (más implícitas que explícitas) de cada usuario de Gmail.

zo0Zl

“Somos conscientes de que las bandejas de entrada no son todas iguales”, dicen desde Google. “Tal vez a tu vecino le encantan las 'newsletters' semanales y tú las detestas. Con los avances en 'machine learning', el filtro 'antispam' es capaz de reflejar esas preferencias individuales”.

Concretamente, la multinacional está empezando a implementar en su herramienta de correo las técnicas que viene utilizando en su buscador -y sobre todo en Google Now- desde hace algunos años. Un departamento específico, conocido como 'Google Brain', se dedica a investigar esta rama de la inteligencia artificial desde 2011. Además, en febrero del pasado año, la multinacional compró DeepMind, una 'startup' especializada en 'machine learning' y el aprendizaje automático.

Con estos mimbres, que Gmail consiga bloquear el 99,9% del 'email' indeseado no resulta tan extraño. ¿Cuándo fue la última vez que marcaste un correo como 'spam'? Quizá ya ni lo recuerdas.

Publicidad