Dime lo que buscas y te diré si tienes Covid

"No huelo nada". Así se usan tus búsquedas de Google para predecir contagios de Covid-19

Investigadores y científicos de datos han demostrado cómo las búsquedas de Google se pueden emplear para intentar frenar el avance del coronavirus. ¿Por qué no utilizarlas en España?

Foto: Una mujer con guantes y mascarilla para protegerse del coronavirus, mira su móvil en el puente viejo de Murcia. (EFE)
Una mujer con guantes y mascarilla para protegerse del coronavirus, mira su móvil en el puente viejo de Murcia. (EFE)

"No puedo oler nada". "He perdido el gusto". "Tengo tos seca". ¿Es usted uno de los muchos millones de personas que se ha metido en Google en las últimas semanas para teclear estas palabras? Si es así, sepa que sus búsquedas (anónimas) están siendo analizadas por investigadores de medio mundo para intentar encontrar una relación entre lo que le preguntamos a Google y las tendencias reales de contagiados por coronavirus. El objetivo final es detectar focos desconocidos de infectados antes de que sea demasiado tarde. Y hay una buena noticia: el método funciona.

Vasileios Lampos, científico de datos en el University Collegue London (UCL), es uno de esos investigadores que trabaja en usar las búsquedas de Google como herramienta de bajo coste para predecir la evolución del coronavirus. Lampos y varios colegas han creado un modelo matemático que mezcla los datos del buscador (obtenidos a través de la API Google Health Trends, solo disponible para investigadores), las noticias publicadas en medios sobre el Covid-19, los síntomas reales diagnosticados y los datos oficiales de contagios en cada país para obtener tendencias que comparan lo que busca la gente con las cifras reales de infectados.

Su conclusión es que no solo hay una correlación directa, sino que en muchos casos ese flujo de búsquedas se adelanta a la confirmación oficial de contagios. Es decir, muchas de las personas que teclean en Google "no puedo oler nada" o "tengo diarrea" lo hacen porque han comenzado a experimentar esos síntomas, están preocupados y necesitan información. Si esas búsquedas se ubicasen por zonas geográficas, los Gobiernos tendrían una potente herramienta de localización de posibles focos de contagio. Información clave para, por ejemplo, decidir realizar tests masivos en esas zonas y obligar a confinamientos en el domicilio.

Foto: Reuters.
Foto: Reuters.

"Las búsquedas online constituyen un dato alternativo que nos puede ayudar a estimar el nivel de contagios que hay en una determinada zona", explica Vasileios Lampos a Teknautas. "La mayoría de países hacen tests solo a pacientes hospitalizados de Covid-19, y esto puede no ofrecer un dato representativo de lo que está ocurriendo con el resto de la población. Este sistema funciona. Los modelos matemáticos para la influenza basados en búsquedas online y en técnicas tradicionales se llevan usando un tiempo. En Reino Unido, el organismo Public Health England está usando nuestro modelo de detección de influenza que se basa en búsquedas de Google", señala.

El uso de las búsquedas online dentro de modelos epidemiológicos no es nuevo. Google lanzó su mayor esfuerzo en este frente en el 2008, con su herramienta Google Flu Trends, que estimaba los contagios por influenza en más de 25 países agregando datos de búsqueda. La compañía inicialmente aseguró que la fiabilidad de esta herramienta era del 97% respecto a los datos publicados por el Centro para el Control y la Prevención de Enfermedades​ (CDC) de EEUU. La realidad es que la imprecisión acabó siendo mucho mayor. La epidemia estaba constantemente en los medios y la gente buscaba por palabras como "fiebre" o "tos" pero no porque empezara a tener síntomas, sino solo por curiosidad.

Álex Arenas, físico y catedrático del departamento de Ciencias de la Computación y Matemáticas de la Universitat Rovira i Virgili (Tarragona), lleva años desarrollando modelos epidemiológicos y trabajando desde enero en el del coronavirus y, pese a las limitaciones de esta técnica, lo tiene claro. "Los datos de búsquedas son muy interesantes sobre todo para las etapas posteriores de la epidemia, cuando entras en fase de control. ¿Dónde debería el Gobierno hacer más tests? ¿Dónde concentrar los recursos? Esos modelos basados en búsquedas son un complemento a otras herramientas que ya se están usando", explica.

El especialista en 'big data' y doctor en economía por Harvard Seth Stephens-Davidowitz ha demostrado también en una columna reciente en 'The New York Times' la correlación entre las búsquedas de la gente "No puedo oler nada" y los casos confirmados por estado. Y explica cómo otros investigadores, como Joshua Gans, profesor en la Universidad de Toronto (Canadá), demostró cómo las búsquedas en Italia por "non sento odori" se habían disparado incluso días antes de que el síntoma comenzara a reportarse en los medios de forma oficial. Lo mismo ocurrió en Irán.

En España, el epidemiólogo y científico de datos Joe Brew, ex investigador del Instituto de Salud Global de Barcelona, hizó una rápida comprobación usando Google Trends para el número de muertes por coronavirus en España por CCAA y la correlación se cumple exactamente igual. Afinar con los datos es posible, pero requiere de usar la API de Google para investigadores y, además, un posible acuerdo entre la compañía y los Gobiernos para cruzar esta información con datos de localización. "Esperar a tener siempre los datos clínicos tradicionales, número de contagios, altas, UCIs etc, es demasiado tarde. Te hace ir dos o tres semanas por detrás. Por eso hay que usar otras herramientas, modelos matemáticos, 'apps' y también búsquedas de Google. Tendrían que pasar un minucioso proceso de validación, pero es algo que se debería empezar a usar ya", explica Brew a este diario en conversación telefónica.

Fuente: Joe Brew.
Fuente: Joe Brew.

Google demostró hace unos días que tiene tantos o más datos que los operadores que sí están llegando a acuerdos con los gobiernos para ceder sus datos de clientes anónimos y agregados. La compañía publicó un extenso informe por país (aquí puedes consultar el de España) de cómo ha cambiado la movilidad tras los confinamientos por el Covid-19. Y lo dejaba caer: "Estos informes estarán disponibles durante un tiempo limitado, siempre que las autoridades sanitarias los encuentren útiles en su trabajo para detener el avance del Covid-19". E, igual que los operadores, Google fue muy claro: "No se usa en ningún momento datos de identificación personal, como la ubicación de una persona, sus contactos o movimientos. Estos informes se crean con datos agregados y anonimizados de usuarios que han activado la función "Location History", que viene desactivada por defecto".

La teoría funciona, pero lo que no ha llegado de momento es la práctica, es decir, que España o algún otro país europeo comience a usar las búsquedas en Google de forma activa en sus modelos epidemiológicos. La empresa ha tendido la mano a los gobiernos pero estos, de momento, han preferido ir de la mano de los operadores para estudiar los flujos de movimiento. La vieja rivalidad entre Google y las 'telecos' no se esfuma ni en tiempos de coronavirus.

Ciencia
Escribe un comentario... Respondiendo al comentario #1
3 comentarios
Por FechaMejor Valorados
Mostrar más comentarios