Cambian encuestas por 'big data'

Fomento rastrea desde 2017 los móviles de millones de españoles, y este es el resultado

El Ministerio de Fomento encargó un informe de movilidad a Orange utilizando tecnología 'big data' aplicada a telefonía móvil y ahora ha publicado los resultados en ‘OpenData’

Foto: (Foto: Pixfuel)
(Foto: Pixfuel)

Hace algo más de un mes saltó la noticia que crearía una de las polémicas sobre privacidad más importantes de los últimos años en nuestro país. El Instituto Nacional de Estadística (INE) acababa de firmar un contrato con Movistar, Vodafone y Orange para utilizar la geolocalización de los móviles de la mayoría de españoles para un estudio sobre transporte y movilidad. Pese a que se advertía del anonimato de los datos, en ese momento muchos lo vieron como una locura digna del Gran Hermano de George Orwell. La realidad es que, como detallamos aquí, este tipo de contratos se llevaban firmando entre las operadoras y empresas y organismos públicos desde hace casi tres años. Fomento de hecho lo hizo ya en el 2017 y ahora se acaba de conocer el resultado.

El departamento bajo la batuta del ministro en funciones José Luis Ábalos acaba de publicar el informe resultante de un estudio realizado en varios meses de 2017 y en el que se analizaba el movimiento interprovincial de millones de españoles durante varios días de julio, agosto y octubre de 2017 con la idea de conocer más en detalle estos desplazamientos y poder actuar en consecuencia. Para ello, en un movimiento que sus impulsores tildan de "gran hito", en vez de usar encuestas a la vieja usanza optaron por apuntarse al 'big data' y aprovechar el potencial de una ‘teleco’ como Orange para sacar los datos de localización de los móviles de sus más de 14 millones de clientes. ¿El objetivo? Ahorrar costes y ganar más información y más detallada para optimizar sus actuaciones.

Al menos eso es lo que aseguran tanto desde el Ministerio como desde Orange, la compañía encargada de realizar todo el informe (Fomento compró el informe entero, no el acceso a los móviles ni los datos anonimizados) en colaboración con la consultora madrileña especializada en datos y transporte Kineo. "La verdad es que es todo un logro que una institución pública como el Ministerio de Fomento haya apostado por una tecnología tan nueva que todavía cuesta integrar incluso en la empresa privada. Y hay que dejar claro que es todo seguro y anónimo, que nadie te espía o te roba tu información", explica José Antonio Serrano, el empleado de Orange encargado de gestionar este y otros proyectos similares de venta de datos a terceros.

Serrano se afana en demostrar que todo es legal y seguro y repite que ni siquiera ellos saben de quien es cada móvil. "Ni siquiera nosotros lo sabemos. Contamos registros de localización de móviles por nuestras antenas y se pintan como puntos en cuadrículas que forman todo el mapa de España. Agregamos los datos y los analizamos para el informe". Según este ingeniero, al final utilizan el registro del móvil como punto de referencia y siguen su trayectoria por las diferentes antenas hasta completar su recorrido. "Pueden aumentar o disminuir la exactitud de la localización pero no pasan de ser números, no hay datos personales detrás".

El problema, como en el caso del INE, está en las dudas que genera el control de esta información por parte de una operadora. ¿Quién controla estos sistemas? ¿Quién asegura que el proceso de anonimizado es robusto? ¿Quién vigila que los operadores no están enviando datos personales a sus clientes, por error o de forma intencionada? ¿Quién comprueba que un cliente no esté cruzando los datos de los operadores con datos propios internos para identificar grupos de clientes? "La respuesta es sencilla: nadie", sentenciaba el jurista Samuel Parra a este periódico tras la polémica nacida en noviembre.

En el informe publicado hace unos días se ve el resultado de un análisis que puede ser muy similar al que salga del estudio del INE. "La idea es que el del INE sea más detallado, no solo interprovincial, pero es un procedimiento muy similar y que también utilizan las empresas. Al final el objetivo es utilizar el 'big data' para tener más datos y con más detalle y así poder actuar mejor. Gracias a este estudio ya se puede saber, por ejemplo, a ciencia cierta dónde hace falta más trenes o más estaciones", apuntan desde Orange.

Resultados y 'open data'

A pesar de que no se ha armado ni una mínima parte del revuelo generado tras el caso del INE, Fomento ha decidido habilitar una web a la que se puede acudir a ver los resultados del informe e incluso descargar los datos para realizar tu propio análisis en una apuesta por el 'Open Data'. Descargados los ficheros se puede ver la información recogida y observar que no hay ningún dato personal, solo localizaciones y fechas.

Lo más llamativo es que también son capaces de distinguir por tipo de medio de transporte en el que viaja cada móvil estudiado (aunque confiesan los problemas para separar autobuses y coches). "Nos hemos dado cuenta que tenemos que hacer pedagogía para que no pasé como con lo del INE. Esperemos que esto ayude a que se vea lo que hacemos y no alimente más conspiranoias", confiesa Serrano.

Entre los datos a destacar descubiertos con este estudio están por ejemplo que cada día en España se producen más de 2 millones de viajes interprovinciales de más de 50 km, con puntas de más de 4 millones en verano. Y entre los puntos más concurridos en la corta distancia están los viajes entre Madrid y Toledo que llegan a superar los 108.000 en una sola jornada de octubre. En el gráfico que te dejamos debajo puedes observar todos los resultados extraídos y cómo nos movemos los españoles cuando pasamos de provincia en provincia.

Obviamente este no es el único resultado analizado. Es interesante saber también que el día de la semana que más viajes se realizan son los viernes (un 26% más que el resto de días laborables de media) y que la distancia media de los viajes interprovinciales es de 221 km en un día laborable de octubre. Y si vamos a ejemplos más pequeños llama la atención el caso del corredor entre Cádiz y Málaga que aprovechan miles de extranjeros cada día (es, sin duda, el movimiento interprovincial más repetido por extranjeros que pasan por Andalucía, o eso dice el estudio).

Es este nivel de detalle lo que más valoran desde Orange y lo que, aseguran, debe destacarse de este acuerdo. "Estamos dando una información fundamental a nuestros dirigentes para que tomen las mejores decisiones con nuestro dinero y lo mejor es que ellos se están abriendo a estas nuevas tecnologías. No sé de dónde nace la polémica, de verdad". Sin embargo hay quien todavía duda tanto de su utilidad como de sus peligros ante la falta de legislación y control.

Ahorro a las arcas públicas y ciertas dudas

Para dar más peso a este estudio y dar más argumentos a la decisión tomada por Fomento, Serrano recuerda que antes que este macroestudio solo se había realizado otro de tamaño similar en los últimos años. Su nombre es Movilia, se hizo en 2006/2007 y se puede acceder a él a través de la web del Ministerio. ¿En qué se diferencia del actual? Pues que el anterior se hizo con miles de encuestas telefónicas. "Fue mucho más caro, más lento y menos exacto. Con este cambio se gana velocidad, detalle e información de valor que puede ser clave para tomar decisiones como dónde construir infraestructuras o en qué punto se está infrautilizando un servicio de transporte".

Aunque no hay datos concretos se habla que esa encuesta costaba unos 5 millones de euros, aproximadamente, mientras que el nuevo estudio reduce ese presupuesto hasta los 150.000 euros, una reducción de costes que muestran con orgullo desde Orange. "El 'big data' es el futuro por cosas como estas. Y este solo es un ejemplo de muchos. Nosotros ya tenemos proyectos pilotos en sitios como Boadilla del Monte, en Madrid, para intentar optimizar la recogida de basuras conociendo en qué momento exacto suelen usarse más los cubos o qué lugares dejan más residuos y esto mismo se puede hacer con luces, con horarios y recorridos de autobús... Da muchísimas posibilidades".

La anonimización de los datos está basada en la utilización de una función hash unidireccional

Frente a estos usos están las dudas sobre la privacidad y el control que se muestran incluso en la nota metodológica del informe publicado. En este se deja un buen apartado a explicar cómo se controla técnicamente el uso correcto de los datos y su anonimización.

"La anonimización de los datos está basada en la utilización de una función hash unidireccional, es decir, una función que permite el cálculo de un identificador anonimizado (similar a un texto aleatorio) a partir del identificador original (habitualmente el IMSI, en el caso de un operador de telefonía) de tal forma que resulta imposible realizar el proceso a la inversa (es decir, una vez aplicada la función no se puede reconstruir el identificador original). Orange ha utilizado lo que se conoce como funciones hash perfectas, que por su diseño evitan las colisiones, es decir, evitan que dos identificadores originales diferentes den como resultado un mismo identificador anonimizado".

Tecnología

El redactor recomienda

Escribe un comentario... Respondiendo al comentario #1
2 comentarios
Por FechaMejor Valorados
Mostrar más comentarios