Es noticia
El negocio de los datos de los operadores: así venden tu información (y no solo al INE)
  1. Tecnología
el (polémico) 'big data' de las telecos

El negocio de los datos de los operadores: así venden tu información (y no solo al INE)

El contrato de 500.000 euros que el INE ultima con Movistar, Vodafone y Orange no es ni nuevo ni ilegal. Es el gran negocio del 'big data' de las operadoras. ¿El riesgo? Nadie lo controla

Foto: Vista de una antena de telefonía móvil. (EFE)
Vista de una antena de telefonía móvil. (EFE)

Más de 50 millones de líneas móviles en España analizadas al detalle durante ocho días. A qué hora nos levantamos, qué trayecto seguimos para ir a trabajar, a dónde vamos después, cuánto tiempo estamos en una calle comercial... Es el proyecto que está a punto de arrancar el Instituto Nacional de Estadística (INE) de la mano de Movistar, Vodafone y Orange. Se trata de un contrato delicado, por las sospechas que levanta en el frente de la privacidad, pero tanto el INE como las operadoras aseguran que todos los datos tratados serán 100% anónimos. De hecho, no es la primera iniciativa de este tipo que las operadoras realizan con otras empresas u organismos. En realidad, es uno de sus negocios más rentables y crecientes de los dos últimos años: vender información agregada y anónima de sus abonados.

Telefónica es el operador que más tiempo lleva intentando sacar rédito económico al 'big data'. Hace justo tres años estrenó una nueva unidad de negocio llamada Luca, una apuesta personal de Chema Alonso, máximo responsable de datos de la operadora. La idea: usar los millones de datos que maneja Movistar de sus clientes para anonimizarlos, analizarlos y transformarlos en un jugoso negocio listo para vender. Si Google y Facebook han montado imperios con este modelo de negocio, ¿por qué los operadores no pueden hacer algo parecido? Vodafone y Orange siguieron sus pasos y crearon sus propias unidades de 'big data'. Hasta hoy.

Foto: (Reuters)

El acuerdo de los operadores con el INE ha servido para que muchos usuarios de a pie descubran un negocio que en realidad lleva ya al menos tres años fraguándose, una actividad que es perfectamente lícita pero cuya falta de transparencia hace que nadie, salvo las operadoras, sepa qué hay realmente detrás del cartel de "tranquilos, todo es legal".

¿Qué sabe un operador de ti?

Los operadores saben mucho más de todos sus abonados que Google, Facebook o cualquier otra compañía de internet. El motivo es sencillo: la triangulación de antenas les ofrece la posibilidad de ubicar e identificar clientes a lo largo del día y en tiempo real. Recopilan todos los datos posibles sobre ti y de forma constante.

placeholder Antenas de telefonía. (Reuters)
Antenas de telefonía. (Reuters)

¿Adónde vas al salir de casa? ¿Cuánto tiempo pasas en un punto determinado de una calle comercial? ¿Dónde aparcas el coche? Además, a través de las diferentes aplicaciones que cada operador desarrolla (Movistar+, Mi Movistar, Mi Vodafone, etc.), tienen información adicional sobre tu ubicación por GPS y hábitos de navegación. Ambos frentes combinados y unidos a los datos personales de cada cliente (nombre, DNI, número de móvil, datos de facturación...) ofrecen una ingente cantidad de información tanto para uso interno como para, anonimizados y agregados, venderlos a terceros.

Los operadores están obligados por ley a conservar esa información durante al menos 12 meses (incluyendo el tráfico de datos, localización, llamadas y datos personales) en caso de que tengan que ser entregados tras petición judicial en las investigaciones policiales de presuntos delitos. Si no son requeridos, las compañías tienen la obligación de anonimizar y agregar toda esta información para evitar identificar a clientes individuales. Esos datos anónimos y agregados, los metadatos de sus millones de clientes, es lo que han comenzado a vender desde hace 3 años.

¿Cómo capturan los datos?

Dependiendo de cada cliente, la captura, análisis y presentación de datos es diferente, pero muchos siguen la misma metodología que la adoptada en el caso del INE. Se trata de dividir las zonas que se quieren estudiar (calles, barrios, ciudades enteras) en celdas con un número mínimo de personas lo suficientemente grande en cada una como para evitar que pueda haber una identificación a nivel individual. En el caso del INE, se dividirá el territorio nacional en 3.200 celdas con un mínimo de 5.000 personas en cada una. Pero la casuística es enorme: Vodafone, por ejemplo, trabaja en un proyecto similar con el ayuntamiento de Barcelona en el que bastan 10 móviles conectados a una antena para que esta información sea captada por el sistema (lo que provoca riesgos adicionales que veremos en breve).

placeholder (Reuters)
(Reuters)

Las divisiones del territorio tienden a ser más pequeñas y, por tanto, más precisas, en zonas de alta densidad de población con un mayor número de antenas. En grandes ciudades la precisión de este sistema por triangulación de antenas puede bajarse a los +/- 100-150 metros. Es preciso, pero no tanto como el rango de 10 a 20 metros que ofrece el GPS de los ‘smartphones’ y del que tiran las aplicaciones que usamos a diario.

Los operadores almacenan toda esta información en bases de datos internas. Sobre ellas utilizan 'software' de análisis y algoritmos para extraer conclusiones y tendencias, que es lo que realmente importa a los clientes potenciales.

¿Y los venden?

Sí, y cada vez más. Bancos, aseguradoras, grandes cadenas de almacenes, ayuntamientos para analizar las necesidades de movilidad... Son los grandes abonados de las operadoras ahora mismo, pero casi cualquier empresa y sector es objetivo potencial. Telefónica cuenta con 340 clientes en 18 países, principalmente grandes empresas, a los que venden datos anonimizados y tendencias para la toma de decisiones a través de su unidad Luca. Presume de casos de éxito en su web corporativa: Repsol, diversos ayuntamientos españoles, el Consorcio de Transportes del Área de Zaragoza, Lloyds Bank, organismos de turismo de diversos países latinoamericanos... Curiosamente, el acuerdo con el INE ya aparece también publicado en su web.

placeholder Chema Alonso, 'chief data officer' en Telefónica e impulsor del proyecto de la cuarta plataforma y Luca, la unidad de 'big data' del operador. (EFE)
Chema Alonso, 'chief data officer' en Telefónica e impulsor del proyecto de la cuarta plataforma y Luca, la unidad de 'big data' del operador. (EFE)

Durante los dos últimos años, la compañía ha situado esta unidad, Luca, como una de sus prioridades clave. Es solo una parte de una idea mayor, la llamada cuarta plataforma, un proyecto liderado por Chema Alonso en el que se usa el 'big data' tanto de forma interna como para venderlo a terceros. La operadora, sin embargo, no comparte datos sobre la evolución y volumen de este negocio.

Vodafone tiene también su propia versión de este servicio, Vodafone Insights, que vende a "decenas de clientes", según confirman fuentes de la compañía a Teknautas. Entre ellos está el ayuntamiento de Barcelona, que recibe datos "anonimizados para entender mejor cómo gestionar la recogida de residuos, cómo distribuir los recursos policiales o la inversión en transporte público". Y Orange otro tanto: su sistema Flux-Vision es justo lo que ha contratado el INE y otras empresas por los mismos motivos.

¿Es legal venderlos?

Tal y como está planteado el negocio, sí. La clave del asunto está en el anonimato de los datos. Las antenas telefónicas pueden captar la ubicación aproximada de una persona y eso, unido a sus datos personales (nombre, DNI, número de móvil y datos de facturación), sirve para saber absolutamente todo sobre un individuo. Sin embargo, los operadores no facilitan ninguno de esos datos personales a sus clientes: realizan un proceso previo que anonimiza la información de forma que solo envían datos agregados y no vinculados a ningún dato personal.

Organismos y empresas como el INE, Repsol o el Ayuntamiento de Barcelona reciben inteligencia, por ejemplo, sobre qué porcentaje de ciudadanos se mueve entre diversos barrios y en qué medio de transporte, o cuáles son los horarios aproximados en los que bajamos a tirar la basura por barrio. Imposible rastrear usuarios individuales.

placeholder Foto: EFE.
Foto: EFE.

El anonimato de los datos cumple por tanto dos leyes clave: la Ley de Protección de Datos (LOPD) y su versión europea del GDPR e, igual de importante, la ley 25/2007 de conservación datos relativos a las comunicaciones electrónicas. Los datos de clientes, al estar anonimizados, dejan de ser datos personales, por lo que los operadores, por ley, ya no estarían obligados a pedir permiso expreso a sus clientes para venderlos a terceros.

¿Sirven de algo estos datos?

Las telecos (igual que hace Google o Facebook con los anunciantes) aseguran que sus datos anonimizados de tendencias son clave para la toma de decisiones. Sin embargo, diversos especialistas consultados difieren sobre su verdadera efectividad, especialmente en el terreno de la planificación urbana y de la movilidad, justo el motivo por el que el INE o el ayuntamiento de Barcelona han comprado los datos a Movistar y Vodafone.

El dato es demasiado grueso para sacar tendencias que no sean macro, muy generales. No sirven para planificar el transporte público o mejorarlo”, asegura Marta Serrano, ingeniera especializada en movilidad. Recuerda que lo único que se va a ver es dónde está la gente a una hora determinada, el tiempo que permanece y otros parámetros que vienen a decirnos cómo se mueve la gente. “Es muy difícil distinguir por conexiones a antenas la forma de transporte en la que se mueven”.

¿Quién asegura que el proceso de anonimizado es robusto? ¿Quién vigila que los operadores no están enviando datos personales a sus clientes?

Sergio Carrasco, ingeniero de telecomunicaciones y abogado especializado en tecnología, opina lo contrario: la triangulación sí permite identificar muchos parámetros. “Una cosa es lo que se puede extraer y otra lo que puede vender la operadora”. Habla de “velocidades”, “paradas” o “cambios de señal por pasar a subterráneo” como valores que permitirían identificar el medio de transporte. "Seguramente muchas de las limitaciones que se verán en la recolección serán más por temas de protección de datos, que por capacidades técnicas".

¿Qué faltaría para que fueran útiles de verdad?

Para sacarle provecho de verdad a estos datos de tendencias como los que el INE va a comprar a las operadoras falta una pregunta clave: el por qué. ¿Por qué se escoge un medio de transporte u otro a una hora determinada? “El motivo de elección aquí no se refleja, y en el censo —el último data, de 2011— sí se hacen preguntas relativas”, explica Marta Serrano.

“En algunas ocasiones puedes intuir la razón porque no tienes otra opción más que el transporte por carretera, pero en otras ocasiones se puede deber a eficacia, motivos económicos... Esos aspectos son claves para los planificadores de movilidad”, remata. Esta experta aboga por recuperar estudios y encuestas como Movilia, cuya última publicación por parte del Ministerio de Industria se produjo en 2007, hace ya 12 años, en lugar de invertir medio millón de dinero público en sistemas cuya efectividad está aún por probar. Y pone un ejemplo.

placeholder Foto: EFE.
Foto: EFE.

“Aquí se ha abandonado a los niños. Con 10 años, salvo excepciones, no tienen móvil. También hay una movilidad asociada a ellos y aquí simplemente no se refleja”, explica. “En las encuestas para estudiar estos hábitos se reflejan todos los miembros de un núcleo familiar. Y no solo son los niños. Hay adolescentes con el contrato de móvil a nombre de sus padres. Así que en lo que se refiere a género y edad tampoco tenemos un registro válido”.

Vale, entonces, ¿cuál es el problema?

Más allá de las dudas sobre la efectividad real de estos sistemas para ayudar a la toma de decisiones, hay riesgos adicionales en el frente de la privacidad que para varios juristas especializados en tecnología son el verdadero elefante en la habitación. ¿Quién controla estos sistemas? ¿Quién asegura que el proceso de anonimizado es robusto? ¿Quién vigila que los operadores no están enviando datos personales a sus clientes, por error o de forma intencionada? ¿Quién comprueba que un cliente no esté cruzando los datos de los operadores con datos propios internos para identificar grupos de clientes? "La respuesta es sencilla: nadie", explica el jurista Samuel Parra.

La Agencia Española de Protección de Datos, la AEPD, solo entra a actuar si hay datos personales en juego. Y no es el caso. Se trata de un proceso en el que la información es, según los operadores, 100% anónima y agregada. "Solo entraría a actuar si alguien denuncia irregularidades, o de oficio, pero lo hace muy, muy pocas veces. Es un negocio sumamente opaco para lo delicado de los datos que se manipulan", añade Parra. De momento, la AEPD acaba de solicitar información sobre los protocolos establecidos con los operadores, una decisión que en pocas ocasiones toma de forma tan rápida tras conocerse un caso polémico.

placeholder Foto: Reuters.
Foto: Reuters.

La falta de fiscalización y armonización entre los operadores de estos procesos crea situaciones peligrosas para la privacidad de los ciudadanos. Un ejemplo: mientras que en el proyecto del INE se dividirá el territorio nacional en 3.200 celdas, cada una de ellas con al menos 5.000 residentes (un número de abonados lo suficientemente alto como para evitar identificaciones a nivel individual) en el proyecto de Vodafone con el ayuntamiento de Barcelona bastan 10 conexiones a las antenas para ser procesado por el sistema. Con solo 10 o 20 móviles, el cruce de datos haría mucho más fácil las identificaciones personales. ¿Quién unifica metodologías? ¿Cuál debería ser el número mínimo de residentes agregados para evitar problemas de privacidad? Cada operador lo hace de una forma diferente, y ahí está el riesgo.

Por este motivo, el abogado especializado en internet, David Maeztu, uno de los especialistas que más ha dudado de la plena legalidad de este negocio de los operadores, asegura que los riesgos, la falta de transparencia en el modelo y su intención comercial es suficiente como para que las telecos deban pedir permiso expreso a sus clientes si quieren que sus datos formen parte de estos proyectos, incluso aunque sean anonimizados. "Se abre un camino, cada vez más claro, a una sociedad del control a cambio de comodidades", señala. "En nosotros está elegir si renunciamos a las mismas a cambio de mantener ciertos derechos o no".

Más de 50 millones de líneas móviles en España analizadas al detalle durante ocho días. A qué hora nos levantamos, qué trayecto seguimos para ir a trabajar, a dónde vamos después, cuánto tiempo estamos en una calle comercial... Es el proyecto que está a punto de arrancar el Instituto Nacional de Estadística (INE) de la mano de Movistar, Vodafone y Orange. Se trata de un contrato delicado, por las sospechas que levanta en el frente de la privacidad, pero tanto el INE como las operadoras aseguran que todos los datos tratados serán 100% anónimos. De hecho, no es la primera iniciativa de este tipo que las operadoras realizan con otras empresas u organismos. En realidad, es uno de sus negocios más rentables y crecientes de los dos últimos años: vender información agregada y anónima de sus abonados.

Orange
El redactor recomienda