dos caídas en dos días

Cómo WhatsApp se cayó en todo el mundo (y por qué volverá a ocurrir)

La noche del miércoles la aplicación de mensajería sufrió un fallo a nivel mundial que dejó a millones de usuarios sin servicio durante horas

Foto: La caída mundial de WhatsApp: en rojo y amarillo, países afectados. (Imagen: DownDetector)
La caída mundial de WhatsApp: en rojo y amarillo, países afectados. (Imagen: DownDetector)
Autor
Tiempo de lectura3 min

Anoche cundió el pánico por todo el planeta cuando millones de personas tuvieron que posponer el envío de memes y vídeos graciosos por unas horas. WhatsApp se había caído por segunda vez en dos días. La empresa anunció el retorno del servicio sin dar muchas explicaciones, pero deja atrás la pregunta de por qué fallan tanto sus servidores y qué puede hacer Facebook para solucionarlo.

WhatsApp tiene 1.200 millones de usuarios activos por todo el planeta y gestionar tanto tráfico en tiempo real no es una tarea sencilla, ni siquiera para Facebook. "Las comunicaciones son parecidas a sistemas de puentes: imagina que por uno empiezan a pasar coches y más coches hasta que llega un punto en el que se produce un atasco y se colapsa", explica a Teknautas el CEO y fundador de Noysi, una alternativa española a Slack, Hector Castillo.

Si hay demasiados coches, ¿por qué la empresa no crea más puentes? "WhatsApp crea miles o millones de 'puentes', pero por probabilidad matemática puede llegar un punto en el que todos colapsen. Es casi imposible gestionar las comunicaciones de miles de millones de personas porque hay cuellos de botella físicos, a veces por el protocolo o a veces por el certificado de seguridad".

Son los famosos picos, muchas veces difíciles de prever, que han hecho que la 'app' haya fallado en otras ocasiones, como en la Nochevieja de 2015. No así en la de 2016, donde WhatsApp 'resistió' los 63.000 millones de mensajes enviados. "Se puede hacer un cálculo de la media y luego controlar los picos, pero tampoco puedes sobredimensionar la infraestructura", comenta Castillo.

Los picos son como un terremoto: difíciles de adivinar, sacuden de repente y no dejan tiempo a reacciónar. "Los sistemas de autoescalado tardan más de 30 segundos en actuar". Castillo define la caída de un gigante como WhatsApp como "una pescadilla que se muerde la cola", debido a la ingente cantidad de datos que se envían cada segundo. "Si se interrumpe el servicio, al intentar reconectarlo al cabo de un minuto ya no hay 10 millones de mensajes en cola sino 200 millones, por lo que el problema de levantar el servicio es cada vez mayor".

Actualización fatídica

Un cuello de botella no es el único culpable que pudo causar una de las mayores caídas globales de la aplicación: "Me consta que WhatsApp está cambiando su arquitectura y haciendo una migración a nuevos servidores con un sistema más distribuido", comenta Castillo. Estas palabras coinciden con el tuit publicado por la cuenta @WABetaInfo hace un par de días, en el que se anunciaba un "cambio radical que será increíble".

Es la misma hipótesis que apoya el experto en experiencia digital de Dynatrace, Dave Anderson, en esta entrevista a la 'BBC': "WhatsApp envía una nueva versión de la aplicación cada pocos días y es probable que el estar creando código nuevo cada poco tiempo suponga que a veces no esté listo para su lanzamiento". La posibilidad de un fallo es más alta de lo que parece: "Cada desarrollo viene con un riesgo. Sólo se necesita una línea de código errónea y la aplicación puede fallar".

El número de personas conectadas a internet no deja de crecer y Facebook ya roza los 2.000 millones de usuarios. En este contexto es muy difícil crear un sistema estable que resista picos y actualizaciones. Castillo cree que solucionar el problema hoy "es matemáticamente imposible", a menos que se utilizaran kilómetros y kilómetros cuadrados de servidores. "Quizá en cinco o diez años, cuando evolucionen los sistemas de cómputo, se pueda solucionar, pero con la computación actual es imposible".

Tecnología

El redactor recomienda

Escribe un comentario... Respondiendo al comentario #1
5 comentarios
Por FechaMejor Valorados
Mostrar más comentarios