Caos en las cañerías de Facebook: el fallo que les ha borrado de internet durante horas
  1. Tecnología
LA MAYOR CAÍDA DE SU HISTORIA

Caos en las cañerías de Facebook: el fallo que les ha borrado de internet durante horas

¿Cómo se puede caer al mismo tiempo la red social, WhatsApp, Instagram y Messenger? El problema de lo sucedido ayer son los BPG, una especie de caminos que indican donde se encuentran las cosas en internet

Foto: Foto: Reuters
Foto: Reuters

Ha sido un lunes negro para Facebook. La semana arrancaba con una entrevista a cara descubierta de Frances Haugen, la garganta profunda que ha filtrado en las últimas semanas las miserias de la compañía de Mark Zuckerberg. Durante 60 minutos, la exejecutiva relató nuevos detalles sobre cómo la multinacional de Menlo Park omitía el daño que estaban causando sus productos, mirando para otro lado y priorizando las ganancias que le exigían sus accionistas. Si la jornada se presentaba movida con este testimonio, a media tarde comenzaban a saltar las alarmas. No había manera de acceder. Había 'desaparecido' de internet. Y no solo la red social, todo el cortijo. WhatsApp, Instagram y Messenger se quedaron fuera de juego. Poco después, Oculus, el servicio de realidad virtual de la empresa, también reconocía que estaba atravesando problemas. El impacto no era menor: casi 6.000 millones de perfiles y cuentas se quedan sin acceso, cerradas a cal y canto.

Foto: Foto: Reuters.

Aunque en un principio se especuló con un ciberataque o un ataque de denegación de servicio, el motivo de la caída se debió a un fallo técnico en las tripas de la compañía lo que ha provocado que los tres servicios se quedaran más de seis horas K.O. En un comunicado durante la madrugada hora española, una vez se había restablecido el servicio, el equipo de ingeniería de Facebook reconoció que la raíz del problema estuvo en un "cambio en la configuración de los routers que coordinan el tráfico de red entre nuestros centros de datos". Al comienzo del caos, todas las miradas se dirigieron a un sospechoso habitual: el sistema de nombres de dominio, algo más conocido por las siglas DNS. Sin entrar en demasiados vericuetos técnicos, los DNS son los responsables de resolver la IP del servidor cuando alguien introduce la dirección de Facebook o cualquier otra web en la barra de búsqueda del navegador.

"El error, que provenía de que los navegadores no eran capaces de encontrar esa dirección IP de los servicios de Facebook, parecía confirmar este extremo", explica Diego Suárez, director de tecnología de Transparent Edge Services, firma especializada en infraestructura de internet. Pero en esta ocasión, la razón habitual no era la responsable de este particular efecto dominó. Era una consecuencia. El fallo que ha propiciado la mayor caída de la historia de estos servicios se encontraba en realidad en el enrutamiento BGP ('border gateway protocol').

placeholder Foto: Reuters
Foto: Reuters

Grosso modo', el BGP es lo que sirve a Facebook, Google, Twitter o la plataforma que sea para indicar a los proveedores de internet y otras redes dónde están y cómo encontrarlos. Si no hay BGP, no hay camino a destino. "Es el sistema postal de internet", añade este experto. "Es un protocolo mediante el cual los 'routers' de los proveedores de internet saben cómo enviar los paquetes de red a los segmentos y direcciones IP concretas que corresponden". A las 17:50 hora española, Facebook retiró estas rutas del sistema de anuncios BGP. El efecto no tardó en dejarse notar: se habían sacado a ellos mismos de internet. Esto provocó que los DNS de la red social quedasen fuera de juego y con ello sus servicios cayesen a plomo. "Si, por lo que fuera, Facebook decidiera un día retirarse de su negocio, este es el camino que debería seguir", puntualiza Suárez.

Facebook ha reconocido en su comunicado que el origen del problema ha sido simplemente un error en la configuración de los sistemas, y no un ataque sobre la red autónoma de Facebook. El 'New York Times', citando a trabajadores bajo la condición de anonimato, aseguraba que la compañía descartaba este último extremo. Aunque una situación así podría ser un motivo de alegría para las plataformas rivales, estas también se vieron afectadas al vivir ciertos atascos y lentitud a la hora de servir sus páginas. ¿El motivo? Tal y como explicaban desde Cloudfare, que gestiona un servidor DNS utilizado por Facebook y muchos otros, los usuarios, al ver que la red social no respondía, seguían intentando acceder. Esto impide que el sistema pueda atender todas las peticiones que le entran a tiempo.

Fue un error interno en los BGP, el código postal de Internet, el que provocó el fallo

Pero ¿cómo es posible que los tres servicios hayan quedado fuera de juego?, ¿no tiene cada uno sus servidores? "Internet es una red de redes y Facebook tiene su espacio", aclara este experto. "Aunque tengan los tres servicios separados, el barrio de internet, por así decirlo, es el mismo. Y has borrado las rutas y los caminos que conducen hasta él".

Hasta la Casa Blanca

El asunto no tardó en trascender. Se coló hasta en la comparecencia diaria de Jen Psaki, portavoz de la Casa Blanca. "Somos conscientes de la situación, la estamos monitoreando", afirmó la representante de Joe Biden ante los medios de comunicación. La compañía vio cómo su cotización retrocedía al final de la sesión un 5%. Es decir, perdió en una jornada capitalización por el valor de todo Twitter.

Toda la galaxia del universo Facebook estaba fuera de juego. Pero los efectos de este seísmo tecnológico también se sintieron de puertas para dentro. Todos aquellos usuarios que utilizasen Facebook Login para acceder a alguna web o plataforma en concreto no podían hacerlo. Los empleados que habían vuelto a trabajar presencialmente también se vieron afectados. Sus tarjetas y credenciales digitales quedaron inutilizadas, impidiendo que accediesen a sus puestos o a salas de reuniones. Los que teletrabajan tampoco se libraron de la onda expansiva. Workplace, la plataforma con la que se manejan en su día a día, quedó inutilizada. Cuentas corporativas de correo o teléfonos de empresa también experimentaron problemas, según relatan algunos medios estadounidenses. La solución en estos casos, tirar de la competencia y recurrir a correos de Gmail, conferencias de Zoom o Hangouts para poder seguir en contacto.

placeholder Mark Zuckerberg. Foto: Reuters
Mark Zuckerberg. Foto: Reuters

Esto también habría ocurrido en los centros de datos de la compañía, algo que dificultaría poner remedio a esta crisis, puesto que hace falta acceder físicamente a los servidores para solucionarlo todo con un 'reseteo manual'. Que hayan tenido que recurrir a una recuperación forzosa en lugar de restaurar una versión anterior (algo que se suele hacer cuando ocurren problemas de programación o cargas erróneas) da pistas de que no era un tropezón y que la caída era grave.

Suárez compara el problema con las credenciales con salir de casa, dejarte las llaves dentro y no tener otra copia encima. "El acceso dependería de una validación alojada en los propios servidores de la compañía. Es cierto que se pueden encontrar soluciones para acceder, pero los centros donde se alojan los BGP son sitios superseguros, con protocolos de acceso superrestringidos". A última hora de este lunes, los problemas comenzaron a remitir en la mayoría de países.

Desde Transparent Edge Services explican que recuperar la normalidad no es sencillo, ya que el arranque hay que hacerlo con mucho cuidado. "Esto es como una fábrica, no puedes pararla y arrancarla al gusto. Tienes muchas peticiones en cola que te pueden generar una avalancha de peticiones que te pueden tumbar todo de nuevo". Alrededor de las 00:30 hora española de este martes, Facebook, Instagram y WhatsApp volvían a nacer. En total, habían sido más de seis horas sin poder acceder.

El redactor recomienda