Caída masiva de Google: así puede un fallo técnico tumbar todos sus servicios de golpe
  1. Tecnología
La fragilidad de la red

Caída masiva de Google: así puede un fallo técnico tumbar todos sus servicios de golpe

Alphabet vio cómo durante una hora ninguno de sus sistemas funcionaba correctamente y medio planeta se quedaba sin servicio. Parece ciencia ficción pero algo así es fácil que ocurra

placeholder Foto: (Foto: Reuters)
(Foto: Reuters)

Ha sido uno de esos momentos en los que medio mundo cree que el planeta se acaba. A la una de la tarde, hora española, Google se caía. Entero, a plomo, todo el árbol gigantesco en el que se ha convertido Alphabet, la matriz del buscador, se quedaba fuera de servicio y sin razón aparente. Durante una hora cientos de millones de usuarios se vieron sin servicios esenciales como el buscador, Gmail o Google Drive y sin saber cuándo volverían. El problema se resolvió pasado ese tiempo, pero quedan dudas por resolver. ¿Cómo uno de los mayores gigantes de internet pueden hundirse de esta manera? Google ha dado una primera versión oficial, pero a falta de más detalles los expertos ya analizan un caso "bastante único".

Por lo publicado por la compañía estadounidense en la tarde de este lunes, el fallo se debió a "un problema de cuota de almacenamiento interno. Los servicios que requieren que los usuarios inicien sesión experimentaron altas tasas de error durante este período", y el sistema no pudo más. Se trata de una primera versión que la propia compañía ha anunciado que seguirá ampliando durante la semana, pero ya de por sí deja varias preguntas en el aire. ¿Puede Google quedarse sin espacio, como cualquier usuario? ¿Y hacerlo a nivel global? Los expertos recalcan que hay que esperar a conocer más detalles, pero apuntan ciertas hipótesis.

Foto: Twitter no se ha caído, así que se ha convertido en la mejor fuente de creatividad y humor en respuesta a la caída de Google

Por ejemplo, Diego Suárez, director de Tecnología de Transparent CDN cree que la explicación con tan pocos detalles deja bastante en el aire, y es complicado sacar conclusiones exactas, pero se pueden ir deduciendo puntos importantes. "A ver, Google no se puede quedar sin espacio así como así, eso no tiene mucho sentido, por lo que habrá que esperar a conocer más detalles, pero sí podemos confirmar que el problema estaba en los procesos de autenticación, que era la principal hipótesis que se manejaba desde esta mañana".

Como comenta Suárez, poco después de la caída ya muchos expertos empezaron a señalar el asunto de las autenticaciones, porque, aunque parecía que estaba todo caído, se podía entrar a YouTube o al buscador si no te habías 'logado'. Es decir, que el corte aparecía cuando un usuario intentaba identificarse en los diferentes servicios. Al tener un sistema integrado (uno de los grandes puntos de Google es que el mismo usuario se registra con las mismas claves en todos los servicios y la información se entrelaza) esto explicaría la razón de por la que ha afectado a todas las plataformas de la compañía. Al menos una parte.

Lo que ya no cuadra tanto es que fuese solo por falta de espacio y que dicho problema fuese global. "Cuota pueden ser muchas cosas, desde el espacio asignado a una aplicación, a número de accesos al mismo... Más que quedarse sin espacio tal cual, diría que algún subsistema de Google tenía asignado un espacio máximo que se superó, y al estar superado no podía guardar nuevas sesiones... Pero es raro que ocurra simultáneamente en todo el mundo", comenta Suárez, en conversación con Teknautas, tras conocer la explicación.

Eso mismo opina Marc Almeida, programador y experto en ciberseguridad, que coincide en el análisis con Suárez, pero va más allá en las razones. Para este experto, aunque aún no se conocen más detalles, la caída podría estar relacionada con los grandes cambios que Google tiene preparados para sus sistemas de almacenamiento y gestión (G-Suite) de cara a 2021. "No hay pruebas claras, pero ya es casualidad que esto ocurra cuando se van a llevar estos cambios justo en el almacenamiento. Obviamente si ellos no lo dicen no lo sabremos, pero pueden ir por ahí los tiros porque no dejan de ser grandes cambios que pueden fallar". Google ya ha anunciado que reducirá, por ejemplo, la capacidad de Google Fotos y cambiará sus políticas sobre Drive.

Es un problema raro, también para Almeida, sobre todo por cómo se ha dado y hasta dónde ha llegado, pero no imposible, ni mucho menos. "Creemos que estas compañías, con lo gigantescas que son, no pueden sufrir problemas así, de forma tan sencilla y de un minuto para el otro, pero ya tenemos un nuevo ejemplo. Obviamente están muy controladas, pero puede ocurrir y más si pensamos que todo esto es 'online', el riesgo de fallos es muy alto en internet y un pequeño movimiento en un transatlántico como Google puede originar un gran problema".

Pocos saben cómo funciona

Tanto para Suárez como para Almeida lo mejor es esperar a que Google publique un informe sobre lo ocurrido y que sea la empresa la que vaya detallando lo ocurrido, pero el segundo añade una reflexión. ¿Una compañía tan grande e importante para nuestro día a día debería ser mucho más transparente y cuidar al detalle cada movimiento? Para este programador es algo clave. "Ahora mismo hay millones de empresas y ciudadanos que han visto peligrar puntos fundamentales de su día a día por un fallo sin razón aparente y sin aviso alguno. Son estructuras clave y deberíamos abrir ese debate", añade.

Por su parte, Suárez destaca lo llamativo de que el problema haya aparecido a nivel global, algo que sí que, según este experto, es único o se ha dado en poquísimas ocasiones. "Se ve que ha sido un problema profundo, no un apagón en un centro de datos, pero sigue llamando la atención que el fallo haya llegado tan lejos. Estas compañías suelen tener barreras y soluciones a nivel local o regional para evitar que estos problemas se generalicen tanto, pero bueno no es algo perfecto y aquí se ve claramente".

placeholder (Foto: Reuters)
(Foto: Reuters)

El error en los sistemas de autenticación daría una respuesta a este problema aunque, para Suárez, sigue necesitándose una investigación que seguro que muestra opciones para que esto no ocurra de nuevo, o al menos sea algo más difícil. "Google apuesta claramente por la integración de los sistemas y es uno de sus puntos fuertes. Claro, eso en este caso se ha visto que puede ser un problema para el control de los fallos. Y no hay que olvidar que en estas compañías siguen trabajando humanos y máquinas que pueden errar, como en cualquier otra".

No es el primer caso

Lo cierto es que aunque el caso de Google es bastante impactante porque se ha caído la compañía al completo, en los últimos tiempos estamos viendo cómo grandes sistemas (Amazon, Facebook, Microsoft...) están sufriendo problemas similares con cada vez más asiduidad, y la pandemia solo ha hecho que agravar la situación. "Al final estamos todo el mundo frente a las pantallas, hay más gente conectada que nunca y las compañías tienen más riesgo de sufrir tanto ataques como fallos con una gran repercusión. Esto no quiere decir que antes no los sufrieran, pero al menos no se notaban tanto", comenta Almeida.

Por eso, el programador hace especial hincapié en la transparencia y en pedir a estas empresas que tanto grandes cambios, como fallos o problemas, los trasladen a la ciudadanía con franqueza. "Al final es que tienen una capacidad y una responsabilidad brutal, y por eso mismo deberían ser claros. En septiembre, aunque pasase desapercibido, se cayó Level 3, un proveedor poco conocido, pero fundamental en internet y provocó que tuviese problemas como el 3% de la red. Pues apenas hizo ruido ni nadie se enteró. La compañía no dio explicaciones y todo tan normal. Eso debería hacernos reflexionar, pues de estas pocas manos depende cada vez más todo nuestro mundo".

Google Alphabet Almacenamiento
El redactor recomienda