Es noticia
Vuelco en la IA: investigadores de IBM logran conectar servidores a la velocidad de la luz
  1. Tecnología
Cinco veces menos consumo energético

Vuelco en la IA: investigadores de IBM logran conectar servidores a la velocidad de la luz

IBM ha conseguido interconectar servidores dentro de un mismo centro de datos con fibra óptica en lugar de cables de cobre. Esto permitirá avances en eficiencia y velocidad en el entrenamiento de modelos de IA

Foto:  Prototipo del módulo óptico desarrollado por IBM. (Foto: Cedida)
Prototipo del módulo óptico desarrollado por IBM. (Foto: Cedida)

La compañía IBM ha presentado un avance que podría transformar la forma en que se entrenan y ejecutan modelos de IA generativa. Sus investigadores han desarrollado un nuevo tipo de tecnología óptica que permite la conectividad dentro de los centros de datos a velocidad de la luz, usando fibra óptica en lugar de cables de cobre. El avance permitiría, entre otras cosas, entrenar modelos de IA con hasta cinco veces menos consumo energético y con unas comunicaciones internas en los servidores hasta 80 veces más rápidas.

La fibra óptica es, desde hace años, la principal tecnología usada para transmitir datos y llevar internet a nuestros hogares, entre otras muchas aplicaciones. En España, el 87% de las líneas de banda ancha son ya líneas de fibra óptica hasta el hogar (FTTH, en sus siglas en inglés), según datos de la Comisión Nacional del Mercado y la Competencia (CNMC). La fibra óptica transporta datos utilizando pulsos de luz que viajan a través de delgados filamentos de vidrio o plástico. Este proceso permite transmitir información a altas velocidades y largas distancias con una eficiencia mucho mayor que los cables eléctricos tradicionales.

Aunque los centros de datos utilizan fibra óptica para sus redes de comunicaciones externas, los servidores que los componen se comunican entre sí de puertas hacia dentro utilizando principalmente cables eléctricos de cobre. Estos cables conectan aceleradores GPU que pueden permanecer inactivos más de la mitad del tiempo, esperando a recibir datos de otros dispositivos, lo que genera costes y consumo de energía significativos.

Los investigadores de IBM han demostrado ahora una forma de interconectar estos servidores mediante fibra óptica en lugar de cables de cobre, logrando ventajas de ahorro de costes, eficiencia y aumento de velocidad. En un artículo recientemente publicado en el repositorio online arXiv (sin revisar aún por pares), IBM presenta un nuevo prototipo de tecnología de óptica coempaquetada (CPO, por sus siglas en inglés), que permite conectividad óptica de alta velocidad. Esta tecnología podría aumentar el ancho de banda de las comunicaciones en los centros de datos, minimizando el tiempo de inactividad de las GPU y acelerando el procesamiento de IA.

Foto: Vista de aérea de la planta de Kumamoto. (Reuters/Kiodo)

IBM calcula que este avance puede reducir el consumo energético hasta 5 veces en comparación con interconectores eléctricos de rango medio. Además, ha logrado entrenar grandes modelos de lenguaje (LLM) hasta cinco veces más rápido con esta tecnología óptica que con cableado eléctrico convencional, reduciendo el tiempo de entrenamiento de tres meses a tres semanas (con mayores ganancias en modelos más grandes y más GPU). Esto se ha traducido, aseguran, en ahorros equivalentes al consumo anual de energía de 5.000 hogares en EEUU por cada modelo de IA entrenado.

"A medida que la IA generativa demanda más energía y potencia de procesamiento, los centros de datos deben evolucionar, y la óptica coempaquetada supone una gran alternativa", afirmó el español Darío Gil, vicepresidente senior y director de investigación de IBM. "Con este avance, los chips del futuro se comunicarán de manera similar a cómo los cables de fibra óptica transportan datos hacia y desde los centros de datos, inaugurando una nueva era de comunicaciones más rápidas y sostenibles".

placeholder Investigadores de IBM en el laboratorio de fotónica. (Foto: cedida)
Investigadores de IBM en el laboratorio de fotónica. (Foto: cedida)

En los últimos años, los avances en la tecnología de chips han incrementado significativamente la densidad de transistores. La tecnología CPO busca escalar la densidad de interconexión entre aceleradores al permitir que los fabricantes de chips añadan rutas ópticas que conecten chips en un mismo módulo, superando los límites de las rutas eléctricas actuales. Según el artículo de IBM, estas nuevas estructuras ópticas de alta densidad, combinadas con la transmisión de múltiples longitudes de onda por canal óptico, tienen el potencial de aumentar hasta 80 veces el ancho de banda entre chips en comparación con las conexiones eléctricas.

La innovación de IBM permitiría a los fabricantes de chips añadir seis veces más fibras ópticas en el borde de un procesador de fotónica de silicio, un campo conocido como "densidad de línea costera", en comparación con la tecnología CPO actual. Cada fibra, de aproximadamente tres veces el ancho de un cabello humano, podría abarcar desde centímetros hasta cientos de metros y transmitir terabits de datos por segundo.

La compañía IBM ha presentado un avance que podría transformar la forma en que se entrenan y ejecutan modelos de IA generativa. Sus investigadores han desarrollado un nuevo tipo de tecnología óptica que permite la conectividad dentro de los centros de datos a velocidad de la luz, usando fibra óptica en lugar de cables de cobre. El avance permitiría, entre otras cosas, entrenar modelos de IA con hasta cinco veces menos consumo energético y con unas comunicaciones internas en los servidores hasta 80 veces más rápidas.

Inteligencia Artificial
El redactor recomienda