Es noticia
Cómo la IA china DeepSeek ha reventado a Silicon Valley (y a las bolsas mundiales)
  1. Tecnología
La mayor caída bursátil de la historia

Cómo la IA china DeepSeek ha reventado a Silicon Valley (y a las bolsas mundiales)

El lanzamiento de DeepSeek-R1 supone un mazazo para la industria tecnológica de EEUU. Esta 'startup' china apenas se ha gastado dinero en comparación con las 'big tech' y ha enviado a pique a las bolsas

Foto: Ilustración del logotipo de DeepSeek y un gráfico de Bolsa. (Reuters)
Ilustración del logotipo de DeepSeek y un gráfico de Bolsa. (Reuters)
EC EXCLUSIVO Artículo solo para suscriptores

Hace una semana, mientras Trump anunciaba "el mayor proyecto de infraestructura de IA de la historia" y una inversión de la mareante cifra de 500.000 millones de dólares en EEUU, DeepSeek, una startup China poco conocida y controlada por un grupo de jóvenes lanzaba un sistema de IA que desafía toda lógica de ingeniería y barre en rendimiento a los productos de las empresas más valiosas y punteras del mundo. En pocos días, ese modelo se ha convertido en la app más descargada en todo EEUU, superando a ChatGPT, ha generado alarma en Silicon Valley y ha desplomado a cotas históricas las acciones de las principales tecnológicas. Que China adelante a OpenAI, Google o Meta en razonamiento es un mazazo importante para la industria, pero que lo haga sin haberse gastado apenas un duro en comparación con el colosal desembolso que invierten estas empresas, está creando una debacle en el sector con consecuencias económicas impredecibles.

Nvidia, -17%. ASML, -9%, ARM, -10%... cada uno de los fabricantes de chips más importantes del mundo se ha dejado en cuestión de 24 horas millones de euros en bolsa. La primera, intocable por ser el mayor fabricante de tarjetas gráficas capaces de impulsar la IA, ha sufrido la mayor pérdida de valor de una compañía en la historia de EEUU, más de 600.000 millones de dólares. El motivo es uno y solo uno: el modelo DeepSeek-R1. Su lanzamiento y llegada a los móviles de todo el mundo ha desafiado la idea de que solo las empresas reinantes de la industria pueden permitirse fabricar los sistemas más potentes. Y también que, al igual que en otros sectores como el de los coches eléctricos, el dragón chino está adelantando por la derecha a EEUU a la velocidad de la luz. La pregunta que surge ahora es cómo lo ha conseguido.

Según varios test de rendimiento, R1, el software lanzado por DeepSeek, supera a los líderes de la industria, como o1, de OpenAI, por su capacidad para abordar tareas de razonamiento complejas, especialmente en matemáticas y programación. Este modelo, a diferencia de la mayoría que están accesibles ahora mismo para el público general, dedica tiempo a “reflexionar” para ofrecer mejores respuestas a preguntas que requieren un razonamiento lógico paso a paso, lo que se conoce como "cadena de pensamiento". Es lo mismo que hace o1 y o3, de OpenAI, solo que DeepSeek-R1 lo hace de forma muchísimo más barata. Lo mismo ocurre con su reciente sistema generativo de imagen Janus Pro, que ha empezado a ventilarse a otros rivales de EEUU como DALL-E de manera sorprendente.

Por poner las cosas en perspectiva. Las principales empresas de IA del mundo entrenan a sus chatbots utilizando alrededor de 16.000 chips, si no más. Mientras, los ingenieros de DeepSeek afirman haber necesitado sólo 2.000. Y lo mismo señalan del gasto monetario: a penas se necesitaron 6 millones de dólares en potencia bruta, aproximadamente 10 veces menos de lo que el gigante Meta se gastó en su IA. No obstante, algunos investigadores especulan que DeepSeek pudo tomar atajos en sus propios costes de entrenamiento al aprovechar los últimos modelos de OpenAI, lo que sugiere que si bien han podido copiar eso muy rápido, le será más difícil a la compañía china seguir avanzando en el futuro. Y no solo eso, se desconoce también si en realidad han podido tener acceso a más microprocesadores de los que mencionan.

Foto: El presidente de China, Xi Jinping, aparece en una pantalla gigante. (Reuters/Florence Lo)

Esos avances les han permitido obtener nada menos que una puntuación del 97,3% en el conjunto de problemas matemáticos MATH-500 y superar al 96,3% de los participantes humanos en Codeforces, otra prueba dedicada a medir la inteligencia a las IA.

La hazaña de China no es casual, sino que responde casi directamente a las restricciones de exportación impuestas por EEUU. La administración de Joe Biden temía que la IA del régimen comunista les aventajara, por eso limitó la cantidad de chips avanzados que llegaban al país asiático. Sin embargo, lo que estaban haciendo sin saberlo, era estimular la innovación de sus adversarios que, con menos recursos, se habían centrado en renovar la estructura de sus modelos para hacerlos más eficientes. Digamos que todos esos controles obligaron a los investigadores chinos a ser más “creativos” con un abanico de herramientas mucho más reducido.

"Era inevitable que pasara. Si limitas los recursos de alguien, acabará encontrando la forma de hacer lo mismo, pero con mucho menos. En el libro Superpotencias de la IA: China, Silicon Valley y el nuevo orden mundial, de Kai-Fu Lee, se defiende la idea de que EEUU va a liderar el futuro en cuanto innovación, pero que China lo que va a hacer es eficientar toda esa innovación. Ya hemos empezado a verlo con R1 de DeepSeek", explica a El Confidencial José Luis Calvo ingeniero, experto en IA y cofundador de la empresa Diverger.ai.

Desde que ChatGPT, de OpenAI, desencadenó la locura en 2022, los inversores se habían obcecado con la idea de que ninguna empresa podría competir con los dinosaurios del mercado sin desembolsar cientos de millones de dólares en infraestructura. Pero que una empresa china pueda construir un modelo de esta magnitud con un coste bajo y sin chips, está poniendo en duda la utilidad de todo ese despilfarro de capital.

Foto: Interior del Li Mega durante una demostración. (Foto cedida)

“El gasto hecho hasta ahora en Occidente era necesario para llegar a donde estamos. El problema es que coincide en tiempos con el anuncio de Stargate, de 500.000 millones, que es una cifra desorbitada y que irremediablemente plantea la pregunta de si es necesario tanto o no. De hecho, DeepSeek ha demostrado que se puede tener un rendimiento similar con un coste mucho menor”, señala Calvo. “Hasta ahora, para crear un modelo fundacional, solo existían cuatro empresas capaces. Que China haya entrado en juego es interesante, sobre todo porque ahora sabemos que se pueden hacer cosas relevantes con muchos menos recursos. En ese tablero podría incursionar Europa, incluso el modelo Alia de España que, aunque por el momento es limitado, puede llegar a hacer las cosas muy bien. ¿Las GPU son importantes? Sí, pero igual no son tan imprescindibles”, añade el experto.

Algunos analistas creen que, si se pueden entrenar modelos de IA suficientemente buenos a un coste relativamente bajo, entonces su uso proliferará. “El beneficio en IA (especialmente por Service as a Software) será aún mayor del esperado por la paradoja de Jevons, que viene a decir que cuando eficientas un proceso y lo haces más barato, se impulsa su consumo. Un ejemplo son los coches. Si mejoras el uso de la gasolina, entonces todos empezamos a usar más gasolina”, explica Calvo.

El mecanismo detrás de esa eficiencia

El objetivo de DeepSeek es el mismo que el de OpenAI: alcanzar la inteligencia general artificial (AGI), una herramienta que pueda igualar o incluso superar a los humanos en diferentes tareas. Para ello, con una infraestructura mínima, DeepSeek encontró formas de reducir el uso de memoria y acelerar el cálculo sin sacrificar significativamente la precisión. “Optimizaron la arquitectura de sus modelos utilizando una batería de trucos de ingeniería: esquemas de comunicación personalizados entre chips, reducción del tamaño de los campos para ahorrar memoria y un uso innovador de la combinación de modelos”, señalaba Wendy Chang, ingeniera y analista del Mercator Institute for China Studies.

Además, DeepSeek emplea aprendizaje de refuerzo, una técnica de aprendizaje automático (machine learning) que entrena al software para tomar decisiones, lo que permite que los modelos aprendan a través de prueba y error y se mejoren a sí mismos a través de recompensas algorítmicas. Es decir, es capaz de aprender interactuando con su entorno y recibiendo retroalimentación sobre sus acciones, de manera similar a cómo los humanos aprenden a través de la experiencia.

Foto: El presidente de EEUU, Donald Trump, junto al consejero delegado de Oracle, Larry Ellison, el CEO de Softbank, Masayoshi Son, y el CEO de OpenAI, Sam Altman. (Reuters)

Por otro lado, utilizan una arquitectura MoE (Combinación de expertos o Mixture of Experts, en inglés). Se trata de un sistema que implica la colaboración de múltiples modelos locales que se activan sólo cuando sea necesario para realizar una tarea determinada. Esta activación selectiva reduce significativamente los costes computacionales y mejora la eficiencia. Imagínate a un equipo de expertos, cada uno especializado en un área distinta. Cuando hay que enfrentarse a una tarea, solo se convoca a los expertos relevantes, lo que garantiza un uso eficiente de los recursos y de la experiencia. Al aprovechar todas estas herramientas, también se reduce significativamente el coste.

Por otro lado, el código abierto de DeepSeek mejora aún más la rentabilidad del modelo. Esto significa que comunidades de desarrolladores de cualquier sitio pueden acceder, modificar e implementar libremente los modelos de DeepSeek, lo que a su vez reduce las barreras financieras de entrada. “DeepSeek se ha beneficiado de la investigación abierta y del código abierto (por ejemplo, PyTorch y Llama de Meta)”, afirmaba Yann LeCun, jefe de IA de Meta hace unos días. “Si trabajas con código abierto, trabajas con talento de todo el mundo", decia en la misma línea Yineng Zhang, ingeniero de software de SGLang

El potencial real de DeepSeek aún no está claro y, al igual que OpenAI, está aún muy lejos de conseguir alcanzar la AGI. Pero, lo que sí está claro es que, si China se mantiene fuerte en la carrera de la IA, podría ser la primera en llegar, lo que sería un revés casi impensable para EEUU. En el peor de los casos, ya ha puesto en tela de juicio la creencia de que más hardware es igual a mejor IA. De momento, podemos decir que las reglas del juego han empezado a cambiar. Que tu tío o tu prima estén usando una herramienta que ha creado, en cuestión de dos meses, un joven de Zhejiang ya dice mucho de lo que está ocurriendo y puede ocurrir en el mercado próximamente.

Hace una semana, mientras Trump anunciaba "el mayor proyecto de infraestructura de IA de la historia" y una inversión de la mareante cifra de 500.000 millones de dólares en EEUU, DeepSeek, una startup China poco conocida y controlada por un grupo de jóvenes lanzaba un sistema de IA que desafía toda lógica de ingeniería y barre en rendimiento a los productos de las empresas más valiosas y punteras del mundo. En pocos días, ese modelo se ha convertido en la app más descargada en todo EEUU, superando a ChatGPT, ha generado alarma en Silicon Valley y ha desplomado a cotas históricas las acciones de las principales tecnológicas. Que China adelante a OpenAI, Google o Meta en razonamiento es un mazazo importante para la industria, pero que lo haga sin haberse gastado apenas un duro en comparación con el colosal desembolso que invierten estas empresas, está creando una debacle en el sector con consecuencias económicas impredecibles.

Noticias de China Inteligencia Artificial DeepSeek
El redactor recomienda