Es noticia
Otro capítulo en la 'guerra de la IA': Alibaba anuncia un modelo que supera a DeepSeek
  1. Tecnología
En varios 'benchmarks'

Otro capítulo en la 'guerra de la IA': Alibaba anuncia un modelo que supera a DeepSeek

A pesar de que China se encuentra inmersa en las celebraciones de Año Nuevo, Alibaba no ha querido esperar para presentar Qwen2.5-Max y dar a conocer sus resultados

Foto: Otro actor se suma a la batalla por el reinado de la IA (Montaje: Reuters/Tingshy Wang/Florence Lo)
Otro actor se suma a la batalla por el reinado de la IA (Montaje: Reuters/Tingshy Wang/Florence Lo)

Alibaba ha presentado Qwen2.5-Max, un modelo de inteligencia artificial que supera en rendimiento a DeepSeek-V3 y compite con los desarrollos más avanzados del sector. Esta nueva versión optimiza la arquitectura Mixture of Experts (MoE), permitiendo un uso más eficiente de los recursos computacionales y destacando en tareas de programación, generación de texto y razonamiento complejo.

El modelo ha sido entrenado con 20 billones de tokens y perfeccionado mediante técnicas avanzadas como el aprendizaje por refuerzo y el fine-tuning supervisado. Estas mejoras le han permitido superar a sus rivales en diversos benchmarks, elevando la posición de Alibaba en la carrera por el liderazgo de la inteligencia artificial.

Al parecer, los resultados obtenidos por Qwen2.5-Max en distintos benchmarks lo sitúan por encima de sus competidores. En el test MMLU, que mide conocimientos generales, alcanzó un 87,9%, superando a DeepSeek-V3 (87,1%) y a Llama 3.1 (85,2%). En la evaluación BBH, diseñada para medir el razonamiento complejo, obtuvo un 89,3%, por encima de DeepSeek-V3 (87,5%) y Llama 3.1 (85,9%).

Su desempeño en matemáticas avanzadas también es digno de mención. En la prueba MATH, que mide la capacidad para resolver problemas matemáticos de nivel olímpico, alcanzó un 68,5%, por encima de DeepSeek-V3 (61,6%) y a Llama 3.1 (53,8%).

Disponibilidad y acceso

A diferencia de otros modelos que permanecen en entornos cerrados, Alibaba ha puesto Qwen2.5-Max a disposición del público a través de diversas plataformas. Los usuarios pueden acceder al modelo mediante la API de pago, a través de Hugging Face o utilizando el chatbot interactivo Qwen Chat. Este último permite experimentar con las capacidades del modelo y realizar comparaciones con versiones anteriores.

Foto: El director ejecutivo de OpenAI, Sam Altman. (EFE/Aaron Schaertz)

El lanzamiento de Qwen2.5-Max coincide con la festividad del Año Nuevo chino, un momento poco habitual para presentar novedades tecnológicas. Sin embargo, el tsunami generado por DeepSeek parece haber alterado (y acelerado) los planes de Alibaba. También los de Baidu y Tencent, que aseguran estar doblando esfuerzos para actualizar y mejorar lo antes posible sus modelos.

Alibaba ha presentado Qwen2.5-Max, un modelo de inteligencia artificial que supera en rendimiento a DeepSeek-V3 y compite con los desarrollos más avanzados del sector. Esta nueva versión optimiza la arquitectura Mixture of Experts (MoE), permitiendo un uso más eficiente de los recursos computacionales y destacando en tareas de programación, generación de texto y razonamiento complejo.

DeepSeek Inteligencia Artificial
El redactor recomienda