La última IA de OpenAI piensa antes de hablar y es un cambio más importante de lo que parece
Este modelo ha sido entrenado de una manera diferente a sus predecesores para "razonar" y responder preguntas complejas. Solo hay un pequeño problema: su elevado precio
OpenAI presentó ayer un nuevo modelo de lenguaje de IA que, según la empresa, es capaz de razonar y responder preguntas complejas, más rápido que un humano. Se trata del rumoreado modelo “Strawberry” que la comunidad tanto esperaba, aunque al final le han bautizado como “o1”. Según la compañía, puede "refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores". Eso sí, llega con un pequeño inconveniente: su elevado precio.
El modelo ha sido entrenado para ‘pensar antes que hablar’, por eso tarda un poco más en realizar las tareas que otros modelos de IA, razonando su respuesta como lo haría un humano. A cambio, consigue resolver problemas muy complejos. El o1 “se desempeña de manera similar a los estudiantes de doctorado cuando trabajan en problemas de física, química y biología”, explicaba OpenAI. De hecho, obtuvo una puntuación del 83% en un examen de clasificación para la Olimpiada Internacional de Matemáticas, mientras que su modelo anterior GPT-4o resolvió correctamente solo el 13% de las preguntas.
Se trata de un gran paso hacia el objetivo de la tecnológica de similar la inteligencia humana. Según explicaba el jefe de investigación de OpenAI, Jerry Tworek, en un artículo de The Verge, el entrenamiento detrás de o1 es muy diferente al de sus predecesores, ya que “ha sido entrenado utilizando un algoritmo de optimización completamente nuevo para resolver problemas por sí solo utilizando una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones”. Luego utiliza una "cadena de pensamiento" para procesar consultas, de manera similar a cómo los humanos procesan los problemas al analizarlos paso a paso. Como resultado de esta nueva metodología de entrenamiento, OpenAI dice que el modelo debería ser más preciso. "Hemos notado que este modelo alucina menos", señalaba Tworek.
Today, I’m excited to share with you all the fruit of our effort at @OpenAI to create AI models capable of truly general reasoning: OpenAI's new o1 model series! (aka 🍓) Let me explain 🧵 1/ pic.twitter.com/aVGAkb9kxV
— Noam Brown (@polynoamial) September 12, 2024
Sin embargo, y a consecuencia de este nivel de pensamiento reforzado, o1 es también bastante más lento que otros modelos. Antes de responder a la solicitud de un usuario, el nuevo software se detiene unos segundos mientras considera una serie de solicitudes relacionadas y luego resume lo que parece ser la mejor respuesta. La propia interfaz está pensada para mostrar cómo el modelo pasa más tiempo procesando y profundizando en su resolución, algo que también lo hace más "humano". Mientras lo hace, incluso suelta algunas frases como “Tengo curiosidad por”, “Estoy pensando en ello” y “Ok, déjame ver”, que crean una ilusión de que está razonando todos los pasos.
Con esas características, podría ser utilizado por investigadores de la salud para anotar datos de secuenciación celular, por físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y por desarrolladores para crear y ejecutar flujos de trabajo de varios pasos. Sin embargo, o1 no es tan bueno como GPT-4o en otras muchas áreas. Por ejemplo, no se desempeña tan bien en el conocimiento sobre el mundo. Tampoco tiene la capacidad de navegar por la web o procesar archivos e imágenes.
El modelo está ya disponible para los usuarios de ChatGPT si están suscritos a Plus o Team o a través de la API de OpenAI. Aquí llega uno de los principales obstáculos. El acceso de los desarrolladores a o1 es realmente caro: en la API, o1-preview cuesta 15 dólares por 1 millón de tokens de entrada, o fragmentos de texto analizados por el modelo, y 60 dólares por 1 millón de tokens de salida, bastante más que GPT-4o.
El lanzamiento se produce justo cuando los de San Francisco buscan recaudar dinero. La valoración de OpenAI se ha disparado recientemente a 150.000 millones de dólares tras levantar una nueva ronda de financiación. En la operación, la empresa de Sam Altman aspira a captar unos 6.500 millones de dólares para lograr sus objetivos. Esta ronda estará liderada por la firma de capital riesgo Thrive Capital y será la mayor entrada de fondos en la empresa desde que Microsoft inyectó 10.000 millones en 2023. También está previsto que la compañía que dirige Satya Nadella invierta ahora. Y Bloomberg adelantaba también que Nvidia, suministrador de los chips que usa la empresa para sus tareas de computación, y Apple, que ha firmado una reciente alianza con la empresa, se plantean entrar con una participación minoritaria.
Los fondos captados servirán para cubrir gastos (como microprocesadores) en su carrera por sistemas sofisticados de IA que superen a la humana. Una maratón a la que cada vez se suman más empresas y que ya le empiezan a comer terreno a OpenAI, como Anthropic, Google y xAI, de Elon Musk, las cuales también presumen de habilidades de "razonamiento" con sus modelos.
OpenAI presentó ayer un nuevo modelo de lenguaje de IA que, según la empresa, es capaz de razonar y responder preguntas complejas, más rápido que un humano. Se trata del rumoreado modelo “Strawberry” que la comunidad tanto esperaba, aunque al final le han bautizado como “o1”. Según la compañía, puede "refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores". Eso sí, llega con un pequeño inconveniente: su elevado precio.
- OpenAI lanza GPT-4o mini, un nuevo modelo de IA económico y más rápido que el anterior P. Cubria de Gorostegui
- Apple y Nvidia estudian una inversión millonaria en OpenAI P. Cubria de Gorostegui
- El buscador de OpenAI parece un cataclismo para Google, pero el riesgo está en otro lado M. Mcloughlin