Es noticia
Bard ya es historia: Google da un vuelco a su IA y sigue el camino de OpenAI
  1. Tecnología
LA GUERRA DE LA DÉCADA

Bard ya es historia: Google da un vuelco a su IA y sigue el camino de OpenAI

A partir de ahora, llámenlo Gemini. La compañía unifica el nombre de varios de sus productos de IA. No es el único cambio. Habrá 'app' para Android e iOS y, si se quiere acceder a la versión más potente, habrá que pasar por caja

Foto: Foto: Getty/Carl Court.
Foto: Getty/Carl Court.
EC EXCLUSIVO Artículo solo para suscriptores

Si algo ha quedado claro desde que la irrupción de ChatGPT provocó el big bang de la inteligencia artificial y una rivalidad entre las grandes tecnológicas por conquistarla y ponerse al frente de esta revolución es que, al desconectarse un mes, uno se pierde muchas novedades. En las últimas semanas, el que más está dando que hablar ha sido Google.

Primero liberó la función Rodea para Buscar, una herramienta basada en la búsqueda visual de Google Lens que, en algunos países, ya permite hacer preguntas directamente sobre la imagen y obtener una respuesta generada por su IA. A eso le siguió un sistema de verificación, con el que el usuario puede comprobar tan solo pulsando un botón qué afirmaciones son correctas y cuáles no, con base en la información existente en internet, un anuncio que vino acompañado de que a Bard se le cambiaba el motor y empezaría a funcionar, en todo el mundo, con Gemini Pro, una de las variantes del último modelo de lenguaje (más conocido por las siglas LLM) que los de Mountain View han entrenado y han puesto en circulación.

Foto: El CEO de Google, Sundar Pichai. Foto: Rajat Gupta (Efe)

Ahora los californianos dan un paso más allá. Han anunciado que Bard ya es historia. El ChatGPT de Google a partir de ahora se llama Gemini. Es decir, no ha muerto, sino que toma el nombre de su último LLM para tratar de organizar el lío de nombres y marcas, y ayudar a que al usuario le quede todo un poco más claro. No es la primera vez que alguien hace algo así.

Recientemente, Microsoft hizo algo parecido. Eliminó la denominación de Bing Chat, que es como se llamaba el chatbot que incluyen en su buscador. Los de Redmond decidieron englobar todo bajo una misma marca, Copilot, que es la que venían utilizando en otros productos, algunos más destinados al mundo empresarial.

App oficial y suscripción a su IA

Gemini seguirá siendo accesible a través del navegador web, pero ahora contará con una aplicación oficial para Android y podrá funcionar también en iOS a través de la app de Google. Aunque la compañía va a seguir dando la opción de que se siga utilizando Assistant como hasta ahora, lo cierto es que Google ha diseñado todo para que esta IA generativa se active de forma similar. Se podrá interactuar con voz, con texto y se podrá cargar imágenes.

Eso sí, el cambio de Bard a Gemini ha venido con la confirmación de una de las cosas que se venía especulando mucho en las últimas horas. Se acabó el café para todos. Si se quiere acceder a la inteligencia artificial más potente, habrá que pasar por caja. Google ha presentado Gemini Advanced, un servicio que se integrará en su suscripción Google One, que incluye más almacenamiento o versiones prémium de su editor de fotos o de su app Meet. El precio completo será de 19,90 dólares al mes, incluye 60 días de prueba y el resto de prebendas de ser usuario de pago de estos servicios. Dentro de poco, los suscriptores de este servicio también podrán utilizarlo en Gmail, Sheets, Docs o Slides, un servicio solo disponible para algunas empresas a través de Duet AI, que es como hasta ahora se conocía su producto para el mundo empresarial y no para el usuario final.

El enfoque que ahora toma Google es similar al de Open AI, creando una versión de pago para el público general. El precio es similar, pero no hay que olvidar que el plan de Google One con Gemini Advanced incluye, entre otras cosas, 2TB de almacenamiento. Hasta ahora se comportaba como Microsoft, con productos gratuitos para los usuarios e intentando sacar tajada, principalmente, del mundo empresarial.

De momento, se ofrecerá en EEUU, Japón, Corea del Sur y otros 150 países únicamente en inglés. Respecto a los planes para llegar a la UE, se han limitado a decir que están estudiando con las autoridades correspondientes que el producto se adapte a la normativa local en lo que se refiere a materias como protección de datos. No es nuevo. Cada vez que Google ha lanzado un nuevo producto o servicio relacionado con la IA, el modus operandi ha sido el mismo.

Gemini Advanced dará acceso a Gemini Ultra 1.0, que es la versión más potente de su modelo de lenguaje. Los que no quieran pasar por caja tendrán acceso a Gemini Pro, que es el escalón intermedio, a caballo entre Ultra y Gemini NanoUltra y Gemini Nano, pensado para ejecutarse en smartphones.

"Con nuestro modelo Ultra 1.0, Gemini Advanced es mucho más capaz de realizar tareas muy complejas como escribir código, razonar lógicamente, entender y seguir instrucciones matizadas o colaborar en proyectos creativos", aseguran desde la compañía estadounidense, que ponen el acento en que el sucesor de Bard permite tener "conversaciones más largas y detalladas" y está preparado para entender mejor "el contexto de las indicaciones previas". "Puede ser tu tutor personal, creando instrucciones paso a paso, mostrando cuestionarios o planteando debates al estilo de aprendizaje", explicaba Sissie Hisao, vicepresidenta de Google encargada de Gemini y Assistant, en un encuentro virtual con medios internacionales al que asistió este periódico. La ejecutiva también detalló que el nuevo chatbot es más capaz de ayudar a escribir código, ayudando a los desarrolladores a "evaluar y experimentar" con diferentes enfoques de programación.

Gemini y sus variantes fueron anunciadas a finales de 2023. La versión Ultra viene avalada, según sus creadores, por sus sorprendentes resultados en las principales pruebas que se utilizan para medir las capacidades de estos desarrollos, donde superó a sus principales rivales. "Cuando llegamos a la fase final de su entrenamiento, empezamos a ver que era superior a cualquier otro modelo en los benchmarks", afirmó Demis Hassabis, CEO de DeepMind, en el video de presentación. El ejecutivo, además, aseguró que en el medio centenar de materias (historia, medicina…) en las que se ha probado, Gemini ha demostrado ser "tan buena" como los "mejores expertos humanos" en dichas materias.

La prueba que mide esto se llama MMLU (comprensión masiva del lenguaje multitarea), un examen que, según la memoria técnica de Gemini Ultra, superó con el 90,04% de la nota. GPT-4 consiguió un 86%. En GSM8K, un examen matemático de un nivel similar al escolar, ha obtenido un 94,4% frente al 92% del modelo de OpenAI. MATH, un test matemático que exige tener capacidades avanzadas de geometría o álgebra, se les ha atragantado un poco más.

Gemini obtuvo un 53,2% de puntuación, mientras que GPT-4 logró un 52,9%. En HumanEval, que mide el talento para escribir código en Python, la nueva IA de Google rascó una calificación de casi el 75%. Su gran rival, el 67%. Una de las novedades de Gemini es que también tendrá un nuevo sistema de generación de código, AlphaCode 2. Según se recoge en el documento de Google, la versión Ultra mejora los resultados y supera a todos sus rivales en 30 de las 32 pruebas de referencia. Cuando se habla de todos los rivales, se habla también de GPT-4, el desarrollo más avanzado que OpenAI ha puesto en circulación hasta la fecha. También hay que señalar que el modelo intermedio obtiene calificaciones más bajas, más en línea con las logradas por GPT-3.5. Ahora toca refrendar estas buenas cifras en entornos y usos reales, más allá de estos test de estrés.

Si algo ha quedado claro desde que la irrupción de ChatGPT provocó el big bang de la inteligencia artificial y una rivalidad entre las grandes tecnológicas por conquistarla y ponerse al frente de esta revolución es que, al desconectarse un mes, uno se pierde muchas novedades. En las últimas semanas, el que más está dando que hablar ha sido Google.

Google
El redactor recomienda