Es noticia
Google por fin muestra cómo va a utilizar su inteligencia artificial y para qué te va a servir
  1. Tecnología
GOOGLE I/O

Google por fin muestra cómo va a utilizar su inteligencia artificial y para qué te va a servir

La compañía utiliza su conferencia anual para mostrar su nuevo modelo de lenguaje y cómo va a cambiar Gmail, GDocs, su buscador y decenas de productos. También ha presentado nuevos móviles y una tableta

Foto: Sundar Pichai, durante la presentación. Foto: Google
Sundar Pichai, durante la presentación. Foto: Google

El I/O, la cumbre anual de desarrolladores que Google, era hasta hace dos telediarios un evento muy importante dentro del gremio, pero en absoluto se veía como algo trascendental. La compañía lo utilizaba para anunciar novedades sobre Android, su buscador, Maps, Cloud y, más recientemente, muchos de los dispositivos que comercializa bajo los nombres de Pixel y Nest. También aprovechaba la ocasión y explicaba cómo estaba trabajando en computación cuántica y otros retos de futuro. Pero el de este este año se ha convertido en una cita crucial, una dicotomía entre puerta grande o enfermería, para los intereses de la multinacional de Mountain View y su posición de supremacía tecnológica en los próximos años.

¿Por qué lo que era un sarao así ha pasado de ser algo tranquilo e inocente a ser algo incluso peligroso? Porque hasta el día de hoy nadie había supuesto una amenaza real o lo suficientemente grande para ninguno de los productos que sostienen su negocio, que no es otro que ser el mayor imperio publicitario del mundo. Eso cambió a principios de año con el matrimonio de Microsoft y OpenAI, creadora de ChatGPT, el chatbot que ha puesto patas arriba la industria tecnológica y ha desatado una loca carrera por conquistar el trono de la inteligencia artificial.

Foto: Logo de Google. (Reuters/Dado Ruvic Illustration)
TE PUEDE INTERESAR
Google vs. Microsoft: guerra abierta por la inteligencia artificial que va a cambiar tu vida
Manuel Ángel Méndez Gráficos: Miguel Ángel Gavilanes

Se lleva semanas especulando con que Google utilizaría este evento para alejar el fantasma de que todo este tsunami le había pillado con el pie cambiado y que por eso se había quedado a rebufo de su competencia en la materia, que a día de hoy, principalmente, es Microsoft. La respuesta ha sido contundente. Cualquier otra cosa podía ser percibida como un error. A las alturas de la película en la que nos encontramos cualquier fallo, por mínimo que sea, se paga caro. No se puede olvidar los 100.000 millones de capitalización bursátil que se evaporaron en cuestión de horas el pasado mes de febrero, cuando mostró una pequeña muestra de Bard, su chatbot conversacional, y este patinó en una respuesta

“La inteligencia artificial está teniendo un año frenético”, afirmaba Sundar Pichai, CEO de Alphabet, al comienzo de la presentación de este miércoles a la que El Confidencial ha podido asistir presencialmente. El máximo responsable de la multinacional recordaba que llevan metidos en faena desde hace una década, cuando compraron DeepMind y adelantaba que todo lo que se vería hoy era producto de años de investigación.

Un nuevo motor para la carrera de la IA

Las novedades han llegado a todos los niveles. La IA de Google se dejará sentir entre los usuarios, pero también entre los desarrolladores y todos aquellos que hacen su trabajo entre bambalinas, lejos del entendimiento y el conocimiento del común de los mortales. Ha habido muchos titulares sobre aplicaciones y herramientas que harán que escribir un informe o preparar una presentación sea mucho más fácil y más rápido. Pero el anuncio clave, el que sirve de base para el resto de avances, ha sido el de un nuevo modelo de lenguaje, PaLM2, que promete ser más rápido y razonar mejor que su predecesor, presentado en 2022. En el evento también se ha presentado Gemini, el siguiente modeloa de lenguaje, que ya está siendo entrenado.

PaLM2 es el modelo de lenguaje que sostendrá la llegada masiva de la IA a los productos de Google

El propio Pichai ha sido el que ha dirigido la puesta de largo, explicando que este LLM ha sido “entrenado intensivamente en un entorno multilingüe”, ya que se ha trabajado con más de 100 idiomas para capacitarlo. Todo este trabajo permite que la IA de Google sea más comprensiva, más humana, con lo que se le pida. Esto incluye poder interpretar mejor órdenes en diversas lenguas así como mayor capacidad para trabajar con textos que contengan matices, ironía o doble sentido, como pueden ser los poemas, las frases hechas, modismos o los chascarrillos.

PalM2 también ha mejorado su capacidad de razonamiento. Para lograrlo Google lo ha alimentado con una base de datos construida con investigaciones científicas pero también con el contenido de webs con expresiones, fórmulas y lenguaje matemático, en general. Una de los logroso de Microsoft ha sido el de convertir la tecnología de OpenAI en una potente herramienta para escribir código fuente y crear aplicaciones.

Ahora ha utilizado su nuevo modelo de lenguaje para construir un chatbot de desarrollo capaz de trabajar con 20 lenguajes de programación diferentes. Aseguran que sobresale a la hora de trabajar con cosas tan populares y extendidos como Python y JavaScript, pero también puede generar código en lenguajes más especializados como Prolog, Fortran y Verilog. También se han mostrado otros usos verticales para PaLM2, como Sec-PalM2, pensado para el mundo de la ciberseguridad; o Med-PaLM2, enfocando al mundo de la sanidad. Durante la conferencia inaugural se ha visto a esta inteligencia artificial diagnósticando una lesión a través de una radiografía.

placeholder Foto: Google.
Foto: Google.

¿Para qué te va a servir la IA?

PaLM 2 es una de esas cosas que puede quedar lejos de la comprensión y el interés del usuario de a pie, ese que no se interesa por cómo funcionan las cosas sino por los resultados y ventajas que le pueden aportar. Por eso Google se ha afanado en mostrar utilidades prácticas y diarias de este modelo de lenguaje, que ya es el encargado de hacer funcionar la IA en al menos 25 de sus productos. La compañía ha anunciado que Bard, que hasta ahora solo estaba disponible para un grupo pequeño de probadores de confianza, ya funciona en abierto en 180 países diferentes. Ninguno de estos países será de la UE, que ha quedado fuera por un motivo evidente: regulación. Google no quiere ningún incendio como el de ChatGPT e Italia. Eso sí, si se quiere acceder desde estos territorios basta con una VPN.

De momentoBard solo operará en inglés, japonés y surcoreano, pero han asegurado que pronto estará disponible en abierto en otros 40 idiomas. Entre ellos, estarán el castellano y el catalán. Para justificar que, a diferencia de Bing, su chatbot Bard solo siga funcionando en apenas tres idiomas han afirmado que agregar nuevas opciones "implica un trabajo profundo para lograr que cosas como la calidad y los matices locales sean correctos".

placeholder Vista de los resultados de Bard en el buscador. Foto: Google.
Vista de los resultados de Bard en el buscador. Foto: Google.

PaLM 2 es la mano invisible que mueve toda la inteligencia artificial de Google hasta que llegue Gemini, su próximo modelo de lenguaje, que ya se encuentra cocinándose. Sin embargo, la compañía no ha querido englobar todo bajo una misma marca. Una marca que podía haber sido Bard, la que ha sido hasta ahora la cara más visible de sus esfuerzos por entrar en esta carrera. Bard seguirá como chatbot, en una app independiente y no reemplazará a Assistant. Aunque el funcionamiento sea similar a Bard, en el buscador la función de inteligencia generativa se conocerá como Search Generative Experience.

La compañía ha mostrado un primer ejemplo de este nuevo modelo de búsqueda, donde los resultados del chatbot serán mucho más visuales y no se limitarán únicamente a texto. Las respuesta ya no serán un listado de enlaces donde aparezca el término de búsqueda. Presentará una respuesta basada en lenguaje natural, en formato conversacional aunque seguirá ofreciendo enlaces para acudir a la fuente o las fuentes de la información.

Habrá un nuevo bloque que se presentará al inicio de la página, en la que se resumirá la respuesta. En la parte inferior se mostrarán preguntas relacionadas, así como dos botones en los que mostrar si la respuesta ha sido correcta o no. En el caso de que la consulta sea sobre algún tipo de producto, el buscador tendrá en cuenta el contexto de tus busquedas para mostrarte productos que encajen al máximo posible.

La compañía no quiere fiar todo el protagonismo a las máquinas. Prueba de ello es Perspectivas, una función que buscará e incluirá respuestas humanas entre los resultados. Esas respuestas saldrán de Reels, YouTube o Reddit. Ambas funciones se empezarán a testar en el mercado estadounidense, únicamente en inglés. A este nuevo sistema de búsquedas se le podrá pedir información sobre algo y pedirle que nos coloque la información en el mapa o, incluso, que exporte esos resultados y los clasifique en una tabla de Spreadsheet (el Excel de Google). Estas nuevas funciones se probarán a pequeña escala en EEUU y en inglés entre los usuarios que se den de alta en una lista de espera.

Para el mundo profesional, la marca será la de Duet AI. Se trata de una caja de herramientas basadas inteligencia artificial generativa que estará integrada en su suite de productividad WorkSpace así como en servicios de Google Cloud. En Gmail se le podrá pedir que cree un email, indicándo el tono y la extensión y pedir al sistema que tenga en cuenta los correos anteriores de dicha conversación para crear una respuesta contextual. Cuando escribamos un documento de texto también podremos utilizar sus capacidades para completarlo. Sin embargo, lo realmente impresionante en este sentido ha sido el proyecto Tailwind, que nos permitirá entrenar un modelo de lenguaje fácilmente en base a los textos y los documentos que tenemos en Google Drive así como con otras fuentes que le facilitemos.

En su herramienta de presentaciones, se le podrá pedir a Duet AI que nos prepare las notas para el portavoz de turno o que nos genere las imágenes de fondo. Si queremos un fondo personalizado para nuestra videollamadas de trabajo con Meet, podremos crearla a golpe de prompt, el nombre que reciben las instrucciones que se dan a las IA generativas. Para crear las imágenes, Bard y Duet AI recurrirán a la tecnología generativa de Adobe Firefly, presentada hace pocas semanas. Todas estas funciones, por ahora, estarán disponibles en inglés bajo lista de espera.

Contra la muerte de la realidad

Google no es ajena a las preocupaciones que generan los desarrollos y las capacidades de las inteligencias artificiales generativas. En este sentido ha hecho varios anuncios relevantes. El primero de ellos es que las imágenes y contenidos que sean creados con sus tecnologías llevarán metadatos para identificar que han sido generados por esta vía.

Otras herramientas, como la traducción universal, estarán disponibles solo para proveedores de confianza para evitar que se utilicen para generar deepfakes. Esta función permite traducir un video a otro idioma, corrigiendo el movimiento de los labios para que parezca que fue grabado originalmente así. 

Por último, Google activará en verano una función de búsqueda inversa llamada Sobre esta imagen. Permitirá ver cosas como cuándo fue indexada y utilizada por primera vez, qué web la subió y que otras la han utilizado. El objetivo es que ese contexto sirva para ver si esa imagen viene de una fuente de confianza o no.

IA también en Android y más

Algunas de estas posibilidades también llegarán a Android 14. Los móviles que funcionen con esta versión del sistema operativo permitirá crear respuestas para correos electrónicos o para mensajes desde la aplicación nativa solo con pulsar un botón. Estará disponible en pruebas este verano en Estados Unidos.

Por otra parte, los fondos de pantalla dejarán de ser una librería estática o simplemente una foto que escojamos de nuestro album. Google ha preparado un puñado de opciones que incluyen desde la posibilidad de crear un fondo simplemente describiéndolo con palabras o crear un salvapantallas animado a partir de una imagen estática, entre otras cosas. Estas funciones irán desbloqueándose progresivamente en los próximos meses.

En lo que se refiere a dispositivos móviles, Google ha anunciado una nueva versión de Wear OS, su plataforma para relojes inteligentes, que se estrenará a finales de año. Bard también se integrará con Google Lens, esa función disponible en Android que sirve para identificar con la cámara del teléfono cualquier cosa que nos rodea. Desde un árbol, un perro, un edificio o un objeto. Durante la presentación se ha mostrado cómo se puede utilizar esta herramienta para conocer la raza de dos perros que tenemos en una fotografía y, de paso, que el chatbot nos escriba una descripción "divertida" sobre la imagen utilizada.

La inteligencia artificial también llegará a otros rincones del universo de Google, como Maps o Fotos. A finales de este año la compañía empezará a desplegar Vista inmersiva en los mapas de 15 grandes ciudades de todo el mundo. Se trata de un sistema que ofrecerá rutas realistas y plagadas de detalles en tres dimensiones, que además de darnos una idea de por dónde vamos a movernos, también hace simulaciones de tráfico o de la previsión metereológica para saber exactamente lo qué nos vamos a encontrar en cada momento.

En Google Fotos la inteligencia artificial alimentará una herramienta de edición al más puro estilo Photoshop que permitirá transformar nuestras imágenes por completo. Se podrán mover objetos, cambiar el cielo para que un día tormentoso parezca el más soleado o cambiar la iluminación solo con un toque. Durante la presentación, se anunció que el borrador mágico de los Pixel, una función que permite eliminar elementos no deseados de la imagen, también estará disponibles para los usuarios de la plataforma.

Foto: Así es la nueva vista inmersiva de Google Maps para rutas que llegará a estas ciudades a finales de año. (Google)

Competencia para Samsung, pero a qué precio

Aunque en este I/O tocaba hablar y mucho de IA, también ha habido tiempo para presentar dispositivos. Concretamente, tres nuevos dispositivos se unen a partir de hoy al catálogo de Google. El único que de momento llegará a España será el Pixel 7A, una nueva versión del móvil más asequible de Google. Se trata de una renovación muy continuista y que bebe directamente del Pixel 7 y del Pixel 7 Pro lanzados el pasado otoño. Es un dispositivo con pantalla OLED de 6,1 pulgadas que mantiene el mismo diseño que sus hermanos mayores, aunque añade dos colores mas: un azul celeste y un rojo coral.

El chip que moverá este terminal será el Tensor G2, diseñado por los de Mountain View y fabricado por Samsung. En esta ocasión este procesador irá de la mano de 8GB de RAM, lo que supone un aumento de dos GB frente a su predecesor; y 128GB de almacenamiento. Incorpora una cámara doble (angular y ultra gran angular). La última novedad es la incorporación de carga inalámbrica. El Pixel 7A no ha podido escapar a la escalada de precios y su coste subirá 50 euros, hasta los 509 euros.

placeholder El Pixel Fold. Foto: M. McLoughlin
El Pixel Fold. Foto: M. McLoughlin

El evento ha servido también para que Google entre en una nueva categoría de producto, los teléfonos plegables; y vuelva al de las tabletas, unos dispositivos que hace tiempo había dejado atrás. El Pixel Fold es un móvil de 5,8 pulgadas que se despliega para convertirse en una tableta pequeña de 7,6 pulgadas. El móvil viene equipado con una cámara triple, de la misma forma que los Pixel Pro. El Fold de Google tendrá algunas funciones interesantes y no vistas antes en competidores como Samsung, Xiaomi o Huawei.

placeholder El Pixel Fold, desplegado. Foto: M. McLoughlin
El Pixel Fold, desplegado. Foto: M. McLoughlin

Una de ellas, probablemente la más interesante, es la función de interprete.El usuario escribe algo en la pantalla interior en su idioma y la pantalla exterior muestra el mensaje a nuestro interlocutor en el idioma que corresponda. Otras de las cosas es la de poder utilizar el móvil para poder tomar fotografías astronómicas sin necesidad de trípode. El Pixel Fold, de momento, se lanzará en EEUU, Alemania y Reino Unido a 1,799 dólares.

placeholder La Pixel Tablet. Foto: M. McLoughlin
La Pixel Tablet. Foto: M. McLoughlin

La Pixel Tablet es una propuesta bastante peculiar dentro de este mercado. Google incluirá una base de carga magnética que, además de recargar la batería, nos servirá para convertirlo en un altavoz inteligente cuando no lo estemos utilizando. Su pantalla será de 11 pulgadas y 2560 x 1600 pixeles de resolución y en su interior funcionará también con el Tensor G2, que también vendrá acompañado con 8GB de RAM y 128 o 256GB de memoria. Habrá que esperar para verla en España y, de momento, se estrena en Estados Unidos a un precio de 499 dólares.

El I/O, la cumbre anual de desarrolladores que Google, era hasta hace dos telediarios un evento muy importante dentro del gremio, pero en absoluto se veía como algo trascendental. La compañía lo utilizaba para anunciar novedades sobre Android, su buscador, Maps, Cloud y, más recientemente, muchos de los dispositivos que comercializa bajo los nombres de Pixel y Nest. También aprovechaba la ocasión y explicaba cómo estaba trabajando en computación cuántica y otros retos de futuro. Pero el de este este año se ha convertido en una cita crucial, una dicotomía entre puerta grande o enfermería, para los intereses de la multinacional de Mountain View y su posición de supremacía tecnológica en los próximos años.

Tasa Google