Es noticia
Google libera una de sus funciones de IA más prometedoras: ya puede ver y entender lo que te rodea
  1. Tecnología
los ojos de gemini

Google libera una de sus funciones de IA más prometedoras: ya puede ver y entender lo que te rodea

A partir de ahora, los usuarios podrán hablar con Gemini Live de lo que ven en su pantalla o a través de la cámara. Es un paso fundamental para crear en Astra, su proyecto para crear un asistente universal

Foto: Foto: Efe.
Foto: Efe.

El pasado año, Google anunció en su conferencia anual un desarrollo bautizado como Proyecto Astra. Se trataba de un plan para crear un asistente universal que realmente entendiese el mundo que rodea al usuario y pudiese reconocer y responder sobre cualquier cosa con la que nos encontrásemos, viéndolo a través de la cámara del móvil o de unas gafas inteligentes.

Once meses más tarde, la compañía ha liberado una de sus funciones más prometedoras a la hora de sacar provecho de la inteligencia artificial en nuestros smartphones, lo que acerca un poco más el Proyecto Astra a la realidad.

A partir de ahora, Gemini Live, el modo de voz de la IA de Google, podrá dialogar con los usuarios sobre lo que están viendo a través de la cámara o en la pantalla del móvil. Esto es posible gracias a las capacidades multimodales de esta tecnología.

Por ejemplo, el usuario podrá sacar una foto de un cajón desordenado y pedirle a Gemini que le dé ideas para ordenarlo y clasificarlo. Se podrá compartir una presentación para que nos sugiera mejoras o hacer una foto a un código y preguntarle si encuentra errores. También se podrá charlar con este asistente mientras visitamos una tienda online y pedirle ideas para complementar un outfit. Y así una larga lista.

La función está disponible en 45 idiomas y, por ahora, llegará a los Pixel 9 de Google, así como a la serie S25 de Samsung.

El pasado año, Google anunció en su conferencia anual un desarrollo bautizado como Proyecto Astra. Se trataba de un plan para crear un asistente universal que realmente entendiese el mundo que rodea al usuario y pudiese reconocer y responder sobre cualquier cosa con la que nos encontrásemos, viéndolo a través de la cámara del móvil o de unas gafas inteligentes.

Google
El redactor recomienda