La última novedad de Gmail te adelanta el gran cambio tecnológico que va a revolucionar tu trabajo
La IA que nos llevan casi dos años vendiendo está a punto de entrar en una nueva fase: la de las herramientas que toman el control del PC por tí. La última novedad de Google, que depende de una ingeniera española, es un pequeño aperitivo
:format(jpg)/f.elconfidencial.com%2Foriginal%2F0a5%2F1fe%2F557%2F0a51fe5576093139ab001653755f4c72.jpg)
Aunque el teletrabajo parece estar diluyéndose de forma más o menos clara, hay otras cosas que trajo la pandemia al ámbito laboral que siguen muy vivas. Una de ellas es la sensación perenne que tienen muchos trabajadores de que las aplicaciones de mensajería instantánea han reemplazado al correo electrónico en buena parte de su día a día y de que WhatsApp ahora puede acabar siendo el nuevo Gmail.
“Es una evolución, digamos, normal y lógica. Los modos de comunicación cambian con cada generación y en cada momento”, reflexiona la zaragozana María Fernández Guajardo. Sabe bien de lo que habla. Con 25 años de trayectoria en Silicon Valley y tras pasar por empresas tanto de hardware como de software, ahora mismo es la directora de producto del correo electrónico más utilizado del mundo, el de Google.
“Nosotros también tenemos herramientas para adaptarnos a este nuevo entorno”, apunta. Emojis, respuestas tipo chat, mensajería instantánea… Enumera varias de las nuevas funciones que la plataforma ha ido lanzando en los últimos tiempos antes de asegurar que el correo electrónico no ha perdido ni una pizca de importancia. “Sigue siendo la interfaz fundamental cuando trabajas con gente del exterior de tu organización”, añade, a la par que recuerda una cifra: el servicio que ella dirige cuenta ya con 2.700 millones de usuarios en todo el mundo.
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fb86%2F9f7%2Fe12%2Fb869f7e12b9d084332bb49bda67175dd.jpg)
Además de mantener fresca la plataforma para que ninguna aplicación vaya ocupando su hueco, esta ingeniera afronta ahora una misión crítica: la de llevar la tecnología de moda, la inteligencia artificial generativa, a uno de los productos más populares de la compañía de Mountain View. Desde que ChatGPT irrumpió en escena a finales de 2022 se ha hablado y mucho de cómo los chatbots podían cambiar su imperio de las búsquedas. Pero hace también bastante tiempo que Google dejó entrever que la web no era el centro de esta pelea y que iba a llevar Gemini a todas partes y a todos los frentes.
El futuro del correo electrónico pinta bien
En el pasado I/O, la cumbre de desarrolladores que la multinacional celebra cada primavera para presentar sus novedades de software, mostró, entre otras cosas, el futuro que vislumbra para aquellos que utilicen Gmail. Aparna Pappu, una de las vicepresidentas de la multinacional encargada de Google Workspace, subió al escenario y pidió en primer lugar que le resumiera un hilo de más de diez correos que se había intercambiado con una empresa de reparaciones. Pocos segundos después tenía un pequeño texto con los puntos clave. La directiva no se acordaba de otros dos presupuestos que le habían dado, así que pidió a la IA que los buscase y los comparase.
Nuevamente, poco después tenía una respuesta donde se veían los precios y la disponibilidad de cada uno. La ventaja de esto es bastante evidente. En vez de bucear en su buzón, localizar los diferentes hilos, encontrar los datos exactos y luego compararlos, solo necesitó introducir una frase en la caja del chatbot y en unos segundos tenía el asunto despachado. Hubo una tercera demostración, incluso algo más sorprendente que las anteriores. Pappu le pidió a Gemini que rastreara sus recibos y le ayudara a organizarlos en una hoja de Spreadsheet, que es como se llama el Excel de los de Mountain View.
El sistema se lo devolvió sugiriendo que podía automatizarlo. Meses después de presentarlas, parte de esas funciones llegan a nuestro país. Google ha activado Gemini para Workspace en español y otros siete nuevos idiomas. Esto se va a traducir en un nuevo panel lateral que permitirá utilizar esta inteligencia artificial sobre aplicaciones como Gmail, Docs o Spreadsheets, entre otros. Cuando se le pregunta a María Fernández Guajardo si va a ser posible pedirle al sistema que nos haga algo parecido a lo que hizo Pappu con los recibos, responde que no tardará. “Todavía no, pero muy pronto. Es algo en lo que estamos trabajando ahora mismo”, responde la ejecutiva, que enumera algunas de las funciones que se liberan en esta primera fase.
Los trabajadores de empresas que utilicen la suite de Google podrán pedir a Gemini que les resuma los documentos de un proyecto, que les sintetice un hilo de correos o que les ayude a crear una plantilla de una hoja de cálculo. El sistema, antes de lanzarse en abierto, ha estado en pruebas en algunas empresas seleccionadas.
“Hemos encontrado que los departamentos que más recurren a ello suelen ser los departamentos comerciales, los de marketing o los de soporte al cliente, porque manejan un alto volumen de documentos”, comenta. Y ofrece un dato bastante relevante: las métricas de estos experimentos previos dicen que los trabajadores que usan la IA en su día a día han ahorrado 105 minutos por semana. “Nosotros no queremos que la gente gaste tiempo gestionando su correo o sus archivos”, explica la española, dando a entender que eso sería un fallo garrafal por su parte.
“Tenemos una tradición ya larga incorporando inteligencia artificial con este objetivo”, apunta. Señala funcionalidades que, por ejemplo, te ofrecen darte de baja de una newsletter cuando llevas varios días sin abrir ninguno de los boletines o con tarjetas que te resumen ese mail de Amazon destacando lo que importa: cuándo y a dónde llega el pedido en cuestión. “Esto es un paso más”.
Cuando se le pregunta si esta tecnología puede llegar a cambiar la interfaz del correo electrónico tal y como la conocemos, Fernández Guajardo es prudente y explica que el panel lateral es una solución interesante para abrir una ventana en una herramienta conocida por millones de personas que todavía no han “entrado en contacto” con la IA. “El cambio no se puede hacer de la noche a la mañana”.
Un paso intermedio para el gran cambio
Más allá de las posibilidades que incorporar los lenguajes de modelo ofrece a la ofimática para ahorrar tiempo en nuestros quehaceres diarios, las novedades de Gmail también sirven como pequeño aperitivo del cambio tecnológico que se está cocinando ahora mismo en los fogones de las grandes tecnológicas y que va a dar mucho que hablar en los próximos meses. El de inteligencias artificiales que puedan tomar el control de nuestros PC para hacer cosas que tendríamos que hacer nosotros manualmente, tirando del ratón y el teclado. Es lo que se han venido a llamar agentes de inteligencia artificial.
El concepto de los agentes se puso de moda la pasada primavera. Los responsables fueron dos. Por una parte, OpenAI con el lanzamiento de GPT-4o, un modelo de lenguaje multimodal que permitía al chatbot más conocido del planeta entender texto escrito, pero también audios, vídeos, fotos o lo que se muestra en una pantalla. Y por otra, Google con la presentación de Project Astra, un concepto de asistente que podría funcionar perfectamente en un móvil o unas gafas inteligentes interactuando con el mundo que les rodea.
Pero ha sido Anthropic, una startup fundada por exingenieros de OpenAI e invertida, entre otros, por Amazon, quien ha dado el siguiente paso. Hace unas semanas presentó una nueva entrega de su modelo de lenguaje, Claude 3.5 Sonnet, que incorporaba una función experimental llamada ‘Computer Use’, que le permitía imitar pulsaciones de teclas, clics y gestos del ratón. En resumen, emular a un usuario de carne y hueso.
:format(jpg)/f.elconfidencial.com%2Foriginal%2F162%2F0a9%2Fa66%2F1620a9a666712ccc6a30577c33b637df.jpg)
:format(jpg)/f.elconfidencial.com%2Foriginal%2F162%2F0a9%2Fa66%2F1620a9a666712ccc6a30577c33b637df.jpg)
“Entrenamos a Claude para ver lo que está sucediendo en una pantalla y luego usar las herramientas de software disponibles para llevar a cabo tareas”, escribió la compañía en su blog oficial, dando a entender que esto iba a acabar sirviendo para automatizar ciertos procesos. “Cuando un desarrollador le asigna el uso de un software y le da el acceso necesario, Claude mira las capturas de pantalla de lo que es visible para el usuario y luego cuenta cuántos píxeles vertical y horizontalmente necesita para hacer clic en el lugar correcto”. Esta semana, en Ignite 2024, la cumbre de desarrolladores de Microsoft, los de Redmond han hablado abiertamente sobre sus apuestas en esta vía. La firma dirigida por Satya Nadella ha asegurado que dentro de poco sus agentes de inteligencia artificial podrán funcionar las 24 horas del día “para revisar y aprobar devoluciones de clientes o revisar facturas de envío para ayudar a las empresas a evitar costosos errores en la cadena de suministro”.
Próximamente: desfile de agentes
Al principio, herramientas como ChatGPT o Bard ofrecían respuestas de texto con datos limitados temporalmente. Después, empezaron a llegar las herramientas que creaban videos, imágenes o ilustraciones con unas solas palabras. También aparecieron chatbots que podían hacer búsquedas en internet. Poco después llegaron los que podían entender cualquier formato multimedia y reconocer lo que veían en una pantalla y que además podían hablar de forma casi humana con nosotros. Ahora, como es el caso de Gemini para Workspace, aparecen los que pueden buscar información y entenderla en diferentes aplicaciones. Y por último, con Anthropic o Microsoft, los que pueden además hacer acciones en nuestro lugar.
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fa03%2Fc98%2Ff14%2Fa03c98f141068695ac46d31e713544f7.jpg)
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fa03%2Fc98%2Ff14%2Fa03c98f141068695ac46d31e713544f7.jpg)
En resumen, en apenas dos años, hemos pasado de aquel ChatGPT primigenio que nos podía decir cuáles eran las vías aéreas para unir España y Estados Unidos a herramientas que, con las instrucciones y permisos necesarios, podría llegar a comprarnos ese vuelo. Cabe recordar que ‘Computer Use’ es una función en pañales, cuyo uso todavía está muy restringido y conlleva un consumo de recursos brutal.
Pero dentro de poco, serán más. Se espera que en las próximas semanas, Google mueva ficha con Jarvis, el nombre en clave de un agente que podrá tomar el control de Chrome para buscarnos información, realizar compras o reservar un hotel. Según el medio especializado The Information, una versión previa podría estar al alcance de usuarios seleccionados en diciembre. Según Bloomberg, OpenAI, que recientemente presentó el buscador para ChatGPT, podría desvelar en enero un sistema similar. También se han filtrado los planes de Apple para que su sistema pueda entender lo que hay en pantalla y llevar a cabo acciones en distintas aplicaciones. La pregunta que ya surge es si las aplicaciones tal y como las conocemos seguirán siendo las mismas o nos tendremos que acostumbrar a interactuar y pedir las cosas a las cajas blancas de los chatbot que se dedicarán a navegar por internet y acceder a diferentes APIs para cumplir nuestras órdenes.
Aunque el teletrabajo parece estar diluyéndose de forma más o menos clara, hay otras cosas que trajo la pandemia al ámbito laboral que siguen muy vivas. Una de ellas es la sensación perenne que tienen muchos trabajadores de que las aplicaciones de mensajería instantánea han reemplazado al correo electrónico en buena parte de su día a día y de que WhatsApp ahora puede acabar siendo el nuevo Gmail.