He usado varias IA para ahorrarme tiempo en diferentes tareas. Hay una opción mejor
Los 'chatbots' hacen muchas cosas, pero no siempre merece la pena usarlos cuando hay software tradicional que (de momento) hace lo mismo, más rápido y mejor
Ni ChatGPT ni Copilot, para estas tareas, aún no me han convencido.
Las IA son lo más. Permiten hacer de todo, hasta cosas que no sabes hacer. Eso es, al menos, lo que nos venden los pizpiretos entusiastas de ChatGPT y compañía, pero… ¿Realmente es tan fácil como lo pintan? Hemos puesto a prueba las IA más conocidas en una serie de tareas que van un poco más allá de resumir un artículo, generar una imagen fea, o responder una pregunta haciendo una búsqueda cruzada en Internet. Los resultados revelan que no es oro todo lo que reluce, ni es tan inteligente todo lo que se llama inteligente.
Antes de entrar en harina con cada una de las pruebas, te podemos adelantar dos cosas. La primera es que hay pocas tareas de las que hacen las IA que no se puedan hacer con aplicaciones dedicadas externas. La razón es simple. A fecha de hoy, la mayor parte de los desarrolladores de software que aspiran a vender su producto han integrado bajo el capó sus propios sistemas de IA para automatizar algunas de sus funciones. En otras palabras, puedes borrar el fondo de una foto con un chatbot, sí, pero Photoshopo Canva ya tienen esa opción también.
La diferencia entre un chatbot y una aplicación está en la mecánica a la hora de ejecutar la tarea. Las aplicaciones dedicadas suelen tener la función automatizada mediante un solo botón. En el ejemplo de arriba, probablemente encuentres un botón o menú llamado “Eliminar fondo”. Lo seleccionas, sigues las instrucciones pulsando aquí y allá con el ratón y ¡listo!
En los chatbots, como Gemini, Copilot o el propio ChatGPT, hay que tratar de convencer a la IA de que te haga lo que quieres mediante instrucciones de texto. Los connoisseurs de las IA llaman a estas instrucciones prompts para darse pisto, pero no son más que comandos redactados en lenguaje natural accesibles a cualquier persona alfabetizada.
Usar un chatbot para todo se siente como si, de repente, todas las aplicaciones que usas se hubieran fusionado en una enorme aventura conversacional de los 80, en la que hay que dar con el comando correcto para borrar el fondo del que hablábamos arriba sin tocar nada más.
Soy consciente de que las IA permiten crear automatismos para no tener que escribir tantos comandos, pero si necesito programar el chatbotpara que siempre me borre igual los fondos de la foto, casi mejor me compro un software ya programado. En algunos momentos, tratar de convencer a ChatGPT de que haga algo se siente como cuando tratabas de tener una conversación seria con ese amigo completamente fumado a las cuatro de la mañana.
El segundo punto a tener en cuenta es que, para obrar todos esos milagros que dicen algunos que hacen las IA, a menudo hay que rascarse el bolsillo en las versiones de pago. Hay chatbots, por ejemplo, que solo procesan audio en sus versiones bajo suscripción.
Por supuesto, OpenAI y las demás compañías de IA no viven del aire, y tienen derecho a desarrollar un modelo de negocio, pero a menudo los charlatanes de la IA obvian este dato a la hora de cacarear las virtudes de su nuevo juguete favorito. En definitiva, que a día de hoy puedes elegir entre pagar la versión premiumde Zoom para que te transcriba una reunión a texto, o pagar la versión premium de ChatGPT para que haga lo mismo, pero con una interfaz mucho más incómoda. El futuro era esto.
Probarse ropa virtual
El pasado mes de mayo, Google presentó en su conferencia de desarrolladores una herramienta llamada Try it on. Se trata de una nueva función de su plataforma de compras. Try it on está basada en Gemini. En concreto, se trata de un modelo de generación de imágenes especialmente diseñado para entender las proporciones del cuerpo humano y aplicar sobre ellas una prenda de ropa concreta. Dicho de otro modo más burdo, el usuario sube una foto de sí mismo a Try it on, y el modelo generativo se encarga de vestirle con diferentes prendas de ropa de manera realista para que pueda probárselas virtualmente.
Antes de que corras a probarlo, hay que aclarar que Try it on es una función completamente experimental. Para empezar, solo puede probarse desde Google Shopping en Estados Unidos (ni siquiera es accesible mediante VPN), y antes debes activar las funciones experimentales de Search Labs. Para continuar, no funciona con cualquier prenda de ropa. Tan solo aplica en modelos seleccionados de algunas marcas que podemos encontrar en Google Shopping.
¿Hay alguna otra herramienta específica similar a Try it on que pueda usarse ya desde España? Sí, pero ya voy advirtiendo que los resultados son más hilarantes que prácticos. Para empezar, si buscas Try it on en Google Play, te saldrá una app muy nueva con ese nombre y que supuestamente sirve para probarse ropa de forma virtual. Resulta que una empresa con sede en India llamada VistoureAI no ha tardado en capitalizar la idea de Google y ha lanzado un probador de ropa por IA.
El sistema funciona tanto desde la app, como desde la web oficial, aunque no descarto que mi correo electrónico ya esté en alguna base da datos de hackeo en las profundidades de Ankara. VistoureAI no especifica qué modelo de lenguaje lleva bajo el capó su aplicación. Muy probablemente sea alguna versión limitada de ChatGPT.
Copilot, ChatGPT y Gémini tratan de cambiar la indumentaria por una camisa haswáiana de gatitos. Los resultados son desiguales.
Por supuesto, puedes pedirle educadamente a ChatGPT que genere una imagen de tu persona con cualquier prenda que hayas encontrado en Internet, pero trabajar esto con el chatbot no es ni rápido, ni fácil, ni satisfactorio. El problema estriba en que el chatbot no se limita a ponerte la prenda, sino que corrige otros detalles que cree oportunos hasta dejar a la persona de la foto irreconocible. No me disgusta la idea de parecerme a Jake Gyllenhaal, pero me temo que necesito algo más que un par de filtros para llegar a su nivel.
Copilot, hace exactamente lo mismo, lo que resulta comprensible teniendo en cuenta que también se basa en los modelos de lenguaje de OpenAI. En ambos casos, hay que forcejear un rato con la IA, y a menudo pedirle que restablezca los cambios que no queremos para dejar nuestra cara original. Gemini es incluso más obtusa a la hora de entender lo que le pedía y acabó poniendo mi cara a la camisa, y no al revés.
Uses la IA que uses, probarse ropa virtualmente es posible, pero es necesario invertir un buen rato en lograr algo que no de risa. Incluso aunque demos con un resultado visualmente decente, los chatbots alucinan tanto, que no sirven para saber con seguridad si la prenda realmente nos quedaría bien o no, que se supone que es el objetivo último. Lo único que me han permitido sacar en claro las pruebas es que no me quedan bien las camisas hawaianas. Es bastante comprensible que Google esté trabajando en una herramienta específica para probarnos ropa, así sea con el noble propósito de vendérnosla. Algo me dice que Amazon no tardará en ir detrás.
Transcribir reuniones
Pasar a texto una hora y pico de conversación es una de las tareas más tediosas que existen. Lo sé con conocimiento de causa. Son casi treinta años grabando entrevistas para luego tener que transcribirlas. Los sistemas de transcripción automática no son nada nuevo, pero las IA los ha democratizado hasta el punto de hacerlos ubicuos. ¿Necesitas tener por escrito el contenido de esa reunión por Zoom? No hay problema... siempre y cuando prepares la cartera.
En el caso concreto de Zoom no hay ni que salir de la propia app. La compañía ofrece servicio de transcripción por IA desde hace un par de años. Eso sí, para acceder a esa función hay que tener alguna de las cuentas de pago. Microsoft Teams también cuenta con servicio de transcripción integrado en sus planes de empresa y para usuarios premium.
También podemos recurrir a servicios externos como Trint, Sonix, Krisp, o TurboScribe, pero todos ellos tienen algún tipo de limitación y planes de pago. Sonix, por ejemplo, ofrece 30 minutos gratuitos. A partir de ahí cobra por hora de transcripción, o de traducción. La app tiene planes mensuales y anuales que reducen los precios si vas a darle un uso muy habitual.
Krisp puede usarse durante 14 días. A partir de ahí, los planes comienzan en 8 dólares mensuales, pero incluyen una buena colección de servicios que van desde grabación de audio hasta cancelación de ruido, identificación de participantes y hasta corrección de acentos. La versión gratuita de TurboScribe ofrece tres transcripciones diarias de un máximo de 30 minutos cada una. La versión ilimitada, que incluye traducción en 134 idiomas, cuesta 10 dólares mensuales.
Cockatoo es otro excelente servicio de transcripción que ofrece hasta 10GB de archivos mensuales de forma gratuita. El problema es que esta versión gratuita está fijada en inglés de forma que incluso los audios en español los transcribe directamente al idioma de Shakespeare. Para desbloquear todas sus funciones e idiomas hay que pagar 9,99 dólares al mes.
¿Qué añaden las IA a todo este panorama? Pues añaden el poder transcribir llamadas gratuitamente... siempre y cuando te armes de santa paciencia. Para empezar, necesitas grabar la llamada para poder suministrar al chatbot de turno un archivo de audio en algún formato reconocible como MP3 o M4A. En principio, esto no debería ser un problema. Todas las apps de llamada tienen la función de grabar audio, siempre y cuando los participantes estén de acuerdo en ello. Si el archivo de audio es muy pesado, es posible que ChatGPT te pida que lo cortes en partes de un máximo de media hora. La transcripción también lleva tiempo, sobre todo si la realizas desde una cuenta gratuita.
Copilot no está por la labor de procesar archivos de audio hoy.
Todo ello suponiendo que puedas subir el archivo. No es raro que las versiones gratuitas de GPT no permitan subir archivos de audio en algunos momentos. Para asegurarnos de poder hacerlo siempre, necesitamos la versión Plus o GPT-4o. Copilot sufre del mismo problema y suele contestar con evasivas hasta qué le preguntas directamente por qué no puedes subir un MP3. Gemini tropieza en la misma piedra, reconociendo que aún no puede transcribir audio directamente.
En definitiva, que si quieres transcribir audio, las IA no te van a ser de mucha ayuda a menos que pagues por ellas. De todos modos, es bueno recordar que si lo que buscas no es transcribir conversaciones enteras, sino solo tus propias notas de voz, te basta con Google Keep o con Microsoft OneNote. Ambas aplicaciones de notas transcriben tu voz a texto de manera automática a medida que vas grabando la nota de voz.
En teoría, no hay límite a la duración de estas notas, pero en ambos casos se graban en la nube, así que puede que el almacenamiento en tu cuenta se vea resentido. Google especifica un límite de 30.000 caracteres por nota, y Microsoft 90 segundos de audio, o 300 minutos de transcripción al mes si cuentas con una cuenta Microsoft 365.
Hacerte entender en otro idioma
Google Translate lleva con nosotros un tiempo, pero pronto será más útil que nunca gracias a la IA. Google está trabajando en inyectar a la app una buena dosis de Gemini para hacer su traducción aún más potente. Entre estas nuevas funciones estará la posibilidad de resumir las traducciones o de ofrecer versiones alternativas para tratar de hacerlas más comprensibles. También se podrá modificar el tono, y hasta añadir acentos regionales específicos.
Todo esto, sin embargo, aún no se ha hecho realidad. Lo que no quita que Google Translate no sea una auténtica joya de aplicación que nos permite traducir textos, voces y hasta textos dentro de imágenes entre una plétora de idiomas. En dispositivos como los Píxel recientes hasta es posible traducir conversaciones en vivo. Muchos dispositivos cuentan también con funciones como la traducción instantánea de partes de la pantalla solo seleccionando el texto con el dedo.
Las IA también son potentes máquinas de traducir, pero su experiencia de uso no aporta mucho sobre la de los traductores de Google o Microsoft. Tanto ChatGPT como Gemini, o Copilot pueden configurarse como intérpretes de traducción más o menos instantánea, pero con un matiz: solo en texto. La cosa va más o menos así: le decimos al chatbot un idioma de entrada y salida, y este transcribe lo que le decimos de viva voz, y nos los devuelve traducido como texto. Las frases que subamos se demoran unos segundos dependiendo de la conexión, y de la carga de los servidores, y su calidad es buena siempre y cuando hablemos con claridad y no compliquemos mucho las frases.
Si lo que buscamos es un traductor que entienda nuestra voz y responda con una traducción hablada en otro idioma, y en tiempo real, la mejor alternativa gratuita a fecha de hoy sigue siendo el modo conversación de Google Translate. Además está disponible tanto vía web como por extensión del navegador o aplicación independiente. Hay dispositivos como los Timekettle que llevan este servicio a otro nivel con modos offline, diferentes voces y una conversación mucho más ágil, pero no son precisamente baratos. La traducción por IA aún no tiene la potencia y la rapidez como para quitarles el trabajo.
Encontrar los mejores precios
El de los economía es un mundo en el que la IA se vuelve especialmente vaporosa. En teoría, deberíamos ser ya capaces de usar chatbots para que nos avisen cuándo baja de precio ese móvil que queremos comprarnos o que nos toquen en el hombro cuando sea el mejor momento de hacerse con un pasaje de avión. Curiosamente, la tarea es más compleja de lo que parece. ¿Por qué? Pues porque los chatbot trabajan con la información que encuentran en Internet, que es la misma información que proporcionan los vendedores.
En el caso de los billetes de avión, es la información de Amadeus, de las aerolíneas, o de los comparadores de vuelos y hoteles. El que proporciona esa información sigue teniendo la sartén por el mango, bien la consultemos desde la página web, o usando un chatbot. Es más, muchos vendedores ya están usando la IA para programar sus ofertas de manera que nos resulten más atractivas. Tratar de usar la IA para comprar más barato es, en definitiva, una lucha desigual.
En cuento a la interfaz. Sigo teniendo mis reservas. Entiendo que ChatGPT puede buscar más rápido porque consulta simultáneamente en Kayak, Tryp, Google Vuelos y Skyscanner, pero tener que describir cada uno de los detalles de un vuelo me parece más tedioso que entrar en Skyscanner, y simplemente seleccionar con clics lo que necesito. Eso por no mencionar que, para encontrar buena información, es preciso ser muy específico en los detalles.
Encontrar buenos precios requiere de no pocos prompts.
Ni ChatGPT ni Gemini pueden rastrear precios directamente. Si lo que necesitas es saber cuándo baja de precio esa tableta que te gusta, la mejor alternativa es instalar una extensión del navegador como las de Honey (una herramienta de monitorización de precios de Paypal), CamelCamelCamel, o Keepa. Google también ofrece su propia herramienta de seguimiento de precios para Chrome, pero no siempre está disponible para todos los productos y tiendas en línea.
Redecorar la casa
Si podemos probarnos ropa sin probárnosla, tiene que ser posible decorar la casa sin gastarnos un dineral en comprar lámparas y alfombras, ¿no?. La función, efectivamente, existe desde hace tiempo, y es más útil de lo que parece, porque permite hacer cosas tan básicas como cambiar el color de una pared, o tan complicadas como redecorar toda una estancia al estilo nórdico.
El matiz, a la hora de usar chatbots, es el mismo que ocurría en el momento de probarnos ropa. Si ya es complicado explicarle a GPT que solo quieres que te ponga una camisa encima sin hacerte una reconstrucción maxilofacial completa, imagina el proceso en un salón comedor.
De nuevo, y ya es tendencia en este artículo, es mejor usar aplicaciones que integran IA en sus funciones, que tratar de usar una IA a pelo. Redecorar una habitación o una casa entera es un proceso tan visual que las mejores herramientas, aunque usen algoritmos, son las más visuales. AI Home Design, por ejemplo, parte de una simple foto de una habitación. A partir de ahí se pueden quitar y poner muebles, aplicar estilos a todo según el tipo de habitación, y hasta probar los resultados con diferentes niveles y estilos de iluminación. Las herramientas de IA son accesibles desde la web con solo registrar nuestro correo. Como en casos anteriores, acceder a funciones avanzadas o eliminar marcas de agua requiere pagar.
Las IA tienen un concepto muy liberal del espacio.La ubicación de las ventanas es irrelevante.
MyAIRoomDesigner es otra plataforma con las mismas funciones de decoración por IA, pero el servicio es de suscripción y cuesta 15 dólares al mes en su versión más barata. Hay otras opciones como RoomGPT que permiten modificar una o dos fotos de forma gratuita, pero alucinan tanto que no respetan ni la posición de las ventanas.
Mientras tanto, ChatGPT cambia el color de las paredes, pero aprovecha para redecorar otros elementos sin preguntar como hizo con mi cara al principio de este artículo. Copilot se atasca frecuentemente en el proceso. En cuestiones de decoración, Gemini es la que más rápido responde y la que mejor da con el punto a la hora de respetar los espacios. De todas maneras, todos los chatbots acostumbran a cometer errores como eliminar elementos que no pueden obviarse porque son estructurales. Tratar de corregir esos errores requiere de tiempo, paciencia... y muchos prompts.
Llego al final de esta batería de pruebas con la sensación (una vez más) de que el becerro de oro de las IA no es tan revolucionario como nos lo pintan, y que se sustenta demasiado en algunas aplicaciones generativas que sí son nuevas (básicamente crear texto, fotos o vídeos), pero cuya legalidad es dudosa, yque no aportan nada realmente necesario a la sociedad aparte de servir de bálsamo a personas con complejos artísticos y procrastinadores en general. Eso sí, como plataforma de desarrollo de software, las IA tienen un brillante futuro a la hora de hacer que las aplicaciones que usamos cada día sean cada vez más útiles.
Todo esto me recuerda un poco a los albores de los sistemas operativos visuales. En los 90, saber de MS DOS te permitía hacer cualquier cosa en tu PC, pero la mayor parte de usuarios encontró más conveniente poder copiar un archivo de una carpeta a otra simplemente arrastrándolo dentro de un entorno gráfico en lugar de tener que escribir una línea de comandos de texto sobre una pantalla negra. A las IA les pasa un poco lo mismo que a tantas otras tecnologías. Son mucho mejores cuando son invisibles, y no tienes que lidiar directamente con ellas.
___________________
El Confidencial elabora estas reviews, comparativas y guías siguiendo un criterio estrictamente editorial. El equipo detrás de ¿Me Lo Compro? tiene en cuenta tendencias, actualidad del sector, interés de la audiencia, así como criterios de calidad y precio para la elección de los productos y servicios que analiza. Las muestras han sido facilitadas por las compañías de manera temporal, sin ningún tipo de contrapartida, compromiso de publicación o beneficio de cualquier otra naturaleza. El texto incluye una selección de botones/enlaces para comprar el producto al menor precio posible. El Confidencial puede generar ingresos por las ventas de estos productos, pero la inclusión de estos enlaces cumple una mera función de servicio al lector dentro de un contenido periodístico. El sistema de afiliación y la publicidad programática son las únicas vías de monetización de la sección ¿Me Lo Compro?, además de las suscripciones al periódico que generan estos contenidos. En ningún caso se publican contenidos o análisis patrocinados.
Las IA son lo más. Permiten hacer de todo, hasta cosas que no sabes hacer. Eso es, al menos, lo que nos venden los pizpiretos entusiastas de ChatGPT y compañía, pero… ¿Realmente es tan fácil como lo pintan? Hemos puesto a prueba las IA más conocidas en una serie de tareas que van un poco más allá de resumir un artículo, generar una imagen fea, o responder una pregunta haciendo una búsqueda cruzada en Internet. Los resultados revelan que no es oro todo lo que reluce, ni es tan inteligente todo lo que se llama inteligente.