He hablado con el nuevo ChatGPT. Es el 'secretario' definitivo, pero tiene un gran riesgo
He probado el nuevo modo avanzado de voz de ChatGPT y me he encontrado con una herramienta que deja muy atrás todo lo que había hasta ahora. Sus posibilidades te hacen levantar las cejas, la pregunta es a qué precio
:format(jpg)/f.elconfidencial.com%2Foriginal%2F89c%2F501%2F87d%2F89c50187d3ceeb254316762cb88d0e9f.jpg)
ChatGPT lo ha cambiado todo. Tan solo dos meses tras su lanzamiento ya alcanzaba los 100 millones de usuarios activos, convirtiéndose en la app de más rápido crecimiento de la historia. Ahora tiene el doble. En aquel entonces, 2022, nadie atisbó ni por casualidad en lo que iba a convertirse. Ni mucho menos imaginar que íbamos a vivir una experiencia como la que nos ha ofrecido el nuevo modo avanzado de voz que ha lanzado OpenAI, aún no disponible en España, pero accesible con una VPN.
Apenas bastan unos minutos para darse cuenta de que lo que nos encontramos es una herramienta que deja muy atrás todo lo que había hasta ahora por varios motivos. Lo primero, el nuevo modelo es capaz de mantener una conversación fluida con el usuario. Es decir, se acabó lo de pulsar al botón cada vez que quieres hablar. Podríamos decir que se trata de una “llamada” permanente en la que puedes interrumpir al asistente cuando te venga en gana, como si fuera una persona que tienes al teléfono. Segundo, se siente mucho más humana en todos los sentidos, hasta en la forma de hablar y pronunciar, lo que aporta cierta “cercanía” que antes no existía. Y tercero, está casi lista para convertirse en el asistente que todo el mundo va a necesitar en su día a día.
"Espero que pienses que valió la pena la espera", decía Sam Altman, director ejecutivo de OpenAI, en una publicación de X hace unas semanas. La compañía de IA quiere que todos estemos usando su IA a diario en 2025, a pesar de los imperantes temores de privacidad. Algunos expertos advierten de otras oscuras consecuencias: que la gente se enganche y piense que realmente el sistema es su “amigo”. Las nuevas posibilidades que ofrece te hacen levantar las cejas, pero la pregunta es a qué precio.
Para probar esta nueva función hay que tener algunas cosas en consideración. Hay que actualizar a la última versión de la app, usar una VPN si resides en algún país de la Unión Europea, ya que en el continente aún no está disponible, y crear un nuevo chat diferente a los que tienes ya abiertos. A la derecha de la barra de texto y del icono del micrófono, deberías ver otro con forma de onda. Al pinchar, sabrás que tienes acceso a la nueva función si aparece un mensaje emergente de “Modo avanzado”. Escucharás un pequeño sonido y un círculo en el medio de la pantalla se transformará en una animación de color azul y blanco similar a un planeta.
— Soy Arbor, en qué puedo ayudarte.
Nada más iniciar la conversación, una pantalla te pide que selecciones una voz que sea de tu agrado. Hay nueve predeterminadas, las cuatro que ya existían y cinco nuevas: Arbor, Maple, Sol, Spruce y Vale. Ninguna de ellas suena robótica o artificial, sino que posee cierta cadencia, inflexiones, velocidad y emoción que la hace parecer más humana. Ahora, incluso puede imitar voces, acentos y entonaciones a un grado asombroso. De hecho, si no te gusta lo que estás escuchando, puedes pedirle que hable de otra manera, o que lo haga más rápido o más lento.
:format(jpg)/f.elconfidencial.com%2Foriginal%2F50c%2Fa38%2F59a%2F50ca3859a8bd28b5530d419614496106.jpg)
:format(jpg)/f.elconfidencial.com%2Foriginal%2F50c%2Fa38%2F59a%2F50ca3859a8bd28b5530d419614496106.jpg)
Lo más increíble es la fluidez. Aquello de “Ok, Google”, ha pasado a mejor vida. Tanto, que he empezado a entender por qué algunas personas llaman a esto “acompañante”. Durante mis pruebas, simulé diferentes escenarios en los que quería que el asistente me ayudara. Por ejemplo, le dije que tenía una reunión de trabajo en 30 minutos sobre cómo mejorar una plataforma web y que necesitaba que me preparara una lista de puntos que mencionar. Sin embargo, mientras me iba citando cada uno de ellos, le interrumpí para decirle que me había llamado mi jefe y que esa reunión se había anulado, que ahora tenía que irme pitando a una mesa redonda presencial en Gran Vía con algunos inversores, que me preparara un guion para coordinarlo: “Claro, aquí tienes una presentación que puede ayudarte”.
— Está lloviendo y hay un tráfico horrible. ¿Cómo llego hasta allí más rápido?
— La linea 3 de Metro es la forma más rápida de…
— Perdona, puedes decirme algún sitio para tomar café de camino, estoy somnoliento.
— Claro, te aconsejaría acercarte a Café de Oriente, tienen un capuccino excelente.
— Puedes, mientras, pasarme un texto para enviarle a mi jefe sobre los resultados financieros. Te envío un PDF para que lo resumas. Está en inglés, tendrás que traducirlo también.
En unos segundos tenía las indicaciones para ir a una dirección, una recomendación de cafetería y una presentación corporativa lista para enviar a mis superiores. ChatGPT no es perfecto, pero su precisión también reside en el modo en el que le haces tú las preguntas. En algunas ocasiones, se siente como si tuvieras un centro de atención al cliente al teléfono, solo que sin largas esperas ni esa maldita musiquita infernal de fondo. Y no creo que haya arañado ni la superficie de lo que es posible hacer. Por ejemplo, si voy a un supermercado, podría ir pidiéndole sugerencias de ingredientes o recetas. Si me voy de viaje, puedo ir haciéndole fotos a las cosas que veo y preguntándole. Sería como tener una audioguía que viaja conmigo todo el tiempo. Al ser tan natural y receptivo, con la capacidad de interrumpir mencionada, cambia todo considerablemente.
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fb3b%2Ffb6%2F13e%2Fb3bfb613e19cee1ef3a267fddb317260.jpg)
Por supuesto, aún hay pequeños fallos: alucinaciones, imprecisiones… Durante algunos segundos se quedaba en silencio o es la IA quien me interrumpe a mí porque no ha recibido bien mi mensaje. Dependiendo de la pregunta, la latencia puede ir de medio a 2 segundos. Algunos de estos errores pueden estar causados por un fallo de conexión a internet, aunque un portavoz de la empresa ha dicho que varias correcciones en los próximos días podrían solucionar muchos de estos problemas. También es bastante molesto que no puedes pasar de una conversación de texto con ChatGPT al modo de voz avanzado, ni puedes llevar una conversación de voz estándar al modo avanzado.
Los “otros problemas” de todo esto
OpenAI fantasea con la idea de que ChatGPT se convierta en algo habitual en 2025, como lo es WhatsApp en occidente. Pero, a la par que intenta aumentar sus ingresos con una demanda cada vez mayor, también le pesa publicar informes de seguridad en los que advierte de que los usuarios podrían volverse emocionalmente dependientes de la función, de que empiecen a reemplazar sus relaciones personales por hablar con una máquina. No es algo que diga un internauta conspiranoico, lo dice la propia empresa. Pero OpenAI no es la única. A Anthropic, que desarrolla el modelo de IA Claude, no le tiembla el pulso al publicitar su herramienta directamente como un "amigo".
Anthropic: safety is #1 priority
— Ben Brooks (@opensauceAI) October 8, 2024
Also Anthropic: pic.twitter.com/JhHqrKxDIf
Por otro lado, cuando le pedimos a la herramienta que responda preguntas o realice tareas, podemos estar entregando información confidencial y poniéndola en manos de terceros. Ya sea que le pidamos que revise una hoja de resultados financieros o que analice mi dieta diaria, estas indicaciones ya formarán parte de la base de datos de OpenAI. Y eso significa que se pueden utilizar para entrenar aún más la herramienta e incluirlos en las respuestas a las indicaciones de otras personas.
Más allá de esto, OpenAI recopila ingentes cantidades de información del usuario. Según la política de privacidad de la empresa, guarda la dirección IP de los usuarios, el tipo y la configuración del navegador, y datos sobre las interacciones de los usuarios con el sitio, incluido el tipo de contenido con el que interactúan los usuarios, las funciones que utilizan y las acciones que realizan. También actividades de navegación. Sorprende que la empresa declare de forma tan trivial que puede compartir la información personal de los usuarios con terceros no especificados, sin informarles, para cumplir con sus objetivos comerciales. Vamos, que no podemos olvidarnos que, al final, OpenAI es una empresa privada cuyos intereses económicos no necesariamente tienen por qué alinearse con el bien común de la sociedad.
:format(jpg)/f.elconfidencial.com%2Foriginal%2F1a6%2Fadb%2Fe7b%2F1a6adbe7b6e93e6eadaf2d720635312c.jpg)
:format(jpg)/f.elconfidencial.com%2Foriginal%2F1a6%2Fadb%2Fe7b%2F1a6adbe7b6e93e6eadaf2d720635312c.jpg)
Recordemos que el pasado de la empresa no está exento de polémicas. En mayo, cuando reveló por primera vez su asistente de voz, se enfrentó a duras críticas por emplear una voz que sonaba muy similar a la de Scarlett Johansson. Esto llevó a la actriz a amenazar con llevar a cabo acciones legales. Desde entonces, se le ha acusado a la empresa no solo de robar voces, sino de haber pescado información y contenido por toda la web sin permiso para entrenar sus modelos de IA.
Ahora quieren completar una ronda de financiación de 6.500 millones mientras negocian con Microsoft, Nvidia, SoftBank y las firmas de capital de riesgo Thrive Capital y Tiger Global. Necesitan convencer a los inversores de que son superiores a sus rivales Google, Meta o Anthropic. Los primeros han lanzado su propia función de voz Gemini Live y funciona extremadamente bien. Meta presentó otro asistente con las voces de algunas celebridades. Desde que la IA irrumpió en nuestras vidas, el mercado se ha vuelto completamente caótico. El dinero va y viene de un lado a otro mientras usuarios e inversores tratan de aceptar si este realmente es el futuro que la tecnología nos aguardaba. Yo, de momento, me subo al tren. Lo que no tengo claro es en qué estación lo hago.
ChatGPT lo ha cambiado todo. Tan solo dos meses tras su lanzamiento ya alcanzaba los 100 millones de usuarios activos, convirtiéndose en la app de más rápido crecimiento de la historia. Ahora tiene el doble. En aquel entonces, 2022, nadie atisbó ni por casualidad en lo que iba a convertirse. Ni mucho menos imaginar que íbamos a vivir una experiencia como la que nos ha ofrecido el nuevo modo avanzado de voz que ha lanzado OpenAI, aún no disponible en España, pero accesible con una VPN.