Spotify ha empezado a usar la IA para replicar y traducir voces
Varios 'podcasts' traducidos al español mediante Whisper (OpenAI) ya se pueden encontrar en la plataforma. La autenticidad de la voz es una muestra más de las posibilidades de esta tecnología
Daniel Ek ha anunciado una función absolutamente innovadora (Reuters/Shannon Stapleton)
Spotify será el primer servicio de música y podcasts en streaming que utilizará la inteligencia artificial para replicar las voces de los creadores de contenido. Para ello, ha llegado a un acuerdo de colaboración con OpenAI. La empresa propietaria de ChatGPT y Dall-E le brindará la posibilidad de utilizar su sistema automático de reconocimiento de voz (ASR, por sus siglas en inglés), que ha sido bautizado como Whisper.
Esta tecnología es capaz de crear una voz sintética realista a partir de una muestra bastante pequeña. En concreto, OpenAI habla de “solo unos pocos segundos”. Sin embargo, Spotify va a utilizar mucho contenido con el propósito de conseguir réplicas auténticas y naturales que permitan mantener las características distintivas del habla. El objetivo no es otro que el de traducir podcasts a otros idiomas.
Podcasters - what if I told you could offer your pod to any listener around the world, in their own local language but still keep it in your own voice? That’s the pilot we’re launching @Spotify!
It’s called Voice Translation and using AI, translates podcasts episodes into… pic.twitter.com/kYq0bgxJYq
La compañía dirigida por Daniel Ek empezó a trabajar en esta tarea mucho antes de realizar el anuncio. En concreto, eligió a los podcasters Dax Shepard y Monica Padman (Armchair Expert), Bill Simmons (The Bill Simmons Podcast), Steven Bartlett (The Diary of a CEO) y Lex Friedman (Lex Fridman Podcast). Ya hay varios episodios en la plataforma que han sido traducidos al español gracias al uso de Whisper.
Otros idiomas estarán disponibles pronto
La intención de Spotify es que esos episodios, que han sido previamente seleccionados, estén disponibles próximamente también en alemán y en francés. En principio, están disponibles tanto para suscriptores como para usuarios que utilizan la plataforma de forma gratuita, pero la compañía no ha indicado si esto cambiará en el futuro. Lo que sí afirmó a través del comunicado emitido es que “esto es solo el comienzo”.
The Wall Street Journal. Anne Steele y Sarah Krouse
Conviene decir Spotify ha llegado a un acuerdo con todos los podcasters cuyos contenidos han sido traducidos por IA a otros idiomas. Es más, avisa a los usuarios de que se ha usado este sistema en el propio título del programa y del episodio en cuestión. Algo muy importante si tenemos en cuenta que esta tecnología está generando problemas con los derechos de autor. Solo hay que recordar los casos de George R.R. Martin y de Stephen Fry.
Ahora bien, el objetivo de Spotify, como puede verse en el tweet publicado por Daniel Ek que hemos citado un poco antes, es poner esta herramienta a disposición de todos los creadores de contenido que ofrezcan sus podcasts en la plataforma. Lo que está por ver es si ellos sí que tendrán que pagar por utilizarla o si no. En cualquier caso, se trata de una oportunidad excelente para expandir horizontes comerciales.
Spotify será el primer servicio de música y podcasts en streaming que utilizará la inteligencia artificial para replicar las voces de los creadores de contenido. Para ello, ha llegado a un acuerdo de colaboración con OpenAI. La empresa propietaria de ChatGPT y Dall-E le brindará la posibilidad de utilizar su sistema automático de reconocimiento de voz (ASR, por sus siglas en inglés), que ha sido bautizado como Whisper.