Es noticia
Meta acaba de lanzar un traductor de voz y es espectacular: así puedes usarlo
  1. Tecnología
IA MULTIMODAL SEAMLESSM4T

Meta acaba de lanzar un traductor de voz y es espectacular: así puedes usarlo

La herramienta está preparada para reconocer voz en hasta 100 idiomas diferentes. También tiene la capacidad de traducir hasta 36 idiomas con una pronunciación fluida

Foto: Meta acaba de lanzar un traductor de voces y es espectacular: así puedes usarlo (REUTERS/Dado Ruvic Illustration)
Meta acaba de lanzar un traductor de voces y es espectacular: así puedes usarlo (REUTERS/Dado Ruvic Illustration)

Poco se habla ya del metaverso. Meta, la empresa de Mark Zuckerberg, está centrada en otros proyectos y desarrollos, como un nuevo modelo de traducción y transcripción de IA multimodal. Se llama SeamlessM4T y ha sido presentado esta semana en el blog de IA de la empresa.

El objetivo es conseguir un modelo único que pueda realizar traducciones al momento, inspirado en el ficticio Pez Babel de la película La Guía del autoestopista galáctico. Con esta herramienta, que se distribuye bajo una licencia CC BY-NC 4.0 (con atribución y de carácter no comercial), Meta quiere colaborar en crear un entorno más conectado, ofreciendo mayor acceso al contenido multilingüe y a la comunicación entre personas que hablan diferentes idiomas.

Con SeamlessM4T, se pueden efectuar traducciones de voz a texto, de texto a voz, de voz a voz y de texto a texto. La herramienta está preparada para reconocer voz en hasta 100 idiomas diferentes. También tiene la capacidad de traducir voz a voz en hasta 36 idiomas, con una pronunciación fluida, más alejada de las voces robóticas habituales de las IA.

¿Para qué servirá esta nueva herramienta?

Como explica Zuckerberg en su perfil de Facebook, este nuevo modelo de IA multimodal permitirá que las personas puedan comunicarse, independientemente de si hablan varios idiomas diferentes, sin necesidad de conocerlos. El objetivo de Meta es implementar y habilitar con el tiempo esta herramienta de traducción y transcripción en Facebook, Instagram, WhatsApp, Messenger y Threads.

Foto: Mark Zuckerberg. (Reuters/Archivo/Facebook)

A su vez, Meta informa que han publicado los metadatos de SeamlessAlign, el conjunto de datos de traducción multimodal abierto más amplio hasta la fecha, con un total de 270.000 horas de muestras de voz y texto extraídas. Este proyecto ha sido todo un desafío, ya que los modelos existentes de traductores de voz a voz y de voz a texto tienen limitaciones en cuanto a idiomas se refiere.

Aunque esta herramienta todavía no está disponible para ser usada por el público general, los investigadores y desarrolladores tendrán acceso al proyecto. Además, cualquiera que lo desee, puede acceder a una demo desde un ordenador o smartphone, en la que puede grabar un pequeño fragmento de voz y este será traducido al idioma escogido. SeamlessM4T, un “todo en uno”, ha sido posible gracias al desarrollo previo de otras herramientas de Meta de traducción automática como Language Left Behind (NLLB), Universal Speech Translator y Massively Multilingual Speech.

Poco se habla ya del metaverso. Meta, la empresa de Mark Zuckerberg, está centrada en otros proyectos y desarrollos, como un nuevo modelo de traducción y transcripción de IA multimodal. Se llama SeamlessM4T y ha sido presentado esta semana en el blog de IA de la empresa.

Mark Zuckerberg Tecnología
El redactor recomienda