Es noticia
Habla la creadora de la IA que dobla vídeos: "Lo de España ha sido una auténtica avalancha"
  1. Tecnología
Entrevista | Maria Chmir, CEO de Rask

Habla la creadora de la IA que dobla vídeos: "Lo de España ha sido una auténtica avalancha"

Rask AI, la aplicación de IA para doblar vídeos, está triunfando en España, donde ya ha conseguido alcanzar los 100.000 usuarios. Ahora han tenido que poner muro de pago para que no caigan sus servidores

Foto: Maria Chmir, CEO de Rask. (Cedida)
Maria Chmir, CEO de Rask. (Cedida)

"El estrés es una definición muy interesante para una startup, pero estamos muy contentos". Así resume Maria Chmir cómo han sido sus últimos días. Esta ucraniana afincada Barcelona es la fundadora y consejera delegada de Rask AI, la plataforma de doblaje de vídeos con inteligencia artificial que ha llenado internet de memes en los últimos días. Su lugar de residencia ha sido una mera casualidad —ella es nómada digital y la empresa tiene su sede en Dover, Estados Unidos— con el pelotazo que ha pegado estos días en España y, tras ello, en otros países hispanohablantes, como Argentina, Chile o Perú. "Los usuarios españoles están siendo los más activos", apunta en conversación con El Confidencial.

El Fary explicando cómo surgió La Mandanga, el mítico "droja en el Cola-Cao", momentos icónicos de Aquí no hay quien viva o Callejeros... La lista de memes creados estos días es interminable y para todos los gustos: hay desde un chiste de Chiquito de la Calzada hasta ElXokas enfadándose en una decena de idiomas. En cuestión de días, si no horas, prácticamente no ha habido un meme que se resista a Rask AI, que fue lanzada al público el pasado marzo. Y, claro, hasta los servidores de la aplicación lo han acabado notando.

"En España, el hype empezó por un influencer de Twitter", apunta Chmir en referencia a @norcoreano, que fue quien creó el vídeo de Belén Esteban y David Broncano en La resistencia que popularizó Rask AI hasta un nivel que ni sus propios creadores podían sospechar. "Ya estamos en contacto con él", dice sobre el tuitero. En la empresa ni siquiera esperaban que esta herramienta, pensada pasa usar en contextos educativos, acabara siendo la mejor palanca para el cachondeo en internet.

Sin embargo, eso no les preocupa y aprovechan para sacar pecho: "Cuando creas algo grande, hay veces que pasan estas cosas, porque la gente lo utiliza por su cuenta. Alguien vio que era divertido cambiar por completo el caso de uso y hacer memes virales. Habíamos visto patrones similares en otros países, pero España ha sido de los más exitosos. Se ha encontrado una nueva forma de usar Rask AI que es totalmente increíble, y a nosotros eso nos encanta".

Foto: Chiquito de la Calzada. (YouTube)

Es lo que explica que, según los datos aportados por la empresa, hayan alcanzado ya los 100.000 usuarios. "El viernes fue una auténtica avalancha", explican. Fue ahí cuando sus servidores se empezaron a sobrecargar y decidieron tomar cartas en el asunto. "Hemos tenido que fortalecer nuestro muro de pago porque la cantidad de usuarios era enorme, y nosotros ya teníamos unos usuarios previos que necesitaban procesar sus vídeos", continúan.

Ahora bien, ¿cómo funciona la aplicación? El proceso de creación de estas plataformas de traducción consta de cuatro partes. Primero, el paso de voz a texto, al que le sigue la traducción y, después, una de las partes más complejas: pasar del texto traducido con un tono de voz muy parecido al original. Por último, se procesa la imagen para que el movimiento de los labios se corresponda con la aplicación.

Para todo ello, es necesario que haya un entrenamiento previo de su modelo, de modo que sea capaz de clonar una voz con solo una pequeña muestra. Aquí hay que recordar que, con un vídeo de un minuto —el máximo permitido en la versión gratuita—, la aplicación consigue unos resultados que hasta no hace tanto solo se podían conseguir con decenas, sino cientos, de horas de audio, tal y como ocurrió en los casos de los asistentes de Google o Apple. Rask AI, además, es capaz de trasladar eso a más de un centenar de lenguajes.

Preguntada por este asunto, Chmir no da demasiados detalles y se limita a comentar que "hemos alcanzado esta calidad en los modelos gracias que ha habido unos grandes ingenieros de aprendizaje automático (machine learning) trabajando en ello durante tres años". Sobre el entrenamiento, explican que utilizan "distintas fuentes", donde cita bases de datos abiertas y otras aportadas por sus clientes "siempre que den su consentimiento". "Nos preocupamos por la política de seguridad de recopilación de datos, y podemos decir que es una de nuestras mayores ventajas en el mercado", asegura, consciente de que este punto se ha convertido en uno de los más críticos para el futuro de la IA.

"Esto no es solo para hacer memes"

Chmir hace énfasis en que, antes del boom de estos días, ya tenían un número importante de clientes en España, uno de los cinco países donde más penetración habían logrado en clientes de pago. Casualmente, le ha pillado trabajando desde Barcelona. "España tiene una buena localización entre Estados Unidos y China, así que puedes viajar y trabajar aquí sin problemas. Tanto yo como parte de mi equipo estamos aquí ahora. Antes he vivido en Ámsterdam, Georgia, Dubái... Somos nómadas digitales", remacha.

Eso sí, la sede de la empresa está en Delaware, donde está su matriz, Brask —de la que Chmir también es fundador y consejera delegada—, que tiene un enfoque más general sobre la IA generativa. Es el caso de Brask Doubles, una herramienta para crear vídeos de una persona "sin su presencia física, pero con su consentimiento explícito". Es decir, lo que se conoce como deepfakes, aunque en la firma prefieren hablar de "dobles digitales". "Nuestro próximo paso no será solo la transformación de contenidos, sino su creación desde cero en diferentes idiomas, sin costes de producción y de forma fácil", explican.

Foto: El director general de la tecnológica de Microsoft, Satya Nadella. (EFE/Sarah Yáñez-Richards)

Sea como sea, en Rask AI también hacen hincapié en que su aplicación "no solo se usa para hacer memes". "También trabajamos con instituciones serias que lo utilizan para crear material educativo", apunta Chmir, que recuerda que creció en una pequeña ciudad minera en Ucrania, donde "la lengua limitaba mucho las oportunidades que teníamos a nuestro alcance". "Por desgracia, aún hay un montón de información que sigue estando disponible solo en inglés. Creo que estamos ayudando a la gente a crear un nuevo mundo en el que, hables español o chino mandarín, puedas acceder a los mejores materiales educativos", dice, enfatizando que "se trata de eliminar la barrera del lenguaje utilizando la inteligencia artificial".

Sin embargo, son conscientes de que no hay nada como hacerse viral para dar conocer su tecnología y pescar en otros caladeros. "Conseguir tráfico y colaboraciones con influencers es uno de los aspectos más valiosos para nosotros, así que es algo en lo que ya estamos trabajando", explica Chmir. Es lo que ha hecho que hayan aprovechado el boom para apuntar alto y tirarle la caña a Elon Musk y que los integre en X, la plataforma antes conocida como Twitter. "Por desgracia, Musk aún no ha contestado", lamentan.

"El estrés es una definición muy interesante para una startup, pero estamos muy contentos". Así resume Maria Chmir cómo han sido sus últimos días. Esta ucraniana afincada Barcelona es la fundadora y consejera delegada de Rask AI, la plataforma de doblaje de vídeos con inteligencia artificial que ha llenado internet de memes en los últimos días. Su lugar de residencia ha sido una mera casualidad —ella es nómada digital y la empresa tiene su sede en Dover, Estados Unidos— con el pelotazo que ha pegado estos días en España y, tras ello, en otros países hispanohablantes, como Argentina, Chile o Perú. "Los usuarios españoles están siendo los más activos", apunta en conversación con El Confidencial.

Internet Inteligencia Artificial Innovación
El redactor recomienda