El nuevo invento de OpenAI es como tomarse un 'tripi' pero va a cambiar el futuro de la IA
He probado Sora para crear vídeos ultrarrealistas y me he encontrado con una herramienta que mira por el retrovisor a todo lo que había hasta ahora. Sus posibilidades son infinitas, aunque a veces es como estar drogado
:format(jpg)/f.elconfidencial.com%2Foriginal%2F1a2%2F905%2F7d4%2F1a29057d46c34e19063afea5e70af765.jpg)
Sora ha llegado pisando fuerte. OpenAI lanzó la semana pasada su nuevo modelo de inteligencia artificial generativa de vídeos y desde entonces internet se ha plagado de gatos haciendo malabares, enanos con cara de Elon Musk bailando en Marte o de Abraham Lincoln bebiendo chupitos en una discoteca. Desde que la startup presentó su nueva herramienta hace casi 10 meses, se ha generado muchísima expectación en torno al lanzamiento y, por fin, el producto final ha desembarcado. Aunque aún no está disponible en Europa, hemos tenido acceso a través de una VPN. Y lo que podemos decir tras varias horas de uso es que es una tecnología que puede cambiarlo todo. Para bien o para mal.
Los primeros días tras el lanzamiento han sido complicados para la compañía, ya que la demanda fue tan grande que los servidores colapsaron y OpenAI se vio obligada a suspender temporalmente la creación de nuevas cuentas. Dejando de lado los problemas técnicos, apenas bastan unos minutos de uso para darse cuenta de que lo que nos encontramos es una herramienta con muchos puntos fuertes pero también muchas debilidades.
En primer lugar, tenemos una nueva interfaz dedicada exclusivamente a Sora, por lo que para entrar no hace falta pasar por ChatGPT. Sin embargo, el funcionamiento es casi idéntico: envías un prompt y en cuestión de segundos el sistema te devuelve un vídeo generado con las indicaciones que le has dado.
— "Crea un anuncio publicitario para una marca de comida para perros en el que aparezca un Golden Retriever".
El resultado es muy decente pero, sobre todo, muy realista. Y ese es precisamente el punto fuerte del modelo: el hiperrealismo. En comparación con otros softwares basados en IA disponibles como Runway Gen-2, Sora se desenvuelve extremadamente bien, aunque le demos indicaciones muy básicas y escuetas. De hecho, cuanto más simple sean, mejor responde. El modelo parece entender lo que tenemos en mente, tal y como hace ChatGPT. Los animales de compañía son una de las cosas que mejor parecen dársele tras el testeo realizado. Lo mismo sucede con los primeros planos, la herramienta es toda una experta simulando la fisionomía humana cuando se le piden planos detallados, como de los ojos. Aquí otro ejemplo:
La interfaz es intuitiva, principalmente porque aún no dispone de demasiadas funciones, pero algunas de ellas son interesantes. Por ejemplo, te permite cargar tus propios vídeos para trabajar sobre ellos o combinarlos con creaciones propias. También hay un botón de estilo que incluye opciones como "Stop Motion" o "Cine negro", al que poco a poco se le irán añadiendo más estéticas. Por último, cuenta con funciones básicas de edición de vídeo, para cortar los clips o mezclarlos, y con un modo "Storyboard" para añadir diferentes ritmos o instrucciones como si de un guion de cine se tratase.
Sora estará disponible para quienes dispongan de una cuenta Plus de ChatGPT sin coste adicional. De esta manera puedes generar hasta 50 vídeos con una resolución de 480p o alrededor de 20 vídeos con una resolución de 720p al mes. Sin embargo, existe un plan Pro que incluye una cantidad ilimitada, una resolución de hasta 1080p y 20 segundos de duración. Eso sí, el precio es bastante elevado: 200 euros. Según ha anunciado la compañía, están trabajando en modificar los precios y personalizarlos según diferentes tipos de usuarios de cara al año que viene.
En general, he quedado bastante sorprendido con los resultados, sobre todo por la rapidez del modelo, que es capaz de generar vídeos de alta calidad en tan solo 3 segundos. Sin embargo, peca de los mismos errores que decenas de otros modelos de IA generativa como Midjourney o Adobe Firefly. En algunas pruebas, los objetos chocan y se atraviesan unos con otros. Las piernas son otra fuente importante de problemas para Sora. Cada vez que un humano tiene que caminar durante varios segundos, pierde autenticidad. En el video anterior, había pedido que creara a un alpinista subiendo el Everest y el movimiento de caderas es digno de Michael Jackson.
En este otro caso, queríamos simular la escena de un agradable paseo navideño por un mercadillo de Nueva York y vemos como, literalmente, un hombre negro que pasea con una mujer se transforma en un hombre blanco y se va con dos chicas diferentes. Una verdadera ida de olla que demuestra que aún faltan muchos arreglos por hacer.
Cambios que, sin duda, llegarán cuando menos lo esperemos. Cuando GPT-1 hizo aparición en 2018, muchos lo criticaron por fallar más que una escopeta de feria y, seis años después, millones de personas lo usan a diario. No está garantizado que esto vaya a sucederle también Sora, pero sólo con lo que hemos visto, apostaría a que sí. A continuación otro vídeo, esta vez una visión realista de un monje budista meditando en un templo. El movimiento del humo es realmente fascinante.
En los últimos años, hemos sido testigos de la proliferación de modelos de IA generativa de imagen, pero el vídeo es algo que se ha hecho esperar. Meta anunció recientemente su propia herramienta de texto a video, Movie Gen. Y Google dio acceso a Veo a un número limitado de usuarios el mes pasado. Pisar el acelerador en la construcción de estas herramientas ha llevado a las grandes tecnológicas a ser demandadas por usar contenido público en internet sin permiso.
Sora acaba de llegar y tampoco se libra. A los pocos días de hacer aparición, OpenAI ha sido acusada de haber entrenado su modelo con retransmisiones de Twitch. Hasta el punto que si le pides que cree una escena de un streamer en su casa, el resultado es una copia pocha del famoso creador de contenido español Auronplay. La exdirectora de tecnología de OpenAI, Mira Murati, nunca llegó a negar rotundamente que Sora se hubiera entrenado con contenido de otras redes sociales como YouTube, Instagram o Facebook. En las especificaciones técnicas de Sora, OpenAI reconoce que utilizó datos “disponibles públicamente”, junto con datos con licencia de bibliotecas de medios como Shutterstock, para desarrollar la herramienta.
En medio de esa tormenta, otro huracán está arruinando la innovación de empresas de IA como OpenAI, y son las malas prácticas. En los últimos meses, han aparecido miles de deepfakes sexuales. OpenAI ha bloqueado de serie la desnudez y la violencia en Sora, pero el contenido que favorece el abuso y la desinformación anda por doquier. Este vídeo en el que se simula un telediario es tan real que pone los pelos de punta. A medida que el contenido creado por IA se vuelve más convincente, se corre el riesgo de que llegue el momento en el que ya no podamos confiar en nuestros propios ojos y nos veamos obligados a convertirnos en detectives amateur sólo para asegurarnos de que lo que tenemos delante es real. Porque creedme, el momento en el que sea imposible, está muy cerca de llegar.
Sora ha llegado pisando fuerte. OpenAI lanzó la semana pasada su nuevo modelo de inteligencia artificial generativa de vídeos y desde entonces internet se ha plagado de gatos haciendo malabares, enanos con cara de Elon Musk bailando en Marte o de Abraham Lincoln bebiendo chupitos en una discoteca. Desde que la startup presentó su nueva herramienta hace casi 10 meses, se ha generado muchísima expectación en torno al lanzamiento y, por fin, el producto final ha desembarcado. Aunque aún no está disponible en Europa, hemos tenido acceso a través de una VPN. Y lo que podemos decir tras varias horas de uso es que es una tecnología que puede cambiarlo todo. Para bien o para mal.