Es noticia
Google se enfrenta a otra encrucijada con la inteligencia artificial: se llama YouTube
  1. Tecnología
El fin de la realidad está más cerca

Google se enfrenta a otra encrucijada con la inteligencia artificial: se llama YouTube

La inteligencia artificial generativa ha llegado al vídeo. Basta escribir una frase para obtener clips de varios segundos con calidad realista, una posibilidad que va a cambiar por completo la creación de contenidos. ¿Qué va a pasar con YouTube?

Foto: Imágenes hiperrealistas realizadas con la IA Midjourney. (Nick St. Pierre)
Imágenes hiperrealistas realizadas con la IA Midjourney. (Nick St. Pierre)
EC EXCLUSIVO Artículo solo para suscriptores

Salvo que haya vivido en una cueva estos días, es casi imposible no haber visto esta foto: Donald Trump arrestado por la policía en EEUU. La imagen acumula ya millones de visualizaciones (seis millones solo en Twitter) y es tan realista que mucha gente se pensaba que estaba ocurriendo de verdad. La creó el investigador y periodista Eliot Higgins usando Midjourney, una firma de inteligencia artificial (IA) que acaba de estrenar una nueva versión tan potente que es casi imposible distinguir una imagen real de otra inventada. Solo un par de días después, la startup Runway anunciaba Gen-2, un avanzado software que permite hacer lo mismo pero con vídeo. "Cuando lo vi, me quedé sin palabras", dice a este diario Nick St. Pierre, diseñador y creador de contenido afincado en Nueva York. Si ChatGPT está removiendo los cimientos de los buscadores, el e-mail, la programación y casi cualquier actividad, la creación de contenido y plataformas como YouTube, TikTok o incluso Netflix es la siguiente en la lista.

"Estas herramientas cambian por completo las reglas de la fotografía y la edición de vídeo. Imagina el impacto de algo así para montar, por ejemplo, vídeos musicales. O los vídeos cortos de YouTube, los shorts. Esto derrumba las barreras de entrada a la creación de vídeo, cortos, series e incluso cine", explica St. Pierre. Este creativo de 30 años, fundador de varias startups de diseño y especialista en realidad virtual, lleva desde enero dedicado día y noche a entender y probar IA de creación de fotos y vídeo. Lo va documentando todo en su cuenta de Twitter y en su recién creado canal de YouTube. El resultado es un primer vistazo a la revolución que viene.

Foto: Foto: Reuters

"He convertido una barra de pan en un corto de ciencia ficción usando inteligencia artificial". Así tituló St. Pierre, en YouTube, su primer experimento mezclando varios de estos programas. "Usé Luma para convertir imágenes 2D en 3D. Es de lo más potente que he visto nunca. Luego con Midjourney busqué fotos para imaginar el tono de ciencia ficción del corto. Y con Gen-1 de Runway, creé el vídeo", explica. El resultado es una animación onírica de 10 segundos de duración creada 100% desde el móvil y con herramientas gratuitas. "Es un experimento, pero es solo el comienzo, imagina lo que podrás hacer en un año".

placeholder Donald Trump arrestado... en un mundo paralelo generado por IA. (Midjourney/Eliot Higgins)
Donald Trump arrestado... en un mundo paralelo generado por IA. (Midjourney/Eliot Higgins)

Runway, una startup afincada en Nueva York y creada por los chilenos Alejandro Matamala y Cristóbal Valenzuela, es lo más parecido a un ChatGPT del vídeo. Con solo introducir una línea de texto en el sistema, este produce de forma automática un vídeo de varios segundos. "Astronautas montando a caballo en la Luna". "Un surfero pillando una ola". "Una persona caminando bajo la lluvia, en estilo cinemático". Son solo algunos ejemplos que ha mostrado la compañía de Gen-2, la nueva versión de su IA presentada esta semana. Si con Gen-1 las imágenes resultantes eran difusas y con apariencia de animación, Gen-2, disponible ya para cualquiera que desee usarlo, se acerca mucho a producir imágenes similares a las que puedes grabar con una cámara convencional.

Tanto Runway como Midjourney han cautivado a miles de personas por la rapidez y realismo de su IA. Midjourney, fundada por David Holz, creador de Leap Motion, una de las primeras tecnológicas en centrarse en realidad virtual, tiene solo 11 empleados y se ha convertido ya en el OpenAI de las fotos. Su rival, Stability AI, creador del programa Stable Diffusion, supera ya los 1.000 millones de dólares de valoración. Las tres empresas han adelantado por la derecha a Google y Facebook que, paradójicamente, llevan años invirtiendo en este tipo de IA.

En septiembre de 2022, Meta presentó su programa Make a Video, que permite hacer exactamente eso, crear vídeos a partir de texto. "El progreso es increíble", dijo Mark Zuckerberg en un comunicado. "Es mucho más difícil generar vídeo que fotos porque, más allá de crear correctamente cada píxel, el sistema también tiene que predecir cómo cambiarán con el tiempo", explicó. A día de hoy, Make a Video sigue cerrado. Nadie, más allá de los empleados de Facebook, puede utilizarlo por motivos de seguridad, explican, para evitar un mal uso de la tecnología.

En octubre, Google respondió a Facebook mostrando el funcionamiento de Image Video, su propia IA para generar vídeo. Pero tomaron la misma decisión, cerrarla al público para evitar "usos maliciosos". Semanas después, OpenAI abrió GPT-3,5 a todo el mundo, y el resto es historia. Google activó su mayor estado de alarma en una década para responder a la amenaza que la IA generativa de Microsoft y ChatGPT suponía para su buscador y su imperio publicitario.

El enorme éxito de Midjourney, Runway o Stable Diffusion pone ahora en el punto de mira otro de sus negocios, YouTube, que parece haber entrado también en modo pánico. El pasado 16 de febrero, Susan Wojcicki, la jefa mundial de YouTube durante casi una década y miembro de la élite más selecta de Silicon Valley, dejaba su puesto al frente de la plataforma tras 25 años al servicio de Google. Lo primero que hizo su sucesor al tomar el cargo, Neal Mohan, un desconocido y brillante ingeniero de origen indio, fue anunciar el lanzamiento de herramientas de IA "en los próximos meses". La pregunta es inevitable: ¿cómo va a afectar la IA generativa al negocio multimillonario de YouTube?

placeholder Susan Wojcicki, ex-CEO de YouTube y directiva de Google durante 25 años. (Reuters)
Susan Wojcicki, ex-CEO de YouTube y directiva de Google durante 25 años. (Reuters)

"Desarrollar una buena plataforma de edición de vídeo es extremadamente complejo, incluso para Google. Ese no es su negocio. Necesitas un nivel de obsesión que no van a tener los ingenieros a los que paga 200.000 o 300.000 dólares al año. Les sale mejor comprarse un Stable Diffusion o un Runway, como ha hecho Microsoft en parte con OpenAI, que crear eso ellos mismos", explica a este diario Victoriano Izquierdo, fotógrafo y creador de la startup de visualización de datos Graphext.

Izquierdo lleva días probando a fondo Midjourney, generando imágenes con IA a partir de algunas de sus fotos reales, y los resultados le parecen abrumadores. "Es el fin de la fotografía tal y como la conocemos. Las fotos para documentar el mundo y lo que ocurre van a seguir. Pero todas las demás van a tener que convivir con estas nuevas tecnologías, que abren unas posibilidades brutales", explica. "Creo que el gran problema de Google y YouTube si estrenan este tipo de herramienta es justificar cómo han entrenado los algoritmos. Si usan YouTube para entrenarlos, van a tener un problema, a la comunidad de creadores no les va a hacer ni pizca de gracia saber que su trabajo se ha empleado para sacar beneficio de esta manera", dice St. Pierre.

Tras la salida de Wojcicki, algunas voces creen que es el momento de que Google se deshaga de YouTube y la convierta en una compañía 100% independiente. "Alphabet tiene demasiado en el plato como para prestarle toda la atención a YouTube", sentenciaba recientemente The Economist. Sin Google respirándole en la oreja, YouTube podría experimentar con otros modelos de negocio más allá de la publicidad y, sobre todo, podría ser más agresivo con su estrategia de IA sin temor a disparar a Alphabet en el pie. En otras palabras, podría dejar de ser solo una plataforma de distribución de contenido (masiva, eso sí, con 2.600 millones de usuarios activos al día y 29.000 millones de dólares en ingresos en publicidad, casi tanto como Netflix) para pasar a ser también una plataforma de creación de vídeos con IA generativa.

Igual que Google ha tardado en reaccionar a la amenaza de OpenAI, YouTube corre el riesgo de dormirse. Un ejemplo de lo contrario es Adobe, que acaba de lanzar Firefly, un generador de imágenes por IA libres de copyright. La respuesta de YouTube tardará aún "unos meses" en llegar. Mientras, miles de usuarios están ya creando vídeos cortos e imágenes con software de la competencia. La gran mayoría acabará colgando sus creaciones en YouTube, pero si Google no reacciona a tiempo, serán otras plataformas las que determinen qué se crea, cómo se crea y, más importante aún, las que tengan los datos para saber a quién mostrarlo.

Para los creadores de contenido, el futuro pinta también radicalmente distinto. "Vamos a tener que aprender a saber cómo usar estas herramientas dentro del proceso creativo. Yo las veo más como una forma de inspiración. Y para eso, necesitarás saber cómo hacer las peticiones y cómo refinarlas para que el programa te dé lo que buscas", dice St. Pierre. Igual que ahora buscamos y rebuscamos en Google con diferentes frases hasta encontrar lo que queremos, la IA de imágenes va a ser algo parecido. La pregunta del millón es quién será ese nuevo Google de los vídeos.

Salvo que haya vivido en una cueva estos días, es casi imposible no haber visto esta foto: Donald Trump arrestado por la policía en EEUU. La imagen acumula ya millones de visualizaciones (seis millones solo en Twitter) y es tan realista que mucha gente se pensaba que estaba ocurriendo de verdad. La creó el investigador y periodista Eliot Higgins usando Midjourney, una firma de inteligencia artificial (IA) que acaba de estrenar una nueva versión tan potente que es casi imposible distinguir una imagen real de otra inventada. Solo un par de días después, la startup Runway anunciaba Gen-2, un avanzado software que permite hacer lo mismo pero con vídeo. "Cuando lo vi, me quedé sin palabras", dice a este diario Nick St. Pierre, diseñador y creador de contenido afincado en Nueva York. Si ChatGPT está removiendo los cimientos de los buscadores, el e-mail, la programación y casi cualquier actividad, la creación de contenido y plataformas como YouTube, TikTok o incluso Netflix es la siguiente en la lista.

YouTube
El redactor recomienda