Por qué hay youtubers ganando mucho dinero por vídeos que no se publican en ningún lado
La última y contundente victoria de Google sobre OpenAI en materia de inteligencia artificial recuerda cómo YouTube se ha convertido en una tecnología clave en esta pelea y ayuda a entender un negocio inesperado
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fe5d%2Fa52%2F16b%2Fe5da5216b64d874276f0750e76edc6a1.jpg)
La crítica especializada ha sido unánime: Google le ha metido un gol a OpenAI, la empresa que más dolores de cabeza le ha dado en los dos últimos años. Lo ha hecho con uno de sus últimos productos, Veo 2, una inteligencia artificial que genera vídeos a partir de unas palabras. Los creadores de ChatGPT también tienen una herramienta similar, Sora, presentada a principios de 2024 pero puesta a disposición de sus usuarios de pago hace apenas unas semanas. La cuestión es que los resultados del desarrollo de los de Mountain View han sacado los colores a los de Sam Altman.
Veo 2 asomó la patita a mediados de diciembre. Como la práctica totalidad de los desarrollos de IA, se presentó con algunos ejemplos bajo el brazo, pero su despliegue se realizó de manera progresiva. Las primeras muestras de sus capacidades ya generaron asombro, aunque muchos mostraron prudencia hasta poder probarla. Algunos expertos de nuestro país ya lo han hecho, y las primeras buenas impresiones no han hecho más que confirmarse.
La herramienta de Google supera en muchos aspectos a la de OpenAI. Puede generar vídeos de hasta 4K, mientras que su rival se queda en Full HD, es decir, multiplica por cuatro la resolución de Sora. Además, permite crear piezas mucho más largas, de hasta 2 minutos. Una de las características destacadas de este desarrollo es su capacidad para generar clips a partir de texto, así como de una imagen y un prompt (el término que se utiliza en la jerga especializada para referirse a la instrucción introducida en un sistema de estas características).
:format(jpg)/f.elconfidencial.com%2Foriginal%2F1a2%2F905%2F7d4%2F1a29057d46c34e19063afea5e70af765.jpg)
Otro de los aspectos que llamó poderosamente la atención fue cómo se veían las acciones en movimiento generadas por Veo 2. Las imágenes son mucho más fluidas y, sobre todo, más coherentes. Esto se debe a que los desarrolladores lograron que el modelo que sostiene la herramienta representase mejor las reglas que gobiernan el mundo físico. Esto le permitió controlar los ejes y el movimiento de la cámara con mayor precisión, así como representar de forma más realista la luz, las sombras y los líquidos, ofreciendo resultados bastante más coherentes que los de Sora.
A pesar de haber cosechado buenos resultados, todavía hay mucho trabajo por delante. Un artículo científico en el que han participado, entre otros, investigadores de DeepMind, se ha dedicado a estudiar si estos modelos de generación de vídeo son capaces de aprender principios de física única y exclusivamente a través de la observación de horas y horas de video. El texto afirma que existe una "limitada comprensión física" por parte de los modelos, a pesar de la capacidad que tienen para generar piezas realistas. Es decir, no lo comprenden, sino que cuando logran una representación adecuada, es por imitación. Este es uno de los retos que se presentan para estas herramientas, especialmente si se quieren utilizar para crear videos más largos.
Pues aquí tenéis uno de los primeros cortos de animación hechos con Veo 2 con un acabado muy presentable y del que además, he olvidado que era una pieza hecha con IA que estaba examinando.
— Carlos Santana (@DotCSV) January 16, 2025
Y esto todavía con herramientas con un control muy prematuro 👌 pic.twitter.com/xsXsC4hScn
RIP Sora. This is Veo 2 🛹📷🎅pic.twitter.com/B9RuRsdQER
— Javi Lopez ⛩️ (@javilopen) December 22, 2024
I tested Sora vs. the new Google Veo-2.
— Ruben Hassid (@RubenHssd) December 17, 2024
I feel like comparing a bike vs. a starship: pic.twitter.com/YcHsVcUyn2
El motivo que ha propulsado este sorpasso de Google a OpenAI no es difícil de encontrar. La respuesta es YouTube, que en los últimos años se ha consolidado como una de las tecnologías más importantes para la multinacional estadounidense. Es la plataforma de vídeo online más utilizada del planeta y un escaparate que genera ingresos publicitarios superiores a los 30.000 millones de dólares anuales. Según Pew Research, es la aplicación de streaming de vídeo y audio más utilizada del mundo. En Estados Unidos, es la opción favorita para ver vídeos online en televisores inteligentes y también la más popular entre los adolescentes del país. Los últimos datos de Nielsen, que analizaban cómo gastaban los estadounidenses las horas frente a la pantalla de su casa, recogía varios datos en esta línea. Las plataformas de streaming ya acumulaban ya el 43% del tiempo que se veía televisión en el país. Youtube, según el informe de la consultora, acumula el 11 por ciento del tiempo total, bastante por encima de Netflix o de Prime Video.
Sin embargo, más allá de los ingresos que genera, la plataforma es un recurso clave para Google porque supone una enorme fuente de datos para entrenar inteligencias artificiales. No es la única fuente obviamente, pero existe un consenso generalizado en que esta ventaja es responsable de la superioridad de Veo 2. La compañía ya había reconocido anteriormente que utilizaba estos materiales, siempre en cumplimiento de los términos y condiciones de uso, así como de los acuerdos con los creadores.
No todos tienen Youtube
La importancia de YouTube como gran caladero de material para entrenar estos sistemas quedó especialmente patente cuando OpenAI presentó Sora. Ante las cuestiones sobre si habían recurrido a la plataforma propiedad de Google, los responsables de OpenAI respondieron con evasivas. Quizá el capítulo más significativo fue una entrevista con Mira Murati, ex directora de tecnología y antigua mano derecha de Sam Altman, en la que se le preguntó directamente por esta situación. Ella, que supervisaba en primera persona los desarrollos de la empresa, se limitó a decir que "no lo sabía", que era incapaz de concretar ese dato.
En primavera del año pasado, el New York Times confirmó las sospechas y publicó una investigación que señalaba que la compañía de Sam Altman había utilizado sin avisar a los creadores un millónn de horas de YouTube para entrenar, entre otras cosas, GPT-4, uno de los modelos de lenguaje que dan vida a ChatGPT. Esto ha sido posible porque no solo interesa lo que se ve en los vídeos, sino también lo que se dice. Para aprovecharlo en herramientas generadoras de texto, basta con utilizar un asistente capaz de transcribir automáticamente los diálogos. Desde Alphabet, diversos directivos, incluido el propio Sundar Pichai, se pronunciaron al respecto. Confirmaron que estaban investigando el asunto, pero los mensajes apuntaban en la misma dirección: si se confirmaba el extremo, OpenAI habría “violado” los términos y condiciones de uso de YouTube.
La ventaja que Google puede sacar a su ecosistema de productos para avanzar en esta carrera ya ha sido comentada y debatida en otros foros. Por ejemplo, en el juicio que ha enfrentado al Gobierno estadounidense contra la compañía californiana y que se ha traducido en una sentencia en su contra por monopolio, el Departamento de Justicia, entre otras cosas, ha solicitado imponer salvaguardas que limiten el uso de datos de sus servicios para entrenar su inteligencia artificial para evitar perpetuar su posición dominante.
:format(jpg)/f.elconfidencial.com%2Foriginal%2F996%2F189%2F1c2%2F9961891c2fef843e95bb126f4a3818e2.jpg)
Un negocio inesperado
Toda esta situación ha propiciado un negocio inesperado para miles de creadores de contenido: la venta de recursos de vídeo que no incluyen en sus producciones, como vídeos, reels o tiktoks, y que terminan almacenados en un disco duro o directamente en la basura. Un youtuber puede acumular cientos de horas de material bruto sin publicar a lo largo de un año. Los compradores, a través de intermediarios, son empresas tecnológicas que buscan contenido para mejorar sus algoritmos y sistemas de IA. Según reveló Bloomberg hace unos días, varias compañías, incluidos gigantes como OpenAI y Google, están recurriendo a esta vía. Es cierto que recurrir a contratistas y empresas externas viene siendo una tradición de varios años, pero en el caso del entrenamiento de IA generadoras de videos ha cobrado una nueva importancia.
Los precios son variables, pero la mayoría, según esta información, se encuentra en una horquilla de 1 a 4 dólares por minuto. Factores como el formato del vídeo, la calidad de imagen, la resolución o planos no tradicionales, como los grabados con drones o que incluyan animaciones en tres dimensiones, son elementos que incrementan el valor de estos materiales. Esta estrategia responde también a una de las mayores polémicas que ha enfrentado la industria desde el big bang de la IA generativa que provocó la irrupción de ChatGPT a finales de 2022. Nvidia, OpenAI, Meta, Microsoft y Google han sido acusados de utilizar artículos, fotografías o vídeos sin respetar la propiedad intelectual.
Todo esto también ayuda a entender el interés de las últimas semanas en hacerse con el negocio de TikTok en Estados Unidos. Antes de que Donald Trump irrumpiese en escena para decir que finalmente permitiría a la aplicación china seguir operando en el país, se especuló con que incluso Elon Musk estaría interesado en hacerse con las operaciones locales de ByteDance.
:format(jpg)/f.elconfidencial.com%2Foriginal%2F102%2F42b%2F044%2F10242b044f00bc242f8fc30e8a5fa7eb.jpg)
:format(jpg)/f.elconfidencial.com%2Foriginal%2F102%2F42b%2F044%2F10242b044f00bc242f8fc30e8a5fa7eb.jpg)
El primer diagnóstico empujaba a pensar que este eventual interés respondería a un plan para fortalecer el imperio de influencia que ha construido gracias a la red social antes conocida como Twitter y que le ha servido para acabar susurrando al oido al actual inquilino de la Casa Blanca.
Indiferentemente que esto fuese así o no, la adquisición de TikTok también le serviría a Musk para inyectar la hormona de crecimiento a Grok y a X.AI, la división que montó el hombre más rico del mundo para sus desarrollos de inteligencia artificial.
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fff7%2F262%2Fe02%2Fff7262e02bec1c212661f35327a2d1b7.jpg)
Aunque la plataforma puede seguir funcionando en la primera economía del mundo gracias a la intervención presidencial, no es descartable que una transacción se acabe produciendo. Trump ha aprobado una prórroga de 90 días para que TikTok busque una solución y ha deslizado que su plan es que se conforme una sociedad conjunta al 50% entre ByteDance y una empresa local, lo que da pie a que una empresa del país norteamericano acabe teniendo un acceso preferencial a todo el contenido de la aplicación.
El propio Trump ya se ha pronunciado a este respecto: no ve problemas en que el dueño de X sea el que acaben fagocitando, talonario mediante, la rama estadounidense de TikTok "si él quiere".
De momento, no se ha formalizado ningún tipo oferta de esta naturaleza por parte de Musk. Los que sí se posicionaron como posible comprador fueron los responsables de Perplexity, una de las startups de IA que más ha dado que hablar el año pasado. Se trata de una empresa que se ha centrado en crear un buscador impulsado por esta tecnología y que actualmente tiene una valoración de 9.000 millones de dólares. Según ha informado CNBC, la compañía presentó una oferta para crear una sociedad conjunta entre Perpletixy y la filial de TikTok en Estados Unidos, dando entrada a otros socios en el capital.
Este pasado fin de semana se han filtrado más detalles de los planes de Perplexity para la creación de esta nueva sociedad, que se llamaría NewCo. El documento propone básicamente que ByteDance aporte las operaciones de TikTok US, a excepción de su algoritmo de recomendación principal. Como contrapartida, los inversores actuales de la empresa recibirían títulos de la nueva sociedad. Algo similar a lo que recibirían los invversores de Perplexity. El informe también habla de la necesidad de un mecanismo de gobernanza simplificada y el objetivo de sacar a Bolsa esa join venture a corto plazo.
El objetivo, según el documento filtrado, sería recaudar al menos 300.000 millones de dólares en esa oferta pública inicial. Una cantidad muy superior a los 50.000 millones en los que se estima el valor de TikTok US y superior a los 9.000 millones en las que está valorada Perplexity. Además la vía de convertirse en una cotizada también permitiría al Gobierno de EEUU tomar posiones en NewCo a través de la compra de títulos, una opción también reflejada en la propuesta.
La crítica especializada ha sido unánime: Google le ha metido un gol a OpenAI, la empresa que más dolores de cabeza le ha dado en los dos últimos años. Lo ha hecho con uno de sus últimos productos, Veo 2, una inteligencia artificial que genera vídeos a partir de unas palabras. Los creadores de ChatGPT también tienen una herramienta similar, Sora, presentada a principios de 2024 pero puesta a disposición de sus usuarios de pago hace apenas unas semanas. La cuestión es que los resultados del desarrollo de los de Mountain View han sacado los colores a los de Sam Altman.