Es noticia
Rajoy comiendo noodles: el programador detrás de la idea que ha vuelto loco a internet
  1. Tecnología
Dall-E Mini registra 500 peticiones por seg

Rajoy comiendo noodles: el programador detrás de la idea que ha vuelto loco a internet

El funcionamiento de Dall-E Mini es tan sencillo como teclear unas palabras y esperar a que genere imágenes relacionadas. Ni sus creadores se explican cómo, pero está por todas partes

Foto: Juan Carlos I en su versión del videojuego GTA, según Dall-E Mini.
Juan Carlos I en su versión del videojuego GTA, según Dall-E Mini.

Una pelea entre Rocky Balboa y el muñeco de Michelín, una resonancia magnética de Darth Vader o dibujos de Karl Marx y Juan Carlos I convertidos en personajes del videojuego GTA. Sí, son tres ideas bastante surrealistas, pero también un claro ejemplo de la fiebre que ha levantado Dall-E Mini, el nuevo gran juguete viral en la red. Se trata de una aplicación de inteligencia artificial que es capaz de dibujar con cierta precisión recibiendo solo unas pocas palabras como orden. Después, en poco más de diez segundos, es capaz de ofrecer nueve resultados distintos. Es lo que ha bastado para que las redes sociales se llenen de estas ilustraciones que, por supuesto, también se han convertido en carne de meme. Todo ha sido una cuestión de días, pero la realidad es que el proyecto llevaba un año publicado y nadie le había hecho caso.

"Ha sido impresionante", reconoce Pedro Cuenca, programador español que ha sido uno de los pilares del proyecto y al que todo esto le ha pillado de sorpresa. "Nosotros no hemos hecho nada para promocionarlo. Lo han puesto varios youtubers, luego ha pasado a Twitter y ha acabado explotando, pero ni idea de cuál ha sido el detonante", cuenta en conversación con este periódico.

La cuestión es que Dall-E Mini no es la típica aplicación simpática que, en realidad, se queda con tus datos para hacer caja con ellos. Este proyecto surgió durante un evento para miembros de la comunidad de Hugging Face, un repositorio de códigos abiertos de 'deep learning', al estilo de GitHub. Allí hubo un concurso en el que había que desarrollar algún proyecto relacionado con la inteligencia artificial, para lo que Google ponía sus procesadores TPU a disposición de los asistentes. Fue allí cuando Boris Dayma, un ingeniero francés, llamó a Cuenca para que se sumara a su idea, que era crear una versión reducida de grandes modelos como Dall-E. Este es obra de OpenAI, una organización de investigación de esta rama científica que fue fundada, entre otros, por Elon Musk.

"Son modelos espectaculares, pero muy grandes y costosos de entrenar computacionalmente. Es algo que solo está al alcance de unas pocas empresas y laboratorios, pero nos preguntamos si sería posible hacer algo parecido que funcionara con menos recursos", continúa el programador. "La motivación era aprender y la mera curiosidad, pero ganamos". Después, dejaron a Dall-E Mini publicado en Hugging Face (puedes entrar aquí) y ahí se quedó hasta su reciente salto a la fama.

*Si no ves correctamente este formulario, haz clic aquí.

Uno de sus grandes atractivos es que todo el mundo puede utilizar esta aplicación, algo que no ocurre con los proyectos más importantes, como Dall-E o Imagen, un proyecto muy similar de Google. Hoy en día, únicamente se puede acceder a ellos mediante lista de espera. "No están dando acceso a todo el mundo y es algo de lo que cada vez se habla más, así que creo que la disponibilidad es una de las razones por las que se ha hecho viral", subraya Cuenca. "A la gente le gusta mucho jugar con él y ver cómo interpreta el texto que le pones". Tanto, que se han creado incluso cuentas en Twitter para recopilar las creaciones más surrealistas, como esta de David Bisbal en una lavadora, o esta otra de Mariano Rajoy comiendo un bowl gigantesco de noodles.

Lo mejor y lo peor de Dall-E Mini

Los resultados de Dall-E Mini, claro, no son tan perfectos como los de estos grandes modelos, que cuentan con un entrenamiento y capacidad de computación mucho mayor. Por ejemplo, las caras de animales y personas que dibuja suelen dejar bastante que desear. "Esto se debe a que el sistema que utilizamos no puede representar todo con absoluta fidelidad, pero también a que nuestro cerebro está muy acostumbrado a ver caras. Cuando ves algo que está un poco fuera de lugar, te das cuenta rápido", apunta. En cambio, si se pide que dibuje paisajes o determinados objetos, la cosa mejora. Igual que si se pide que dibuje cuadros con el estilo de un determinado pintor. Aquí, más abajo, puedes ver un ejemplo.

¿Cómo consigue estos resultados? Aunque se habla de un modelo en singular, en realidad se trata de la combinación de varios. El primero es un codificador de imágenes que las convierte en una secuencia de números con un decodificador asociado; mientras, hay otro que se dedica a convertir texto en una fotografía y, por último, un algoritmo juzga la calidad de las imágenes generadas para filtrarlas. "Algunos de los conceptos se aprenden de memoria, ya que puede haber visto imágenes similares. Sin embargo, también puede aprender a crear imágenes únicas que no existen, como 'la torre Eiffel está aterrizando en la luna', combinando varios conceptos", explican los investigadores en su presentación. "La gracia es tener muchas imágenes muy variadas", enfatiza Cuenca, que explica que de vez en cuando actualizan la versión para que vaya mejorando.

Aun así, hay quien ya está buscando trucos para perfeccionar Dall-E Mini. "Hemos visto que hay gente que modifica el texto para conseguir mejores resultados, añadiendo palabras como "alta calidad" o "foto realista", y consiguen mejorar bastante". Por otro lado, el modelo fue entrenado únicamente en inglés, pero también se ha descubierto que responde cuando se habla en español, francés o portugués, aunque no tan bien. "Siempre hay un conjunto mínimo de datos que viene en otros idiomas. Con él, el sistema puede atacar cabos y entender cómo funcionan otras lenguas. Es algo que no hemos estudiado bien todavía". En cualquier caso, su compañero ya está trabajando en Dall-E Mega, ahora en fase de entreno, que tendrá mucha más calidad, pero sin llegar al nivel de los gigantes.

El éxito que lleva al colapso

El 'boom' de Dall-E Mini ha hecho que cada vez sea más difícil usarlo, ya que el tráfico lleva colapsado desde hace días. "Google nos deja varios servidores para procesar las imágenes y sería imposible hacerlo si no lo tuviéramos", dice este programador. Cuando vieron que las visitas a la web se disparaban, la tecnológica multiplicó varias veces su capacidad de computación y ellos optimizaron el código para hacerlo más eficiente, pero eso no ha evitado los problemas. "En condiciones normales, tarda unos 15 segundos, pero cuando se acumulan muchas peticiones a veces hay que esperar un poco", indica.

Foto: El proyecto Waterfall of Meaning, de Google, durante una exposición en Londres. (Getty/Tristan Fewings)

Es lo que tiene haber pasado de ser una web testimonial a tener picos de 500 peticiones por segundo durante horas, mientras que su capacidad empieza a sufrir a partir de los 60. Por ejemplo, durante la entrevista con Teknautas, a mediodía, ya superaba los 100. "Por la mañana se puede manejar más o menos de España, pero en el horario estadounidense estamos colapsados", confirma. El éxito en EEUU ha sido tal que 'The New Yorker' le ha dedicado una de sus viñetas diarias de este martes en la que se puede ver cuál puede ser una de sus aplicaciones de futuro.

"Nosotros no nos planteamos ningún uso en concreto. Estamos viendo que mucha gente lo hace por la gracia y los memes, pero también vemos mucha gente que tiene inclinación artística y lo usa como herramienta para coger ideas para inventarse algo de lo que no existen imágenes", cuenta. "Le falta calidad para ese tipo de cosas, pero como bocetos ya se está utilizando". Los ilustradores de la revista neoyorquina ya han tomado nota.

Cómo usar Dall-E Mini

Si te ha llamado la atención este 'software', aquí tienes los pasos a seguir para que Dall-E Mini dibuje o ilustre por ti. 

1. Entra aquí.

2. En la barra, escribe lo que quieras ver dibujado. Funciona mucho mejor en inglés, pero puedes probar en castellano, aunque el resultado sea menos fino. Ah, y no te cortes a la hora de poner especificaciones sobre lo que quieres.

3. Pulsa 'Run' y espera a que Dall-E Mini cumpla tus órdenes. 

4. Si no funciona, es que el servicio está recibiendo demasiado tráfico. En apenas unos minutos debería llegar tu turno.

Una pelea entre Rocky Balboa y el muñeco de Michelín, una resonancia magnética de Darth Vader o dibujos de Karl Marx y Juan Carlos I convertidos en personajes del videojuego GTA. Sí, son tres ideas bastante surrealistas, pero también un claro ejemplo de la fiebre que ha levantado Dall-E Mini, el nuevo gran juguete viral en la red. Se trata de una aplicación de inteligencia artificial que es capaz de dibujar con cierta precisión recibiendo solo unas pocas palabras como orden. Después, en poco más de diez segundos, es capaz de ofrecer nueve resultados distintos. Es lo que ha bastado para que las redes sociales se llenen de estas ilustraciones que, por supuesto, también se han convertido en carne de meme. Todo ha sido una cuestión de días, pero la realidad es que el proyecto llevaba un año publicado y nadie le había hecho caso.

Inteligencia Artificial Internet Elon Musk
El redactor recomienda