NO ES SOLO UNA SUBIDA DE PRECIOS

Una huelga ha tumbado el mayor foro de internet y ChatGPT tiene mucho que ver

Los creadores de contenido en Reddit se han revuelto contra la subida de precios de la API y han conseguido que la web colapse durante horas. En realidad, la empresa está tratando de atajar uno de los grandes problemas de la IA

Foto: Foto: Reuters/Dado Ruvic. — Foto: Reuters/Dado Ruvic.

Por

Mario Escribano

13/06/2023 - 05:00

El foro más grande de internet está en llamas. Hace unas semanas, Reddit anunciaba una importante subida de tarifas a los desarrolladores que utilizan su API para crear productos y servicios relacionados. Es decir, lo mismo que había hecho poco antes Elon Musk con Twitter y que, precisamente, fue criticado por ellos mismos. En ambos casos, la motivación era la misma: se habían dado cuenta de que otros estaban sacando mucha tajada de su producto, así que querían una parte mayor del pastel. Sin embargo, aquí ha habido un detonante más, porque quien de verdad estaba aprovechando su plataforma era la inteligencia artificial. La polémica decisión ya ha desembocado una huelga que, además, ha conseguido tumbar la conocida web durante horas.

Apollo, una plataforma que se nutre de Reddit para ofrecer un acceso e interfaz distintas para iPhone, fue la que puso sobre aviso al resto de esta comunidad. En su caso, tienen un modelo gratuito y otros de pago, con suscripciones a partir de 4,99 euros al mes. Sin embargo, eso no les da ni de lejos para compensar los nuevos precios de la API (sin entrar en demasiados vericuetos técnicos, una API es una herramienta, entre otras cosas, a terceros conectarse a una plataforma y explotar sus funcionalidades y contenido). Según explicaron, tendrían que duplicar sus precios para evitar perder dinero, ya que las nuevas tarifas les supondrían pagar 20 millones de dólares al año, puesto que Reddit pide 12.000 dólares por cada 50 millones de peticiones a su API y ellos hacen 7.000 millones cada mes.

Foto: Sam Altman, CEO de OpenAI, durante su visita a Madrid. (IE University)

TE PUEDE INTERESAR

Una tarde en Madrid con el creador de ChatGPT: la IA en persona aún no tiene respuestas

Mario Escribano

¿La repuesta de Reddit? Que no son tan eficientes como podrían, han contestado desde esta empresa, que también está impulsando estos cambios para maquillar su futura salida a bolsa. Aunque explicaron que los cambios solo afectarían a las empresas que hacen caja –otros desarrolladores, como ReddPlanet o Sync, ya se han dado por aludidos– y no a fines académicos o no comerciales, todo esto ha llevado a una huelga de 48 horas durante este lunes y martes. Así, los creadores de contenido están ocultando los hilos (subreddits) durante ese tiempo en señal de protesta, con algunos incluso amenazando con borrar su contenido. Por si fuera poco, este apagón temporal ha sido tan masivo que ha provocado que la plataforma dejara de estar disponible durante las primeras horas del lunes.

De cualquier modo, el trasfondo de todas estas protestas es mucho mayor de lo que pueda parecer. "Tenemos un problema con quienes rastrean Reddit, generan valor y no devuelven nada de eso a nuestros usuarios", dejó caer Reddit cuando comunicó estos cambios, apuntando directamente a la inteligencia artificial. Esto se debe a que el contenido que circula en este foro, que cuenta con 57 millones de usuarios activos diarios, había sido utilizado activamente para mejorar los modelos de lenguaje de OpenAI o Google, entre otros.

"El corpus de datos de Reddit es realmente valioso, pero no necesitamos regalar todo ese valor a algunas de las empresas más grandes del mundo", ha explicado Steve Huffman, fundador y director ejecutivo de la tecnológica, a The New York Times. En realidad, se trata del enésimo conflicto provocado por el entrenamiento de la inteligencia artificial, donde se entremezclan cuestiones laborales, morales o legales, entre otras.

Las otras huelgas de la inteligencia artificial

El pasado 5 de junio, los moderadores de Stack Overflow, un foro para programadores, también comenzaron otro parón relacionado con la inteligencia artificial, aunque por causas bien distintas. Así, estos voluntarios publicaron una carta abierta en la que denunciaban que la empresa "ha decretado una prohibición casi total de moderar contenido generado por IA, tras la avalancha de este tipo de contenido que se publica y posteriormente se elimina". Es algo que consideran que "permite tácitamente la proliferación de información incorrecta, como las alucinaciones, y el plagio sin restricciones", algo que compromete la calidad y la confianza de esta plataforma.

placeholder — Foto: EFE/EPA/Axel Heimken.

En este caso, los cambios de políticas no se conocen en concreto, ya que los moderadores no tienen permitido compartir en público las directrices que les dan en la empresa, por lo que solo han dado algunas pinceladas sobre lo ocurrido. "Los moderadores ya no pueden eliminar las respuestas generadas por IA sobre la base de que fueron generadas por IA, fuera de circunstancias extremadamente limitadas. El resultado es permitir que casi todas las respuestas generadas por IA se publiquen libremente, independientemente del consenso establecido por la comunidad sobre dicho contenido", especifican.

Además, lamentan que no se les ha tenido en cuenta en ningún momento para hacer estos cambios ni han tenido en cuenta sus peticiones, pese a que muchos de ellos llevaban cerca de una década haciendo estas labores sin recibir una contraprestación económica. En cambio, en otros casos, los conflictos están alcanzando ya a los propios trabajadores de distintos sectores, algo que ha alentado la propia OpenAI como estrategia de marketing. "Aproximadamente el 80% de la mano de obra estadounidense podría ver afectado al menos el 10% de sus tareas laborales por la introducción de las GPT", aseguraban un estudio reciente, que fue criticado por no ser demasiado riguroso.

Sin embargo, el caso más sonado hasta ahora ha sido el de los guionistas de Hollywood, que comenzaron su huelga el pasado mayo (y todavía continua), la primera en 15 años. Además del impacto que han tenido las plataformas de streaming en la industria, uno de los puntos calientes está en la regulación del "uso del material producido mediante inteligencia artificial o tecnologías similares", ya que lo ven como un más que probable sustituto de su trabajo, además de criticar el empeoramiento del resultado final.

Foto: Las protestas del Sindicato de Guionistas se suceden en California. (Reuters)

TE PUEDE INTERESAR

Las plataformas y la IA hacen tambalear al cine: ¿corre peligro la industria española?

Marta Medina

"En un año hemos pasado de unos ligeros ensayos con fotografías a encontrarnos con herramientas que ya empiezan a diseñar historias con cierta coherencia y con cierto peso, con una consideración de la historia que muchas veces puede parecer creada por un humano", explicó Carlos Muriana, guionista y miembro de la junta directiva del sindicato de guionistas ALMA, en conversación con este periódico, donde enfatizaba que la IA "puede ayudar o puede ser nefasta para la creación".

Esto es solo el principio

De hecho, las industrias culturales están siendo unas de las que más miran con recelo al auge de la inteligencia artificial. El punto no es solo que estas herramientas puedan desempeñar las tareas laborales de un humano, sino también con el proceso de aprendizaje, tal y como señalaba Huffman, el jefe de Reddit. Básicamente, los modelos necesitan una cantidad abismal de datos de todo tipo para desarrollarse, como pueden ser artículos, imágenes o canciones. Y eso lleva al siguiente problema: ¿qué pasa con la gente que había creado previamente ese contenido?

Una investigación reciente de The Washington Post confirmaba lo que se venía especulando desde hace meses: los grandes modelos de lenguaje (LLM, en sus siglas en inglés), que son la base de ChatGPT, Bard (Google) o LLaMA (Facebook), recolectan millones de datos disponibles en internet de miles de fuentes, sean Wikipedia o Reddit. Sin embargo, ninguna de ellas ha pedido permiso a esas webs o a los usuarios para llevarse ese contenido, algo que puede suponer una violación directa de, entre otras normativas, el reglamento europeo de protección de datos (RGPD). Es más, es un asunto que está siendo investigado por distintas agencias de privacidad en Europa (entre ellas, la española), pero por el que ahora no está claro cómo proceder.

Foto: Pantallazo de un programa de Adobe que ahora incorpora IA generativa para retocar imágenes. (Reuters)

TE PUEDE INTERESAR

El escándalo que viene con la IA y sobre el que ChatGPT no te va a responder

Manuel Ángel Méndez

Es algo que ya ha provocado que algunos actores importantes, como las grandes discográficas, hayan comenzado a pedir explicaciones a plataformas como Spotify, a las que exigen que se aseguren de que las canciones que alojan ahí no se usen para crear nueva música sin su consentimiento. Ahí aparecen más problemas, independientemente del tipo de contenido que genere.

Por un lado, ni siquiera los responsables de los modelos de inteligencia artificial saben qué fuentes usan para ofrecer esos resultados. Por otro, para solucionar toda esta captación masiva de información sin consentimiento, habría que resetear todos los sistemas para entrenarlos desde cero y solo con aquel material que tengan permiso para usar. Por ahora, es un extremo que no contempla la propuesta de ley europea de IA que se votará esta semana en Estrasburgo, donde se limitan a pedir una mayor transparencia sobre el origen de estos datos

Internet Inteligencia Artificial Innovación

El redactor recomienda