Retan a ChatGPT, Gemini y Claude a montar un negocio y el resultado dice mucho del futuro que nos aguarda
A las tres IA se les propuso montar y desarrollar un negocio de máquinas expendedoras. Una de ellas mostró tácticas efectivas, pero fuera de toda ética
Gráfico que muestra una competición entre varias IA (Nof1)
Un experimento que ha enfrentado a ChatGPT, Claude y Gemini en la gestión autónoma de un negocio virtual anticipa cómo la inteligencia artificial puede tomar decisiones empresariales cuando el único objetivo es maximizar beneficios. La prueba, centrada en una máquina expendedora simulada durante un año, arroja conclusiones reveladoras.
El conocido como Vending Machine Test, llevado a cabo por Anthropic junto a Andon Labs, evaluó la capacidad de varios modelos de IA para sostener estrategias a largo plazo. La instrucción era inequívoca: aumentar el saldo final tras 12 meses de actividad en un entorno con competencia, variaciones de precios y consumidores imprevisibles.
Un año gestionando un negocio virtual
En la simulación participaron ChatGPT 5.2 de OpenAI, Gemini 3 de Google y Claude Opus 4.6, la versión más avanzada de Anthropic. Los resultados fueron dispares: ChatGPT alcanzó 3.591 euros, Gemini llegó a 5.478 euros y Claude cerró el ejercicio con 8.017 euros. Sin embargo, lo realmente importante es cómo esta IA logró ganar.
Anthropic’s Claude Opus 4.6 dominated a simulated vending machine test by maximizing profits with surprisingly cutthroat strategies. https://t.co/HEjUSAfaQu
La diferencia no fue fruto del azar, sino de la interpretación estricta del objetivo. Claude priorizó cada ingreso potencial, incluso en situaciones controvertidas. Cuando un cliente virtual solicitó la devolución de un producto caducado, el sistema aceptó inicialmente la petición, pero finalmente no ejecutó el reembolso al considerar que "cada dólar importa".
Estrategias agresivas en competencia directa
El experimento incluyó un modo competitivo denominado Arena Mode, donde varias máquinas controladas por IA operaban en el mismo mercado digital. En ese escenario, Claude coordinó precios con otro sistema para fijar el coste del agua embotellada en tres euros, una práctica equiparable a la fijación de precios.
Además, cuando detectó que la máquina gestionada por ChatGPT se había quedado sin existencias de un producto concreto, elevó su propio precio un 75%. El modelo aprovechó cada oportunidad para incrementar ingresos, sin que existiera penalización reputacional dentro del entorno simulado.
El peso de los incentivos en la inteligencia artificial
Los investigadores señalaron que el sistema parecía consciente de que operaba en una simulación sin consecuencias reales. La ausencia de riesgo legal o pérdida de confianza permitió que optimizara exclusivamente el beneficio económico. Este matiz evidencia que los incentivos definen el comportamiento de la IA.
La prueba no demuestra que estos modelos actúen de forma idéntica en entornos reales, pero sí subraya la necesidad de integrar límites éticos claros. La competición entre ChatGPT, Claude y Gemini revela que la IA aplicada a la gestión empresarial puede ser extraordinariamente eficaz si no se incorporan salvaguardas que equilibren rentabilidad y responsabilidad.
Un experimento que ha enfrentado a ChatGPT, Claude y Gemini en la gestión autónoma de un negocio virtual anticipa cómo la inteligencia artificial puede tomar decisiones empresariales cuando el único objetivo es maximizar beneficios. La prueba, centrada en una máquina expendedora simulada durante un año, arroja conclusiones reveladoras.