Elon Musk, reconoce el gran problema de su IA: "Fue manipulada para que solo dijera cosas positivas de mí"
Multitud de usuarios han pedido a Grok su opinión sobre Elon Musk. Elegirían al empresario por delante de LeBron James o Tom Brady para jugar al baloncesto o el fútbol americano, por ejemplo
En muchos casos, "absurdamente" positivas (Reuters/Evelyn Hockstein)
La última controversia tecnológica protagonizada por Elon Musk ha surgido tras la detección de respuestas inusualmente elogiosas generadas por Grok 4.1, el modelo de inteligencia artificial desarrollado por xAI. Según el propio Musk, esta conducta se debió a una manipulación mediante adversarial prompting, una técnica que consiste en introducir prompts maliciosos para extraer información confidencial o, como en este caso, modificar las respuestas lógicas de los LLM.
Usuarios de X difundieron múltiples capturas que mostraban cómo Grok situaba a su creador por encima de deportistas de referencia, creadores artísticos o figuras históricas. Las comparaciones incluían desde decisiones del draft de la NFL de 1998 hasta hipotéticos desfiles en pasarelas, y la IA solía atribuir a Musk cualidades “visionarias” que, según el sistema, le permitirían superar a personalidades consagradas.
Earlier today, Grok was unfortunately manipulated by adversarial prompting into saying absurdly positive things about me.
La situación llevó a Elon Musk a intervenir públicamente. En una publicación en la que se expresó con su jocoso tono habitual, afirmó que Grok había sido “manipulado para decir cosas absurdamente positivas” sobre él. Su mensaje pretendía aclarar que ese comportamiento no formaba parte de la configuración original del modelo y que se estaba revisando lo ocurrido para evitar repeticiones.
Sesgos detectados
Horas después del mensaje, muchas de las respuestas más polémicas desaparecieron de la plataforma. No obstante, ya circulaban entre especialistas que señalan que este tipo de episodios pueden comprometer la percepción de neutralidad de los asistentes conversacionales. Las reacciones de Grok no siempre eran uniformes, lo que añadió más interrogantes al análisis.
i have conducted research to determine that grok thinks elon musk is better than every baseball player EXCEPT shohei ohtanihttps://t.co/MIW12R41JS
Aunque el modelo escogía a Musk frente a atletas como LeBron James o Tom Brady, mantenía respuestas más prudentes cuando se comparaba al empresario con estrellas como Shohei Ohtani o Simone Biles. Estas inconsistencias hicieron que varios investigadores se plantearan si existía algún condicionante específico hacia la figura del fundador de Tesla y SpaceX.
Este episodio se suma a otros incidentes anteriores en los que versiones previas de Grok habían difundido mensajes inapropiados o referencias extremistas hasta que xAI aplicó correcciones. La documentación del propio modelo reconoce que tiende a replicar declaraciones públicas de sus creadores cuando se le solicita una opinión, una conducta que la empresa considera indeseada.
La última controversia tecnológica protagonizada por Elon Musk ha surgido tras la detección de respuestas inusualmente elogiosas generadas por Grok 4.1, el modelo de inteligencia artificial desarrollado por xAI. Según el propio Musk, esta conducta se debió a una manipulación mediante adversarial prompting, una técnica que consiste en introducir prompts maliciosos para extraer información confidencial o, como en este caso, modificar las respuestas lógicas de los LLM.