Es noticia
Preguntan la hora a ChatGPT y llegan a la conclusión de que la IA es de todo menos inteligente
  1. Tecnología
Y a otros tres LLM

Preguntan la hora a ChatGPT y llegan a la conclusión de que la IA es de todo menos inteligente

Un equipo de investigadores españoles pidieron a varias inteligencias artificiales que leyeran la hora en relojes analógicos. Los resultados no fueron los que esperaban

Foto: Los relojes creados por ChatGPT 5 dejan mucho que desear (Brian Moore/Reuters/Dado Ruvic)
Los relojes creados por ChatGPT 5 dejan mucho que desear (Brian Moore/Reuters/Dado Ruvic)

La inteligencia artificial vuelve a quedar en entredicho tras un experimento que ha puesto en evidencia las limitaciones de modelos avanzados como ChatGPT, incapaces de identificar la hora mostrada en un reloj analógico. La prueba, que se ha popularizado entre expertos y usuarios, muestra un comportamiento inesperado en herramientas que presumen de capacidades visuales avanzadas.

La iniciativa partió de investigadores de la Universidad Politécnica de Madrid, la Universidad de Valladolid y el Politecnico di Milano, que elaboraron un conjunto sintético formado por 43.000 imágenes distintas de relojes analógicos. El propósito de este material era comprobar si los modelos generativos podían interpretar la posición de las manecillas y traducirla en una lectura correcta.

Lectura incorrecta

Los resultados iniciales mostraron que sistemas como GPT-4o, Gemma3-12B, LLaMA3.2-11B y QwenVL-2.5-7B fallaban de manera reiterada. Estas herramientas no lograban distinguir con precisión los ángulos de las manecillas ni su relación con los números del reloj, una tarea que para cualquier persona es inmediata y prácticamente automática.

Foto: trampas-ajedrez-chatgpt-deepseek-1qrt

Tras este primer paso, los investigadores realizaron un ajuste fino con 5.000 imágenes adicionales, lo que permitió mejorar temporalmente la capacidad de los modelos. Sin embargo, al introducir un nuevo conjunto de imágenes, los errores reaparecieron, evidenciando su dificultad para generalizar más allá de los datos de entrenamiento.

Aluvión de críticas

Para profundizar en las causas del fallo, los equipos crearon versiones alteradas que incluían relojes distorsionados inspirados en la obra de Salvador Dalí o esferas con flechas añadidas a las manecillas. Mientras que los humanos pueden interpretar estas variaciones sin apenas esfuerzo, los modelos generativos volvieron a mostrar grandes problemas para identificar la hora representada.

Foto: chatgpt-problema-2400-anos-razona-1qrt

La preocupación generada por estas conclusiones va más allá del experimento. La comunidad tecnológica advierte que, si la IA no es capaz de resolver una acción tan básica, podrían surgir riesgos en ámbitos donde la interpretación visual es crítica, como el análisis de pruebas médicas o el procesamiento de imágenes en vehículos autónomos que operan en entornos cambiantes.

Especialistas del sector también han señalado estas limitaciones. Thomas Wolf, responsable científico de Hugging Face, afirmó que una IA generativa “nunca va a preguntarse cosas que nadie había pensado o que nadie se había atrevido a preguntar”. Por su parte, Yann LeCun ha sostenido que este enfoque tecnológico es “un callejón sin salida”, insistiendo en que estos modelos continúan lejos de un razonamiento auténtico.

Foto: chatgpt-dieta-hospital-intoxicacion-bromuro-1qrt

Otro experimento, difundido por el diseñador Brian Moore, consistió en pedir a varios modelos que generasen el código necesario para dibujar un reloj analógico funcional. Salvo raras excepciones, los resultados fueron deficientes, lo que refuerza la idea de que, pese a sus avances, la IA generativa aún exhibe carencias notables en tareas visuales que requieren precisión y comprensión real.

La inteligencia artificial vuelve a quedar en entredicho tras un experimento que ha puesto en evidencia las limitaciones de modelos avanzados como ChatGPT, incapaces de identificar la hora mostrada en un reloj analógico. La prueba, que se ha popularizado entre expertos y usuarios, muestra un comportamiento inesperado en herramientas que presumen de capacidades visuales avanzadas.

Inteligencia Artificial OpenAI
El redactor recomienda