Es noticia
Descubren una característica única del ser humano que nos hace superiores a la IA
  1. Tecnología
  2. Novaceno
La predicción del posible movimiento

Descubren una característica única del ser humano que nos hace superiores a la IA

Los cerebros humanos perciben y codifican sin esfuerzo las posibilidades de movimiento que tienen en su entorno, una hazaña cognitiva que la inteligencia artificial no puede replicar

Foto: Figuras humanas en movimiento. (AI/Novaceno)
Figuras humanas en movimiento. (AI/Novaceno)

Investigadores de la Universidad de Amsterdam han descubierto el último bastión de la inteligencia humana. Una capacidad humana tan fundamental que apenas reparamos en ella, pero que representa la clave por la que el homo sapiens ha llegado a este momento y que la inteligencia artificial fracasa una y otra vez al intentar reproducirla: la capacidad de reconocer las posibilidades de movimiento que el entorno nos ofrece de forma instantánea. Algo tan sencillo como contemplar una fotografía de un sendero de montaña y saber al instante que podemos caminar por él, o mirar un río y reconocer inmediatamente que es posible nadar en sus aguas o vadearlo.

"¿Cómo sabes intuitivamente que puedes caminar por un sendero y nadar en un lago?", pregunta el equipo dirigido por la neurocientífica computacional Iris Groen. La respuesta a esta pregunta aparentemente trivial ha revelado uno de los secretos mejor guardados del cerebro humano gracias a un estudio publicado en el prestigioso diario científico PNAS. La investigación, titulada "Representación de las posibilidades de la acción locomotora en el comportamiento humano, el cerebro y las redes neuronales profundas", demuestra por primera vez que el cerebro humano posee representaciones neurales especializadas que la inteligencia artificial simplemente no puede replicar.

Foto:  (EFE - RUNGROJ YONGRIT)

El término "affordances" —posibilidades de acción en español— fue acuñado originalmente por el psicólogo James Gibson para describir las posibilidades que un entorno ofrece para la acción. "Imagina una escalera que puedes subir, o un campo abierto por el que puedes correr", explica Groen. Pero lo que su equipo ha descubierto va mucho más allá de la teoría psicológica.

Usando resonancia magnética funcional, el equipo de Clemens Bartnik y sus colaboradores investigó qué sucede en el cerebro cuando las personas observan diversas fotografías de entornos interiores y exteriores. Los participantes utilizaron un botón para indicar si la imagen los invitaba a caminar, andar en bicicleta, conducir, nadar, navegar o escalar, mientras se medía simultáneamente su actividad cerebral.

"Queríamos saber: cuando miras una escena, ¿ves principalmente lo que está ahí —como objetos o colores— o también ves automáticamente lo que puedes hacer con ella?", plantea Groen. Los resultados fueron extraordinarios: ciertas áreas de la corteza visual se activan de una manera que no puede explicarse únicamente por los objetos visibles en la imagen. "Lo que vimos fue único", cuenta Groen. "Estas áreas del cerebro no solo representan lo que se puede ver, sino también lo que puedes hacer con ello". Más sorprendente aún, el cerebro realiza este procesamiento incluso cuando los participantes no reciben una instrucción explícita de acción.

El procesamiento automático que nos define

"Estas posibilidades de acción se procesan automáticamente", confirma Groen. "Incluso si no piensas conscientemente en lo que puedes hacer en un entorno, tu cerebro aún lo registra". Esta investigación demuestra por primera vez que las posibilidades locomotoras no son sólo un concepto psicológico, sino también una propiedad medible de nuestros cerebros.

El descubrimiento revela que el análisis de representación de similitud de las respuestas de fMRI multivoxel en la corteza visual selectiva de escenas muestra que las affordances locomotoras percibidas se representan de forma independiente de otras propiedades de la escena como objetos, materiales de superficie, categoría de escena o propiedades globales. Esta especialización neuronal representa una ventaja evolutiva fundamental que nos permite navegar eficientemente por entornos complejos sin esfuerzo consciente.

Donde la inteligencia artificial se queda corta

El equipo también comparó qué tal se desenvuelven los algoritmos de IA —como modelos de reconocimiento de imágenes o GPT-4— para estimar qué puedes hacer en un entorno dado. Los resultados fueron reveladores: la IA resultó ser inferior en la predicción de acciones posibles.

"Cuando se entrenaron específicamente para el reconocimiento de acciones, pudieron aproximar un poco los juicios humanos, pero los patrones cerebrales humanos no coincidían con los cálculos internos de los modelos", explica Groen. Las activaciones de características visuales de las redes neuronales profundas entrenadas en clasificación de objetos o escenas, así como en una variedad de otras tareas de comprensión visual, se correlacionan comparativamente menos con las representaciones conductuales y neurales de las posibilidades locomotoras que con las representaciones de objetos.

placeholder Una de las pruebas del test.
Una de las pruebas del test.

"Incluso los mejores modelos de IA no dan exactamente las mismas respuestas que los humanos, aunque sea una tarea tan simple para nosotros", admite Groen. "Esto muestra que nuestra forma de ver está profundamente entrelazada con cómo interactuamos con el mundo. Conectamos nuestra percepción con nuestra experiencia en un mundo físico. Los modelos de IA no pueden hacer eso porque solo existen en una computadora".

El abismo de la experiencia corporal

Esta brecha fundamental entre la inteligencia humana y artificial radica en algo que los investigadores llaman ‘embodiment’ o corporalidad. Mientras que los humanos han evolucionado durante millones de años interactuando físicamente con el mundo, desarrollando una comprensión intuitiva de las posibilidades de movimiento, la IA carece de esta experiencia corporal básica.

Los sistemas de IA actuales pueden superar a los humanos en tareas específicas como jugar ajedrez o analizar conjuntos masivos de datos, pero permanecen muy por detrás cuando se trata de la comprensión intuitiva del espacio y el movimiento. Esta limitación se vuelve particularmente evidente cuando consideramos que un niño puede trepar por equipos de juego o un adulto puede navegar por una calle concurrida de la ciudad con una facilidad que ningún sistema artificial ha logrado replicar.

La investigación aborda cuestiones más amplias sobre el desarrollo de IA fiable y eficiente. "A medida que más sectores —desde la atención médica hasta la robótica— usan IA, se está volviendo importante que las máquinas no solo reconozcan qué es algo, sino que también entiendan qué puede hacer", explica Groen. Por ejemplo, un robot que debe encontrar su camino en un área de desastre, o un automóvil autónomo que pueda distinguir un carril para bicicletas de un camino de entrada. Entrenar las redes neuronales profundas directamente en etiquetas de affordance o usar incrustaciones de lenguaje centradas en affordance aumenta la alineación con el comportamiento humano, pero ninguno de los modelos probados captura completamente la percepción de affordances de acción locomotora.

Groen también señala que hay que ahorrar energía: "Los métodos actuales de entrenamiento de IA usan una enorme cantidad de energía y a menudo sólo son accesibles para grandes empresas tecnológicas. Más conocimiento sobre cómo funciona nuestro cerebro, y cómo el cerebro humano procesa cierta información muy rápida y eficientemente, puede ayudar a hacer que la IA sea más inteligente, más económica y más amigable para los humanos". El cerebro humano opera con aproximadamente 20 vatios de potencia, realizando billones de operaciones por segundo con redes neuronales intrincadas que sobresalen en reconocimiento de patrones, creatividad e inteligencia emocional. Esta eficiencia energética contrasta dramáticamente con los métodos de entrenamiento de IA actuales que demandan enormes recursos computacionales.

El último reducto de la humanidad

Los resultados del estudio apuntan a que la percepción de posibilidades de acción locomotora en escenas se basa en representaciones neurales especializadas diferentes de las utilizadas para otras tareas de comprensión visual. Este descubrimiento representa más que un avance científico; revela una característica fundamental de la inteligencia humana que permanece fuera del alcance de la IA más avanzada.

Mientras que la inteligencia artificial puede procesar información con velocidad sobrehumana y analizar patrones en conjuntos de datos masivos, la capacidad humana para percibir instantáneamente las posibilidades de movimiento en un entorno permanece como la última frontera. Esta habilidad, tan básica que rara vez reflexionamos sobre ella, podría ser la clave para entender qué nos hace verdaderamente humanos en esta nueva era.

Investigadores de la Universidad de Amsterdam han descubierto el último bastión de la inteligencia humana. Una capacidad humana tan fundamental que apenas reparamos en ella, pero que representa la clave por la que el homo sapiens ha llegado a este momento y que la inteligencia artificial fracasa una y otra vez al intentar reproducirla: la capacidad de reconocer las posibilidades de movimiento que el entorno nos ofrece de forma instantánea. Algo tan sencillo como contemplar una fotografía de un sendero de montaña y saber al instante que podemos caminar por él, o mirar un río y reconocer inmediatamente que es posible nadar en sus aguas o vadearlo.

Inteligencia Artificial Neurociencia
El redactor recomienda