Es noticia
La IA confunde un elefante con una silla, pero estos españoles tienen una solución
  1. Tecnología
  2. Ciencia
CÓMO COPIAR AL CEREBRO

La IA confunde un elefante con una silla, pero estos españoles tienen una solución

Un proyecto de investigación se propone desarrollar un nuevo modelo de redes neuronales más acorde con el auténtico funcionamiento del cerebro humano

Foto: Jesús Malo, investigador del Departamento de Óptica de la Universidad de Valencia. (Fundación BBVA)
Jesús Malo, investigador del Departamento de Óptica de la Universidad de Valencia. (Fundación BBVA)

Gran parte de la información que obtenemos los seres humanos nos llega a través de los ojos: la procesamos y tomamos infinidad de decisiones. Desde hace años, estamos intentando que las máquinas hagan lo mismo. Por eso, una parte importante de la inteligencia artificial (IA) pasa por la visión artificial, una tecnología fundamental para desarrollar robots, mejorar procesos industriales o avanzar en el mundo de los vehículos autónomos. ¿Hasta dónde hemos llegado? Probablemente, no tan lejos como parece.

Una persona es capaz de conducir un automóvil con seguridad gracias a la información visual. No importa que sea de día o de noche, que las condiciones meteorológicas sean adversas o que haya cambios de luminosidad radicales al entrar y salir de un túnel: los seres humanos somos capaces de adaptarnos y procesar todos esos estímulos, siguiendo el trazado de la carretera y teniendo en cuenta al resto de los vehículos y la posible irrupción de peatones o de objetos imprevistos. Todo, gracias, casi exclusivamente, a uno solo de nuestros sentidos. Los sistemas de conducción autónoma también son muy eficientes, pero utilizan sensores, láseres, radares y las balizas de la carretera; así que están lejos de basarse únicamente en la visión. De hecho, si lo hicieran, hoy en día, sería un desastre.

Foto: Imagen: Asimob.

A pesar de toda la sofisticación que ha alcanzado la visión artificial, sigue cometiendo errores garrafales que nunca tendría un ser humano. Los expertos usan un ejemplo muy gráfico. Si a estos sistemas se les muestra una silla, son capaces de identificarla, pero basta una pequeña rotación de la imagen para que la confundan con un elefante. Algo así nunca le sucedería a una persona. El motivo es que la máquina todavía está lejos de procesar la información como lo hace nuestro cerebro, pero eso podría cambiar muy pronto.

Esa es la intención del proyecto Harnessing Vision Science to Overcome the Critical Limitations of Artificial Neural Networks (VIS4NN), uno de los financiados por la Fundación BBVA dentro del Programa Fundamentos, que apoya la investigación de “cuestiones centrales de la ciencia básica”. El objetivo de esta iniciativa, dotada con 600.000 euros, es conseguir sistemas de visión artificial basados en el funcionamiento real del cerebro humano. La idea es mejorar las redes neuronales artificiales que se emplean en este campo.

placeholder El investigador de la Universidad de Valencia Jesús Malo. (Fundación BBVA)
El investigador de la Universidad de Valencia Jesús Malo. (Fundación BBVA)

Por qué fallan los sistemas actuales

Desde hace más de una década, “ha habido una explosión de aplicaciones de visión por ordenador basadas en la utilización de redes neuronales artificiales”, explica a El Confidencial uno de los responsables del proyecto, Jesús Malo López, investigador del Departamento de Óptica de la Universidad de Valencia. El problema es que estos sistemas “son muy sensibles y poco robustos”. Es decir, que “aprenden una tarea, como reconocer ciertos objetos, y son muy buenos realizándola; pero bastan pequeñas modificaciones para que cometan errores tremendos”.

La clave es que las técnicas de redes neuronales están basadas en “modelos de neuronas que, dentro de la neurociencia biológica, ya están un poco anticuados”, comenta. De hecho, surgieron entre los años 60 y 80 del siglo pasado y son “versiones muy simplificadas” de lo que sucede en la realidad. Básicamente, se pensaba que las neuronas capturaban información a través de las dendritas (prolongaciones ramificadas de estas células nerviosas) y que realizaban una operación sencilla para dar una respuesta. Este tipo de computación ha dado resultados muy interesantes, porque, sumando elementos básicos, “en redes de gran tamaño, el resultado es una potencia increíble para realizar cálculos complejos y resolver tareas”.

placeholder Jesús Malo realizando cálculos. (Fundación BBVA)
Jesús Malo realizando cálculos. (Fundación BBVA)

Sin embargo, en el campo de la visión artificial da lugar a “fallos de generalización”, como el de la silla y el elefante. Lo mismo podría pasar con un plátano y un cocodrilo e infinidad de ejemplos parecidos, porque las redes neuronales aprenden usando grandes bases de datos para hallar patrones, pero tienen muchas limitaciones. “Estos sistemas están entrenados por aprendizaje supervisado, es decir, ven muchos ejemplos que les dicen: ‘este objeto es una silla, este otro también lo es y aquel es un elefante’”, según Jesús Malo. El problema es que hacen falta infinidad de casos, porque no se adaptan y basta con cambiar unos pocos píxeles para que cometa errores inconcebibles en el cerebro humano.

“Si a nosotros nos cambian la iluminación, si vemos sombras, si llueve o hay niebla; los humanos no tenemos ningún problema en seguir identificando objetos. Sin embargo, los sistemas artificiales no son capaces de ajustar su funcionamiento a las nuevas condiciones”, apunta el experto. Por eso, los sistemas de conducción automática no se basan únicamente en la información que aportan las cámaras de los coches. “Al final, los ojos de un conductor no dejan de ser una cámara vulgar, pero lo que cuenta es el procesado de la información que hace el cerebro”, destaca.

placeholder Conducción autónoma.
Conducción autónoma.

De las neuronas reales a la tecnología

Por eso este nuevo proyecto, coordinado por Marcelo Bertalmío (Instituto de Óptica del CSIC) y en el que también participa el grupo de Felix Wichmann (Departamento de Ciencias de la Computación de la Universidad de Tubinga, Alemania), va a tratar de incorporar a este campo los nuevos conocimientos biológicos sobre el funcionamiento de las neuronas, que ofrecen una visión bastante distinta sobre sus funciones. “Las neuronas no son un elemento pasivo, como se pensaba hace 40 años”, destaca el científico de la Universidad de Valencia.

La neurociencia ha demostrado que el sistema de procesamiento es mucho más complejo de lo que parecía. Por ejemplo, las dendritas realizan operaciones previas a la entrada de información en la neurona. Así, "descartan elementos del entorno que no son interesantes”, señala el investigador. De esta forma, en los modelos computacionales, unas pocas neuronas más complejas podrían tener tanta capacidad como una gran cantidad de neuronas simples e incluso obtener resultados más finos. “Eventualmente, tenemos la esperanza de que, utilizando este modelo más cercano a la realidad biológica, se van a poder resolver algunos de los problemas de los sistemas actuales de visión artificial”, añade.

Foto: Edificio de oficinas. (Pixabay)

La aportación de este proyecto podría ser aún más importante porque las operaciones básicas que realizan las neuronas del sentido de la vista son idénticas en otros tipos de percepción. Por ejemplo, “el sistema auditivo, el olfativo o el táctil funcionan de manera bastante similar y, matemáticamente, se pueden utilizar las mismas expresiones”, afirma Jesús Malo. Por eso, “las transformaciones en las que estamos trabajando”, comenta, pueden ser la base para una computación que “ocurre en muchos otros lugares del cerebro, no solamente en la vía visual”.

Las neuronas están organizadas por capas que van transmitiendo la información, de manera que cada una de estas células del sistema nervioso siempre tiene a su lado neuronas vecinas que, a su vez, van modelando su respuesta. Esas interacciones ocurren en todo el cerebro y entenderlas no solo ayuda al campo de las neurociencias, sino también al desarrollo de la IA. “Hay una retroalimentación muy positiva entre la biología y el campo de las ciencias de la computación”, afirma el experto.

Gran parte de la información que obtenemos los seres humanos nos llega a través de los ojos: la procesamos y tomamos infinidad de decisiones. Desde hace años, estamos intentando que las máquinas hagan lo mismo. Por eso, una parte importante de la inteligencia artificial (IA) pasa por la visión artificial, una tecnología fundamental para desarrollar robots, mejorar procesos industriales o avanzar en el mundo de los vehículos autónomos. ¿Hasta dónde hemos llegado? Probablemente, no tan lejos como parece.

Neurociencia
El redactor recomienda