Sólo la IA puede descifrar ya el último lenguaje desconocido del planeta (y quizás no pueda)
Escrita hace 5.300 años, la escritura del valle del Indo sigue siendo un misterio indescifrable para los lingüistas, que esperan que algún equipo desarrolle una inteligencia artificial para entenderla
En el corazón de Pakistán y el noroeste de la India yacen las ruinas de la civilización del valle del Indo, una cultura que floreció entre el 2600 y el 1900 a. C. Con el urbanismo avanzado de ciudades como Mohenjo-Daro o Harappa y la gestión de un gigantesco volumen comercial, los pueblos de esta civilización rivalizaban con la egipcia o la mesopotámica. Pero sigue siendo uno de los mayores misterios de la historia, especialmente por su sistema de escritura absolutamente indescifrable. Un misterio que podría resolverse gracias al inteligencia artificial —una vez más— y un reto con una recompensa de un millón de dólares para quien logre descifrar el lenguaje.
La iniciativa busca atraer a criptógrafos, lingüistas y científicos de todo el mundo para duplicar el éxito de iniciativas como el descifrado de los escritos de Herculano, donde la inteligencia artificial fue capaz de desentrañar los textos ocultos en el papel quemado por el volcán que sepultó esta ciudad y Pompeya bajo miles de toneladas de material incandescente emitidas en la explosión del Vesubio el 24 de octubre del año 79 después de Cristo. "Si logramos avanzar aunque sea un poco en la comprensión de estos textos, podría ser el mayor descubrimiento lingüístico del siglo", afirma uno de los organizadores del reto de la civilización del Indo.
Imposible hasta ahora
El problema ha desconcertado a los expertos desde 1872, cuando los primeros sellos con inscripciones fueron descubiertos en Harappa por el arqueólogo británico Alexander Cunningham. En las décadas siguientes, las excavaciones desenterraron cientos de inscripciones adicionales, pero ninguna pista clara sobre su significado.
Hoy, a pesar de miles de símbolos grabados en sellos, tablillas y cerámicas, nadie ha logrado descifrar el lenguaje de esta civilización. No se ha encontrado una piedra de Rosetta que permita cotejar con lenguas conocidas, ni un corpus de inscripciones lo suficientemente extenso como para analizar patrones con claridad, una práctica habitual en la decodificación de lenguas desconocidas o textos cifrados.
Los especialistas han propuesto diversas hipótesis, ninguna confirmada. Algunos creen que es una lengua dravídica o una antecesora del tamil, mientras que otros sugieren que podría ser una lengua de la familia munda o incluso una forma primitiva de sánscrito. Otros afirman que ni siquiera es un lenguaje escrito moderno, sino un protolenguaje.
En busca de la lengua perdida
Es importante poder descifrar los idiomas perdidos no por mera curiosidad sino porque supone desbloquear el conocimiento y el patrimonio cultural de civilizaciones desaparecidas, proporcionando valiosas ideas históricas y sabiduría, además de ayudarnos a entender la evolución de la civilización.
La inteligencia artificial será clave para evitar que el conocimiento de la civilización del valle del Indo se pierda para siempre. Pero los retos son mayúsculos. Oculto tras la falta de una piedra de Rosetta, la evolución del lenguaje vivo, una escritura totalmente desconocida y textos de apenas unos cuantos símbolos, la IA lo va a tener muy difícil aunque no imposible.
Su habilidad para encontrar patrones ocultos en comparaciones de grandes cantidades de datos gracias al aprendizaje automático, puede ayudar a los investigadores a identificar patrones y conexiones entre este idioma perdido y los idiomas conocidos.
Para ello los investigadores que intenten usar esta herramienta deberán recopilar y limpiar las muestras de datos del lenguaje y todos sus posibles parientes de la época. Después la IA podrá entrenarse para identificar patrones en algunos pares coincidentes para, finalmente, poder crear perfiles lingüísticos comparando caracteres en el idioma no descifrado con aquellos en idiomas relacionados conocidos. Es en ese punto donde quizás la máquina hará lo que los humanos no han podido hacer durante más de un siglo.
En el corazón de Pakistán y el noroeste de la India yacen las ruinas de la civilización del valle del Indo, una cultura que floreció entre el 2600 y el 1900 a. C. Con el urbanismo avanzado de ciudades como Mohenjo-Daro o Harappa y la gestión de un gigantesco volumen comercial, los pueblos de esta civilización rivalizaban con la egipcia o la mesopotámica. Pero sigue siendo uno de los mayores misterios de la historia, especialmente por su sistema de escritura absolutamente indescifrable. Un misterio que podría resolverse gracias al inteligencia artificial —una vez más— y un reto con una recompensa de un millón de dólares para quien logre descifrar el lenguaje.