Es noticia
La idea para crear un traductor universal de 24 idiomas (y sin fallos)
  1. Tecnología
francés, búlgaro, español, maltés, griego...

La idea para crear un traductor universal de 24 idiomas (y sin fallos)

Estos investigadores tienen la difícil misión de traducir textos entre lenguas minoritarias sin tener que pasar por el inglés, como hace Google Translate

Foto: (Kevin O’Mara)
(Kevin O’Mara)

Del francés al búlgaro. Del español al maltés. O del letón al griego. Y viceversa. Estas combinaciones de idiomas se pueden dar perfectamente en una jornada de trabajo en Bruselas o Estrasburgo. Los traductores e intérpretes trabajan con ellas porque todas son lenguas oficiales de la Unión Europea. En total, 24, más algunas cooficiales. ¿Y si de alguna manera se simplificara el trabajo de la organización?

Foto: castelseras-corrales-para-competir-con-amazon

Están trabajando en ello. Quality Translation 21 es un proyecto financiado con fondos de la Unión Europea (según la web Phys.org, con 3,9 millones de euros) para ahondar en la idea de un mercado unido y libre, también de las barreras del lenguaje. Derribar esos muros es uno de los propósitos del organismo supranacional como parte de lo que se denomina mercado único digital, que busca “ofrecer oportunidades digitales a los particulares y las empresas”, según la Comisión Europea. En este contexto, Quality Translation 21 o QT21 es un consorcio de instituciones dedicadas a la traducción: universidades, empresas, institutos de investigación…

El principal problema es que la traducción se hace del inglés a otra lengua o de otra lengua al inglés, nunca entre dos lenguas distintas a la vez

“En efecto, la Unión Europea tiene esta meta, y quieren ampliar la máquina de traducción a un acceso completo con alta calidad”, o sea, no solo para sus trabajadores, sino para la población en general. El alemán Stephan Busemann, uno de los responsables del proyecto, define lo que hacen como “una máquina de traducción de vanguardia”. Para ello se sirve de expertos en lingüística computacional, en estadística y, sobre todo, de muchos, muchos datos.

Como explica Busemann a Teknautas, sistemas actuales como Google Translate tiran de estadística para elaborar sus traducciones: cuentan con una base de datos con millones de textos y la utilizan para traducir las frases que les pides. Lo hacen en base a la posición que ocupaban esos mismos términos en la mayoría de los casos registrados. Así se explican los errores en el orden de elementos de una oración o que una palabra se traduzca con un significado más común en vez de con uno más específico.

No es la única razón por la que existen estos errores. El principal problema es que la traslación se hace del inglés a otra lengua o de otra lengua al inglés, nunca entre dos lenguas distintas a la vez. Es decir, si alguien quiere traducir del húngaro al estonio o viceversa, el texto deberá pasar primero por una aproximación en inglés y de ahí a otra lengua. “Nosotros también queremos traducir entre el húngaro y el estonio” sin pasar por la lengua de Shakespeare, explica Busemann. “Todo esto depende de las habilidades o destrezas del personal, del dinero…”.

Así, el principal reto de este nuevo traductor será conseguir traducciones muy exactas, a la manera de las que se piden a un ser humano y mejorando lo presente en el ámbito tecnológico. “Los traductores necesitan hacer un trabajo muy fiel, porque puede haber diferencias si usas la versión letona o la versión inglesa”, recuerda el investigador.

Además, Busemann y su equipo trabajan para que el ordenador sepa detectar qué palabra es la principal en la oración o dónde colocar artículos, conjunciones o preposiciones. Hay que tener en cuenta que hay lenguas donde los elementos (sujeto, verbo, complementos) no guardan un orden obligatorio, como es el caso del español, y otras en las que sí lo hacen.

Busemann trabaja para que el ordenador sepa detectar qué palabra es la principal y dónde colocar artículos, conjunciones y preposiciones

Los textos que están recopilando para la base estadística han de ser de todo tipo de campos: “Si usas textos legales para crear el sistema estadístico, será sobresaliente en el dominio legal y no será bueno en otros dominios”, resume Busemann. “Si quieres traducir desde muy diferentes dominios, debe haber datos de estos muy diferentes dominios”. Para ello utilizarán, entre otros, los textos y traducciones de las propias instituciones europeas, que abarcan áreas tan diversas como las finanzas o los asuntos exteriores.

Los datos que se usan para cubrir todos esos dominios son los de la plataforma META-NET. Con sede en 34 países, recoge información sobre 31 lenguas europeas, 23 de ellas oficiales en el marco de la Unión y otras importantes a nivel regional o nacional, desde el islandés o el catalán hasta el francés. Según las conclusiones de META-NET, 20 de esos idiomas están en peligro de extinción digital.

Así, explica Busemann, recopilar textos para el traductor del inglés es muy fácil: es una de las lenguas más usadas en el mundo, los resúmenes de comunicaciones para conferencias deben entregarse en este idioma… Sin embargo, hacerlo con las lenguas eslavas o bálticas es más difícil. Ese es otro de los principales retos a los que se enfrenta el proyecto, así como lograr que el traductor distinga entre versiones de un mismo idioma, como el portugués de Portugal y el de Brasil.

Por ello, la Comisión Europea lanzó en abril de 2015 la European Language Resources Coordination (ELRC), con el objetivo de recopilar datos sobre traducciones y lenguas importantes para las administraciones e instituciones. Una vez recopilados, la Comisión Europea “preparará el ‘software’ de traducción y lo ajustará a los requisitos de las administraciones públicas y ciudadanos europeos”, ha explicado uno de los responsables de ese proyecto, Joseph van Genabith. La European Language Resources Coordination cuenta con un apoyo financiero de 1,7 millones de euros de la Comisión Europea. Los datos de META-NET y del ELRC serán esenciales, en definitiva, para la buena ejecución del traductor.

Van Genabith quiso tranquilizar a los humanos: ninguna máquina podrá sustituir a los traductores de carne y hueso, al menos por completo. “Los ordenadores pueden traducir grandes cantidades de texto mucho más rápido que un humano. Pero las traducciones no serán perfectas, así que dependiendo de los requisitos, los traductores aún tendrán que editar los textos”. La informática seguirá ahondando en la idea de una Europa plurilingüe y ayudando a la integración de las lenguas minoritarias, pero será difícil que sustituya a la materia gris.

Del francés al búlgaro. Del español al maltés. O del letón al griego. Y viceversa. Estas combinaciones de idiomas se pueden dar perfectamente en una jornada de trabajo en Bruselas o Estrasburgo. Los traductores e intérpretes trabajan con ellas porque todas son lenguas oficiales de la Unión Europea. En total, 24, más algunas cooficiales. ¿Y si de alguna manera se simplificara el trabajo de la organización?

El redactor recomienda