Con ayuda de las IA está a punto de revelarse un texto podria cambiar la historia de la humanidad

Un programa similar a 'Google Translate' para cuneiforme acadio permitirá que decenas de miles de tabletas digitalizadas pero no leídas sean traducidas al inglés.

El cuneiforme es la forma más antigua de escritura conocida, pero es tan difícil de leer que solo unos pocos cientos de expertos en todo el mundo pueden decodificar las tabletas de arcilla llenas de símbolos con forma de cuña. Ahora, un equipo de arqueólogos y científicos de la computación de Israel ha creado un programa de traducción impulsado por IA para el cuneiforme acadio antiguo, lo que permite que decenas de miles de tabletas ya digitalizadas sean traducidas al inglés de manera instantánea.

A nivel mundial, bibliotecas, museos y universidades tienen más de medio millón de tabletas de arcilla inscritas con cuneiforme. Sin embargo, la enorme cantidad de textos y la pequeña cantidad de lectores de acadio, un idioma que nadie ha hablado ni escrito durante 2,000 años, significa que solo una pequeña fracción de estas tabletas ha sido traducida.

Un nuevo programa tipo Google Translate podría permitir que arqueólogos aficionados intenten interpretar el cuneiforme.

Gai Gutherz, un científico de la computación que formó parte del equipo que desarrolló el programa expresó:

"Lo sorprendente de esto es que no necesito entender el acadio en absoluto para traducir [una tableta] y entender lo que hay detrás del cuneiforme. Solo puedo usar el algoritmo para entender y descubrir lo que el pasado tiene que decir".

El proyecto comenzó como un proyecto de tesis para la maestría de Gutherz en la Universidad de Tel Aviv. En mayo, el equipo publicó un artículo de investigación en la revista revisada por pares PNAS Nexus, de la Oxford University Press, que describía su traducción automática neuronal del acadio al inglés.

La traducción automática neuronal, también utilizada por Google Translate, Baidu translate y otros motores de traducción, funciona convirtiendo las palabras en una cadena de números y utiliza una fórmula matemática compleja, llamada red neuronal, para generar una oración en otro idioma en una construcción de oración más precisa y natural que la traducción palabra por palabra.

El acadio se escribía y hablaba en Mesopotamia y el Medio Oriente desde alrededor del 3,000 a.C. hasta el año 100 d.C. Fue la lingua franca de la época, lo que permitió a las personas de diferentes regiones comunicarse. El idioma se dividió en acadio asirio y acadio babilónico alrededor del año 2000 a.C. A partir del año 600 a.C., el arameo comenzó lentamente a reemplazar al acadio, hasta que se habló mucho más ampliamente.

El acadio y su predecesor, el sumerio, se escribían usando cuneiforme, en el que una caña afilada crea marcas con forma de cuña en una pieza de arcilla húmeda. El cuneiforme acadio y sumerio son los idiomas escritos más antiguos jamás descubiertos, aunque hay muchos más textos acadios disponibles que textos sumerios.

"La traducción de todas las tabletas que quedan sin traducir podría exponernos a los primeros días de la historia, a la civilización de esas personas, en qué creían, de qué hablaban, qué documentaban"

¿Perdido en la traducción?

La traducción es una forma de arte, por lo que puede ser difícil medir numéricamente lo que constituye una "buena" traducción, dijo Gutherz. Para calificar las traducciones, los investigadores utilizaron la herramienta de evaluación Best Bilingual Evaluation Understudy 4 (BLEU4), una herramienta de evaluación desarrollada a principios de los años 2000 para medir automáticamente la precisión de las traducciones creadas por máquinas.

Según el estudio, la traducción automática neural proporcionó una puntuación BLEU4 de 36,52 para cuneiforme a inglés y una puntuación de 37,47 para cuneiforme transliterado a inglés. Las puntuaciones BLEU4 van de 0 a 100, siendo 0 la más baja y 100 una traducción perfecta, que incluso un traductor humano no podría lograr. Alrededor de 37 se considera bastante bueno para un modelo de traducción en etapa temprana, explicó Gutherz.

Además., dijo que Google Translate, una herramienta comercial financiada privadamente que ha existido durante más de una década, obtendría una puntuación BLEU4 de alrededor de 60 al traducir del español al inglés.

"Uno de los principales logros de la investigación es que demostramos que es posible obtener una traducción de alta calidad directamente desde el cuneiforme al inglés. El proceso de investigación actualmente consume mucho tiempo, ya que requiere que los expertos traduzcan primero el cuneiforme a la transliteración latina y luego principalmente al inglés."

En 2020, Gutherz, el arqueólogo Prof. Shai Gordin de la Universidad Ariel y otros publicaron un artículo sobre el uso de inteligencia artificial para traducir el cuneiforme acadio a un script latino transliterado. El script transliterado se lee como una colección absurda de letras y números para el ojo inexperto, pero es un "lenguaje" común que permite a los arqueólogos e investigadores estudiar y discutir el cuneiforme en todo el mundo.

En el artículo de 2020, el equipo pudo lograr una precisión del 97 por ciento al utilizar inteligencia artificial para traducir el cuneiforme acadio al script latino transliterado. Este es un proceso mucho más simple, ya que funciona mediante la traducción de los símbolos cuneiformes a una sola palabra y manteniendo las palabras en el mismo orden en que se encontraron.

Traducir del acadio al inglés o del script transliterado al inglés es un proceso mucho más complicado porque requiere que la computadora una frases o oraciones completas que tengan sentido en inglés, que se escribe en un orden sintáctico diferente.

Gutherz dijo que a pesar de la complejidad, las traducciones de inteligencia artificial tuvieron un desempeño mejor de lo esperado, aunque el programa aún está en etapas tempranas y está lejos de ser preciso. Predeciblemente, la inteligencia artificial tuvo un mayor nivel de precisión para los textos formulaicos, como decretos reales o adivinaciones, que siguen un cierto patrón.

Los textos más literarios y poéticos, como las cartas de los sacerdotes o los tratados, tuvieron una mayor incidencia de "alucinaciones", un término de inteligencia artificial que significa que la máquina produjo un resultado que no tenía nada que ver con el texto proporcionado.

Una de las cosas que más sorprendió a los investigadores es que las traducciones capturaron el estilo o ritmo de ciertos géneros, lo que les permitió determinar, simplemente basándose en el estilo de la traducción, si el texto era un documento legal formulaico, un informe astrológico o una carta académica.

"Algunas traducciones fueron muy buenas, algunas estuvieron cerca del punto en el que se podría empezar desde allí, pero se tendría que hacer más precisa manualmente, y algunas fueron alucinaciones totales. Este es el primer paso para una traducción automática del acadio y otros idiomas antiguos, y realmente espero que se realice más investigación en esta área y que las traducciones mejoren y tengan una mayor precisión".

El mayor desafío para entrenar el modelo de inteligencia artificial fue la cantidad limitada de material disponible, como imágenes de tabletas y tabletas traducidas. Incluso las mayores bases de datos en línea de tabletas acadias tienen solo decenas de miles de entradas. La cantidad de datos en los que se entrena es correlativa con el desempeño, y cuanto más datos se tienen, mejores serán los modelos, explicó Gutherz. El equipo utilizó un 90% del material disponible para el entrenamiento, un 5% para la validación y otro 5% para las pruebas.

Durante los 3.000 años que se usó el acadio, hubo enormes variaciones. El acadio escrito con 1.000 años de diferencia puede tener símbolos cuneiformes completamente diferentes, y también hubo diferencias en los dialectos, lo que aumenta la complejidad.

No todos los expertos en acadio están dispuestos a utilizar la nueva tecnología, ya que algunos afirman que aún está lejos de ser útil para textos profundos y menos formulados. Por ejemplo, el profesor Nathan Wasserman, experto en textos acadios complicados y poéticos, como los himnos, las oraciones y los mitos, no está convencido de que la nueva tecnología sea útil para él. Su trabajo no solo se trata de traducir, sino también de comprender el contexto dentro de la cultura y la literatura acadias. Aunque no está interesado en utilizar la tecnología en este momento, está interesado en ver cómo se desarrolla y cree que puede ser más útil para escanear grandes cuerpos de tabletas digitalizadas y encontrar conexiones. También está interesado en utilizar el programa para realizar un seguimiento de las estadísticas sobre el uso de diferentes palabras, incluida la distribución cronológica o geográfica de ciertas palabras. Según Wasserman, la tecnología debe evaluarse por lo que puede hacer por nosotros y por lo que no puede hacer, y se necesita la mente humana para entender el significado de los textos, incluso cuando las palabras están correctamente traducidas.

Fuente: Times of Israel


«   »

Añadir comentario

Comentarios

Todavía no hay comentarios