El Aymará en la Ingeniería del Lenguaje

0
606

Con la maestría y suficiencia a la que ya nos tiene acostumbrados Iván Guzmán de Rojas, relata los resultados de la digitalización del denominado “Patrimonio del Léxico del Aymará Antiguo”, que según el autor, está interrelacionado con varios idiomas europeos. Describe con detalle, la ingeniería utilizada para ese fin y su aplicación a la traducción automática en plena conexión en línea con Internet.

El extenso y complejo trabajo de Guzmán de Rojas que supera las tres décadas, ha quedado resumido en la ocasión de su presentación en Cartagena de Colombia, en seis puntos que a su vez y con la expresa autorización del autor, recapitulados por dat0s.

1 El Modelo de Representación Matricial:

Bajo los auspicios de la OEA, ya en marzo de 1985, el autor presentó su trabajo en la capital norteamericana, que por primera vez incluía nada menos que un sistema de traducción automática que Guzmán de Rojas denominó ATAMIRI; es decir que hace 30 años la conferencia que se tituló “Hacia una Ingeniería del Lenguaje”, contenía ya una propuesta para investigar y analizar las propiedades algorítmicas integradas en la gramática del idioma Aymará, que si bien no prosperó en esa ocasión, el autor ahondando sus investigaciones, desarrolló con mayor detalle, el sistema Arunqera consistente en una base de datos lexicográficos a través de la cual vincula el Aymará con varios idiomas europeos, permitiéndole simular creaciones, diseños y desarrollos artificiales de varios idiomas utilizados por la humanidad, esta vez perfectamente funcionales en un computador, económica y puntualmente viables, convirtiéndola en una revolucionaria herramienta ideal para la traducción automática precisa y de alta calidad.

En la conferencia mundial “New Directions in Machine Translation” (“Nuevos Caminos en la Traducción por Máquina”), realizada en 1988 en la ciudad de Budapest, el autor  presentó con representaciones en ordenador, su modelo ATAMIRI.

La frase modelo ingresada en Aymará: “Taykamax mä q’ellu isi muni”, fue simultáneamente traducida por el sistema, al Español, Inglés, Francés y Alemán, reordenando automáticamente y de manera independiente -gracias a la estructura objeto directo-verbo típico del Aymará- cada nivel sintáctico, evidenciando así, “…que el modelo matricial es muy efectivo para manejar estructuras sintácticas diversas…”.

La introducción al sistema del elemento denominado por el autor: Palliri -un algoritmo selector que colecta elementos sintácticos- muestra las categorías sintácticas de las palabras y morfemas aplicadas a través del Arunqera a los correspondientes términos en otros idiomas; de esta manera -afirma el autor-  “…en el sistema Atamiri, la representación formal del Aymará juega el papel de una ‘interlingua’ a nivel sintáctico. Las consabidas operaciones de traducción de la estructura origen a la meta, se simplifican enormemente como transformaciones matriciales de más fácil manejo en un programa informático. De esta manera se hace posible la traducción multilingüe a bajos costos de desarrollo“.

2 Características estructurales de Arunqera.

Según Guzmán de Rojas, Arunqera sirve básica aunque no exclusivamente al ATAMIRI, para que éste cumpla con varios requisitos estructurales del sistema como ser acceso multilingüe, desarrollo léxico independiente por idioma, parámetros universales y específicos por idioma y término, etc.

En la propia presentación del libro, pueden observarse varias pantallas con el detalle desglosado de las entradas léxicas al sistema, constatándose miles de ellas en trece de los idiomas más conocidos del mundo.

Guzmán de Rojas aclara que por obvias razones, el idioma Aymará carece de léxico moderno, por lo que será necesario ir generando neologismos en Aymará: “… en lo posible preservando sus raíces semánticas y estructura morfológica, para llenar esos vacíos en los conceptos de uso más frecuente”.

El autor propone los siguientes ejemplos que grafican la afirmación precedente:

 

“El sufijo de derivación utilizado es “-xtara” que sabemos se aplica en varias conocidas derivaciones similares de ciertos adjetivos a partir de sustantivos (según Bertonio este sufijo es “-k^tara”):

sut’i (nigua) sut’îxtara (lleno de niguas)

lap’a (piojo) lap’axtara (piojoso, lleno de piojos)

qala (piedra) qalaxtara (pedregoso, lleno de piedras)

tillu (caspa) tillûxtara (caspiento, lleno de caspa)

qollqe (plata) qollqextara (lleno, atestado de plata)”

3 Metodología empleada para el Aymara

El autor explica que los términos léxicos del Aymará introducidos en el Arunqera, resultan de un extenso trabajo llevado a cabo a lo largo del desarrollo del ATAMIRI. Afirma que ya se han integrado cerca de siete mil términos con sus correspondientes equivalentes en los otros idiomas implantados en el sistema traductor.

En cuanto al alfabeto utilizado para representar el Aymará, se afirma que es ligeramente diferente del comúnmente utilizado por nosotros todos los días. Al respecto, el autor integra la siguiente explicación: En Arunqera, existen varias entradas léxicas que muestran casos contrastivos.  Otra diferencia es que para los fonemas aspirados no utilizamos la letra “h”, sino mas bien el acento ˆ. Las consonantes explosivas se distinguen con el apóstrofe como es usual. Así tenemos los tríos de las consonantes: p, pˆ, p’, q, qˆ, q’, k, kˆ, k’, ç, çˆ, ç’. Además utilizamos “ç” en vez de “ch”, que se encuentra en todo teclado hispano”.

En lo referido a las vocales, el autor adoptó una representación fonética antes que fonémica, “…sobre todo en consideración a posibles aplicaciones del Aymará con voz digitalizada, en que conviene distinguir las vocales con letras diferentes para sonidos diferentes”.

4 Operación de corrección y ampliación de Arunqera en Internet

Con el propósito de obtener la ampliación y/o corrección de la lexicografía de Arunqera antes mencionada,  el sistema posee una versión destinada a ingresos autorizados para efectuar tales cambios en un determinado idioma. La dirección correspondiente para este propósito, es: www.atamiri.cc/arunqera.

Según el autor, la modalidad señalada, permitirá  “…operar vía Internet para enriquecer Arunqera con el apoyo de la “Unión Latina” para ingresar terminología en el campo del tema de “sociedad de la información”, en francés, italiano y rumano, con traductoras trabajando desde París. Del mismo modo, con el apoyo de la fundación “Atlas de la Diversidad” hemos iniciado una operación de prueba de implementación del catalán, con un léxico básico introducido desde Barcelona. Los resultados y evaluaciones de estos experimentos se pueden ver en el foro con traducción multilingüe: www.atamiri.cc/aynisiwi”

 

5 El traductor multilingüe ATAMIRI

Como vimos previamente, el traductor funciona utilizando la representación matricial del lenguaje que según el autor: “…ofrece tres enormes ventajas…”, es decir, i) La “Sintaxis Externa” con valores de coeficientes que se pueden almacenar en una base de datos sintáctica, de manera independiente y externa de aquellas del parcelador, siendo así posible, enriquecer los conocimientos sintácticos del ATAMIRI, utilizando -sin tocar para nada el sistema- experiencias previas de traducción de textos. El autor afirma que así ATAMIRI tiene incluso la capacidad de “aprender sintaxis”. ii) ATAMIRI tiene asimismo, capacidad de traducción multilingüe en varios idiomas, permitiendo que el usuario pueda escoger el idioma fuente y el idioma meta. iii) ATAMIRI se constituye asimismo en una interlingua, es decir en la representación formal de uno de los lenguajes escogidos en el modelo matricial, para utilizarlo como marco de referencia común para las transformaciones que intervienen en los otros lenguajes.

 

6 La Operación de ATAMIRI en Internet

Tras importantes esfuerzos personales, el autor logró lanzar el sistema ATAMIRI en la Web, haciéndolo operativo de manera gratuita desde el año 2002 y mediante el módulo Qopuchawi, es posible “…intercam-biar mensajes con traducción simultánea…” en inglés y en otros cinco idiomas latinos. De similar manera, en el sitio www.atamiri.cc/aynisiwi, ATAMIRI permite participar en los llamados foros temáticos destinados a probar y a evaluar la calidad de las traducciones entre ocho idiomas con una notable calidad en todos ellos, pero de manera destacable en lo referido al inglés-castellano cuyo léxico supera las 30.000 entradas.

 

7 Una conclusión reflexiva y autocrítica

En el séptimo punto de su presentación, el autor declara que ha dedicado su tiempo profesional al sistema ATAMIRI, durante más de 29 años, ingresando incluso en los años 80, al Centro de Traducciones de la Comisión del Canal de Panamá y a otros centros de traducción europeos mediante el famoso fabricante de minicomputadoras Wang y posteriormente como ya anotamos, al Internet. El autor reconoce haber transitado por caminos sumamente difíciles en la no menos difícil y dinámica transformación de la industria informática que ATAMIRI hubo también de recorrer con idéntico esfuerzo para evitar su obsolescencia, tan frecuente en este ámbito inmisericordemente competitivo y desgastante que según Iván Guzmán de Rojas, bien pudo ser utilizado en fines más productivos de haberse contado con los recursos del caso; sin embargo y a diferencia de proyectos mucho mejor dotados financieramente hablando como el mentado EuroTra en Europa, “…que dejó tantos anuncios altisonantes sin cumplirlos…”, la pervivencia de ATAMIRI, es clara evidencia de su robustez y calidad como un potencial instrumento de solución al problema de la enorme cantidad de lenguas -más de 6.000- que hoy por hoy, pugnan por ingresar en la Web, habiéndolo logrado tan sólo ochenta en sitios como Google, entre los que lastimosamente, no se encuentra el Aymará como tampoco ninguno de los otros idiomas autóctonos de América, circunscribiéndose la gran pugna, al Inglés y en ese orden, al Alemán, Francés, Italiano, Español, Japonés y Holandés, entre más de cien mil sitios en la Web que los utilizan.

 

“…con Atamiri estamos muy cerca de hacer una realidad la traducción al Aymara si se contara con el debido apoyo al proyecto para su implementación en mayor escala. Las consecuencias, sobre todo en el campo de la enseñanza a distancia, serían enormes”

Las consonantes explosivas se distinguen con el apóstrofe como es usual. Así tenemos los tríos de las consonantes: p, pˆ, p’, q, qˆ, q’, k, kˆ, k’, ç, çˆ, ç’. Además utilizamos “ç” en vez de “ch”, que se encuentra en todo teclado hispano”.

 

 

Iván Guzmán de Rojas. (Datos de Wikipedia)

Hijo del famoso pintor potosino Cecilio Guzmán de Rojas.  Iván nació en La Paz, Bolivia en 1934 y realizó sus estudios escolares en el Instituto Americano de esa ciudad, concluyendo el bachillerato en 1952. Ya en el colegio se interesó por las ciencias, principalmente las matemáticas y la física.

Estudió Ingeniería Industrial en la Universidad Mayor de San Andrés y fue becado a Alemania como investigador. Permaneció en Europa cerca de diez años profundizando sus conocimientos en física teórica, matemática aplicada a la física. Luego de su retorno a Bolivia en 1967, promovió el establecimiento de las carreras de Ciencias Básicas en la Universidad Mayor de San Andrés. Es fundador de las carreras de Matemática, Física y Química en esa universidad e impulsor del primer laboratorio de investigaciones en química aplicada.

Obras publicadas:

  • 500 años América Latina: Ciclo de conferencias, 1973
  • El niño vs. el número, Última Hora, 1979.
  • Problemática lógico-lingüística de la comunicación social con el pueblo aymará, Centro Iterna- cional de Investigaciones para el Desarrollo, 1982
  • Logical and linguistic problems of social communication with the aymara people, International Development Research Centre (Estados Unidos), 1985
  • Problèmes de logique et de linguistique qui entravent la communication sociale avec le peuple aymara, Centre de recherches pour le développement international (Canada), 1985
  • Lógica aymara y futurología, Imprenta “Santin” Offset Color, 2007