*

Un hito en la traducción de lenguas

Desde que en 2004, Sergey Brin, cofundador de Google, usó un programa de traducción para traducir un correo del coreano al inglés, Google Translate se ha convertido en una poderosa herramienta de traducción que hoy puede traducir en tiempo real 244 idiomas, incluyendo 111 nuevos idiomas, entre los cuales se encuentran lenguas indígenas de México como el maya, náhuatl y zapoteco. 

La inclusión de estos  idiomas es un hito importante especialmente en el caso de algunos idiomas que no tienen mucha visibilidad. Si bien Google Translate está lejos de la perfección en idiomas que no tienen tanto uso, el hecho no deja de ser significativo.

 México es uno de los países con mayor diversidad lingüística en el mundo, con 68 lenguas indígenas. La preservación de estas lenguas es fundamental no solo por su valor cultural y histórico, sino también por el papel crucial que desempeñan en la identidad de las comunidades indígenas. Cada lengua indígena representa una perspectiva única y un acervo de conocimientos y tradiciones que han sido transmitidos de generación en generación. La preservación de estas lenguas contribuye a mantener la diversidad cultural y fortalece el orgullo y la continuidad de estas comunidades.

La tecnología detrás de esta innovación es impresionante. Con PaLM 2, el modelo de lenguaje extenso que sustenta la inteligencia artificial de Google, la compañía ha incorporado la traducción automática Zero-Shot, que permite aprender a traducir a otro idioma sin necesidad de ver un ejemplo. Esta tecnología ha permitido sumar más de un centenar de idiomas al traductor, incluyendo lenguas indígenas de México como el náhuatl, hablado por alrededor de un millón de personas en el centro del país; el zapoteco, con cerca de 500,000 hablantes en Oaxaca y Veracruz; y el maya yucateco, hablado por casi 800,000 personas en el sur de México y Belice.

Sin embargo, la tecnología no es perfecta. Google advierte que la traducción automática puede contener errores, y es importante tener en cuenta estas limitaciones. La traducción de lenguas indígenas presenta desafíos únicos debido a las variaciones regionales y la falta de ortografías estandarizadas. Google ha priorizado las variedades más utilizadas de cada idioma, aunque esto puede resultar en una mezcla de dialectos.

Además de las lenguas indígenas de México, Google ha sumado otras lenguas indígenas de América Latina, como el guaraní y el aimara. La inclusión de estas lenguas en Google Translate destaca el compromiso de la compañía con la diversidad lingüística y la preservación de lenguas que están en riesgo de desaparecer. Un ejemplo notable es el manés, una lengua celta de la Isla de Man, que estuvo a punto de desaparecer en 1974 con la muerte del último hablante nativo, pero que gracias a un movimiento de revitalización, hoy cuenta con miles de hablantes y ahora es parte de Google Translate.

Google también ha enfocado sus esfuerzos en regiones que habían sido pasadas por alto. Desde 2022, la compañía ha trabajado para sumar al traductor los mil idiomas más hablados en el mundo. Este esfuerzo incluye lenguas africanas como el fon, kikongo, luo, ga, swati y wólof, lo que representa una de las mayores expansiones de lenguas africanas hasta la fecha.  Asimismo, en esta camada se incorporan lenguajes de los Himalayas, como el nepalés y el tibetano.