El traductor de Google continúa en expansión y ahora acaba de agregar 111 nuevos idiomas de todo el mundo, incluyendo dialectos y lenguas de Latinoamérica, como: el K'iche' y el Ta Yol Mam (Guatemala y México); el Náhuatl o Nahua de la Huasteca Oriental, Maya yucateco y Zapoteco (México); el Q'eqchi (México y Bélice); y el Hunsrik (Brasil).
De acuerdo con el gigante tecnológico, este es el lanzamiento más grande hasta el momento de su plataforma de traducción, pues los idiomas recientemente incorporados representan a más de 614 millones de hablantes. Con esto, la compañía busca ayudar a conservar y divulgar el tesoro lingüístico que hay en Latinoamérica y el mundo.
La implementación de los nuevos idiomas se hará de forma gradual, entre el 27 de junio y el 7 de julio. Para probarlo, las personas pueden ingresar al sitio del Traductor de Google desde la computadora o desde la aplicación para iOS y Android.
Esta ampliación en el número de idiomas soportados por el traductor se logra gracias al uso de sistemas de Inteligencia Artificial, como Zero-Shot, un modelo de aprendizaje automático que permite a la plataforma aprender a realizar traducciones a un idioma sin haber visto nunca antes un ejemplo; así como PaLM 2, un modelo de lenguaje de gran tamaño, que ayuda a ampliar la variedad de idiomas que el Traductor de Google soporta.
Algunos de los idiomas que ahora son compatibles con el Traductor de Google son:
- Náhuatl: Es la lengua indígena más hablada en México, con más de un millón y medio de hablantes y 30 variantes lingüísticas. El náhuatl se habla en 15 de las 31 entidades federativas de la República Mexicana: Puebla, Hidalgo, Veracruz, San Luis Potosí, Oaxaca, Colima, Durango, Guerrero, Jalisco, Michoacán, Morelos, Nayarit, Tabasco, Tlaxcala, Estado de México y Distrito Federal.
- Maya: Es la segunda agrupación lingüística (después del náhuatl) más hablada en México, con cerca de 800 mil hablantes. La lengua maayat’aan se ubica geográficamente en los estados de Yucatán y Campeche, principalmente.
- Zapoteco: Actualmente, cerca de 500 mil personas hablan zapoteco en México, quienes se ubican principalmente en el estado de Oaxaca, en las regiones de la Sierra Norte, los Valles Centrales, la Sierra Sur, Tuxtepec, el Istmo de Tehuantepec y la Costa de Oaxaca. Esta lengua cuenta con 62 variantes.
- Afar: es la lengua tonal que se habla en Yibuti, Eritrea y Etiopía. De todos los idiomas incluidos en este lanzamiento, éste es el que recibió la mayor cantidad de aportes de la comunidad de voluntarios.
- Cantonés: Ha sido uno de los idiomas más solicitados, pero también es uno de los más difíciles de incorporar, porque a menudo en la escritura se superpone con el Mandarín, lo que dificulta la búsqueda de datos y el entrenamiento de modelos.
- Manés: Es la lengua celta de la Isla de Man. Estuvo a punto de desaparecer con la muerte de su último hablante nativo en 1974. Pero gracias a un movimiento de revitalización en toda la isla, ahora hay miles de hablantes.
- N'Ko: Es una forma estandarizada de las lenguas mandingas de África Occidental que unifica muchos dialectos en un idioma común. Su alfabeto único se inventó en 1949 y, actualmente, cuenta con una comunidad de investigación activa que desarrolla recursos y tecnologías para éste.
- Punjabi (Shahmukhi): Es el tipo de escritura en el alfabeto perso-árabe (Shahmukhi) y el idioma más hablado en Pakistán.
- Tamazight: Es la lengua Bereber que se habla en todo el norte de África. Aunque existen muchos dialectos, la forma escrita suele ser comprensible para todos. Se escribe en alfabeto Latino y en el Tifinagh, ambos compatibles con el Traductor de Google.
- Tok Pisin: Es un lenguaje criollo basado en el inglés y la lengua franca de Papúa Nueva Guinea. Si hablas inglés, intenta traducir al Tok Pisin y ¡podrías entender el significado!