pixel

Dar voz a todas las lenguas

En la era de la IA, la inclusión de todas las lenguas es esencial para las comunidades y la cultura 

Más de 2500 lenguas corren el riesgo de desaparecer

Cada cierto tiempo, una lengua se acerca más a la extinción.

A medida que los hablantes envejecen y cada vez menos personas la aprenden, el conocimiento práctico que aporta la lengua se vuelve más difícil de transmitir. A medida que la historia de los cuentos y las canciones empieza a desvanecerse, la identidad de una comunidad se va perdiendo silenciosamente: la pérdida es íntima, el mundo se vuelve un poco menos vibrante. A finales de este siglo, miles de lenguas podrían haber desaparecido, dejando solo ecos de nombres para el viento o rituales que honraban la tierra.

En reconocimiento a lo que está en juego, la UNESCO designó el período 2022-2032 como la Década de las Lenguas Indígenas. Esto pone de relieve un esfuerzo global para apoyar la revitalización y la inclusión digital, y el trabajo que los partners en lugares como Nunavut están ayudando a impulsar. Según UNESCO Atlas of World’s Languages in Danger, más de 2500 están en riesgo de desaparecer, y con cada pérdida se desvanecen siglos de sabiduría y tradición.

«La lengua determina quién puede utilizar la IA: sigue siendo inaccesible cuando las personas no pueden interactuar con ella en su propia lengua», señala Inbal Becker-Reshef, director general de Microsoft AI for Good Lab.
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

Más del 70 % de los inuit de Nunavut declaran que el inuktut es su lengua materna

Preservar el patrimonio y empoderar a la comunidad

Nunavut es el territorio más grande y septentrional de Canadá, que abarca la mayor parte del Ártico canadiense, con la mitad de su superficie dentro del círculo polar ártico. Con más de 30.000 indígenas, Nunavut significa «Nuestra Tierra» en inuktut, o el término unificador que engloba los dialectos inuktitut e inuinnaqtun.

Durante mucho tiempo, el inuktut careció de las herramientas de traducción adecuadas y de los modelos de lenguaje de gran tamaño.(LLM) que reflejaran sus dialectos. Esto hizo que preservar la lengua para las generaciones futuras con herramientas digitales fuera una tarea casi imposible.

En un esfuerzo por preservar y promover el inuktitut, el Gobierno de Nunavut se asoció con Microsoft para ayudar a las personas a comunicarse tanto en inglés como en inuktitut y, al mismo tiempo, crear una memoria de traducción sólida y propiedad de la comunidad. Mediante una estrecha colaboración con el Gobierno de Nunavut y las comunidades para recopilar datos lingüísticos, Microsoft ayudó a incorporar los dialectos tradicionales de Nunavut a los entornos digitales modernos al incluir la familia de lenguas inuktut a Microsoft Translator, lo que favoreció la conservación y el uso de estas lenguas por parte de la comunidad.

El enfoque se centra en el codiseño con partners locales para establecer la gobernanza y el consentimiento, recopilar texto y audio aprobados por la comunidad, seleccionar y etiquetar datos con revisores locales y validar los resultados según las normas culturales y lingüísticas. Este proceso, basado en la gestión responsable, genera confianza de modo que los modelos reflejan el lenguaje vivido y son aceptados localmente. Juntos, estos esfuerzos complementarios mejoran la comunicación en el mundo real. Los profesionales de la salud pueden colaborar con mayor facilidad a distancia, los jóvenes de las generaciones de Nunavummiut pueden conectar más plenamente con los mayores y las personas pueden crear, comunicarse y traducir en el idioma que elijan. Hoy en día, los educadores añaden comentarios en los boletines de calificaciones de los estudiantes en inuktitut, lo que les permite interactuar mejor con las familias que solo hablan este idioma.

El trabajo ha continuado mediante una colaboración con Microsoft AI for Good Lab, trabajando conjuntamente para desarrollar un proceso que permita adaptar modelos de lenguaje de gran tamaño de pesos abiertos (LLM) a lenguas con pocos recursos, como el inuktitut.

«Trabajar estrechamente con el Gobierno de Nunavut fue fundamental para que pudieran confiar en los modelos y, en última instancia, adaptarlos y utilizarlos», señala Inbal Becker-Reshef.

Apoyo al avance de todas las lenguas

A medida que la adopción de la IA se acelera en todo el mundo, la inclusión de lenguas de bajos recursos se ha convertido en un problema crítico. La lengua es la puerta de acceso a la educación, la atención sanitaria y las oportunidades económicas, y sin una inclusión intencionada, comunidades enteras corren el riesgo de quedarse atrás. El enfoque de Microsoft es de código abierto, lo que garantiza que las herramientas y los conjuntos de datos desarrollados para la preservación y revitalización de las lenguas estén a disposición de comunidades, investigadores y partners de todo el mundo. Al hacer que estos recursos sean accesibles, los gobiernos pueden interactuar mejor con las comunidades, ya que la difusión de la IA permite que las voces locales configuren el futuro de la tecnología.

«En Microsoft, nos aseguramos de que las comunidades indígenas tomen la iniciativa, aportando corazón y rigor a nuestras colaboraciones. Trabajamos con respeto, consentimiento y responsabilidad compartida», afirma Mike Adams, patrocinador ejecutivo de la Red de Inclusión Indígena).

Microsoft AI for Good Lab ha desarrollado un proceso reproducible para adaptar los LLM de pesos abiertos a lenguas con pocos recursos. Este marco empodera a los partners y promueve herramientas de IA adaptadas a sus comunidades, sin importar la presencia digital de la lengua. Los proyectos globales abarcan el inuktitut en Canadá, el maorí en Nueva Zelanda, el chichewa en Malawi y el swahili en África Oriental. Y a través de su iniciativa LINGUA, Microsoft financia y fortalece proyectos que crean conjuntos de datos de alta calidad para lenguas poco representadas. Al compartir planos técnicos y colaborar con expertos locales, todas las lenguas pueden beneficiarse de los últimos avances en IA.

Desde una perspectiva cultural, es fundamental que las personas puedan comunicarse en su propia lengua. La IA brinda un gran poder a las personas, pero no deberían necesariamente tener que aprender otro idioma para usarla.
Dr. Juan M. Lavista Ferres
Director de Lab, Microsoft AI for Good Lab

Construyendo un futuro de IA para todos

Una investigación reciente de AI for Good Lab destaca que los países en los que predominan las lenguas de bajos recursos presentan una adopción de la IA significativamente menor, lo que demuestra que la inclusión lingüística es un motor independiente y potente de la difusión de la IA. El predominio del inglés en la web, donde la mitad de todo el contenido está en inglés, pero solo el 5 % de la población mundial lo habla como lengua materna, significa que los modelos de IA a menudo tienen dificultades con otros idiomas, lo que perpetúa las desigualdades globales.

La IA es la tecnología de más rápido crecimiento en la historia: 1200 millones de personas ya la utilizan, pero miles de millones más no pueden hacerlo. Muchos no cuentan con los fundamentos que hacen posible la IA, como la electricidad, Internet y las habilidades digitales. La difusión se produce cuando todo el mundo integra las nuevas tecnologías en su forma de vivir, trabajar y aprender, pero si no se abordan y se eliminan las brechas, corremos el riesgo de crear una nueva brecha digital. Para evitar que se repitan las desigualdades del pasado, en las que las tecnologías transformadoras llegaban a algunos, pero no a todos, la inclusión de la IA debe ir acompañada de un acceso básico a la electricidad, la conectividad y las habilidades digitales. Poner herramientas eficaces en manos de todas las comunidades es la forma de hacer realidad la democratización.

El primer Informe de Difusión de la IA del Instituto de Economía de la IA de Microsoft revela que el impacto proviene de la difusión, cuando la tecnología se integra con la vida real. En la era de la IA, la inclusión de todos los idiomas puede inspirar a todas las comunidades, honrar todas las culturas y garantizar que todos puedan participar en la era digital. Al abrazar la diversidad lingüística, surgen nuevas oportunidades para aprender, conectarse e innovar.

Se trata realmente de garantizar que este tipo de tecnologías, que son tan transformadoras para nosotros, se distribuyan de manera equitativa.
Inbal Becker-Reshef
Director general, Microsoft AI for Good Lab