Más de 2.500 lenguas corren el riesgo de desaparecer
Cada pocos meses, una lengua se acerca a la extinción.
A medida que los hablantes envejecen y menos personas lo aprenden, el conocimiento práctico que transmite el idioma se vuelve más difícil de transmitir. A medida que la historia de las narraciones y las canciones comienzan a desvanecerse, la identidad de una comunidad se desmorona silenciosamente: la pérdida es íntima, el mundo un poco menos vibrante. A finales de este siglo, miles de lenguas podrían haber desaparecido, dejando solo ecos de nombres para el viento, o rituales que honraban a la tierra.
Al reconocer lo que está en juego, la UNESCO designó el período 2022-2032 como el Decenio de las Lenguas Indígenas. Esto pone de relieve el esfuerzo mundial para apoyar la revitalización y la inclusión digital, así como la labor que están realizando los socios en lugares como Nunavut. Según el Atlas de las lenguas del mundo en peligro de la UNESCO, más de 2.500 lenguas están en riesgo de desaparecer, y con cada pérdida, se desvanecen siglos de sabiduría y tradición.
“La lengua determina quién puede usar la IA, permaneciendo inaccesible cuando las personas no pueden interactuar con ella en su propia lengua”, dice Inbal Becker-Reshef, director general de Microsoft AI for Good Lab.
Más del 70 % de los inuit de Nunavut informan que el inuktut es su lengua materna
Preservar el patrimonio, empoderar a la comunidad
Nunavut es el territorio más grande y septentrional de Canadá, que abarca la mayor parte del Ártico canadiense y la mitad de él se encuentra en el círculo polar ártico. Hogar de más de 30.000 indígenas, Nunavut significa “Nuestra tierra” en inuktut, o el término unificador para abarcar los dialectos inuktitut e inuinnaqtun.
Durante mucho tiempo, el inuktut no contó con herramientas de traducción adecuadas ni con grandes modelos lingüísticos (LLM) que reflejaran sus dialectos. Esto hizo que preservar el idioma para las generaciones futuras con herramientas digitales fuera una tarea casi imposible.
En un esfuerzo por preservar y promover el inuktitut, el gobierno de Nunavut se asoció con Microsoft para ayudar a las personas a comunicarse tanto en inglés como en inuktitut, a la vez que creaba una memoria de traducción sólida que sea propiedad de la comunidad. Al trabajar en estrecha colaboración con el gobierno de Nunavut y las comunidades para recopilar datos lingüísticos, Microsoft ayudó a llevar los dialectos tradicionales de Nunavut a los entornos digitales modernos al agregar la familia de idiomas inuktut a Microsoft Translator, lo que respalda la preservación y el uso dirigidos por la comunidad.
El enfoque se centra en el diseño conjunto con socios locales para establecer la gobernanza y el consentimiento, obtener textos y audios aprobados por la comunidad, seleccionar y etiquetar datos con revisores locales y validar los resultados con respecto a las normas culturales y lingüísticas. Ese proceso, basado en la administración, genera confianza para que los modelos reflejen el lenguaje vivido y se adopten localmente. Juntos, estos esfuerzos complementarios mejoran la comunicación en el mundo real. Los proveedores de atención médica pueden colaborar fácilmente a distancia, los jóvenes de las generaciones de Nunavummiut pueden conectarse más plenamente con los ancianos y las personas pueden crear, comunicarse y traducir en el idioma que elijan. Hoy en día, los educadores están agregando comentarios sobre los boletines de calificaciones de los estudiantes en inuktitut, lo que permite interactuar mejor con las familias unilingües.
El trabajo ha continuado con una asociación con Microsoft AI for Good Lab, trabajando juntos para desarrollar una canalización para adaptar modelos de lenguaje grande (LLM) de peso abierto a lenguajes de bajos recursos, como el inuktitut.
“Trabajar muy de cerca con el gobierno de Nunavut fue fundamental para que pudieran confiar en los modelos y, en última instancia, adaptarlos y utilizarlos”, dice Inbal Becker-Reshef.
Situada en el territorio más septentrional de Canadá, Nunavut es el hogar de una población mayoritariamente inuit.
Alrededor del 85% de la población de Nunavut habla inuktitut, un idioma con varios dialectos.
En la aplicación Traductor, los usuarios pueden conectarse entre varios idiomas con una foto, voz o texto.
Apoyar el avance de todas las lenguas
A medida que la adopción de la IA se acelera en todo el mundo, la inclusión de lenguas de bajos recursos se ha convertido en un problema crítico. El lenguaje es la puerta de entrada a la educación, la atención médica y las oportunidades económicas, y sin una inclusión intencional, comunidades enteras corren el riesgo de quedarse atrás. El enfoque de Microsoft es de código abierto, lo que garantiza que las herramientas y los conjuntos de datos desarrollados para la preservación y revitalización de idiomas estén disponibles para las comunidades, los investigadores y los socios de todo el mundo. Al hacer que estos recursos sean accesibles, los gobiernos pueden interactuar mejor con las comunidades a medida que la difusión de la IA defiende las voces locales para dar forma al futuro de la tecnología.
“En Microsoft, nos aseguramos de que las comunidades indígenas tomen la iniciativa, aportando sentimiento y rigor a nuestras asociaciones. Colaboramos con respeto, consentimiento y responsabilidad compartida”, dice Mike Adams, patrocinador ejecutivo de la Red de Inclusión Indígena.
Microsoft AI for Good Lab ha desarrollado una canalización reproducible para adaptar los LLM de peso abierto a lenguas de bajos recursos. Este marco empodera a los socios y aboga por herramientas de IA adaptadas a sus comunidades, independientemente de la huella digital de la lengua. Los proyectos globales abarcan el inuktitut en Canadá, los maoríes en Nueva Zelanda, el chichewa en Malawi y el swahili en África Oriental. Y a través de su iniciativa LINGUA, Microsoft está financiando y fortaleciendo proyectos que crean conjuntos de datos de alta calidad para lenguas infrarrepresentadas en toda Europa. Al compartir planos técnicos y colaborar con expertos locales, todas las lenguas pueden beneficiarse de los últimos avances en IA.
Desde una perspectiva cultural, es fundamental que las personas puedan comunicarse en su propia lengua. La IA aporta un gran poder a las personas, pero no deberían necesitar aprender otra lengua para usarla.
Construyendo un futuro de IA para todos
Una investigación reciente del AI for Good Lab destaca que los países en los que predominan las lenguas de bajos recursos presentan una adopción de la IA significativamente menor, lo que demuestra que la inclusión lingüística es un motor independiente y potente de la difusión de la IA. El dominio del inglés en la web, donde la mitad de todo el contenido está en ese idioma, pero solo el 5% del mundo lo habla de forma nativa, significa que los modelos de IA a menudo tienen dificultades con otros idiomas, perpetuando las desigualdades globales.
La IA es la tecnología de más rápido crecimiento en la historia: 1.200 millones de personas ya la usan, pero miles de millones de personas no pueden. Muchos no tienen acceso a los fundamentos que hacen posible la IA, como la electricidad, Internet y las habilidades digitales. La difusión se produce cuando todo el mundo hace que las nuevas tecnologías formen parte de su forma de vivir, trabajar y aprender, pero si no abordamos y cerramos las brechas, corremos el riesgo de crear una nueva brecha digital. Para evitar que se repitan las desigualdades del pasado, en las que las tecnologías transformadoras llegaron a algunas, pero no a todas, la inclusión de la IA debe ir acompañada de un acceso fundamental a la electricidad, la conectividad y las habilidades digitales. Poner en manos de todas las comunidades herramientas eficaces es la forma en que la democratización se hace realidad.
El primer informe de difusión de la IA del Instituto de Economía de la IA de Microsoft revela que el impacto proviene de la difusión, cuando la tecnología se integra con la vida real. En la era de la IA, la inclusión de todas las lenguas puede inspirar a todas las comunidades, honrar todas las culturas y garantizar que todos puedan participar en la era digital. Al abrazar la diversidad lingüística, surgen nuevas oportunidades para aprender, conectarse e innovar.
Realmente se trata de asegurarnos de que este tipo de tecnologías que son tan transformadoras para nosotros se distribuyan equitativamente.