Mais de 2.500 línguas correm o risco de desaparecer
A cada poucos meses, uma língua se aproxima da extinção.
À medida que os falantes envelhecem e menos pessoas a aprendem, o conhecimento prático que a língua carrega se torna mais difícil de transmitir. Conforme a história das narrativas e das canções começa a desaparecer, a identidade de uma comunidade se desfaz silenciosamente. A perda é íntima, e o mundo fica um pouco menos vibrante. Até o final deste século, milhares de línguas podem desaparecer, deixando apenas ecos de nomes para o vento ou rituais que honravam a terra.
Reconhecendo o que está em jogo, a UNESCO designou o período de 2022 a 2032 como a Década das Línguas Indígenas. A iniciativa destaca um esforço global para apoiar a revitalização e a inclusão digital, além do trabalho que parceiros em lugares como Nunavut ajudam a impulsionar. De acordo com o Atlas of World’s Languages in Danger da UNESCO, mais de 2.500 estão em risco de desaparecer e, a cada perda, séculos de sabedoria e tradição se vão.
“A língua determina quem consegue usar a IA, ela continua inacessível quando as pessoas não conseguem interagir com a tecnologia em seu próprio idioma”, afirma Inbal Becker-Reshef, Diretora-geral, Microsoft AI for Good Lab.
Mais de 70% dos inuit em Nunavut declaram o inuktut como língua materna
Preservando a herança, fortalecendo a comunidade
Nunavut é o maior território do Canadá e o mais ao norte, abrangendo a maior parte do Ártico canadense, com metade de sua área dentro do Círculo Polar Ártico. Lar de mais de 30 mil indígenas, Nunavut significa “Nossa Terra” em inuktut, o termo que unifica os dialetos inuktitut e inuinnaqtun.
Por muito tempo, o inuktut não teve ferramentas de tradução adequadas e nem grandes modelos de linguagem (LLMs) que refletissem seus dialetos. Isso tornava quase impossível preservar o idioma para as futuras gerações por meio de ferramentas digitais.
Em um esforço para preservar e ampliar o uso do inuktitut, o Governo de Nunavut firmou parceria com a Microsoft para ajudar as pessoas a se comunicarem em inglês e inuktitut, enquanto construía uma memória de tradução robusta e pertencente à comunidade. Ao trabalhar em estreita colaboração com o Governo de Nunavut e com as comunidades para coletar dados linguísticos, a Microsoft ajudou a levar os dialetos tradicionais de Nunavut para ambientes digitais modernos ao adicionar a família de línguas inuktut ao Microsoft Translator, apoiando a preservação e o uso liderados pela comunidade.
A abordagem se baseia na cocriação com parceiros locais para estabelecer governança e consentimento, coletar textos e áudios aprovados pela comunidade, selecionar e rotular dados com revisores locais e validar os resultados de acordo com normas culturais e linguísticas. Esse processo, baseado na responsabilidade e no cuidado, constrói confiança para que os modelos reflitam o uso real do idioma e sejam adotados localmente. Juntos, esses esforços complementares melhoram a comunicação no mundo real. Profissionais de saúde conseguem colaborar com mais facilidade remotamente, jovens das gerações de Nunavummiut se conectam melhor com os mais velhos, e as pessoas podem criar, se comunicar e traduzir no idioma que escolherem. Hoje, educadores já incluem comentários em inuktitut nos boletins escolares, interagindo melhor com famílias que falam apenas esse idioma.
O trabalho continuou em parceria com o Microsoft AI for Good Lab, desenvolvendo em conjunto um pipeline para adaptar grandes modelos de linguagem (LLMs) de pesos abertos a línguas com poucos recursos, como o inuktitut.
“Trabalhar de perto com o Governo de Nunavut foi essencial para que eles pudessem confiar nos modelos e, por fim, adaptá-los e usá-los”, diz Inbal Becker-Reshef.
Localizado no território mais ao norte do Canadá, Nunavut abriga uma população majoritariamente Inuit.
Cerca de 85% da população de Nunavut fala inuktitut, uma língua com vários dialetos.
No aplicativo Tradutor, os usuários podem se conectar entre idiomas com foto, voz ou texto.
Apoiando o avanço de todos os idiomas
À medida que a adoção de IA acelera em todo o mundo, a inclusão de línguas com poucos recursos se torna uma questão crítica. O idioma é a porta de entrada para educação, saúde e oportunidades econômicas e, sem inclusão intencional, comunidades inteiras correm o risco de ficar para trás. A abordagem da Microsoft é de código aberto, garantindo que as ferramentas e conjuntos de dados desenvolvidos para preservação e revitalização linguística estejam disponíveis para comunidades, pesquisadores e parceiros em qualquer lugar. Ao tornar esses recursos acessíveis, governos conseguem se relacionar melhor com as comunidades, enquanto a difusão da IA fortalece vozes locais para moldar o futuro da tecnologia.
“Em toda a Microsoft, garantimos que as comunidades indígenas liderem o processo, levando sensibilidade e rigor às nossas parcerias. Colaboramos com respeito, consentimento e responsabilidade compartilhada”, afirma Mike Adams, patrocinador executivo da Indigenous Inclusion Network.
O Microsoft AI for Good Lab desenvolveu um pipeline reproduzível para adaptar LLMs de pesos abertos a línguas com poucos recursos. Essa estrutura capacita parceiros e promove ferramentas de IA adaptadas às suas comunidades, independentemente da presença digital do idioma. Projetos globais incluem o inuktitut no Canadá, o maori na Nova Zelândia, o chichewa no Malawi e o suaíli em toda a África Oriental. E, por meio da iniciativa LINGUA, a Microsoft financia e fortalece projetos que criam conjuntos de dados de alta qualidade para línguas sub-representadas em toda a Europa. Ao compartilhar modelos técnicos e colaborar com especialistas locais, todos os idiomas podem se beneficiar dos avanços mais recentes em IA.
Do ponto de vista cultural, é fundamental que as pessoas possam se comunicar em sua própria língua. A IA traz grande poder para as pessoas, mas elas não deveriam precisar aprender outro idioma para usá-la.
Construindo um futuro de IA para todos
Pesquisas recentes do AI for Good Lab destacam que países onde predominam línguas com poucos recursos apresentam níveis significativamente menores de adoção de IA, mostrando que a inclusão linguística é um fator independente e poderoso para a difusão da IA. O predomínio do inglês na web, onde metade de todo o conteúdo está em inglês, mas apenas 5% da população mundial o fala como língua nativa, faz com que modelos de IA frequentemente tenham dificuldades com outros idiomas, perpetuando desigualdades globais.
A IA é a tecnologia que mais cresce na história: 1,2 bilhão de pessoas já a utilizam, mas bilhões ainda não conseguem. Muitas não têm acesso às bases que tornam a IA possível, como eletricidade, internet e habilidades digitais. A difusão acontece quando todos incorporam a nova tecnologia à forma como vivem, trabalham e aprendem, mas, sem enfrentar e reduzir essas lacunas, corremos o risco de criar uma nova divisão digital. Para evitar repetir desigualdades do passado, quando tecnologias transformadoras chegaram a alguns, mas não a todos, a inclusão em IA precisa caminhar junto com o acesso à eletricidade, à conectividade e às habilidades digitais. Colocar ferramentas eficazes nas mãos de todas as comunidades é o que torna a democratização uma realidade.
O primeiro Relatório de Difusão de IA do Microsoft AI Economy Institute revela que o impacto vem da difusão, quando a tecnologia se integra à vida real. Na era da IA, a inclusão de todas as línguas pode inspirar cada comunidade, honrar cada cultura e garantir que todos possam participar da era digital. Ao abraçar a diversidade linguística, surgem novas oportunidades de aprender, se conectar e inovar.
Trata-se de garantir que essas tecnologias, tão transformadoras para todos nós, sejam distribuídas de maneira justa.