pixel

Dar voz a todas as línguas

Na era da IA, a inclusão de todas as línguas é essencial para as comunidades e para a cultura

Mais de 2500 línguas estão em risco de desaparecer

Em cada mês que começa, uma língua aproxima-se mais da extinção.

À medida que os falantes envelhecem e menos pessoas a aprendem, o conhecimento prático transportado pela língua torna-se cada vez mais difícil de transmitir. À medida que a história das narrativas e das canções começa a esbater-se, a identidade de uma comunidade desfaz-se silenciosamente — a perda é íntima e o mundo torna-se um pouco menos vibrante. Até ao final deste século, milhares de línguas poderão desaparecer, deixando apenas ecos de nomes dados ao vento ou de rituais que honravam a terra.

Reconhecendo o que está em jogo, a UNESCO designou o período de 2022 a 2032 como a Década das Línguas Indígenas. Esta iniciativa evidencia um esforço global para apoiar a revitalização e a inclusão digital, assim como o trabalho que parceiros em regiões como Nunavut estão a ajudar a impulsionar. De acordo com o Atlas das Línguas em Perigo no Mundo, da UNESCO, mais de 2500 línguas estão em risco de desaparecer e, a cada perda, séculos de sabedoria e de tradição desaparecem.

“A língua determina quem pode utilizar a IA — torna-se inacessível quando as pessoas não conseguem interagir com ela na sua própria língua”, afirma Inbal Becker-Reshef, Diretora-Geral do Microsoft AI for Good Lab.
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

Mais de 70% dos inuíte em Nunavut consideram o Inuktut a sua língua materna.

Preservar o património, potenciar a comunidade

Nunavut é o maior e mais setentrional território do Canadá e abrange grande parte do Ártico canadiano, com cerca de metade da sua área situada dentro do Círculo Polar Ártico. Lar de mais de 30 mil pessoas indígenas, Nunavut significa “A Nossa Terra” em Inuktut, o termo agregador que engloba os dialetos Inuktitut e Inuinnaqtun.

Durante muito tempo, o Inuktut não dispôs de ferramentas de tradução adequadas nem de modelos de linguagem de grande escala (LLM) que refletissem os seus dialetos. Esta lacuna tornou a preservação da língua para as gerações futuras, através de ferramentas digitais, uma tarefa quase impossível.

Com o objetivo de preservar e promover o Inuktut, o Governo de Nunavut estabeleceu uma parceria com a Microsoft para ajudar as pessoas a comunicar tanto em inglês como em Inuktitut, ao mesmo tempo que era criada uma memória de tradução robusta, detida pela própria comunidade. Trabalhando de forma estreita com o Governo de Nunavut e com as comunidades locais na recolha de dados linguísticos, a Microsoft contribuiu para levar os dialetos tradicionais de Nunavut para ambientes digitais modernos, ao integrar a família de línguas Inuktut no Microsoft Translator, apoiando a preservação e a utilização lideradas pela comunidade.

A abordagem assenta no desenvolvimento conjunto com parceiros locais, de modo a estabelecer governação e consentimento, recolher texto e áudio aprovados pela comunidade, organizar e rotular dados com revisores locais e validar os resultados face às normas culturais e linguísticas. Este processo, ancorado na gestão responsável, constrói confiança, assegurando que os modelos refletem a língua viva e são adotados localmente. Em conjunto, estes esforços complementares melhoram a comunicação no mundo real. Profissionais de saúde conseguem colaborar mais facilmente à distância; jovens das gerações Nunavummiut podem ligar-se de forma mais plena aos mais velhos; e as pessoas podem criar, comunicar e traduzir na língua que escolhem. Atualmente, educadores estão a acrescentar observações nos boletins de avaliação dos alunos em Inuktitut para promover um maior sentido de pertença em famílias unilingues.

O trabalho prosseguiu através de uma parceria com o Microsoft AI for Good Lab para o desenvolvimento de uma cadeia de processamento para adaptar modelos de linguagem de grande escala de peso aberto a línguas com poucos recursos, como o Inuktitut.

“Trabalhar muito de perto com o Governo de Nunavut foi fundamental para que pudessem confiar nos modelos e, no final, adaptá-los e utilizá-los”, afirma Inbal Becker-Reshef.

Apoiar o avanço de todas as línguas

À medida que a adoção da IA acelera a nível global, a inclusão de línguas com poucos recursos tornou-se uma questão crítica. A língua é a porta de entrada para a educação, cuidados de saúde e oportunidades económicas e, sem uma inclusão intencional, comunidades inteiras correm o risco de ficar para trás. A abordagem da Microsoft assenta em princípios de código aberto, garantindo que as ferramentas e os conjuntos de dados desenvolvidos para a preservação e revitalização linguística estão disponíveis para comunidades, investigadores e parceiros em todo o mundo. Ao tornar estes recursos acessíveis, os governos podem interagir de forma mais eficaz com as comunidades, à medida que a difusão da IA valoriza as vozes locais na construção do futuro da tecnologia.

“Na Microsoft, asseguramos que as comunidades indígenas assumem um papel de liderança, trazendo humanidade e rigor às nossas parcerias. Colaboramos com base no respeito, no consentimento e na responsabilidade partilhada”, afirma Mike Adams, patrocinador executivo da Indigenous Inclusion Network.

O Microsoft AI for Good Lab desenvolveu uma cadeia de processamento reproduzível para adaptar LLMs de peso aberto a línguas com poucos recursos. Este quadro de referência capacita parceiros e defensores a criarem ferramentas de IA adaptadas às respetivas comunidades, independentemente da pegada digital da língua. Projetos globais abrangem o Inuktitut, no Canadá, o Maori, na Nova Zelândia, o Chichewa, no Malawi, e o Suaíli, em toda a África Oriental. Paralelamente, através da iniciativa LINGUA, a Microsoft está a financiar e a reforçar projetos que criam conjuntos de dados de elevada qualidade para línguas sub-representadas em toda a Europa. Ao partilhar modelos técnicos de referência e ao colaborar com especialistas locais, todas as línguas podem beneficiar dos mais recentes avanços em inteligência artificial.

De uma perspetiva cultural, é fundamental que as pessoas possam comunicar na sua própria língua. A inteligência artificial confere um grande poder às pessoas, mas não deveria ser necessário aprender outra língua para a poder utilizar.
Dr. Juan M. Lavista Ferres
Diretor de Laboratório, Microsoft AI for Good Lab

Construir um futuro com IA para todos

A investigação recente do AI for Good Lab evidencia que os países onde predominam línguas com poucos recursos apresentam níveis significativamente mais baixos de adoção de inteligência artificial, demonstrando que a inclusão linguística é um fator independente e determinante para a difusão da IA. O predomínio do inglês na Web, onde cerca de metade de todo o conteúdo está em inglês, apesar de apenas 5% da população mundial o falar como língua materna, faz com que os modelos de IA tenham frequentemente dificuldades com outras línguas, perpetuando desigualdades globais.

A IA é a tecnologia com crescimento mais rápido da história: cerca de 1,2 mil milhões de pessoas já a utilizam, mas milhares de milhões de outras ainda não. Muitas não têm acesso às bases que tornam a IA possível, como eletricidade, acesso à Internet e competências digitais. A difusão ocorre quando a tecnologia passa a integrar o modo como as pessoas vivem, trabalham e aprendem; contudo, sem enfrentar e reduzir estas lacunas, existe o risco de criar uma nova divisão digital. Para evitar repetir desigualdades do passado — em que tecnologias transformadoras chegaram a alguns, mas não a todos —, a inclusão na IA deve ser acompanhada por acesso fundamental à eletricidade, à conectividade e às competências digitais. Colocar ferramentas eficazes ao alcance de todas as comunidades é o que torna a democratização tecnológica uma realidade.

O primeiro Relatório sobre a Difusão da IA do Microsoft AI Economy Institute, revela que o impacto resulta da difusão — quando a tecnologia se integra na vida real. Na era da inteligência artificial, a inclusão de todas as línguas pode inspirar todas as comunidades, valorizar todas as culturas e garantir que todos possam participar na era digital. Ao abraçar a diversidade linguística, surgem novas oportunidades para aprender, estabelecer ligações e inovar.

O objetivo final é garantir que este tipo de tecnologias, que são tão transformadoras para todos nós, sejam distribuídas de forma equitativa.
Inbal Becker-Reshef
Diretor-Geral, Microsoft AI for Good Lab