Plus de 2 500 langues sont menacées de disparition
Chaque année, plusieurs langues se rapprochent de l’extinction.
Au fur et à mesure que les locuteurs vieillissent et que de moins en moins de gens l’apprennent, les connaissances pratiques de la langue deviennent plus difficiles à transmettre. L’histoire des récits et des chansons commence à s’effacer, et l’identité d’une communauté s’effrite tranquillement. La perte est intime, le monde un peu moins vif. D’ici la fin de ce siècle, des milliers de langues pourraient avoir disparu, ne laissant que des échos de noms de vent ou de rituels qui honoraient la terre.
Consciente de l’enjeu, l’UNESCO a désigné la période 2022-2032 comme la Décennie des langues autochtones. Elle souligne les efforts déployés à l’échelle mondiale pour soutenir la revitalisation et l’inclusion numérique, ainsi que le travail que les partenaires, dans des endroits comme le Nunavut, contribuent à faire progresser. Selon l’Atlas des langues en danger dans le monde de l’UNESCO, plus de 2 500 langues risquent de disparaître. Avec chaque perte, des siècles de sagesse et de tradition disparaissent.
« La langue détermine qui peut utiliser l’IA. L’intelligence artificielle est inaccessible lorsque les gens ne peuvent pas l’utiliser dans leur propre langue », explique Inbal Becker-Reshef, directrice générale du laboratoire AI for Good de Microsoft.
Plus de 70 % des Inuits du Nunavut déclarent que l’inuktut est leur langue maternelle
Préserver le patrimoine et stimuler la communauté
Le Nunavut est le territoire le plus vaste et le plus au nord du Canada. Il englobe la majeure partie de l’Arctique canadien, dont la moitié se trouve dans le cercle polaire arctique. C’est là que vivent plus de 30 000 Autochtones. Le nom du Nunavut signifie « Notre terre » en inuktut, le terme qui désigne les deux langues inuites, l’inuktitut et l’inuinnaqtun.
Pendant longtemps, l’inuktut ne disposait pas d’outils de traduction adéquats ou de grands modèles linguistiques (LLM) qui reflétaient ses dialectes. Il était donc presque impossible de préserver la langue à l’aide d’outils numériques pour les générations futures.
Dans le but de préserver et de faire progresser l’inuktitut, le gouvernement du Nunavut s’est associé à Microsoft pour aider les locuteurs à communiquer en anglais et en inuktitut, tout en créant une mémoire de traduction robuste qui appartient à la communauté. Grâce à l’étroite collaboration avec le gouvernement du Nunavut et les communautés pour recueillir des données linguistiques, Microsoft a contribué à intégrer les dialectes traditionnels du Nunavut dans les environnements numériques modernes, en ajoutant la famille de langues inuktut à Microsoft Translator. Cela favorise ainsi ainsi la préservation et l’utilisation de ces langues par la communauté.
L’approche est centrée sur la coconception avec des partenaires locaux pour établir la gouvernance et le consentement, trouver des textes et fichiers audio approuvés par la communauté, organiser et étiqueter les données avec les réviseurs locaux et valider les résultats par rapport aux normes culturelles et linguistiques. Ce processus, fondé sur la bonne gérance, renforce la confiance, afin que les modèles reflètent la langue vécue et soient adoptés localement. Ensemble, ces efforts complémentaires améliorent la communication dans le monde réel. Les fournisseurs de soins de santé peuvent collaborer plus facilement à distance, les Nunavummiut de la plus jeune génération peuvent établir des liens plus étroits avec les aînés, et les gens peuvent créer, communiquer et traduire dans la langue de leur choix. Aujourd’hui, les éducateurs ajoutent des commentaires sur les bulletins scolaires des élèves en inuktitut, ce qui permet de mieux interagir avec les membres de la famille unilingues.
Le travail s’est poursuivi dans le cadre d’un partenariat avec le AI for Good Lab de Microsoft, qui a travaillé ensemble à l’élaboration d’un pipeline pour adapter de grands modèles de langage ouverts (LLM) à des langues à faibles ressources telles que l’inuktitut.
« Il était essentiel de travailler en étroite collaboration avec le gouvernement du Nunavut, pour qu’il puisse faire confiance aux modèles et qu’il les adapte et les utilise », explique Inbal Becker-Reshef.
Situé dans le territoire le plus nordique du Canada, le Nunavut abrite une population majoritairement inuite.
Environ 85 % de la population du Nunavut parle l’inuktitut, une langue qui compte plusieurs dialectes.
Dans l’application Translator, les utilisateurs peuvent passer entre plusieurs langues à l’aide d’une photo, de la voix ou d’un texte.
Soutenir le progrès de toutes les langues
Alors que l’adoption de l’IA s’accélère dans le monde entier, l’inclusion de langues à faibles ressources est devenue un enjeu critique. La langue est la porte d’entrée vers l’éducation, les soins de santé et les opportunités économiques. Si les langues rares ne sont pas inclues intentionnellement, des communautés entières risquent de prendre du retard. L’approche de Microsoft est en code ouvert, ce qui garantit que les outils et les ensembles de données développés pour la préservation et la revitalisation des langues sont disponibles pour les communautés, pour la recherche et pour les partenaires du monde entier. En rendant ces ressources accessibles, les gouvernements peuvent mieux s’engager auprès des communautés, car la diffusion de l’IA défend la participation des voix locales pour façonner l’avenir de la technologie.
« À l’échelle de Microsoft, nous veillons à ce que les communautés autochtones mènent les projets, en apportant du cœur et de la rigueur à nos partenariats. Nous collaborons dans le respect, le consentement et la responsabilité partagée », a déclaré Mike Adams, parrain exécutif du Réseau d’inclusion autochtone.
Le Laboratoire AI for Good de Microsoft a développé un pipeline reproductible pour l’adaptation des LLM open-weight pour les langues à faibles ressources. Ce cadre donne aux partenaires les moyens d’agir et conseille des outils d’IA adaptés à leurs communautés, quelle que soit l’empreinte numérique de la langue. Les projets mondiaux couvrent l’inuktitut au Canada, le maori en Nouvelle-Zélande, le chichewa au Malawi et le swahili dans l’Afrique de l’Est. Par le biais de son initiative LINGUA, Microsoft finance et renforce des projets qui créent des ensembles de données de haute qualité pour les langues sous-représentées à travers l’Europe. En partageant des plans techniques et en collaborant avec des experts locaux, chaque langue peut bénéficier des dernières avancées en matière d’IA.
D’un point de vue culturel, il est essentiel que chaque personne puisse communiquer dans sa propre langue. L’IA offre de grandes opportunités aux individus, et ils ne devraient pas avoir besoin d’apprendre une autre langue pour l’utiliser.
Construire un avenir avec l’IA pour tous
Des recherches récentes menées par le AI for Good Lab soulignent que dans les pays où les langues à faibles ressources sont prédominantes, l’adoption de l’IA est nettement plus faible. Cela montre que l’inclusion linguistique est un moteur indépendant et puissant de la diffusion de l’IA. La prédominance de l’anglais sur le Web, où la moitié du contenu est en anglais, quoique celle-ci soit la langue maternelle de seulement 5% de la population mondiale, signifie que les modèles d’IA ont souvent du mal à utiliser d’autres langues, ce qui perpétue les inégalités mondiales.
L’IA est la technologie qui connaît la croissance la plus rapide de l’histoire : 1,2 milliard de personnes l’utilisent déjà, mais des milliards d’autres ne le peuvent pas. Beaucoup n’ont pas accès aux bases qui rendent l’IA possible, comme l’électricité, Internet et les compétences numériques. La diffusion peut se produire lorsque tout le monde intègre les nouvelles technologies dans sa façon de vivre, de travailler et d’apprendre, mais si nous ne nous attaquons pas à ces lacunes pour les combler, nous risquons de créer une nouvelle fracture numérique. Pour éviter de répéter les inégalités du passé, où les technologies transformatrices ont atteint une partie mais pas la totalité de la population, l’inclusion de l’IA doit être associée à un accès fondamental à l’électricité, à la connectivité et aux compétences numériques. C’est en mettant des outils performants entre les mains de toutes les communautés que la démocratisation de cette technologie deviendra une réalité.
Le premier rapport sur la diffusion de l’IA du Microsoft AI Economy Institute révèle que l’impact de cette technologie est entraîné par sa diffusion, c’est-à-dire lorsque l’IA s’intègre à la vie réelle. À l’ère de l’IA, l’inclusion de toutes les langues peut inspirer toutes les communautés, honorer toutes les cultures et garantir que tout le monde puisse prendre part à l’ère numérique. En accueillant la diversité linguistique, de nouvelles opportunités émergent pour apprendre, tisser des liens et innover.
Il est nécessaire de s’assurer que ces types de technologies, qui sont si transformatrices pour nous, soient distribuées équitablement.