pixel

Donner une voix à chaque langue

À l’ère de l’IA, l’inclusion de toutes les langues est essentielle pour les communautés et la culture 

Plus de 2 500 langues sont en voie de disparition

Tous les deux ou trois mois, une langue se rapproche de l’extinction.

Au fur et à mesure que les locuteurs vieillissent et que de moins en moins de personnes l’apprennent, les connaissances pratiques que véhicule cette langue deviennent plus difficiles à transmettre. Au fur et à mesure que l’histoire des récits et des chants s’efface, l’identité d’une communauté disparaît peu à peu. Cette perte est intime, et le monde perd une partie de son éclat. À la fin de ce siècle, des milliers de langues pourraient bien disparaître, ne laissant que des échos de noms portés par le vent, ou des rituels qui honoraient la terre.

Consciente des enjeux, l’UNESCO a désigné la période 2022-2032 comme la Décennie des langues autochtones. Cette initiative met en évidence les efforts déployés à l’échelle mondiale pour soutenir la revitalisation et l’inclusion numérique, ainsi que le travail accompli par les partenaires dans des régions comme le Nunavut. Selon l’Atlas des langues en danger dans le monde de l’UNESCO, plus de 2 500 d’entre elles sont en voie de disparition. À chaque perte, des siècles de sagesse et de tradition disparaissent.

« La langue détermine qui peut utiliser l’IA, car elle reste inaccessible lorsque les personnes ne peuvent pas interagir avec elle dans leur propre langue », explique Inbal Becker-Reshef, directrice générale du AI for Good Lab de Microsoft.
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

Plus de 70 % des Inuits du Nunavut déclarent l’inuktut comme langue maternelle

Préserver le patrimoine, soutenir la communauté

Le Nunavut est le territoire le plus vaste et le plus au nord du Canada, englobant la majeure partie de l’Arctique canadien, dont la moitié se trouve dans le cercle polaire arctique. Habité par plus de 30 000 autochtones, le nom Nunavut signifie « Notre Terre » en inuktut, terme unificateur qui englobe à la fois les dialectes inuktitut et inuinnaqtun.

Pendant longtemps, l’inuktut ne disposait pas d’outils de traduction adéquats ni de grands modèles de langage (LLM) qui reflétaient ses dialectes. Il était donc presque impossible de préserver la langue pour les générations futures à l’aide d’outils numériques.

Dans le but de préserver et de faire progresser l’inuktitut, le gouvernement du Nunavut s’est associé à Microsoft pour aider les gens à communiquer en anglais et en inuktitut tout en créant une mémoire de traduction robuste appartenant à la communauté. En travaillant en étroite collaboration avec le gouvernement du Nunavut et les communautés pour recueillir des données linguistiques, Microsoft a contribué à intégrer les dialectes traditionnels du Nunavut dans des environnements numériques modernes en ajoutant la famille de langues inuktut à Microsoft Translator, soutenant ainsi la préservation et l’utilisation de ces langues par la communauté.

L’approche est centrée sur la co-conception avec des partenaires locaux afin d’établir la gouvernance et le consentement, de collecter des textes et des enregistrements audio approuvés par la communauté, de sélectionner et d’annoter les données avec les experts locaux et de valider les résultats par rapport aux normes culturelles et linguistiques. Fondé sur l’intendance, ce processus renforce la confiance, permettant aux modèles de refléter la langue vivante et d’être adoptés localement. Ensemble, ces efforts complémentaires améliorent la communication dans le monde réel. Les prestataires de soins de santé peuvent collaborer plus facilement à distance, les jeunes générations du Nunavummiut peuvent établir des liens plus étroits avec les aînés et les populations peuvent créer, communiquer et traduire dans la langue de leur choix. Aujourd’hui, les enseignants ajoutent des commentaires en inuktitut sur les bulletins scolaires des élèves, ce qui leur permet de mieux communiquer avec les familles unilingues.

Ce travail s’est poursuivi en partenariat avec le AI for Good Lab de Microsoft, dans le cadre d’une collaboration visant à développer un processus d’adaptation des modèles de langage à grande échelle (LLM) open-source aux langues à faibles ressources, comme l’inuktitut.

« Travailler en étroite collaboration avec le gouvernement du Nunavut était essentiel pour qu’ils puissent avoir confiance dans les modèles et, en fin de compte, de les adapter et de les utiliser », explique Inbal Becker-Reshef.

Soutenir le développement de toutes les langues

Alors que l’adoption de l’IA s’accélère dans le monde entier, l’inclusion de langues à faibles ressources est devenue un enjeu critique. La langue est la porte d’entrée vers l’éducation, les soins de santé et les opportunités économiques, et sans inclusion intentionnelle, des communautés entières risquent d’être laissées pour compte. Microsoft adopte une approche open source, garantissant que les outils et ensembles de données développés pour la préservation et la revitalisation des langues sont accessibles aux communautés, aux chercheurs et aux partenaires partout dans le monde. En rendant ces ressources disponibles, les gouvernements peuvent mieux s’engager auprès des communautés, tandis que la diffusion de l’IA met en avant les acteurs locaux pour façonner l’avenir de la technologie.

« Chez Microsoft, nous veillons à ce que les communautés autochtones prennent la tête des initiatives, en apportant à nos partenariats passion et rigueur. Nous collaborons dans le respect, le consentement et la responsabilité partagée », a déclaré Mike Adams, parrain exécutif du Indigenous Inclusion Network.

Le Microsoft AI for Good Lab a développé un processus reproductible pour adapter des modèles de langage à grande échelle (LLM) open-source aux langues à faibles ressources. Ce cadre permet aux partenaires d’utiliser des outils d’IA adaptés à leurs communautés, quelle que soit l’empreinte numérique de la langue. Les projets internationaux couvrent l’inuktitut au Canada, le maori en Nouvelle-Zélande, le chichewa au Malawi et le swahili en Afrique de l’Est. Par le biais de son initiative LIGUA, Microsoft finance et renforce des projets qui permettent de créer des ensembles de données de haute qualité pour les langues sous-représentées en Europe. En partageant des plans techniques et en collaborant avec des experts locaux, chaque langue peut bénéficier des dernières avancées en matière d’IA.

D’un point de vue culturel, pouvoir communiquer dans sa propre langue est essentiel. L’IA offre un potentiel énorme aux populations, mais elles ne devraient pas avoir besoin d’apprendre une autre langue pour l’utiliser.
Dr Juan M. Lavista Ferres
Directeur de laboratoire, AI for Good Lab de Microsoft

Construire un avenir fondé sur l’IA pour tous

Une étude récente du AI for Good Lab souligne que les pays où les langues à faibles ressources sont prédominantes affichent une adoption de l’IA nettement plus faible, ce qui montre que l’inclusion linguistique est un moteur indépendant et puissant pour la diffusion de l’IA. La prédominance de l’anglais sur Internet – où la moitié de tout le contenu est en anglais, alors que seulement 5 % de la population mondiale l’utilise comme langue maternelle – signifie que les modèles d’IA rencontrent souvent des difficultés avec d’autres langues, perpétuant ainsi les inégalités mondiales.

L’IA est la technologie qui connaît la croissance la plus rapide de l’histoire : 1,2 milliard de personnes l’utilisent déjà, mais des milliards d’autres en sont privées. Beaucoup n’ont pas accès aux ressources qui rendent l’IA possible, comme l’électricité, Internet et les connaissances numériques. La diffusion se produit lorsque chacun intègre une nouvelle technologie dans sa vie, son travail et son apprentissage, mais sans combler ces écarts, nous risquons de créer une nouvelle fracture numérique. Pour éviter de répéter les inégalités du passé, où les technologies transformatrices ne profitaient qu’à certains, l’inclusion de l’IA doit être associée à un accès primordial à l’électricité, à la connectivité et aux compétences numériques. C’est en mettant des outils performants entre les mains de toutes les communautés que la démocratisation deviendra une réalité.

Le premier rapport sur la diffusion de l’IA du AI Economy Institute de Microsoft révèle que l’impact provient de la diffusion, lorsque la technologie s’intègre à la vie réelle. À l’ère de l’IA, l’inclusion de toutes les langues peut inspirer chaque communauté, honorer chaque culture et garantir que chacun peut participer à l’ère numérique. En valorisant la diversité linguistique, de nouvelles opportunités émergent pour apprendre, créer des liens et innover.

Il s’agit en réalité de s’assurer que ces technologies si transformatrices pour nous sont distribuées équitablement.
Inbal Becker-Reshef
Directeur général, AI for Good Lab de Microsoft