Over 2.500 sprog er i fare for at forsvinde
Hver måned er endnu et sprog tættere på at forsvinde.
Efterhånden som talerne bliver ældre og færre lærer sproget, bliver den praktiske viden, som sproget rummer, vanskeligere at videregive. Når historierne og sangene begynder at forsvinde, opløses et samfunds identitet lidt efter lidt – tabet er mærkbart, og verden bliver lidt mindre farverig. Ved slutningen af dette århundrede kan tusindvis af sprog være forsvundet. Tilbage vil kun være ekkoer af vindens navne eller ritualer, der engang hædrede landet.
I erkendelse af, hvad der står på spil, har UNESCO udpeget 2022–2032 som årtiet for oprindelige sprog. Dette understreger en global indsats for at støtte revitalisering og digital inklusion samt det arbejde, som partnere på steder som Nunavut bidrager til at fremme. Ifølge UNESCOs Atlas of World’s Languages in Danger er over 2.500 i fare for at forsvinde, og med hvert tab forsvinder århundreders visdom og tradition.
“Sproget bestemmer, hvem der kan bruge kunstig intelligens – den forbliver utilgængelig, når mennesker ikke kan bruge den på deres eget sprog,” siger Inbal Becker-Reshef, Managing Director, Microsoft AI for Good Lab.
Over 70 % af inuitterne i Nunavut angiver Inuktut som deres modersmål
Bevarelse af kulturarven, styrkelse af lokalsamfundet
Nunavut er Canadas største og nordligste territorium, der omfatter det meste af det canadiske Arktis, hvoraf halvdelen ligger inden for polarcirklen. Nunavut er hjemsted for mere end 30.000 oprindelige folk og betyder “Vores land” på Inuktut, der fungerer som fællesbetegnelse for Inuktitut- og Inuinnaqtun-dialekterne.
I lang tid havde Inuktut ikke tilstrækkelige oversættelsesværktøjer eller store sprogmodeller (LLM’er), der afspejlede dets dialekter. Dette gjorde det næsten umuligt at bevare sproget for fremtidige generationer med digitale værktøjer.
I et forsøg på at bevare og fremme Inuktitut har regeringen i Nunavut indgået et samarbejde med Microsoft for at hjælpe folk med at kommunikere på både engelsk og Inuktitut, samtidig med at der opbygges en omfattende oversættelseshukommelse, som ejes af lokalsamfundet. Ved at arbejde tæt sammen med Nunavuts regering og lokalsamfundene om at indsamle sprogdata har Microsoft bidraget til at bringe Nunavuts traditionelle dialekter ind i moderne digitale miljøer gennem tilføjelse af Inuktut-sprogfamilien til Microsoft Translator, hvilket understøtter bevarelse og brug af sproget.
Tilgangen fokuserer på co-design med lokale partnere for at etablere styring og samtykke, indhente tekst og lyd, der er godkendt af lokalsamfundet, kuratere og mærke data med lokale korrekturlæsere og validere resultaterne i forhold til kulturelle og sproglige normer. Denne proces, der er baseret på ansvarlighed, skaber tillid, så modellerne afspejler det sprog, der tales i dagligdagen, og bliver accepteret lokalt. Sammen forbedrer disse komplementære tiltag kommunikationen i den virkelige verden. Sundhedspersonale kan lettere samarbejde over store afstande, unge i Nunavummiut-generationen kan få bedre kontakt med de ældre, og folk kan skabe, kommunikere og oversætte på det sprog, de vælger. I dag tilføjer undervisere feedback i elevernes karakterbøger på Inuktitut, hvilket giver en bedre kontakt med ensprogede familier.
Arbejdet er videreført i samarbejde med Microsoft AI for Good Lab, hvor man i fællesskab udvikler en pipeline, der skal tilpasse åbne, store sprogmodeller (LLM’er) til sprog med begrænsede ressourcer, såsom Inuktitut.
“Det var afgørende at arbejde tæt sammen med Nunavuts regering, for at de kunne stole på modellerne og i sidste ende tilpasse og anvende dem,” siger Inbal Becker-Reshef.
Nunavut ligger i Canadas nordligste territorium og er hjemsted for størstedelen af inuitbefolkningen.
Omkring 85 % af Nunavuts befolkning taler Inuktitut, et sprog med flere dialekter.
I Translator-appen kan brugere oprette forbindelse på tværs af sprog med et foto, tale eller tekst.
Støtte til udvikling af alle sprog
I takt med at implementeringen af kunstig intelligens tager fart på verdensplan, er inkluderingen af sprog med begrænsede ressourcer blevet et kritisk spørgsmål. Sprog er indgangen til uddannelse, sundhedspleje og økonomiske muligheder, og uden bevidst inkludering risikerer hele samfund at sakke bagud. Microsofts tilgang er open source, hvilket sikrer, at de værktøjer og datasæt, der er udviklet til sprogbevarelse og genoplivning, er tilgængelige for fællesskaber, forskere og partnere overalt. Ved at gøre disse ressourcer tilgængelige kan regeringer bedre involvere sig i lokalsamfund, da udbredelsen af kunstig intelligens styrker lokale stemmer, som kan forme teknologiens fremtid.
“Hos Microsoft sørger vi for, at oprindelige samfund tager føringen og bringer hjerte og stringens ind i vores partnerskaber. Vi samarbejder med respekt, samtykke og delt ansvarlighed,” siger Mike Adams, Executive Sponsor for Indigenous Inclusion Network.
Microsoft AI for Good Lab har udviklet en reproducerbar pipeline til tilpasning af åbne LLM’er til sprog med begrænsede ressourcer. Denne ramme giver partnere og fortalere mulighed for at skræddersy AI-værktøjer til deres samfund, uanset sprogets digitale fodaftryk. Globale projekter spænder over inuktitut i Canada, maori i New Zealand, chichewa i Malawi og swahili i hele Østafrika. Og gennem sit LINGUA-initiativ finansierer og styrker Microsoft projekter, der skaber datasæt af høj kvalitet for underrepræsenterede sprog i hele Europa. Ved at dele tekniske planer og samarbejde med lokale eksperter kan alle sprog drage fordel af de seneste fremskridt inden for kunstig intelligens.
Set fra et kulturelt perspektiv er det afgørende for folk at kunne kommunikere på deres eget sprog. Kunstig intelligens giver mennesker store muligheder, men de bør ikke være nødt til at lære et andet sprog for at kunne bruge dem.
Opbygning af en fremtid med kunstig intelligens for alle
Nyere forskning fra AI for Good Lab tydeliggør, at lande, hvor sprog med begrænsede ressourcer er dominerende, udviser betydeligt lavere anvendelse af kunstig intelligens, hvilket viser, at sproglig inklusion er en uafhængig og stærk drivkraft for udbredelsen af kunstig intelligens. Engelsk er det dominerende sprog på internettet – hvor halvdelen af alt indhold er på engelsk, selvom kun 5 % af verdens befolkning har engelsk som modersmål. Det betyder, at AI-modeller ofte har svært ved andre sprog, hvilket igen forstærker globale uligheder.
Kunstig intelligens er den hurtigst voksende teknologi i historien – 1,2 milliarder mennesker bruger den allerede, men milliarder af andre har ikke denne mulighed. Mange har ikke adgang til de grundlæggende forudsætninger, der gør bruge af kunstig intelligens mulig, det være sig elektricitet, internet eller digitale færdigheder. Udbredelsen sker, når alle gør ny teknologi til en del af deres måde at leve, arbejde og lære på, men uden at adressere og lukke hullerne risikerer vi at skabe en ny digital kløft. For at undgå at gentage tidligere uligheder – hvor transformative teknologier nåede nogle, men ikke alle – skal inklusionen af kunstig intelligens kombineres med adgang til elektricitet, internetforbindelse og digitale færdigheder. Ved at give alle samfund adgang til effektive værktøjer bliver demokratisering en realitet.
Den første AI Diffusion Report (Rapport om udbredelse af kunstig intelligens) fra Microsoft AI Economy Institute afslører, at indflydelsen kommer fra diffusion – når teknologien integreres i det virkelige liv. I AI’s tidsalder kan inklusion af alle sprog inspirere alle samfund, respektere alle kulturer og sikre, at alle kan deltage i den digitale tidsalder. Ved at omfavne sproglig mangfoldighed opstår der nye muligheder for læring, samspil og innovation.
Det handler i høj grad om at sikre, at denne slags teknologier, der er så transformerende for os, fordeles retfærdigt.