pixel

Vi gir alle språk en stemme

I AI-alderen er inkludering av alle språk avgjørende for samfunn og kultur 

Over 2500 språk står i fare for å forsvinne

Med noen måneders mellomrom beveger et språk seg nærmere utryddelse

Når talerne blir eldre og færre mennesker lærer språket, blir den praktiske kunnskapen språket bærer med seg vanskeligere å føre videre. Når historien i fortellinger og sang begynner å falme, løser identiteten til et fellesskap seg stille opp, tapet er nært og personlig, og verden blir litt mindre levende. Mot slutten av dette århundret kan tusenvis av språk være borte, og bare etterlate seg ekkoer av navn på vinden eller ritualer som hedret landet.

Som følge av det som står på spill, utpekte UNESCO perioden 2022-2032 til det internasjonale tiåret for urfolksspråk. Dette setter søkelys på en global innsats for å støtte revitalisering og digital inkludering, samt arbeidet som partnere på steder som Nunavut bidrar til å drive frem. Ifølge UNESCO Atlas of World’s Languages in Danger står over 2500 språk i fare for å forsvinne, og med hvert tap går århundrer med visdom og tradisjon tapt.

«Språk avgjør hvem som får bruke kunstig intelligens – da den forblir utilgjengelig når folk ikke kan bruke den på sitt eget språk», sier Inbal Becker-Reshef, administrerende direktør for Microsoft AI for Good Lab.
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

Over 70 % av inuittene i Nunavut oppgir inuktut som morsmålet deres

Å bevare arv, å styrke samfunnet

Nunavut er Canadas største og nordligste territorium og omfatter store deler av det canadiske Arktis, med halvparten innenfor polarsirkelen. Territoriet er hjem for over 30 000 urfolk, og navnet Nunavut betyr «vårt land» på inuktut, eller en samlebetegnelse som omfatter både inuktitut- og inuinnaqtun-dialektene.

I lang tid manglet inuktut egnede oversettelsesverktøy eller store språkmodeller (large language models, LLM)som gjenspeilte dialektene. Dette gjorde det nærmest umulig å bevare språket for fremtidige generasjoner ved hjelp av digitale verktøy.

I et forsøk på å bevare og videreutvikle inuktitut inngikk Nunavuts regjering et samarbeid med Microsoft for å hjelpe folk med å kommunisere på både engelsk og inuktitut, samtidig som det ble bygget opp et solid, felleseid oversettelsesminne. Gjennom tett samarbeid med Nunavuts regjering og lokalsamfunnene for å samle inn språkdata, bidro Microsoft til å bringe Nunavuts tradisjonelle dialekter inn i moderne digitale miljøer ved å legge til inuktut-språkfamilien i Microsoft Oversetter, og dermed støtte lokalsamfunnsledet bevaring og bruk.

Tilnærmingen er sentrert rundt samskaping med lokale partnere for å etablere styring og samtykke, bruke tekst og lyd som er godkjent av lokalsamfunnet, velge ut og merke data med lokale fagpersoner, og validere resultater opp mot kulturelle og språklige normer. Denne prosessen, forankret i ansvarlig forvaltning, bygger tillit slik at modellene gjenspeiler levd språk og tas i bruk lokalt. Samlet sett bidrar disse utfyllende tiltakene til bedre kommunikasjon i praksis. Helsepersonell kan samarbeide enklere på tvers av avstand, unge i Nunavummiut-generasjoner kan knytte tettere bånd til eldre, og mennesker kan skape, kommunisere og oversette på språket de selv velger. I dag legger lærere til tilbakemeldinger på elevers karakterkort på inuktitut, noe som gir bedre dialog med enspråklige familier.

Arbeidet har fortsatt gjennom et samarbeid med Microsoft AI for Good Lab, der partene sammen utvikler en pipeline for å tilpasse åpne store språkmodeller til språk med begrensede ressurser, som inuktitut.

«Det var avgjørende å samarbeide svært tett med Nunavuts regjering for at de skulle kunne ha tillit til modellene, og til slutt tilpasse og ta dem i bruk», sier Inbal Becker-Reshef.

Å støtte utviklingen av alle språk

Etter som bruken av AI akselererer globalt, har inkluderingen av språk med begrensede ressurser blitt et kritisk spørsmål. Språk er inngangsporten til utdanning, helsetjenester og økonomiske muligheter, og uten bevisst inkludering risikerer hele lokalsamfunn å bli hengende etter. Microsofts tilnærming er åpen kildekode, noe som sikrer at verktøyene og datasettene som utvikles for bevaring og revitalisering av språk, er tilgjengelige for lokalsamfunn, forskere og samarbeidspartnere overalt. Ved å gjøre disse ressursene tilgjengelige kan myndigheter samhandle bedre med lokalsamfunn, samtidig som spredningen av AI løfter frem lokale stemmer i utformingen av teknologiens fremtid.

«På tvers av Microsoft sørger vi for at urfolkssamfunn tar føringen og bringer både engasjement og grundighet inn i partnerskapene våre. Vi samarbeider med respekt, samtykke og delt ansvarlighet», sier Mike Adams, overordnet sponsor for Indigenous Inclusion Network.

Microsoft AI for Good Lab har utviklet en reproduserbar pipeline for å tilpasse åpne store språkmodeller (LLM) til språk med begrensede ressurser. Dette rammeverket gir partnere handlingsrom og fremmer AI-verktøy som er tilpasset lokalsamfunnene deres, uavhengig av språkets digitale fotavtrykk. Globale prosjekter omfatter inuktitut i Canada, maori i New Zealand, chichewa i Malawi og swahili i Øst-Afrika. Gjennom LINGUA-initiativet finansierer og styrker Microsoft også prosjekter som utvikler datasett av høy kvalitet for underrepresenterte språk i Europa. Ved å dele tekniske veikart og samarbeide med lokale eksperter kan alle språk dra nytte av de nyeste fremskrittene innen AI.

Fra et kulturelt perspektiv er det avgjørende for folk å kunne kommunisere på sitt eget språk. AI gir stor makt til folk, men de burde ikke behøve å lære et annet språk for å bruke det.
Dr. Juan M. Lavista Ferres
Laboratoriedirektør, Microsoft AI for Good Lab

Å bygge en AI-fremtid for alle

Nyere forskning fra AI for Good Lab viser at land der språk med begrensede ressurser dominerer, har betydelig lavere bruk av AI. Dette viser at språklig inkludering er en selvstendig og kraftfull drivkraft for spredning av AI. Engelskens dominans på nettet – der halvparten av alt innhold er på engelsk, mens bare 5 % av verdens befolkning har språket som morsmål – gjør at AI-modeller ofte strever med andre språk, noe som bidrar til å opprettholde globale ulikheter.

AI er den raskest voksende teknologien i historien – 1,2 milliarder mennesker bruker den allerede, men milliarder gjør det ikke. Mange mangler tilgang til grunnleggende forutsetninger som gjør AI mulig, som elektrisitet, internett og digitale ferdigheter. Spredning skjer når alle tar ny teknologi i bruk som en del av hvordan de lever, arbeider og lærer, men uten å ta tak i og lukke gapene risikerer vi å skape et nytt digitalt skille. For å unngå å gjenta tidligere ulikheter – der omveltende teknologier nådde noen, men ikke alle – må AI-inkludering kombineres med grunnleggende tilgang til strøm, tilkobling og digitale ferdigheter. Å få kapable verktøy i hendene på alle lokalsamfunn er slik demokratisering blir virkelig.

Den første AI Diffusion Report fra Microsoft AI Economy Institute avslører at påvirkningen kommer fra spredning – når teknologien integreres med det virkelige liv. I AI-alderen kan inkluderingen av alle språk inspirere alle samfunn, hedre enhver kultur og sikre at alle kan delta i den digitale tidsalderen. Ved å omfavne språklig mangfold oppstår nye muligheter for læring, relasjoner og innovasjon.

Det handler i bunn og grunn om å sikre at denne typen teknologi, som er så omveltende for oss, blir rettferdig fordelt.
Inbal Becker-Reshef
Administrerende direktør, Microsoft AI for Good Lab