Över 2 500 språk riskerar att dö ut
Varje gång årstiderna skiftar närmar sig ett språk utrotning.
I takt med att talarna åldras och färre människor lär sig språket blir den praktiska kunskap som språket bär på svårare att föra vidare. När berättelserna och sångerna börjar blekna vittrar också ett samhälles identitet i tysthet – förlusten är kännbar, världen lite mindre levande. I slutet av detta århundrade kan tusentals språk vara borta och kvar återstår endast ett eko av namn för vinden eller ritualer som hedrade landet.
Med insikt om vad som står på spel har UNESCO utsett 2022–2032 till årtiondet för ursprungsspråk. Detta understryker en global insats för att stödja återupplivande och digital inkludering, samt det arbete som samarbetsorganisationer på platser som Nunavut hjälper till att främja. Enligt UNESCO:s atlas över världens utrotningshotade språk är över 2 500 språk i riskzonen att dö ut, och med varje språk som försvinner förlorar vi också århundraden av visdom och tradition.
”Språket avgör vem som kan använda AI, och förblir otillgängligt när människor inte kan använda det på sitt eget språk”, menar Inbal Becker-Reshef, verksamhetschef för Microsoft AI for Good Lab.
Över 70 % av inuiterna i Nunavut uppger att de har inuktut som sitt modersmål
Ett bevarat kulturarv och stärkt samhälle
Nunavut är Kanadas största och nordligaste territorium och sträcker sig över större delen av kanadensiska Arktis, varav hälften ligger inom polcirkeln. Nunavut är hem till över 30 000 urinvånare och betyder ”vårt land” på inuktut, eller den förenande termen som omfattar både inuktitut- och inuinnaqtun-dialekterna.
Under lång tid saknade inuktut adekvata översättningsverktyg och stora språkmodeller (LLM) som återspeglade dess dialekter. Detta gjorde det nästintill omöjligt att bevara språket för framtida generationer med hjälp av digitala verktyg.
I ett försök att bevara och främja inuktitut har Nunavuts regering inlett ett samarbete med Microsoft för att hjälpa människor att kommunicera på både engelska och inuktitut och samtidigt bygga upp ett robust översättningsminne som ägs av lokalsamhället. Genom att arbeta nära Nunavuts regering och lokalbefolkningen för att samla in språkdata har Microsoft bidragit till att föra Nunavuts traditionella dialekter in i moderna digitala miljöer genom att lägga till språkfamiljen inuktut i Microsoft Translator, vilket stöder lokalbefolkningens arbete med att bevara och använda språken.
Tillvägagångssättet fokuserar på samdesign med lokala samarbetsorganisationer för att etablera ledarskap och samtycke, samla in text- och ljudunderlag som godkänts av lokalsamhället, sammanställa och märka dessa data med lokala korrekturgranskare och validera resultatet mot kulturella och språkliga normer. Denna process – som bygger på förvaltarskap – skapar förtroende så att modellerna återspeglar det levda språket och anammas lokalt. Tillsammans förbättrar dessa kompletterande insatser kommunikationen i verkligheten. Vårdgivare kan samarbeta lättare på distans, ungdomar i nunavummiut-generationerna kan få bättre kontakt med äldre och människor kan skapa, kommunicera och översätta på det språk de själva vill. Numera tillför lärare sin återkoppling på elevernas betygskort på inuktitut, vilket förbättrar kontakten med enspråkiga familjer.
Arbetet har vidareutvecklats i samarbete med Microsoft AI for Good Lab, där man tillsammans arbetar med att utveckla en strategi för att anpassa öppna, stora språkmodeller (LLM) till språk med begränsade resurser, såsom inuktitut.
”Ett nära samarbete med Nunavuts regering var avgörande för att de skulle kunna lita på modellerna och i slutändan anamma och använda dem”, berättar Inbal Becker-Reshef.
Nunavut ligger i Kanadas nordligaste territorium och bebos till största delen av inuiter.
Omkring 85 % av Nunavuts befolkning talar inuktitut, ett språk med flera dialekter.
I Translator-appen kan användare kommunicera med olika språk med hjälp av foto, tal eller text.
Stöd till utvecklingen av alla språk
I takt med att AI-användningen ökar över hela världen har inkluderingen av språk med begränsade resurser blivit en viktig fråga. Språk är nyckeln till utbildning, hälso- och sjukvård och ekonomiska möjligheter, och utan medveten inkludering
riskerar hela samhällen att hamna på efterkälken. Microsofts tillvägagångssätt är öppen källkod, vilket säkerställer att de verktyg och datauppsättningar som utvecklats för språkbevarande och -återupplivande är tillgängliga för samhällen, forskare och samarbetsorganisationer överallt. Genom att göra dessa resurser tillgängliga kan myndigheter samarbeta bättre med lokalsamhället eftersom spridningen av AI främjar möjligheten för lokala röster att forma teknikens framtid.
”På Microsoft ser vi till att ursprungsbefolkningarna tar ledningen och bidrar med engagemang och hårt arbete till våra samarbeten. Vi samarbetar med respekt, samtycke och delat ansvar”, berättar Mike Adams, exekutiv sponsor på Indigenous Inclusion Network.
Microsoft AI for Good Lab har utvecklat en reproducerbar strategi för att anpassa LLM:er med öppen vikt till språk med begränsade resurser. Detta ramverk stärker samarbetsorganisationer och förespråkar AI-verktyg som är skräddarsydda för lokalsamhällena, oavsett språkets digitala fotavtryck. Våra globala projekt sträcker sig från inuktitut i Kanada, maori i Nya Zeeland, chichewa i Malawi och swahili i Östafrika. Genom sitt LINGUA-initiativ finansierar och stärker Microsoft projekt som skapar högkvalitativa datauppsättningar för underrepresenterade språk i hela Europa. Genom att dela tekniska ritningar och samarbeta med lokala experter kan alla språk dra nytta av de senaste framstegen inom AI.
Ur ett kulturellt perspektiv är det viktigt att människor kan kommunicera på sitt eget språk. AI ger människor stora fördelar, men de ska inte behöva lära sig ett annat språk för att nyttja dem.
En AI-framtid skapad för alla
Ny forskning från AI for Good Lab visar att länder där språk med begränsade resurser dominerar har en betydligt lägre användning av AI, vilket tyder på att språklig inkludering är en oberoende och kraftfull drivkraft för spridningen av AI. Engelskans dominans på webben – där hälften av allt innehåll är på engelska, medan bara 5 % av världen talar det som modersmål – innebär att AI-modeller ofta har svårt med andra språk, vilket i sin tur bidrar till att upprätthålla globala orättvisor.
AI är den snabbast växande tekniken i historien – 1,2 miljarder människor använder den redan, medan miljarder andra inte har möjlighet till det. Många saknar tillgång till de grundläggande förutsättningar som krävs för att kunna använda AI, såsom elektricitet, internet och digitala färdigheter. Riktig spridning sker först när alla gör ny teknik till en del av hur de lever, arbetar och lär sig, men utan att ta itu med och överbrygga klyftorna riskerar vi att skapa en ny digital splittring. I syfte att undvika att upprepa tidigare orättvisor – där transformativa tekniker nådde vissa men inte alla – måste AI-inkludering kombineras med grundläggande tillgång till elektricitet, uppkoppling och digitala färdigheter. Demokratiseringen blir först verklig när alla samhällen får tillgång till fungerande verktyg.
Den första rapporten om AI:s spridning från Microsoft AI Economy Institute avslöjar att den verkliga effekten härstammar i spridning, dvs. när teknik integreras i det verkliga livet. I en tid präglad av AI kan inkludering av alla språk inspirera alla samhällen, hedra alla kulturer och säkerställa att alla kan delta i den digitala tidsåldern. Genom att omfamna språklig mångfald skapas nya möjligheter för lärande, kontakter och innovation.
Det handlar i grund och botten om att se till att den här typen av teknik, som är så revolutionerande för oss, sprids på ett rättvist sätt.