pixel

Äänen antaminen kaikille kielille

Tekoälyn aikakaudella kaikkien kielten osallistaminen on välttämätöntä yhteisöille ja kulttuureille

Yli 2 500 kieltä on vaarassa kadota

Muutaman kuukauden välein taas yksi kieli on lähempänä sukupuuttoa.

Kun kielen puhujat ikääntyvät ja yhä harvemmat ihmiset oppivat sitä, kielen sisältämää käytännön tietoa on vaikeampi välittää eteenpäin. Tarinoiden ja laulujen historian alkaessa haalistua yhteisön identiteetti hajoaa hiljalleen – menetys on intiimi jonka myötä maailma muuttuu vähemmän eloisaksi. Tämän vuosisadan loppuun mennessä tuhannet kielet saattavat olla poissa, jättäen vain kaikuja tuulelle annetuista nimistä tai maata kunnioittaneista rituaaleista.

UNESCO tiedosti tämän kehityksen ja nimesi vuodet 2022–2032 alkuperäiskielten vuosikymmeneksi. Tämä korostaa maailmanlaajuista pyrkimystä tukea kielien elvyttämistä ja digitaalista osallistamista sekä työtä, jota kumppanit Nunavutin kaltaisissa paikoissa auttavat kehittämään. UNESCOn Atlas of World’s Languages in Danger -julkaisun mukaan yli 2 500 kieltä on vaarassa kadota, ja jokaisen menetyksen myötä vuosisatojen viisaus ja perinteet katoavat.

”Kieli määrittää, kuka voi käyttää tekoälyä. Se pysyy saavuttamattomana, jos sitä ei voi käyttää omalla kielellä”, sanoo Microsoftin AI for Good Labin toimitusjohtaja Inbal Becker-Reshef.
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

Yli 70 % Nunavutin inuiiteista ilmoittaa, että inuktut on heidän äidinkielensä

Perinnön säilyttäminen, yhteisön toimintamahdollisuudet

Nunavut on Kanadan suurin, pohjoisin territorio, joka kattaa suurimman osan Kanadan arktisesta alueesta ja josta puolet on pohjoisella napapiirillä. Nunavutissa asuu yli 30 000 alkuperäiskansaan kuuluvaa, ja se tarkoittaa ”maamme” inuktutin kielellä, joka on termi, joka kattaa sekä inuktitutin että inuinnaqtunin murteet.

Inuktutilla ei ollut pitkään aikaan riittäviä käännöstyökaluja tai suuria kielimalleja (LLM), jotka heijastaisivat sen murteita. Tämä teki kielen säilyttämisestä tuleville sukupolville digitaalisten työkalujen avulla lähes mahdottoman tehtävän.

Inuktitutin säilyttämiseksi ja kehittämiseksi Nunavutin hallitus ryhtyi yhteistyöhön Microsoftin kanssa auttaakseen ihmisiä kommunikoimaan sekä englanniksi että inuktitutiksi ja rakentaakseen samalla vankan, yhteisön omistaman käännösmuistin. Työskentelemällä tiiviisti Nunavutin hallituksen ja yhteisöjen kanssa kielitiedon keräämiseksi Microsoft auttoi tuomaan Nunavutin perinteiset murteet nykyaikaisiin digitaalisiin ympäristöihin lisäämällä Microsoft Translator -työkaluun inuktutin kieliperheen, mikä tukee yhteisölähtöistä kielen säilyttämistä ja käyttöä.

Lähestymistapa keskittyy yhdessä tehtävään suunnitteluun paikallisten kumppaneiden kanssa hallintotavan ja yhteisymmärryksen luomiseksi, yhteisön hyväksymän tekstin ja äänen hankkimiseksi, tietojen kuratoimiseksi ja merkitsemiseksi paikallisten arvioijien kanssa sekä tuotosten validoimiseksi kulttuuristen ja kielellisten normien mukaisesti. Tämä vastuullisuuteen perustuva prosessi rakentaa luottamusta, jolloin mallit heijastavat elettyä kieltä ja ne omaksutaan paikallisesti. Yhdessä nämä toisiaan täydentävät toimet parantavat tosielämän kommunikointia. Terveydenhuollon tarjoajat voivat tehdä helpommin yhteistyötä etäisyyksien ollessa pitkiä, Nunavummiut-nuoret voivat olla paremmin yhteydessä vanhempien sukupolvien kanssa ja ihmiset voivat luoda, kommunikoida ja kääntää haluamallaan kielellä. Nykyään opettajat antavat palautteensa opiskelijoiden todistuksiin inuktitutin kielellä voidakseen olla paremmin vuorovaikutuksessa yksikielisten perheiden kanssa.

Työtä on jatkettu yhteistyössä Microsoftin AI for Good Labin kanssa, ja yhdessä on kehitetty prosessia avointen laajojen kielimallien (LLM) mukauttamiseksi vähäisten resurssien kieliin, kuten inuktitutiin.

”Hyvin läheinen yhteistyö Nunavutin hallituksen kanssa oli ratkaisevan tärkeää, jotta he pystyivät luottamaan malleihin ja lopulta mukauttamaan ja käyttämään niitä”, sanoo Inbal Becker-Reshef.

Kaikkien kielten kehityksen tukeminen

Tekoälyn käyttöönoton kiihtyessä maailmanlaajuisesti vähäisten resurssien kielten osallistamisesta on tullut ratkaisevan tärkeä kysymys. Kieli on portti koulutukseen, terveydenhuoltoon ja taloudellisiin mahdollisuuksiin, ja ilman tarkoituksellista osallistamista kokonaiset yhteisöt ovat vaarassa jäädä jälkeen. Microsoftin lähestymistapa perustuu avoimeen lähdekoodiin, mikä varmistaa, että kielten säilyttämiseen ja elvyttämiseen kehitetyt työkalut ja tietojoukot ovat yhteisöjen, tutkijoiden ja kumppanien käytettävissä kaikkialla. Asettamalla nämä resurssit saataville hallitukset voivat olla paremmin vuorovaikutuksessa yhteisöjen kanssa, sillä tekoälyn diffuusio tukee paikallisia ääniä ja muokkaa teknologian tulevaisuutta.

”Me Microsoftilla varmistamme, että alkuperäiskansojen yhteisöt ovat toiminnan johdossa sekä tuovat inhimillisyyttä ja perusteellisuutta kumppanuussuhteisiimme. Teemme yhteistyötä kunnioittavasti, yhteisymmärryksessä ja jaetulla vastuulla”, sanoo Mike Adams, Indigenous Inclusion Network -verkoston toiminnanjohtaja.

Microsoftin AI for Good Lab on kehittänyt toistettavissa olevan prosessin avointen LLM-mallien mukauttamiseksi vähäisten resurssien kieliin. Tämä viitekehys antaa kumppaneille toimintamahdollisuuksia ja tukee heidän yhteisöilleen räätälöityjä tekoälytyökaluja kielen digitaalisesta jalanjäljestä riippumatta. Maailmanlaajuiset hankkeet ulottuvat Kanadan inuktitutiin, Uuden-Seelannin maoriin, Malawin chichewaan ja Itä-Afrikan swahiliin. Microsoft rahoittaa ja vahvistaa LINGUA-aloitteensa kautta hankkeita, joissa luodaan korkealaatuisia tietojoukkoja aliedustetuista kielistä kaikkialla Euroopassa. Jakamalla teknisiä suunnitelmia ja tekemällä yhteistyötä paikallisten asiantuntijoiden kanssa jokainen kieli voi hyötyä tekoälyn uusimmista edistysaskeleista.

Kulttuurisesta näkökulmasta on ratkaisevan tärkeää, että pystytään kommunikoimaan omalla kielellä. Tekoäly antaa suurta voimaa, mutta kenenkään ei pitäisi joutua opettelemaan toista kieltä voidakseen käyttää sitä.
Tri Juan M. Lavista Ferres
Laboratorion johtaja, Microsoftin AI for Good Lab

Tekoälytulevaisuuden rakentaminen kaikille

AI for Good Labin viimeaikainen tutkimus on osoittanut, että maissa, joissa vähäisten resurssien kielet ovat vallitsevia, tekoälyn käyttöönotto on huomattavasti vähäisempää. Tämä viittaa siihen, että kielten osallistaminen on itsenäinen ja tehokas tekoälyn diffuusiota edistävä tekijä. Englannin hallitseva asema verkossa – jossa puolet kaikesta sisällöstä on englanniksi, vaikka ainoastaan 5 % maailmasta puhuu sitä äidinkielenään – tarkoittaa, että tekoälymallit kamppailevat usein muiden kielten kanssa, mikä puolestaan pitää yllä maailmanlaajuista eriarvoisuutta.

Tekoäly on historian nopeimmin kasvava teknologia – sitä käyttää jo 1,2 miljardia ihmistä, mutta miljardit muut eivät. Monilla ei ole tekoälyn mahdollistavia perusasioita, kuten sähköä, Internetiä ja digitaalisia taitoja. Diffuusio tapahtuu, kun uusi teknologia tuodaan osaksi elämää, työskentelyä ja oppimista, mutta jos kuiluja ei korjata, vaarana on luoda uusi digitaalinen kuilu. Jotta vältettäisiin aiempien eriarvoisuuksien toistuminen – joissa mullistavat teknologiat saavuttivat vain osan – tekoälyn osallistaminen on yhdistettävä perusasioihin, kuten sähkön saatavuuteen, yhteyksiin ja digitaalisiin taitoihin. Demokratisoinnista tulee todellista, kun kaikkien yhteisöjen käyttöön saadaan pätevät työkalut.

Microsoftin AI Economy Instituten ensimmäinen AI Diffusion Report -julkaisu osoittaa, että vaikutus syntyy diffuusiosta eli teknologian integroitumisesta tosielämään. Tekoälyn aikakaudella kaikkien kielten osallistaminen voi inspiroida jokaista yhteisöä, kunnioittaa jokaista kulttuuria ja varmistaa, että kaikki pystyvät osallistumaan digitaaliaikaan. Kielellisen monimuotoisuuden omaksuminen luo uusia mahdollisuuksia oppimiseen, yhteydenpitoon ja innovointiin.

Kyse on pohjimmiltaan sen varmistamisesta, että tällaiset meille mullistavat teknologiat jakautuvat oikeudenmukaisesti.
Inbal Becker-Reshef
Toimitusjohtaja, Microsoftin AI for Good Lab