Ponad 2500 języków jest zagrożonych wyginięciem
Co kilka miesięcy kolejny język przybliża się do stanu wyginięcia.
Wraz ze starzeniem się ludzi posługujących się nim i coraz mniejszą liczbą osób uczących się go, praktyczna wiedza, którą niesie ze sobą język, staje się trudniejsza do przekazania. W miarę jak historia opowieści i pieśni zaczyna zanikać, tożsamość społeczności po cichu się rozpada – utrata jest dyskretna, świat staje się jedynie nieco mniej tętniący życiem. Ale do końca tego stulecia tysiące języków może zniknąć bezpowrotnie, pozostawiając jedynie echa nazw wiatru lub rytuałów ku czci tej ziemi.
Zdając sobie sprawę z tego, o co toczy się gra, UNESCO wyznaczyło lata 2022–2032 jako Dekadę języków tubylczych (Decade of Indigenous Languages). Podkreśla to globalne wysiłki na rzecz wspierania rewitalizacji i włączenia cyfrowego, a także prace, które partnerzy w miejscach takich jak Nunavut pomagają rozwijać. Według Atlasu zagrożonych języków świata (Atlas of World’s Languages in Danger) UNESCO, ponad aż 2500 jest zagrożonych wyginięciem, a z każdą stratą znikają wieki mądrości i tradycji.
„Język decyduje o tym, kto może korzystać ze sztucznej inteligencji — pozostaje ona niedostępna, gdy ludzie nie mogą się z nią komunikować w swoim własnym języku” — twierdzi Inbal Becker-Reshef, dyrektor zarządzający AI for Good Lab firmy Microsoft.
Ponad 70% Eskimosów w Nunavut podaje inuktut jako swój język ojczysty
Ochrona dziedzictwa, wzmacnianie społeczności
Nunavut jest największym, najbardziej wysuniętym na północ terytorium Kanady, obejmującym większość kanadyjskiej Arktyki, z czego połowa znajduje się za kołem podbiegunowym. Nunavut, zamieszkane przez ponad 30 000 rdzennych mieszkańców, oznacza „naszą ziemię” w języku inuktut, co jest terminem jednoczącym obejmującym zarówno dialekty inuktitut, jak i inuinnaqtun.
Przez długi czas inuktut nie dysponował odpowiednimi narzędziami tłumaczeniowymi ani dużymi modelami językowymi (LLM), które odzwierciedlałyby jego dialekty. To sprawiło, że zachowanie języka dla przyszłych pokoleń za pomocą narzędzi cyfrowych było zadaniem z gatunku praktycznie niemożliwych.
Dążąc do zachowania i rozwoju języka inuktitut, rząd Nunavut nawiązał współpracę z firmą Microsoft, aby pomóc ludziom komunikować się zarówno w języku angielskim, jak i inuktitut, jednocześnie tworząc solidną, należącą do społeczności pamięć tłumaczeniową. Dzięki ścisłej współpracy z rządem Nunavut i społecznościami w celu gromadzenia danych językowych, firma Microsoft pomogła przenieść tradycyjne dialekty Nunavut do nowoczesnych środowisk cyfrowych, dodając rodzinę języków inuktut do usługi Microsoft Translator, wspierając ich zachowanie i stosowanie przez społeczność.
Podejście to koncentruje się na wspólnym projektowaniu z lokalnymi partnerami w celu ustanowienia zarządzania i uzyskania zgody, pozyskiwania tekstów i nagrań zatwierdzonych przez społeczność, selekcjonowania i oznaczania danych z lokalnymi recenzentami oraz weryfikowania wyników pod kątem norm kulturowych i językowych. Ten proces – zakorzeniony w zarządzaniu – buduje zaufanie, dzięki czemu modele odzwierciedlają żywy język i są akceptowane lokalnie. Razem te uzupełniające się wysiłki poprawiają komunikację w świecie rzeczywistym. Pracownicy służby zdrowia mogą łatwiej współpracować na odległość, młodzież z pokolenia Nunavummiut może lepiej porozumiewać się ze starszymi, a ludzie mogą tworzyć, komunikować się i tłumaczyć w wybranym przez siebie języku. Obecnie nauczyciele dodają informacje zwrotne do świadectw uczniów w języku inuktitut, dzięki czemu lepiej angażują się w pracę z rodzinami jednojęzycznymi.
Prace są kontynuowane we współpracy z AI for Good Lab firmy Microsoft w celu opracowania potoku adaptacji dużych modeli językowych (LLM) z otwartą wagą (open-weight) do języków o niskich zasobach, takich jak Inuktitut.
„Ścisła współpraca z rządem Nunavut miała kluczowe znaczenie, aby móc zaufać modelom i ostatecznie je dostosować i wykorzystać”, uważa Inbal Becker-Reshef.
Położone na najbardziej wysuniętym na północ obszarze Kanady Nunavut jest domem dla większości populacji Inuitów.
Około 85% populacji Nunavut posługuje się inuktitut, czyli językiem z kilkoma dialektami.
W aplikacji Translator użytkownicy mogą łączyć się w różnych językach za pomocą zdjęć, mowy lub tekstu.
Wspieranie rozwoju wszystkich języków
W miarę jak wdrażanie sztucznej inteligencji na całym świecie przyspiesza, uwzględnienie języków o niskich zasobach stało się krytyczną kwestią. Język jest bramą do edukacji, opieki zdrowotnej i możliwości ekonomicznych, a bez celowej integracji całe społeczności mogą pozostać w tyle. Podejście firmy Microsoft opiera się o koncepcję open source, dzięki czemu narzędzia i zestawy danych opracowane w celu zachowania i rewitalizacji języka są dostępne dla społeczności, badaczy i partnerów na całym świecie. Udostępniając te zasoby, rządy mogą lepiej współpracować ze społecznościami, ponieważ rozpowszechnianie sztucznej inteligencji wspiera lokalne głosy w kształtowaniu przyszłości technologii.
„W firmie Microsoft dbamy o to, aby społeczności tubylcze przejęły inicjatywę, wnosząc serce i zasady do naszych partnerstw. Współpracujemy z szacunkiem, w oparciu o zgodę i wspólną odpowiedzialność” – mówi Mike Adams, sponsor wykonawczy Indigenous Inclusion Network.
Laboratorium AI for Good firmy Microsoft opracowało powtarzalny potok adaptacji LLM z otwartą wagą do języków o niskich zasobach. Ramy te wzmacniają pozycję partnerów i propagują narzędzia sztucznej inteligencji dostosowane do ich społeczności, niezależnie od cyfrowego śladu języka. Globalne projekty obejmują języki inuktitut w Kanadzie, maoryski w Nowej Zelandii, czewa w Malawi i suahili w Afryce Wschodniej. W ramach inicjatywy LINGUA firma Microsoft finansuje i wzmacnia projekty tworzące wysokiej jakości zestawy danych dla niedostatecznie reprezentowanych języków w całej Europie. Dzieląc się planami technicznymi i współpracując z lokalnymi ekspertami, każdy język może skorzystać z najnowszych osiągnięć w dziedzinie sztucznej inteligencji.
Z kulturowego punktu widzenia bardzo ważne jest, aby ludzie byli w stanie porozumiewać się we własnym języku. Sztuczna inteligencja daje ludziom ogromną moc, ale nie powinni oni uczyć się innego języka, aby z niej korzystać.
Budowanie przyszłości opartej o sztuczną inteligencję dla wszystkich
Niedawne badania przeprowadzone przez AI for Good Lab podkreślają, że kraje, w których dominują języki o niskich zasobach, wykazują znacznie niższe przyjęcie sztucznej inteligencji, co pokazuje, że integracja językowa jest niezależnym i potężnym czynnikiem napędzającym rozprzestrzenianie się sztucznej inteligencji. Dominacja języka angielskiego w Internecie – gdzie połowa wszystkich treści jest w języku angielskim, ale tylko 5% świata posługuje się nim natywnie – oznacza, że modele sztucznej inteligencji często mają problemy z innymi językami, utrwalając globalne nierówności.
Sztuczna inteligencja to najszybciej rozwijająca się technologia w historii – korzysta z niej już 1,2 miliarda ludzi, ale miliardy innych nie. Wiele z nich nie ma dostępu do fundamentów umożliwiających rozwój sztucznej inteligencji, takich jak elektryczność, internet i umiejętności cyfrowe. Rozpowszechnianie trwa, gdy wszyscy włączają nowe technologie do swojego życia, pracy i nauki, ale bez zajęcia się lukami i ich zlikwidowania ryzykujemy powstanie nowej przepaści cyfrowej. Aby uniknąć powtórki nierówności z przeszłości – gdzie technologie transformacyjne dotarły do niektórych, ale nie wszystkich – włączenie sztucznej inteligencji musi iść w parze z podstawowym dostępem do energii elektrycznej, łączności i umiejętności cyfrowych. Dostarczenie kompetentnych narzędzi w ręce wszystkich społeczności jest sposobem, w jaki demokratyzacja staje się rzeczywistością.
Pierwszy raport dotyczący rozpowszechnienia AI (AI Diffusion Report) opracowany przez Microsoft AI Economy Institute pokazuje, że wpływ wynika z rozpowszechnienia — gdy technologia integruje się z prawdziwym życiem. W erze sztucznej inteligencji włączenie wszystkich języków może zainspirować każdą społeczność, uhonorować każdą kulturę i zapewnić, że każdy może uczestniczyć w erze cyfrowej. Akceptacja różnorodności językowej stwarza nowe możliwości uczenia się, nawiązywania kontaktów i wprowadzania innowacji.
Tak naprawdę chodzi o to, aby upewnić się, że tego rodzaju technologie, które są dla nas tak transformacyjne, są sprawiedliwie dystrybuowane.