Mehr als 2.500 Sprachen drohen zu verschwinden
Alle paar Monate rückt eine Sprache näher an das Aussterben heran.
Wenn Sprecherinnen und Sprecher altern und weniger Personen die Sprache lernen, wird es schwieriger, das praktische Wissen, das die Sprache in sich trägt, weiterzugeben. Wenn die Geschichte von Erzählungen und Liedern zu verblassen beginnt, löst sich die Identität einer Community leise auf – der Verlust ist persönlich, und die Welt ein Stück weniger lebendig. Bis zum Ende dieses Jahrhunderts könnten Tausende von Sprachen verschwunden sein und nur ein Echo von Namen für den Wind oder von Ritualen hinterlassen, die einst das Land ehrten.
In Anbetracht dessen, was auf dem Spiel steht, hat die UNESCO den Zeitraum 2022–2032 zur Dekade der indigenen Sprachen erklärt. Dies unterstreicht eine weltweite Bemühung zur Unterstützung der Revitalisierung und digitalen Inklusion sowie die Arbeit, die Partner an Orten wie Nunavut vorantreiben. Laut dem UNESCO Atlas of World’s Languages in Danger , einer Veröffentlichung, die sich mit dem Erhalt von gefährdeten Sprachen auf der ganzen Welt befasste, sind über 2.500 Sprachen vom Verschwinden bedroht, und mit jedem Verlust verschwinden Jahrhunderte an Weisheit und Tradition.
„Die Sprache entscheidet darüber, wer KI nutzen kann – sie bleibt unzugänglich, wenn Personen nicht in ihrer eigenen Sprache mit ihr interagieren können“, sagt Inbal Becker-Reshef, Managing Director, Microsoft AI for Good Lab.
Über 70 % der Inuit in Nunavut geben Inuktut als ihre Muttersprache an
Das Erbe bewahren, die Community stärken
Nunavut ist Kanadas größtes und nördlichstes Territorium, das den Großteil der kanadischen Arktis umfasst und zur Hälfte im nördlichen Polarkreis liegt. Nunavut ist die Heimat von über 30.000 indigenen Einwohnerinnen und Einwohnern und bedeutet „Unser Land“ auf Inuktut – dem Sammelbegriff für die Dialekte Inuktitut und Inuinnaqtun.
Lange Zeit gab es für Inuktut keine angemessenen Übersetzungstools oder großen Sprachmodelle (LLMs), die Dialekte korrekt wiedergaben. Das machte den Erhalt der Sprache für künftige Generationen mit digitalen Tools zu einer fast unmöglichen Aufgabe.
In dem Bestreben, Inuktitut zu bewahren und weiterzuentwickeln, ging die Regierung von Nunavut eine Partnerschaft mit Microsoft ein. Ziel war es, die Kommunikation sowohl auf Englisch als auch auf Inuktitut zu erleichtern und gleichzeitig ein solides, Community-eigenes Translation Memory aufzubauen, also eine Art Terminologiedatenbank. Durch die enge Zusammenarbeit mit der Regierung von Nunavut und den Communitys bei der Erfassung von Sprachdaten trug Microsoft dazu bei, die traditionellen Dialekte Nunavuts in moderne digitale Umgebungen zu integrieren. Die Inuktut-Sprachfamilie wurde Microsoft Translator hinzugefügt, um den von der Community geleiteten Erhalt und die Nutzung der Sprache zu unterstützen.
Der Ansatz konzentriert sich auf die gemeinsame Entwicklung, zusammen mit lokalen Partnerinnen und Partnern. Dabei gilt es, Governance und Zustimmung zu etablieren, von der Community genehmigte Texte und Audioaufnahmen zu beschaffen, Daten mit lokalen Prüferinnen und Prüfern zu kuratieren und zu kennzeichnen sowie die Ergebnisse anhand kultureller und sprachlicher Normen zu validieren. Dieser Prozess – der auf Verantwortung basiert – schafft Vertrauen, sodass die Modelle die gelebte Sprache widerspiegeln und vor Ort angenommen werden. Gemeinsam sorgen diese ergänzenden Maßnahmen dafür, dass die Kommunikation im Alltag besser wird. Fachkräfte im Gesundheitswesen können über Entfernungen hinweg im Handumdrehen zusammenarbeiten, junge Nunavummiut können sich besser mit Älteren verständigen, und Personen können in der Sprache ihrer Wahl Inhalte erstellen, kommunizieren und übersetzen. Lehrkräfte fügen noch heute Feedback auf Inuktitut in Zeugnisse ein und erreichen so Familien besser, die nur diese Sprache sprechen.
Die Arbeit wurde durch eine Partnerschaft mit dem Microsoft AI for Good Lab fortgesetzt. Gemeinsam entstand eine Pipeline, um Open-Weight-Modelle für große Sprachmodelle (LLMs) an ressourcenarme Sprachen wie zum Beispiel Inuktitut anzupassen.
„Die wirklich enge Zusammenarbeit mit der Regierung von Nunavut war entscheidend, damit sie den Modellen vertrauen und sie letztendlich anpassen und nutzen konnten“, sagt Inbal Becker-Reshef.
Nunavut liegt im nördlichsten Territorium Kanadas und ist die Heimat einer mehrheitlich inuitischen Bevölkerung.
Etwa 85 % der Bevölkerung Nunavuts sprechen Inuktitut, eine Sprache mit mehreren Dialekten.
In der Translator-App können Benutzerinnen und Benutzer mittels Foto, Sprache oder Text sprachübergreifend Verbindungen knüpfen.
Unterstützung der Weiterentwicklung aller Sprachen
Da sich die KI-Implementierung weltweit beschleunigt, ist die Einbeziehung ressourcenarmer Sprachen zu einem wichtigen Thema geworden. Sprache ist das Tor zu Bildung, Gesundheitsversorgung und wirtschaftlichen Chancen. Ohne bewusste Inklusion riskieren ganze Communitys, den Anschluss zu verlieren. Der Ansatz von Microsoft ist Open Source und sorgt dafür, dass die für den Spracherhalt und die Revitalisierung entwickelten Tools und Datensätze überall erhältlich sind, und zwar für Communitys, Forschende und Partnerinnen und Partner. Indem diese Ressourcen zugänglich gemacht werden, können Regierungen besser mit den Communitys interagieren, da die Verbreitung von KI lokalen Stimmen Gehör verschafft, um die Zukunft der Technologie zu gestalten.
„Bei Microsoft stellen wir sicher, dass indigene Communitys die Führung übernehmen und unsere Partnerschaften mit Herz und Sorgfalt bereichern. Wir arbeiten mit Respekt, Zustimmung und gemeinsamer Verantwortlichkeit zusammen“, sagt Mike Adams, Executive Sponsor des Indigenous Inclusion Network.
Das Microsoft AI for Good Lab hat eine reproduzierbare Pipeline zur Anpassung von Open-Weight-LLMs an ressourcenarme Sprachen entwickelt. Dieses Framework stärkt Partner und setzt sich für KI-Tools ein, die auf ihre Communitys zugeschnitten sind – unabhängig vom digitalen Fußabdruck der Sprache. Globale Projekte umfassen Inuktitut in Kanada, Māori in Neuseeland, Chichewa in Malawi und Swahili in Ostafrika. Und durch die LINGUA-Initiative finanziert und stärkt Microsoft Projekte, die erstklassige Datensätze für unterrepräsentierte Sprachen in ganz Europa schaffen. Durch den Austausch technischer Blaupausen und die Zusammenarbeit mit lokalen Fachleuten kann jede Sprache von den neuesten KI-Fortschritten profitieren.
Aus kultureller Sicht ist es von entscheidender Bedeutung, dass man in der Lage ist, in seiner eigenen Sprache zu kommunizieren. KI bietet enorme Möglichkeiten, aber niemand sollte eine andere Sprache lernen müssen, um sie auch nutzen zu können.
Eine KI-Zukunft für alle gestalten
Vor Kurzem erschienene Forschungsergebnisse des AI for Good Lab zeigen, dass Länder, in denen ressourcenarme Sprachen vorherrschen, eine deutlich geringere KI-Implementierung aufweisen. Dies verdeutlicht, dass die Einbeziehung von Sprachen ein eigenständiger und starker Treiber für die Verbreitung von KI ist. Die Dominanz des Englischen im Web – wo die Hälfte aller Inhalte auf Englisch ist, aber nur 5 % der Weltbevölkerung Muttersprachler sind – führt dazu, dass KI-Modelle oft Probleme mit anderen Sprachen haben, was zu globalen Ungleichheiten führt.
KI ist die am schnellsten wachsende Technologie der Geschichte – 1,2 Milliarden Personen nutzen sie bereits, aber Milliarden anderen bleibt der Zugang verwehrt. Vielen fehlen die Grundlagen, die KI erst möglich machen, wie zum Beispiel Strom, Internet und digitale Fähigkeiten. Verbreitung findet statt, wenn alle neue Technologien in ihr Leben, ihre Arbeit und ihr Lernen integrieren können. Doch wenn wir die Lücken nicht schließen, riskieren wir eine neue digitale Kluft. Um Ungleichheiten der Vergangenheit nicht zu wiederholen – bei denen transformative Technologien nur einige, aber nicht alle erreichten –, muss die KI-Inklusion mit dem grundlegenden Zugang zu Strom, Konnektivität und digitalen Fähigkeiten einhergehen. Leistungsfähige Tools in die Hände aller Communitys zu legen – genau so wird Demokratisierung Wirklichkeit.
Der erste AI Diffusion Report des Microsoft AI Economy Institute zeigt, dass Wirkung durch Verbreitung entsteht, und zwar, wenn sich Technologie nahtlos in das echte Leben einfügt. Im Zeitalter der KI kann die Einbeziehung aller Sprachen jede Community in Gänze inspirieren, jede Kultur würdigen und dafür sorgen, dass alle am digitalen Zeitalter teilhaben können. Durch die Förderung der sprachlichen Vielfalt entstehen neue Möglichkeiten zum Lernen, Vernetzen und für Innovationen.
Es geht wirklich darum, sicherzustellen, dass diese Art von Technologien, die für uns so transformativ sind, gerecht verteilt werden.