pixel

Her dile ses vermek

Yapay zeka çağında, hiçbir dilin dışarıda bırakılmaması topluluklar ve kültür için çok önemlidir.

2.500’den fazla dil yok olma riskiyle karşı karşıya

Birkaç ayda bir, dillerden biri yok olmaya yaklaşıyor.

Konuşmacılar yaşlandıkça ve daha az insan öğrendikçe, dilin taşıdığı pratik bilgilerin aktarılması zorlaşır. Hikayelerin ve şarkıların mazisi solmaya başladığında, bir topluluğun kimliği sessizce çatırdar. Kayıp çok yakındır ve dünya eskisi kadar canlı değildir. Bu yüzyılın sonuna gelindiğinde, binlerce dil kaybolmuş olabilir. Geriye sadece rüzgar isimlerinin yankıları veya toprağı onurlandıran ritüeller kalır.

Tehlikeyi fark eden UNESCO, 2022-2032’yi Yerli Dillerinin On Yılı ilan etti. Bu, yeniden canlandırmayı ve dijital kapsayıcılığı desteklemeye yönelik küresel bir çabayı ve Nunavut gibi yerlerdeki iş ortaklarının ilerlemeye yardımcı olduğu çalışmaları vurgulamaktadır.UNESCO Tehlike Altındaki Dünya Dilleri Atlası’na göre 2.500’den fazla dil yok olma riskiyle karşı karşıya ve her kayıpla birlikte yüzyıllarca süren bilgelik ve gelenek yok oluyor.

Microsoft AI for Good Lab Genel Müdürü Inbal Becker-Reshef, “Dil, yapay zekayı kimlerin kullanacağını belirler ve insanlar yapay zekayla kendi dillerinde etkileşim kuramadıklarında o dil erişilemez kalır.” diyor.
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

Nunavut’taki Inuitlerin %70’inden fazlası Inuitçenin ana dilleri olduğunu bildiriyor

Mirası korumak, toplumu güçlendirmek

Nunavut, Kanada’nın en büyük, en kuzeydeki bölgesidir ve yarısı Kuzey Kutup Dairesi’nde olmak üzere Kanada Arktik Bölgesi’nin büyük kısmını kapsar. 30.000’den fazla yerliye ev sahipliği yapan Nunavut, Inuitçede “Toprağımız” veya hem Inuktitut hem de Inuinnaqtun lehçelerini kapsayan birleştirici terim anlamına gelir.

Uzun bir süre boyunca Inuitçe, lehçelerini yansıtan yeterli çeviri araçlarına veya büyük dil modellerine (LLM’ler) sahip değildi. Bu, dijital araçlarla gelecek nesiller için dili korumayı neredeyse imkansız bir görev hâline getirdi.

Inuitçeyi korumak ve ilerletmek amacıyla Nunavut Hükümeti, insanların hem İngilizce hem de Inuitçe iletişim kurmasına yardımcı olurken aynı zamanda topluluğa ait sağlam bir çeviri belleği oluşturmak için Microsoft ile ortaklık kurdu. Microsoft, dil verilerini toplamak için Nunavut Hükümeti ve topluluklarla yakın bir şekilde çalışarak Inuktut dil ailesini Microsoft Translator‘a ekledi. Böylece Nunavut’un geleneksel lehçelerinin modern dijital ortamlara taşınmasına yardımcı oldu ve topluluk liderliğinde koruma ve kullanımı destekledi.

Yaklaşım, yönetişim ve rıza oluşturmak, topluluk tarafından onaylanan metin ve seslere kaynak sağlamak, verileri yerel gözden geçirenlerle düzenlemek ve etiketlemek, sonuçları kültürel ve dilsel normlara göre doğrulamak için yerel ortaklarla birlikte tasarlamaya odaklanır. Yöneticiliği temel alan bu süreç, modellerin yaşanmış dili yansıtması ve yerel olarak benimsenmesi için güven oluşturur. Bu tamamlayıcı çabalar birlikte gerçek dünyada iletişimi geliştirir. Sağlık hizmeti sağlayıcıları uzak mesafelerden daha kolay iş birliği yapabilir, farklı Nunavummiut nesillerinden gençler yaşlılarla daha fazla bağlantı kurabilir ve insanlar seçtikleri dilde bir şeyler yaratabilir, iletişim kurabilir ve çeviri yapabilir. Bugün, eğitimciler öğrencilerin karnelerine Inuitçe geri bildirim ekleyerek tek dilli ailelerle daha iyi etkileşim kuruyorlar.

Çalışmanın devamında Microsoft AI for Good Lab ile bir iş ortaklığı kuruldu. Bu kapsamda, açık ağırlıklı büyük dil modellerini (LLM’ler) Inuitçe gibi düşük kaynaklı dillere uyarlamak için bir düzen geliştirmek amacıyla ortak bir çalışma gerçekleştirildi.

Inbal Becker-Reshef, “Nunavut Hükümeti ile gerçekten yakın çalışmak, modellere güvenebilmeleri ve nihayetinde onları uyarlayıp kullanabilmeleri için kritik öneme sahipti” diyor.

Tüm dillerin ilerlemesini destekliyoruz

Yapay zekanın benimsenmesi dünya çapında hızlandıkça, yetersiz kaynağa sahip dillerin dışarıda bırakılmaması kritik bir konu hâline geldi. Dil; eğitime, sağlık hizmetlerine ve ekonomik fırsatlara açılan kapıdır ve bilinçli kapsayıcılık olmadan tüm topluluklar geride kalma riskiyle karşı karşıyadır. Microsoft’un yaklaşımı açık kaynak olup dilin korunması ve yeniden canlandırılması için geliştirilen araçların ve veri kümelerinin her yerdeki topluluklar, araştırmacılar ve iş ortakları tarafından kullanılabilmesini sağlar. Yapay zekanın yayılması teknolojinin geleceğini şekillendirmek için yerel seslere destek olurken hükümetler bu kaynakları erişilebilir hâle getirerek topluluklarla daha iyi etkileşim kurabilir.

Kapsayıcılık Ağı Yönetici Sponsoru Mike Adams, “Microsoft genelinde, yerli topluluklarının öncülük etmesine olanak tanıyarak iş ortaklıklarımıza cesaret ve titizlik katıyoruz. Saygı, rıza ve ortak mesuliyet çerçevesinde iş birliği yapıyoruz.” diyor.

Microsoft AI for Good Lab, açık ağırlıklı LLM’leri düşük kaynaklı dillere uyarlamak için yeniden üretilebilir bir düzen geliştirmiştir. Bu çerçeve, dilin dijital ayak izinden bağımsız olarak iş ortaklarını güçlendirir ve topluluklarına göre uyarlanmış yapay zeka araçlarını savunur. Küresel projeler Kanada’da İnuitçe, Yeni Zelanda’da Maorice, Malavi’de Çevaca ve Doğu Afrika’da Swahili’yi kapsıyor. Ayrıca Microsoft, LINGUA girişimi aracılığıyla Avrupa genelinde yeterince temsil edilmeyen diller için yüksek kaliteli veri kümeleri oluşturan projeleri finanse ediyor ve güçlendiriyor. Teknik planları paylaşarak ve yerel uzmanlarla iş birliği yaparak, her dil yapay zekadaki en son gelişmelerden yararlanabilir.

Kültürel açıdan bakıldığında, insanların kendi dillerinde iletişim kurabilmeleri çok önemlidir. Yapay zeka insanlara büyük bir güç getiriyor ancak onu kullanmak için başka bir dil öğrenmelerine ihtiyaç olmaması gerekiyor.
Dr. Juan M. Lavista Ferres
Laboratuvar Direktörü, Microsoft AI for Good Lab

Herkes için yapay zekalı bir gelecek inşa etme

AI for Good Lab’ın son araştırması, yetersiz kaynağa sahip dillerin baskın olduğu ülkelerin yapay zekayı önemli ölçüde daha düşük seviyede benimsediğini vurgulayarak, dil kapsayıcılığının yapay zeka yayılımında bağımsız ve güçlü bir faktör olduğunu gösteriyor. Tüm içeriğin yarısının İngilizce olduğu, ancak dünyanın yalnızca %5’inin ana dili olarak konuştuğu internette İngilizcenin hakimiyeti, yapay zeka modellerinin genellikle diğer dillerle mücadele ettiği ve küresel eşitsizlikleri sürdürdüğü anlamına geliyor.

Yapay zeka, tarihteki en hızlı büyüyen teknolojidir. Hâlihazırda onu 1,2 milyar insan kullanırken diğer milyarlar kullanamıyor. Birçoğunun elektrik, internet ve dijital beceriler gibi yapay zekayı mümkün kılan temel unsurlara erişimi yok. Yeni bir teknolojinin yayılması, herkes onu yaşamlarının, çalışmalarının ve eğitimlerinin bir parçası hâline getirdiğinde gerçekleşir, ancak boşlukları ele almaz ve kapatmazsak yeni bir dijital uçurum yaratma riskiyle karşı karşıya kalırız. Dönüştürücü teknolojilerin sınırlı sayıda kişiye ulaştığı geçmişteki eşitsizliklerin tekrarlanmasını önlemek için yapay zeka kapsayıcılığına elektrik, bağlantı ve dijital beceriler için temel erişimin eşlik etmesi gerekir. Yetenekli araçları tüm topluluklara ulaştırmak, demokratikleşmeyi gerçeğe dönüştürür.

Microsoft AI Economy Institute tarafından hazırlanan ilk Yapay Zeka Yayılma Raporu, teknoloji gerçek hayatla bütünleştiğinde yayılımın etkili olduğunu ortaya koyuyor. Yapay zeka çağında, tüm dillere yönelik kapsayıcılık her topluluğa ilham verebilir, her kültürü onurlandırabilir ve herkesin dijital çağa katılmasını sağlayabilir. Dilsel çeşitliliğin benimsenmesiyle öğrenmek, bağlantı kurmak ve yenilik yapmak için yeni fırsatlar ortaya çıkar.

Bu bizim için gerçekten dönüştürücü olan bu tür teknolojilerin eşit bir şekilde dağıtılmasını sağlar.
Inbal Becker-Reshef
Genel Müdür, Microsoft AI for Good Lab