יותר מ-2,500 שפות נמצאות בסכנת היעלמות
בכל כמה חודשים שפה מתקרבת להכחדה.
ככל שהדוברים מתבגרים ופחות אנשים לומדים אותה, קשה יותר להעביר את הידע המעשי שהשפה נושאת. כשההיסטוריה של הסיפורים והשירים מתחילה לדעוך, זהותה של קהילה נפרמת בשקט – האובדן אינטימי, העולם קצת פחות תוסס. עד סוף המאה הנוכחית, אלפי שפות יכולות להיעלם, ולהשאיר רק הדים של שמות לרוח, או טקסים שכיבדו את האדמה.
מתוך הכרה במה שמונח על כף המאזניים, אונסק"ו הגדיר את 2022-2032 כעשור השפות הילידיות. זה מדגיש מאמץ גלובלי לתמוך בהתחדשות והכללה דיגיטלית, ואת העבודה ששותפים במקומות כמו נונאווט עוזרים לקדם. על פי אטלס אונסק"ו לשפות העולם בסכנה, למעלה מ-2,500 שפות נמצאות בסכנת היעלמות, ועם כל אובדן, מאות שנים של חוכמה ומסורת נעלמות.
"השפה קובעת מי ישתמש ב-AI – ונשארת בלתי נגישה כשאנשים לא יכולים לעסוק בה בשפה שלהם", אומרת ענבל בקר-רשף, מנכ"לית Microsoft AI for Good Lab.
יותר מ-70% מהאינואיטים בנונאווט מדווחים על אינוקטוט כשפת האם שלהם
שימור המורשת, העצמת הקהילה
נונאווט היא הטריטוריה הצפונית הגדולה ביותר בקנדה המקיפה את רוב האזור הארקטי הקנדי ומחציתה בחוג הארקטי. נונאווט, ביתם של יותר מ-30,000 ילידים, פירושו "ארצנו" באינוקטוט, או המונח המאחד המקיף הן את ניבי האינוקטיטוט ואת ניבי האינואינקאטון.
במשך זמן רב, לאינוקטוט לא היו כלי תרגום או מודלי שפה גדולים (LLM) מתאימים ששיקפו את הניבים שלה. לכן שימור השפה לדורות הבאים עם כלים דיגיטליים היה משימה כמעט בלתי אפשרית.
במאמץ לשמר ולקדם את אינוקטיטוט, ממשלת נונאווט שיתפה פעולה עם Microsoft כדי לעזור לאנשים לתקשר הן באנגלית והן באינוקטיטוט, תוך בניית זיכרון תרגום חזק בבעלות הקהילה. בשיתוף פעולה הדוק עם ממשלת נונאווט והקהילות לאיסוף נתוני שפה, Microsoft סייעה להביא את הניבים המסורתיים של נונאווט לסביבות דיגיטליות מודרניות על ידי הוספת משפחת השפות אינוקטוט ל-Microsoft Translator, תוך תמיכה בשימור ובשימוש בהובלת הקהילה.
הגישה מתמקדת בעיצוב משותף עם שותפים מקומיים כדי לבסס ממשל והסכמה, כדי לאסוף טקסט ושמע שאושרו על ידי הקהילה, כדי לאצור ולתייג נתונים עם סוקרים מקומיים וכדי לאמת תפוקות מול נורמות תרבותיות ולשוניות. תהליך זה – המבוסס על אחריות – בונה אמון כך שהמודלים משקפים שפה חיה ומאומצת באופן מקומי. יחד, מאמצים משלימים אלה משפרים את התקשורת בעולם האמיתי. ספקי שירותי בריאות יכולים לשתף פעולה בקלות רבה יותר על פני מרחקים, בני נוער בדורות נונאוומיוט יכולים להתחבר באופן מלא יותר עם המבוגרים ואנשים יכולים ליצור, לתקשר ולתרגם בשפה שהם בוחרים. כיום, מחנכים מוסיפים משוב על בתעודות של התלמידים באינוקטיטוט, ומתקשרים טוב יותר עם משפחות חד-לשוניות.
העבודה נמשכה בשיתוף פעולה עם Microsoft AI for Good Lab, בעבודה משותפת לפיתוח צנרת להתאמת מודלי שפה גדולים (LLM) במשקל פתוח לשפות דלות משאבים, כמו אינוקטיטוט.
"העבודה ההדוקה עם ממשלת נונאווט הייתה קריטית עבורם כדי שיוכלו לסמוך על המודלים ובסופו של דבר להתאים אותם ולהשתמש בהם", אומרת ענבל בקר-רשף.
נונאווט ממוקמת בטריטוריה הצפונית ביותר של קנדה, והיא ביתם של רוב אוכלוסיית האינואיטים.
כ-85% מאוכלוסיית נונאווט דוברת אינוקטיטוט, שפה בעלת מספר ניבים.
באפליקציה 'מתרגם', משתמשים יכולים להתחבר בשפות שונות באמצעות תמונה, דיבור או טקסט.
תמיכה בקידום כל השפות
ככל שאימוץ AI מואץ ברחבי העולם, הכללת שפות דלות משאבים הפכה לנושא קריטי. השפה היא השער לחינוך, לבריאות ולהזדמנויות כלכליות, וללא הכללה מכוונת, קהילות שלמות עלולות להישאר מאחור. הגישה של Microsoft היא קוד פתוח, המבטיח שהכלים ומערכי הנתונים שפותחו לצורך שימור שפה והחייאתה יהיו זמינים לקהילות, לחוקרים ולשותפים בכל מקום. על ידי הנגשת משאבים אלה, ממשלות יכולות ליצור קשר טוב יותר עם קהילות, כאשר הפצת ה-AI מקדמת קולות מקומיים כדי לעצב את עתיד הטכנולוגיה.
"ברחבי Microsoft, אנחנו מוודאים שקהילות ילידיות יובילו, ויביאו נשמה וקפדנות לשותפויות שלנו. אנו משתפים פעולה מתוך כבוד, הסכמה ואחריות משותפת", אומר מייק אדמס, נותן החסות הראשי של רשת ההכללה הילידית.
Microsoft AI for Good Lab פיתחה צנרת הניתנת לשחזור להתאמת LLMs במשקל פתוח לשפות דלות משאבים. מסגרת זו מעצימה שותפים ותומכת בכלי AI המותאמים לקהילות שלהם, ללא קשר לטביעת הרגל הדיגיטלית של השפה. פרויקטים גלובליים כוללים את אינוקטיטוט בקנדה, מאורית בניו זילנד, צ'יצ'אווה במלאווי וסוואהילית ברחבי מזרח אפריקה. ובאמצעות יוזמת LINGUA שלה, Microsoft מממנת ומחזקת פרויקטים שיוצרים מערכי נתונים באיכות גבוהה עבור שפות שאינן מיוצגות כראוי ברחבי אירופה. על ידי שיתוף תוכניות טכניות ושיתוף פעולה עם מומחים מקומיים, כל שפה יכולה להפיק תועלת מההתקדמות האחרונה ב-AI.
מנקודת מבט תרבותית, חיוני שאנשים יוכלו לתקשר בשפה שלהם. AI מביא כוח רב לאנשים, אבל הם לא צריכים ללמוד שפה אחרת כדי להשתמש בו.
בונים עתיד של AI לכולם
מחקר שנערך לאחרונה על ידי AI for Good Lab מדגיש כי מדינות שבהן שפות דלות משאבים הן דומיננטיות מציגות אימוץ AI נמוך באופן משמעותי, ומראה כי הכללת שפה היא מניע בלתי תלוי ורב-עוצמה של אימוץ AI. הדומיננטיות של אנגלית ברשת – שבה מחצית מכל התוכן הוא באנגלית, אך רק 5% מהעולם מדברים אותה כשפת אם – פירוש הדבר שמודלים של AI נאבקים לעתים קרובות עם שפות אחרות, ומנציחים את חוסר השוויון העולמי.
AI הוא הטכנולוגיה הצומחת במהירות הגבוהה ביותר בהיסטוריה – 1.2 מיליארד אנשים כבר משתמשים בה, אבל מיליארדים אחרים לא יכולים. לרבים אין גישה ליסודות שמאפשרים AI, כמו חשמל, אינטרנט ומיומנויות דיגיטליות. דיפוזיה מתרחשת כאשר כולם הופכים טכנולוגיה חדשה לחלק מהאופן שבו הם חיים, עובדים ולומדים, אך ללא טיפול בפערים וסגירתם, אנו מסתכנים ביצירת פער דיגיטלי חדש. כדי להימנע מחזרה על אי-צדק בעבר – שבו טכנולוגיות טרנספורמטיביות הגיעו לחלק אך לא לכולם – הכללת AI חייבת להיות משולבת עם גישה בסיסית לחשמל, קישוריות ומיומנויות דיגיטליות. העברת כלים בעלי יכולת לידי כל הקהילות היא הדרך שבה דמוקרטיזציה הופכת לאמיתית.
דוח דיפוזיית AI הראשון של המכון לכלכלת AI של Microsoft חושף שההשפעה מגיעה מדיפוזיה – כאשר הטכנולוגיה משתלבת בחיים האמיתיים. בעידן ה-AI, הכללת כל השפות יכולה לעורר השראה בכל קהילה, לכבד כל תרבות ולהבטיח שכולם יוכלו להשתתף בעידן הדיגיטלי. על ידי אימוץ הגיוון הלשוני, נוצרות הזדמנויות חדשות ללמידה, חיבור וחדשנות.
המטרה היא באמת לוודא שטכנולוגיות מסוג זה, שהן כה טרנספורמטיביות עבורנו, מופצות באופן שוויוני.