Oltre 2.500 lingue rischiano di scomparire
Ogni mese, una lingua si avvicina all’estinzione.
Man mano che i coloro che la parlano invecchiano e meno persone la imparano, la conoscenza pratica che la lingua porta con sé diventa più difficile da trasmettere. Mentre la tradizione delle storie e delle canzoni inizia a svanire, l’identità di una comunità diminuisce silenziosamente: la perdita è intima, il mondo un po’ meno vibrante. Entro la fine di questo secolo, migliaia di lingue potrebbero essere scomparse, lasciando solo echi di nomi nel vento o rituali che onoravano la terra.
Riconoscendo la posta in gioco, l’UNESCO ha designato il 2022-2032 come il Decennio Internazionale delle Lingue Indigene. Ciò evidenzia uno sforzo globale per sostenere la rivitalizzazione e l’inclusione digitale e il lavoro che i partner in luoghi come il Nunavut stanno aiutando a portare avanti. Secondo l’Atlante delle lingue del mondo in pericolo dell’UNESCO, sono oltre 2.500 quelle che rischiano la scomparsa e con ogni perdita secoli di saggezza e tradizione svaniscono.
“La lingua determina chi può usare l’IA, che rimane invece inaccessibile quando le persone non possono interagire con essa nella propria lingua”, afferma Inbal Becker-Reshef, Managing Director, Microsoft AI for Good Lab.
Oltre il 70% degli Inuit del Nunavut parla l’inuktut come lingua madre
Preservare il patrimonio, responsabilizzare la comunità
Il Nunavut è il territorio più grande e settentrionale del Canada che comprende la maggior parte dell’Artico canadese, metà del quale si trova nel circolo polare artico. Patria di oltre 30.000 indigeni, Nunavut significa “La nostra terra” in inuktut ed anche il termine unificante che comprende sia i dialetti inuktitut che inuinnaqtun.
Per molto tempo, non ci sono stati strumenti di traduzione adeguati o modelli linguistici di grandi dimensioni (LLM) che riflettessero i dialetti dell’inuktut. Ciò ha reso quasi impossibile preservare la lingua per le generazioni future con strumenti digitali.
Nel tentativo di preservare e far progredire l’inuktitut, il governo del Nunavut ha collaborato con Microsoft per aiutare le persone a comunicare sia in inglese che in inuktitut, creando al contempo una solida memoria di traduzione di proprietà della comunità. Lavorando a stretto contatto con il governo del Nunavut e le comunità per raccogliere dati linguistici, Microsoft ha contribuito a portare i dialetti tradizionali del Nunavut nei moderni ambienti digitali aggiungendo la famiglia di lingue inuktut a Microsoft Translator, supportando la conservazione e l’uso con la guida della comunità.
L’approccio è incentrato sulla co-progettazione con i partner locali per stabilire la governance e il consenso, reperire testi e audio approvati dalla comunità, curare ed etichettare i dati con i revisori locali e convalidare i risultati rispetto alle norme culturali e linguistiche. Questo processo, basato sulla gestione, crea fiducia in modo che i modelli riflettano il linguaggio vissuto e siano adottati a livello locale. Insieme, questi sforzi complementari migliorano la comunicazione nel mondo reale. Gli operatori sanitari possono collaborare più facilmente a distanza, i giovani delle generazioni Nunavummiut possono connettersi pienamente con gli anziani e le persone possono creare, comunicare e tradurre nella lingua che preferiscono. Oggi, gli educatori stanno aggiungendo feedback sulle pagelle degli studenti in inuktitut, coinvolgendo di più le famiglie monolingue.
Il progetto è proseguito con una partnership con il laboratorio Microsoft AI for Good, che ha lavorato insieme per sviluppare una pipeline per l’adattamento di modelli linguistici di grandi dimensioni (LLM) a peso aperto a linguaggi con risorse limitate, come l’inuktitut.
“Lavorare a stretto contatto con il governo del Nunavut è stato fondamentale per potersi fidare dei modelli e, in ultima analisi, adattarli e utilizzarli”, afferma Inbal Becker-Reshef.
Situato nel territorio più settentrionale del Canada, il Nunavut ospita una popolazione a maggioranza Inuit.
Circa l’85% della popolazione del Nunavut parla l’inuktitut, una lingua con diversi dialetti.
Nell’app Translator, gli utenti possono collegare diverse lingue con una foto, un discorso o un testo.
Sostenere il progresso di tutte le lingue
Con l’accelerazione dell’adozione dell’IA in tutto il mondo, l’inclusione di lingue con poche risorse è diventata un problema critico. La lingua è la porta d’accesso all’istruzione, all’assistenza sanitaria e alle opportunità economiche e, senza un’inclusione intenzionale, intere comunità rischiano di rimanere indietro. L’approccio di Microsoft è open source, garantendo che gli strumenti e i set di dati sviluppati per la conservazione e la rivitalizzazione della lingua siano disponibili per comunità, ricercatori e partner in tutto il mondo. Rendendo accessibili queste risorse, i governi possono interagire meglio con le comunità mentre la diffusione dell’IA sostiene le voci locali per plasmare il futuro della tecnologia.
“Noi di Microsoft ci assicuriamo che le comunità indigene prendano l’iniziativa, portando cuore e rigore alle nostre partnership. Collaboriamo con rispetto, consenso e responsabilità condivisa”, afferma Mike Adams, sponsor esecutivo dell’Indigenous Inclusion Network.
Microsoft AI for Good Lab ha sviluppato una pipeline riproducibile per l’adattamento di LLM di grandi dimensioni a linguaggi con risorse limitate. Questo framework potenzia i partner e sostiene gli strumenti su misura basati sull’IA per le loro comunità, indipendentemente dall’impronta digitale della lingua. I progetti globali riguardano l’inuktitut in Canada, il maori in Nuova Zelanda, il chichewa in Malawi e lo swahili in tutta l’Africa orientale. Inoltre, attraverso l’iniziativa LINGUA, Microsoft finanzia e rafforza progetti che creano set di dati di alta qualità per le lingue sottorappresentate in tutta Europa. Condividendo i progetti tecnici e collaborando con esperti locali, ogni lingua può trarre vantaggio dagli ultimi progressi dell’IA.
Da un punto di vista culturale, è fondamentale che le persone siano in grado di comunicare nella propria lingua. L’IA conferisce un grande potere alle persone, ma non dovrebbero aver bisogno di imparare un’altra lingua per usarla.
Costruire un futuro basato sull’IA per tutti
Una recente ricerca dell’AI for Good Lab evidenzia che i paesi in cui le lingue a basso consumo di risorse sono predominanti mostrano un’adozione dell’IA significativamente inferiore, dimostrando che l’inclusione linguistica è un motore indipendente e potente della diffusione dell’IA. Il predominio dell’inglese sul web, dove la metà di tutti i contenuti è in inglese, ma solo il 5% del mondo lo parla in modo nativo, significa che i modelli basati sull’IA spesso lottano con altre lingue, perpetuando le disuguaglianze globali.
L’IA è la tecnologia in più rapida crescita della storia: 1,2 miliardi di persone la usano già, ma miliardi di altre non possono. Molti non hanno accesso alle basi che rendono possibile l’uso dell’IA, come l’elettricità, Internet e le competenze digitali. La diffusione avviene quando tutti rendono le nuove tecnologie parte del loro modo di vivere, lavorare e imparare, ma senza affrontare e colmare le lacune, rischiamo di creare un nuovo divario digitale. Per evitare di ripetere le disuguaglianze del passato, in cui le tecnologie trasformative hanno raggiunto alcuni ma non tutti, l’inclusione dell’IA deve essere abbinata all’accesso di base all’elettricità, alla connettività e alle competenze digitali. Mettere strumenti efficaci nelle mani di tutte le comunità è il modo in cui la democratizzazione diventa reale.
Il primo Report sulla diffusione dell’IA del Microsoft AI Economy Institute rivela che l’impatto deriva dalla diffusione, quando la tecnologia si integra con la vita reale. Nell’era dell’IA, l’inclusione di tutte le lingue può ispirare ogni comunità, onorare ogni cultura e garantire che tutti possano partecipare all’era digitale. Abbracciando la diversità linguistica, emergono nuove opportunità per l’apprendimento, la connessione e l’innovazione.
Si tratta di assicurarsi davvero che questo tipo di tecnologie, che sono così trasformative per noi, siano distribuite equamente.