pixel

すべての言語に声を与える

AI の時代では、すべての言語を取り入れることは、コミュニティと文化にとって不可欠です

2,500 以上の言語が消滅の危機に瀕しています

数か月ごとに、ある言語が絶滅に近づいています。

話者が高齢になり、その言語を学ぶ人が少なくなると、言語が持つ実用的な知識を伝えることが難しくなります。物語や歌に刻まれた歴史が色あせ始めると、コミュニティのアイデンティティが静かに崩壊し、喪失は身近に感じられ、世界はわずかに活気を失います。今世紀の終わりまでに、何千もの言語が消え去り、風の名前の残響や、土地を称える儀式だけが残ることになるかもしれません。

この問題を認識したユネスコは、2022 年から 2032 年を「先住民言語の国際 10 年」と定めました。主な内容は、言語復活とデジタル インクルージョンを支援するための世界的な取り組みと、ヌナブト準州のような地域におけるパートナーが推進を支援している活動です。ユネスコの「世界の絶滅危惧言語アトラス」によると、2,500 以上の言語が消滅の危機に瀕しており、1 言語が消滅するたびに、何世紀にもわたる知恵と伝統が消えてしまいます。

「誰が AI を使えるかは言語によって決まります。自分の言語で AI を操作できなければ、アクセスできないままとなります」と、Microsoft AI for Good Lab のマネージング ディレクターであるインバル・ベッカー=レシェフ氏は述べています。
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

ヌナブト準州のイヌイットの 70% 以上がイヌイット語を母国語としている

遺産を保護し、コミュニティに力を与える

ヌナブト準州はカナダ最大の最北端の領土で、カナダ北極圏の大部分を網羅し、その半分は北極圏にあります。30,000 人以上の先住民が住むヌナブト準州は、イヌクティトゥット語で「私たちの土地」を意味し、イヌクティトゥット語とイヌイナクトゥン語の両方の言語(または方言)を包括する総称です。

長い間、イヌイット語には、その方言を反映した適切な翻訳ツールや大規模言語モデル (LLM) がありませんでした。そのため、デジタル ツールを使って将来の世代のために言語を保存することは、ほとんど不可能な作業でした。

ヌナブト準州政府は、イヌクティトゥット語の保全と発展のために Microsoft と提携し、英語とイヌクティトゥット語の両方でコミュニケーションを取れるようにすると同時に、コミュニティが所有する堅牢な翻訳メモリを構築しました。Microsoft は、ヌナブト準州政府やコミュニティと緊密に連携して言語データを収集し、イヌクティトゥット語族を Microsoft Translator に追加することで、ヌナブト準州の伝統的な方言を最新のデジタル環境に取り込むことを可能にし、コミュニティ主導の保存と使用を支援しています。

このアプローチは現地のパートナーとの共同設計を中心とし、ガバナンスと同意の確立、コミュニティが承認したテキストと音声の出典元の確認、現地の査閲者によるデータのキュレーションとラベル付け、文化的および言語的規範に対するアウトプットの検証を行っています。管理責任の考え方に根ざしたこのプロセスでは、モデルが生きた言語を反映し、ローカルで受け入れられるように信頼を築いています。これらの補完的な取り組みが組み合わさることで、実世界のコミュニケーションが向上します。医療従事者は距離を超えた連携が容易になり、ヌナブトの若者たちは高齢者とより密接につながることができ、人々は選択した言語で作成、コミュニケーション、翻訳を行うことができます。今日、教育者はイヌクティトゥット語の生徒の通知表にフィードバックを追記し、英語を話さない家庭との関わりを深めています。

この取り組みは、Microsoft AI for Good Lab とのパートナーシップによって継続され、オープンウェイトの大規模言語モデル (LLM) をイヌクティトゥット語などの低資源言語に適応させるためのパイプラインを共同で開発しています。

「ヌナブト準州政府と緊密に連携することは、彼らがモデルを信頼し、最終的に適応させて活用できるようにするために不可欠でした」と、インバル・ベッカー=レシェフ氏は述べています。

あらゆる言語の進歩を支援

世界中で AI の採用が加速する中、低資源言語の取り込みが重要な課題となっています。言語は教育、医療、経済的機会への入り口であり、意図的な取り込みがなければ、コミュニティ全体が遅れをとるリスクがあります。Microsoft のアプローチはオープン ソースであり、言語の保存と活性化のために開発されたツールとデータセットを、世界中のコミュニティ、研究者、パートナーが利用できるようにします。これらのリソースにアクセスできるようにすることで、AI の普及によって現地の声が尊重され、テクノロジーの未来を形作ることができ、政府はコミュニティとの関わりを深めることができるようになります。

「Microsoft 全体で、先住民族のコミュニティが主導権を握り、パートナーシップに心と厳格さをもたらすようにしています。私たちは、敬意と同意、そして説明責任を共有して連携しています」と、先住民インクルージョン ネットワークのエグゼクティブ スポンサーであるマイク・アダムス氏は述べています。

Microsoft AI for Good Lab は、オープンウェイト LLM を低資源言語に適応させるための再現可能なパイプラインを開発しました。このフレームワークは、その言語のデジタル上の存在感に関係なく、パートナーに権限を与え、コミュニティに合わせた AI ツールを提唱します。グローバルなプロジェクトは、カナダのイヌクティトゥット語、ニュージーランドのマオリ語、マラウイのチチェワ語、東アフリカのスワヒリ語に及びます。また、Microsoft は LINGUA イニシアチブを通じて、欧州全体で過小評価されている言語の高品質なデータセットを作成するプロジェクトに資金を提供し、強化しています。技術的な設計図を共有し、現地の専門家と協力することで、あらゆる言語が最新の AI の進歩の恩恵を受けることができます。

文化的な観点から見ると、人々が母国語でコミュニケーションを取れることは非常に重要です。AI は人々に大きな力をもたらしますが、AI を使用するために別の言語を学ぶ必要はありません。
フアン・M・ラビスタ・フェレス博士
Microsoft AI for Good Lab、ラボ ディレクター

すべての人のための AI の未来を築く

AI for Good Lab の最近の調査では、低資源言語が主流の国では AI の採用率が著しく低いことが浮き彫りになっており、言語の包摂が AI 普及の独立した強力な推進力であることを示しています。ウェブ上では英語が圧倒的に多いため、全コンテンツの半分が英語で書かれているにもかかわらず、英語を母国語として話す人は世界のわずか 5% しかいないため、他の言語における AI モデルの対応が難しくなることが多く、世界的な不平等が長く続いています。

AI は歴史上最も急速に成長しているテクノロジーであり、すでに 12 億人が使用していますが、その他の何十億人は使用していません。多くの人は、電気、インターネット、デジタル スキルなど、AI を実現可能にする基盤にアクセスできません。普及は、誰もが新しいテクノロジーを生活、仕事、学習の一部にすることで起こりますが、ギャップに対処して埋めることができなければ、新たな情報格差を生み出すリスクがあります。変革をもたらすテクノロジーがすべての人ではなく一部の人にだけ届くという過去の不平等を繰り返さないためには、AI のインクルージョンを、電気、接続性、デジタル スキルへの基本的なアクセスと組み合わせる必要があります。有能なツールをすべてのコミュニティの手に届けることが、民主化を実現する方法です。

Microsoft AI Economy Institute が発行した最初の AI Diffusion Report (AI 普及状況に関するレポート) では、テクノロジーが実生活と融合したとき、影響が拡散から生まれることが明らかになりました。AI の時代において、すべての言語を取り込むことで、あらゆるコミュニティに刺激を与え、あらゆる文化を尊重し、誰もがデジタル時代に参加できるようにすることができます。言語の多様性を受け入れることで、学習、つながり、革新のための新しい機会が生まれます。

私たちにとって大きな変革をもたらすこの種のテクノロジーを、公平に普及させることが重要なのです。
インバル・ベッカー=レシェフ
Microsoft AI for Good Lab、マネージング ディレクター