pixel

모든 언어에 목소리를 더하다

AI 시대에 모든 언어가 존중받는 것은 커뮤니티와 문화에 필수적입니다.

2,500개 이상의 언어가 사라질 위기에 놓였습니다

몇 달에 한 번씩, 하나의 언어가 소멸에 가까워지고 있습니다.

화자가 줄고 배우는 사람이 사라질수록, 그 언어에 담긴 실용적 지식은 전달되기 점점 어려워집니다. 이야기와 노래의 역사가 사라질 때, 커뮤니티의 정체성도 함께 희미해집니다. 그 손실은 커뮤니티에 개인적인 상시로 남고, 세상은 이전보다 덜 활기차게 됩니다. 이 세기 말까지 수천 개의 언어가 사라질 수 있습니다. 그러면 그 언어들이 담고 있던 바람의 이름, 땅을 기리는 의식 같은 흔적만이 희미하게 남게 됩니다.

사라질 위기에 처한 언어의 중요성을 인식한 유네스코는 2022~2032년을 ‘토착 언어 10년’으로 지정했습니다. 이는 언어 회복과 디지털 포용을 전 세계적으로 지원하려는 노력과 누나부트(Nunavut) 같은 지역에서 파트너들이 진행하고 있는 활동을 조명하는 의미를 담고 있습니다. 유네스코의 위험에 빠진 세계 언어 지도(Atlas of World’s Languages in Danger)에 따르면 2,500개 이상의 언어가 사라질 위기에 놓여 있으며, 언어가 하나 사라질 때마다 수세기에 걸친 지혜와 전통도 함께 사라집니다.

“언어는 누가 AI를 사용할 수 있는지를 결정합니다. 사람들이 자신의 언어로 AI와 소통할 수 없다면, 아무리 뛰어나더라도 AI는 여전히 일부만을 위한 기술로 남게 됩니다.” – 인발 베커-레셰프(Inbal Becker-Reshef), Managing Director, Microsoft AI for Good Lab
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

누나부트 주민의 70% 이상이 이누크툿(Inuktut)을 자신의 모국어로 사용하고 있습니다.

유산을 지키고 커뮤니티의 자립을 지원하다

누나부트는 캐나다에서 가장 크고 북쪽에 위치한 준주로, 대부분이 캐나다 북극 지역에 속하며 절반은 북극권에 걸쳐 있습니다. 3만 명이 넘는 원주민이 사는 이곳에서 누나부트는 이누크툿어로 ‘우리의 땅’이라는 뜻을 가지고 있으며, 이누크티툿(Inuktitut)과 이누인나툰(Inuinnaqtun) 두 방언을 아우르는 통합 용어로도 사용됩니다.

오랫동안 이누크툿어는 방언을 반영한 적절한 번역 도구나 대규모 언어 모델(LLM)이 부족했습니다. 이로 인해 디지털 도구를 활용해 다음 세대를 위해 언어를 보존하는 일은 거의 불가능에 가까웠습니다.

이누크티툿어를 보존하고 발전시키기 위해 누나부트 정부는 Microsoft와 협력해 영어와 이누크티툿어를 모두 사용할 수 있는 소통 환경을 마련하는 한편, 커뮤니티가 직접 소유하는 탄탄한 번역 메모리를 구축했습니다. 누나부트 정부 및 지역 커뮤니티와 긴밀히 협력해 언어 데이터를 수집함으로써, Microsoft는 이누크툿 언어군을 Microsoft 번역기에 추가해 누나부트의 전통 방언을 현대적인 디지털 환경으로 확장했고, 커뮤니티 주도의 언어 보존과 활용을 지원했습니다.

이 접근 방식은 지역 파트너와의 공동 설계를 중심으로 합니다. 이를 통해 거버넌스와 동의 절차를 마련하고, 커뮤니티의 승인을 받은 텍스트와 오디오를 수집하며, 지역 검토자들과 함께 데이터를 선별 및라벨링하고, 문화적 및 언어적 기준에 맞춰 결과를 검증합니다. 이러한 과정은 책임 있는 관리를 바탕으로 신뢰를 쌓아, 모델이 실제로 사용되는 언어를 충실히 반영하고 커뮤니티에서 자연스럽게 받아들여지도록 합니다. 이처럼 서로 보완적인 노력들이 모여 현실 세계의 소통을 한층 더 개선하고 있습니다. 의료진은 거리의 제약을 넘어 보다 쉽게 협력할 수 있고, 누나부트의 젊은 세대는 어르신들과 더 깊이 연결될 수 있습니다. 또한 사람들은 자신이 선택한 언어로 창작하고, 소통하고, 번역할 수 있게 됩니다. 오늘날 교육 현장에서는 교사들이 이누크티툿어로 학생 성적표에 피드백을 추가하며, 단일 언어만 사용하는 가정과도 더 효과적으로 소통하고 있습니다.

이러한 노력은 Microsoft AI for Good Lab과의 협업으로 이어졌습니다. 양측은 이누크티툿어와 같은 저자원 언어에 맞게 오픈 웨이트 대규모 언어 모델(LLM)을 적용할 수 있는 파이프라인을 함께 개발하고 있습니다.

“누나부트 정부와 긴밀히 협력하는 것은 그들이 모델을 신뢰하고 궁극적으로 적응하고 사용할 수 있도록 하는 데 매우 중요했습니다”라고 인발 베커-레셰프(Inbal Becker-Reshef)는 말합니다.

모든 언어의 성장을 지원하다

전 세계적으로 AI 도입이 빠르게 확산되면서, 저자원 언어를 포용하는 일은 더욱 중요한 과제가 되었습니다. 언어는 교육과 의료, 경제적 기회로 이어지는 관문이며, 의도적인 포용이 없다면 커뮤니티 전체가 뒤처질 위험에 놓이게 됩니다. Microsoft는 언어 보존과 활성화를 위해 개발한 도구와 데이터 세트를 전 세계 커뮤니티, 연구자 및 파트너가 활용할 수 있도록 오픈 소스 방식으로 제공하고 있습니다. 이러한 자원을 누구나 접근할 수 있게 함으로써, 정부는 커뮤니티와 더 효과적으로 소통할 수 있고, AI의 확산은 기술의 미래를 형성하는 데 있어 지역의 목소리가 반영되도록 돕습니다.

“Microsoft는 원주민 커뮤니티가 주도권을 갖고 파트너십을 이끌도록 하며, 그 과정에 진정성과 전문성을 담습니다. 또한 존중과 동의, 그리고 공동의 책임을 바탕으로 협력합니다.”라고 원주민 포용 네트워크 총괄 스폰서인 마이크 애덤스는 말합니다.

Microsoft AI for Good Lab은 오픈 웨이트 대규모 언어 모델(LLM)을 저자원 언어에 적용할 수 있는 재현 가능한 파이프라인을 개발했습니다. 이 프레임워크는 언어의 디지털 존재 여부와 관계없이, 파트너들이 각 커뮤니티에 맞춘 AI 도구를 만들고 활용할 수 있도록 힘을 지원합니다. 현재 이누크티툿어(캐나다), 마오리어(뉴질랜드), 치체와어(말라위), 스와힐리어(동아프리카 전역) 등 전 세계에서 다양한 프로젝트가 진행되고 있습니다. 또한 LINGUA 이니셔티브를 통해 Microsoft는 유럽 전역에서 소외된 언어를 위한 고품질 데이터 세트를 구축하는 프로젝트를 지원하며 강화해 나가고 있습니다. 또한 기술적 청사진을 공유하고 지역 전문가들과 협력함으로써 모든 언어가 AI의 최신 발전을 함께 누릴 수 있도록 하고 있습니다.

문화적 관점에서 볼 때, 사람들이 자신의 언어로 소통할 수 있다는 것은 매우 중요합니다. AI는 사람들에게 큰 가능성을 열어주지만, 그 기술을 활용하기 위해 다른 언어를 배워야 해서는 안 됩니다.
후안 M. 라비스타 페레스 박사(Dr. Juan M. Lavista Ferres)
Lab Director, Microsoft AI for Good Lab

모두를 위한 AI의 미래를 만들다

AI for Good Lab의 최근 연구에 따르면, 저자원 언어가 주로 사용되는 국가일수록 AI 도입 수준이 현저히 낮은 것으로 나타났습니다. 이는 언어 포용이 AI 확산을 이끄는 독립적이면서도 강력한 요인임을 보여줍니다. 웹 콘텐츠의 절반이 영어로 이루어져 있지만, 전 세계 인구 중 영어를 모국어로 사용하는 비율은 단 5%에 불과합니다. 이러한 영어 중심 구조 속에서 AI 모델은 다른 언어를 제대로 이해하지 못하는 경우가 많고, 이는 결국 전 세계적인 불균형을 더욱 고착화시키고 있습니다.

AI는 인류 역사상 가장 빠르게 확산되는 기술입니다. 이미 12억 명이 AI를 사용하고 있지만, 여전히 수십억 명은 그 혜택을 누리지 못하고 있습니다. 많은 사람들에게는 전기, 인터넷, 디지털 역량처럼 AI를 가능하게 하는 기본적인 토대조차 부족합니다. 새로운 기술은 사람들이 일하고 배우며 살아가는 방식 속에 자연스럽게 자리 잡을 때 확산되지만, 이러한 격차를 해소하지 않는다면 또 하나의 디지털 격차를 만들어낼 위험이 있습니다. 과거에도 혁신적인 기술이 일부에게만 도달했던 불평등이 있었던 만큼, 이를 반복하지 않기 위해서는 AI 포용이 전기와 연결성, 디지털 역량에 대한 기본적인 접근성과 함께 이루어져야 합니다. 모든 커뮤니티가 실제로 활용할 수 있는 도구를 손에 쥘 때, 기술의 민주화는 비로소 현실이 됩니다.

Microsoft AI Economy Institute가 발표한 첫 번째 AI 확산 보고서는 기술이 실제 삶과 결합될 때 비로소 진정한 영향력이 나타난다는 점을 보여줍니다. AI 시대에는 모든 언어를 포용하는 것이 모든 커뮤니티에 영감을 주고, 각 문화를 존중하며, 누구나 디지털 시대에 참여할 수 있도록 하는 기반이 됩니다. 언어적 다양성을 받아들일 때, 배우고 연결되며 혁신할 수 있는 새로운 기회가 열립니다.

결국 중요한 것은 우리에게 큰 변화를 가져오는 이러한 기술들이 공정하게, 누구에게나 고르게 전달되도록 하는 것입니다.
인발 베커-레셰프(Inbal Becker-Reshef)
Managing Director, Microsoft AI for Good Lab