pixel

Δίνοντας φωνή σε κάθε γλώσσα

Στην εποχή της τεχνητής νοημοσύνης, η συμπερίληψη όλων των γλωσσών είναι απαραίτητη για τις κοινότητες και τον πολιτισμό

Πάνω από 2.500 γλώσσες κινδυνεύουν να εξαφανιστούν

Κάθε λίγους μήνες, μια γλώσσα πλησιάζει στην εξαφάνιση.

Καθώς οι ομιλητές γερνούν και λιγότεροι άνθρωποι τη μαθαίνουν, η πρακτική γνώση που μεταφέρει η γλώσσα γίνεται πιο δύσκολο να μεταδοθεί. Καθώς το σύνολο των ιστοριών και των τραγουδιών που μεταφέρει η γλώσσα αρχίζει να ξεθωριάζει, ξηλώνεται σταδιακά η ταυτότητα μιας ολόκληρης κοινότητας: η απώλεια είναι οικεία, ο κόσμος λιγότερο ζωντανός. Μέχρι το τέλος αυτού του αιώνα, χιλιάδες γλώσσες θα μπορούσαν να εξαφανιστούν, αφήνοντας πίσω τους μόνο τον απόηχο των λέξεων που κάποτε περιέγραφαν τον άνεμο ή τις τελετουργίες που τιμούσαν τη γη.

Αναγνωρίζοντας το διακύβευμα, η UNESCO ανακήρυξε τη δεκαετία 2022-2032 ως Δεκαετία των Αυτόχθονων Γλωσσών. Αυτή η πρωτοβουλία υπογραμμίζει μια παγκόσμια προσπάθεια με στόχο την αναζωογόνηση και την ψηφιακή ένταξη των γλωσσών και αναδεικνύει το έργο που υποστηρίζουν διάφοροι εταίροι σε πολλά μέρη του κόσμου, όπως στο Νουναβούτ. Σύμφωνα με τον Άτλαντα των Επαπειλούμενων Γλωσσών του Κόσμου της UNESCO, πάνω από 2.500 γλώσσες κινδυνεύουν να εξαφανιστούν και, με κάθε απώλεια, χάνονται παράλληλα αιώνες σοφίας και παράδοσης.

«Η γλώσσα καθορίζει ποιος μπορεί να χρησιμοποιήσει την τεχνητή νοημοσύνη και παραμένει απρόσιτη όταν οι άνθρωποι δεν μπορούν να αλληλεπιδράσουν μαζί της στη δική τους γλώσσα», λέει ο Inbal Becker-Reshef, Διευθύνων Σύμβουλος της Microsoft AI for Good Lab.
A woman in a blue patterned dress dances with one hand raised, while several people stand and watch her in a room with lockers and coats in the background.

Πάνω από το 70% των Ινουίτ στο Νουναβούτ δηλώνουν ότι τα Ινουκτούτ είναι η μητρική τους γλώσσα

Διάσωση της κληρονομιάς, ενδυνάμωση της κοινότητας

Το Νουναβούτ είναι η μεγαλύτερη και βορειότερη περιοχή του Καναδά, η οποία περιλαμβάνει το μεγαλύτερο μέρος της καναδικής Αρκτικής, η οποία βρίσκεται κατά το ήμισυ εντός του Αρκτικού κύκλου. Η λέξη “Νουναβούτ” σημαίνει “η γη μας” στα Ινουκτούτ και φιλοξενεί πάνω από 30.000 αυτόχθονες πληθυσμούς. Ο όρος Ινουκτούτ χρησιμοποιείται συμπεριληπτικά για όλες τις γλώσσες της περιοχής και περιλαμβάνει τις διαλέκτους Ινούκτιτου και Ινούινακτουν.

Για μεγάλο χρονικό διάστημα, η γλώσσα Ινουκτούτ δεν είχε επαρκή μεταφραστικά εργαλεία ή μεγάλα γλωσσικά μοντέλα (LLM) που να καλύπτουν τις επιμέρους διαλέκτους. Αυτό έκανε τη διατήρηση της γλώσσας για τις μελλοντικές γενιές με ψηφιακά εργαλεία ένα σχεδόν αδύνατο έργο.

Σε μια προσπάθεια να διασώσει και να καλλιεργήσει τη χρήση των Ινουκτιτούτ, η κυβέρνηση του Νουναβούτ συνεργάστηκε με τη Microsoft για να βοηθήσει τους ανθρώπους να επικοινωνούν τόσο στα Αγγλικά όσο και στα Ινουκτιτούτ, χτίζοντας παράλληλα μια ισχυρή μεταφραστική μνήμη που ανήκει στην κοινότητα. Η Microsoft συνεργάστηκε στενά με τις αρχές του Νουναβούτ και τις επιμέρους κοινότητες για να συλλέξει γλωσσικά δεδομένα και συνέβαλε στην εισαγωγή των παραδοσιακών διαλέκτων του Νουναβούτ σε σύγχρονα ψηφιακά περιβάλλοντα, ενώ πρόσθεσε την οικογένεια γλωσσών Ινουκτούτ στον Μεταφραστή της Microsoft, υποστηρίζοντας με αυτόν τον τρόπο τη διατήρηση και τη χρήση της γλώσσας με πρωτοβουλία της κοινότητας.

Η προσέγγιση επικεντρώνεται στον από κοινού σχεδιασμό με τοπικούς εταίρους για την καθιέρωση πρωτοκόλλων διακυβέρνησης και συναίνεσης, την προμήθεια κειμένου και ηχητικού περιεχομένου που έχουν εγκριθεί από την κοινότητα, την επιμέλεια και την επισήμανση δεδομένων με τοπικούς αναθεωρητές και την επικύρωση των αποτελεσμάτων σύμφωνα με τα πολιτιστικά και γλωσσικά πρότυπα. Αυτή η διαδικασία, βασισμένη στις αρχές της δεοντολογικής επιστασίας, καλλιεργεί την εμπιστοσύνη, ώστε τα μοντέλα να αντικατοπτρίζουν τη ζωντανή γλώσσα και να γίνονται αποδεκτά σε τοπικό επίπεδο. Συνολικά, αυτές οι συμπληρωματικές προσπάθειες βελτιώνουν την επικοινωνία στον πραγματικό κόσμο. Οι πάροχοι υγειονομικής περίθαλψης μπορούν να συνεργάζονται πιο εύκολα από απόσταση, ενώ οι νεότερες γενιές των λαών του Νουναβούτ μπορούν να επικοινωνούν πιο ολοκληρωμένα με τους γηραιότερους και οι πληθυσμοί μπορούν να δημιουργήσουν, να επικοινωνήσουν και να μεταφράσουν στη γλώσσα που επιλέγουν. Σήμερα, οι εκπαιδευτικοί είναι σε θέση να προσθέτουν σχόλια στα Ινουκτιτούτ στους ελέγχους προόδου των μαθητών, αλληλεπιδρώντας καλύτερα με μονόγλωσσες οικογένειες.

Το έργο συνεχίστηκε σε συνεργασία με το Microsoft AI for Good Lab, με στόχο την ανάπτυξη ενός διαύλου για την προσαρμογή μεγάλων γλωσσικών μοντέλων (LLM) ανοιχτών παραμέτρων σε γλώσσες χαμηλών πόρων, όπως είναι τα Ινουκτιτούτ.

“Η στενή συνεργασία με την κυβέρνηση του Νουναβούτ ήταν καίριας σημασίας για να μπορέσει ο κόσμος να εμπιστευτεί τα μοντέλα, να προσαρμοστεί σε αυτά και να τα χρησιμοποιήσει”, σύμφωνα με τα λεγόμενα του Inbal Becker-Reshef.

Υποστηρίζουμε την ανάπτυξη όλων των γλωσσών

Καθώς η υιοθέτηση της τεχνητής νοημοσύνης επιταχύνεται παγκοσμίως, η συμπερίληψη γλωσσών με χαμηλούς πόρους έχει καταστεί κρίσιμο ζήτημα. Η γλώσσα είναι η πύλη προς την εκπαίδευση, την υγειονομική περίθαλψη και τις οικονομικές ευκαιρίες, και χωρίς σκόπιμη ένταξη, ολόκληρες κοινότητες κινδυνεύουν να μείνουν πίσω. Η προσέγγιση της Microsoft είναι ανοιχτού κώδικα, διασφαλίζοντας ότι τα εργαλεία και τα σύνολα δεδομένων που έχουν αναπτυχθεί για τη διατήρηση και την αναζωογόνηση της γλώσσας είναι διαθέσιμα σε κοινότητες, ερευνητές και συνεργάτες σε όλον τον κόσμο. Καθιστώντας αυτούς τους πόρους προσβάσιμους, οι κυβερνήσεις μπορούν να συνεργαστούν καλύτερα με τις κοινότητες, καθώς η διάδοση της τεχνητής νοημοσύνης υπερασπίζεται τις τοπικές φωνές για να διαμορφώσει το μέλλον της τεχνολογίας.

“Σε όλα τα επίπεδα της Microsoft, διασφαλίζουμε ότι οι αυτόχθονες κοινότητες αναλαμβάνουν ηγετικό ρόλο, δίνοντας πνοή και ενέργεια στις συνεργασίες μας. Συνεργαζόμαστε με σεβασμό, συναίνεση και κοινή ευθύνη”, λέει ο Mike Adams, Εκτελεστικός Χορηγός του Δικτύου Ένταξης Ιθαγενών.

Το Microsoft AI for Good Lab έχει αναπτύξει έναν δίαυλο για την προσαρμογή LLM ανοιχτών παραμέτρων σε γλώσσες χαμηλών πόρων. Αυτό το πλαίσιο ενδυναμώνει τους εταίρους και υποστηρίζει εργαλεία τεχνητής νοημοσύνης προσαρμοσμένα στις κοινότητές τους, ανεξάρτητα από το ψηφιακό αποτύπωμα της γλώσσας. Τα έργα μας σε όλον τον κόσμο καλύπτουν τις γλώσσες Ινουκτιτούτ στον Καναδά, Μαορί στη Νέα Ζηλανδία, Τσιτσέουα στο Μαλάουι και Σουαχίλι σε όλη την Ανατολική Αφρική. Επιπλέον, μέσω της πρωτοβουλίας LINGUA, η Microsoft χρηματοδοτεί και ενισχύει έργα που δημιουργούν σύνολα δεδομένων υψηλής ποιότητας για υποεκπροσωπούμενες γλώσσες σε όλη την Ευρώπη. Με την ανταλλαγή τεχνογνωσίας και τη συνεργασία με τοπικούς εμπειρογνώμονες, κάθε γλώσσα μπορεί να επωφεληθεί από τις πρόσφατες εξελίξεις στην τεχνητή νοημοσύνη.

Από πολιτιστικής άποψης, είναι πολύ σημαντικό για κάθε άνθρωπο να μπορεί να επικοινωνεί στη δική του γλώσσα. Η τεχνητή νοημοσύνη προσφέρει μεγάλη δύναμη στους ανθρώπους, αλλά δεν χρειάζεται να μάθουν άλλη γλώσσα για να τη χρησιμοποιήσουν.
Δρ. Juan M. Lavista Ferres
Διευθυντής εργαστηρίου, Microsoft AI for Good Lab

Χτίζοντας το μέλλον της τεχνητής νοημοσύνης για όλους

Πρόσφατη έρευνα από το AI for Good Lab υπογραμμίζει ότι οι χώρες όπου κυριαρχούν οι γλώσσες χαμηλών πόρων παρουσιάζουν σημαντικά χαμηλότερη υιοθέτηση της τεχνητής νοημοσύνης. Αυτό υποδεικνύει ότι η γλωσσική ένταξη είναι ένας ανεξάρτητος και ισχυρός μοχλός διάδοσης της τεχνητής νοημοσύνης. Η κυριαρχία της αγγλικής γλώσσας στο διαδίκτυο, όπου το ήμισυ του συνόλου του περιεχομένου είναι στα Αγγλικά, παρόλο που είναι η μητρική γλώσσα μόνο για το 5% του παγκόσμιου πληθυσμού, σημαίνει ότι τα μοντέλα τεχνητής νοημοσύνης συχνά ανταγωνίζονται με άλλες γλώσσες, διαιωνίζοντας τις παγκόσμιες ανισότητες.

Η τεχνητή νοημοσύνη είναι η ταχύτερα αναπτυσσόμενη τεχνολογία στην ιστορία. 1,2 δισεκατομμύρια άνθρωποι τη χρησιμοποιούν ήδη, αλλά υπάρχουν και δισεκατομμύρια άνθρωποι που δεν έχουν αυτή τη δυνατότητα. Πολλοί δεν έχουν πρόσβαση στις θεμελιώδεις προϋποθέσεις για τη χρήση της τεχνητής νοημοσύνης, όπως είναι η ηλεκτρική ενέργεια, το διαδίκτυο και οι ψηφιακές δεξιότητες. Η καθολική αποδοχή μιας τεχνολογίας συμβαίνει όταν όλοι μπορούν να ενσωματώσουν αυτή τη νέα τεχνολογία στον καθημερινό τρόπο ζωής τους, όταν γίνεται μέρος του τρόπου με τον οποίο ζουν, εργάζονται και μαθαίνουν. Κατά συνέπεια, αν δεν εντοπίσουμε και κλείσουμε τα κενά, κινδυνεύουμε να δημιουργήσουμε ένα νέο ψηφιακό χάσμα. Για να αποφευχθεί η επανάληψη των ανισοτήτων του παρελθόντος, όπου η πρόσβαση στις επιδραστικές τεχνολογίες ήταν δυνατή μόνο για ορισμένα σύνολα ανθρώπων, η ένταξη της τεχνητής νοημοσύνης πρέπει να συνδυαστεί με θεμελιώδη πρόσβαση στην ηλεκτρική ενέργεια, τη συνδεσιμότητα και τις ψηφιακές δεξιότητες. Η καθολική παροχή λειτουργικών εργαλείων σε όλες τις κοινότητες είναι ο πιο αποτελεσματικός τρόπος εκδημοκρατικοποίησης της τεχνολογίας.

Η πρώτη έκθεση AI Diffusion Report από το Microsoft AI Economy Institute αποκαλύπτει ότι η διάχυση των νέων τεχνολογιών έχει τον πιο σημαντικό αντίκτυπο στην ενσωμάτωσή τους στην πραγματική ζωή. Στην εποχή της τεχνητής νοημοσύνης, η συμπερίληψη όλων των γλωσσών μπορεί να εμπνεύσει κάθε κοινότητα, να τιμήσει κάθε πολιτισμό και να διασφαλίσει ότι όλοι μπορούν να συμμετάσχουν στην ψηφιακή εποχή. Αγκαλιάζοντας τη γλωσσική πολυμορφία, αναδύονται νέες ευκαιρίες για μάθηση, σύνδεση και καινοτομία.

Το πιο σημαντικό είναι να διασφαλίσουμε ότι κατανέμονται δίκαια οι τεχνολογίες που αλλάζουν τόσο ριζικά τις ζωές μας.
Inbal Becker-Reshef
Διευθύνων Σύμβουλος, Microsoft AI for Good Lab