Tecnologie linguistiche e multilinguismo

Multilinguismo e IA

Il multilinguismo è uno dei valori cardine dell’Unione Europea, al punto da essere stato inserito nella Carta dei diritti fondamentali. Il regime linguistico dell’Unione Europea, sancito dal Regolamento 1/1958, prevede che le 24 lingue dei 27 membri siano lingue ufficiali e che abbiano, dunque, lo stesso valore.
Tale Regolamento stabilisce anche che tutti i documenti debbano essere redatti in ogni lingua ufficiale, sebbene le istituzioni europee abbiano da sempre utilizzato una o due lingue di redazione (inglese e francese) per poi tradurre gli atti nelle altre lingue. Tutti i cittadini europei hanno diritto di comunicare con le istituzioni nella propria lingua madre e le istituzioni hanno il dovere di redigere e informare in quella lingua.

Non è facile, però, rispettare il principio del multilinguismo e, inoltre, farlo implica una gran mole di lavoro. Molti si sono chiesti, man mano che l’Unione si allargava all’Est Europa, se il multilinguismo europeo fosse un ostacolo più che un valore. Le lingue dei paesi europei portano con sé anche la propria cultura e il proprio sistema giuridico, che non sempre trova esatta equivalenza nell’interpretazione normativa, sia in fase di redazione che di traduzione. Bruxelles, però, non ha mai voluto abbandonare la ricchezza del Vecchio continente, con l’obiettivo di preservare l’Unione della pluralità (“uniti nella diversità”) e tutelare il multilinguismo abbattendo allo stesso tempo le barriere linguistiche che possono dividerci. Una sfida faticosa che è stata possibile grazie allo sviluppo tecnologico, con gli strumenti di traduzione automatica a supporto del processo di traduzione che agevolano il lavoro dei giurilinguisti, le applicazioni di assistenza vocale e i software che offrono lezioni di lingue straniere o chatbot con cui dialogare.

I diritti linguistici, però, vanno sempre rispettati, soprattutto se parliamo di lingue minoritarie. Sebbene la tecnologia abbia portato svariati vantaggi nella comunicazione plurilingue, allo stesso tempo rischia di assorbire le lingue meno utilizzate e con minor peso politico ed economico. La lingua della tecnologia è l’inglese e anche la lingua franca delle comunicazioni in ambito europeo. Gli strumenti di deep learning si basano su testi perlopiù scritti in inglese, anche a causa del maggior numero di documenti disponibili.

La tecnologia a tutela del multilinguismo

Uno dei progetti più di successo, in questo senso, è stato l’European Language Resource Coordination (ELRC), che dal 2014 al 2023 ha portato avanti un’attività di ricerca con l’intento di facilitare la coesistenza delle 24 lingue, agevolando la raccolta di oltre 3.300 corpora e database terminologici. Il progetto ELRC aveva l’obiettivo di rafforzare la disponibilità e l’accessibilità delle risorse linguistiche in tutta Europa: i risultati raggiunti sono stati molteplici, come ad esempio la creazione di un database completo di tutte le risorse linguistiche presenti nelle istituzioni europee. In più, grazie ai frequenti workshop promossi in questi anni, si è sviluppata una crescente sensibilizzazione sul tema dell’ausilio tecnologico per abbattere le barriere linguistiche, mirata alla collaborazione tra i soggetti interessati: traduttori delle istituzioni nazionali e sovranazionali, giurilinguisti e informatici.

Il registro creato da questo progetto, ELRC-SHARE, permette di raccogliere e consultare tutte le risorse linguistiche ottenute in questi anni, ritenute utili per alimentare la piattaforma CEF Automated Translation (CEF.AT – Connecting Europe facility – Automated Translation), un programma che punta a connettere più facilmente paesi così diversi tra loro. Quest’ultimo strumento, infatti, è ciò che crea ponti all’interno dei paesi membri, perché si tratta di un dispositivo che permette alle istituzioni di scambiarsi informazioni, anche con carattere urgente, al di là della normativa.

Il progetto ELRC è stato fondamentale per gettare le basi di un sistema digitale multilingue europeo che fosse realmente inclusivo. Seguendo questo intento, il progetto ha contribuito anche alla realizzazione di un nuovo servizio di traduzione automatica propria della Commissione europea: eTranslation. Non solo, dal lavoro del progetto ELRC è partito anche il progetto LDS (Language Data Space) che ha come obiettivo quello di rafforzare la cooperazione e la diversità linguistica e culturale.

I diritti linguistici e l’IA: un binomio per l’integrazione

Oltre facilitare i processi di traduzione, cosa potrebbe fare l’intelligenza artificiale per aiutarci a salvaguardare le lingue dei paesi che compongono l’Unione? Le lingue sono una ricchezza culturale per tutti noi, soprattutto se pensiamo a quelle minoritarie, che rischiano ancor di più di soccombere al predominio dell’inglese. Nonostante la Brexit, l’inglese è rimasta la lingua ufficiale dell’Ue ed è la più privilegiata nell’uso delle nuove tecnologie grazie al suo ampio utilizzo.

In un mondo globalizzato, abbattere le barriere linguistiche è anche un modo per avvicinarsi ad altre culture, non solo in senso economico. Le istituzioni europee non smettono di ribadire quanto sia centrale e rilevante il multilinguismo per creare uno spazio europeo che cooperi in sinergia. Con l’esplosione e la diffusione su larga scala delle generative, infatti, quello relativo all’investimento dell’intelligenza artificiale in favore dell’integrazione europea si è rivelato un interessante campo di studi. Un esempio è il recente gruppo di studi dell’Unito Artificial Intelligence for European Integration (AI4EI), che mira a rafforzare l’integrazione tra i paesi europei anche nell’utilizzo dell’intelligenza artificiale, monitorandone gli impatti a livello socio-economico e limitando le diseguaglianze per il suo utilizzo. Tra i vari campi di osservazione vi è proprio l’accessibilità dell’IA a tutti i cittadini indipendentemente dalla loro lingua madre, proprio con l’obiettivo di promuovere il multilinguismo.

Come dimostra l’AI Act, approvato anche dal Parlamento europeo, in Europa l’intelligenza artificiale si propone come collante in un periodo di difficoltà e divisioni interne all’Unione. Tra le varie potenzialità di questo strumento vi è anche la capacità di favorire l’integrazione, mettendo i popoli e le culture in contatto in modo più agevole. Ciò avverrebbe non solo grazie ai tool di traduzione istantanea, ma anche attraverso strategie per preservare la ricchezza che ci identifica, promuovendo le lingue minoritarie del nostro continente che rischiano di sparire. In questo modo, si bilancerebbe l’adozione delle nuove tecnologie con la tutela della diversità linguistica e culturale, rendendo l’Unione ancora più inclusiva e accessibile anche per le comunità minoritarie.

È importante, secondo Bruxelles, non sottovalutare i rischi che l’IA comporta, e tra questi c’è sicuramente l’omogeneizzazione linguistica. Le lingue dominanti a livello nazionale tendono ad offuscare le lingue minoritarie, perché queste ultime non sono rappresentate a livello sovranazionale. In contesto europeo, a dominare è soprattutto l’inglese, utilizzata come lingua franca, e ad oggi la maggior parte degli strumenti di IA viene addestrata con testi in lingua inglese. Il rischio che l’IA possa contribuire ad assimilare le lingue meno diffuse è reale, ma è necessario sfruttarla a vantaggio di questa diversità per rafforzare i diritti linguistici.

In Europa esistono molte lingue minoritarie parlate da gruppi e comunità più o meno grandi, come il basco o il catalano in Spagna, l’occitano o il bretone in Francia, il ladino, il gaelico e il frisone e tanti altri meno diffusi. In Italia abbiamo il friulano e il sardo come lingue riconosciute, ma abbiamo anche una pluralità di dialetti e varietà linguistiche che sono parte del nostro patrimonio culturale. Fino ad oggi è stato difficile garantire la protezione e la promozione delle diverse lingue e si è venuto meno a quanto sancito dalla Carta europea delle lingue regionali o minoritarie nel 1992, spesso per mancanza di fondi e risorse necessarie. Con le tecnologie linguistiche basate sull’IA questi ostacoli potranno essere superati.

Non è una sfida semplice, perché queste lingue partono svantaggiate anche dal punto di vista pratico: esistono poche documentazioni, soprattutto giuridiche, per poter addestrare gli strumenti di IA con le lingue minoritarie. La scarsità di banche dati relative a queste lingue rischia di lasciarle fuori dal progresso tecnologico. Per ovviare a questo problema occorrono uno sforzo e un impegno non indifferente per documentare e digitalizzare i documenti, anche di tipo giuridico. Un processo che potrà eliminare l’accezione negativa di “minoritarie”. L’obiettivo di utilizzare l’IA in Europa e nelle istituzioni, a protezione di queste lingue, è quello sancito dai diritti linguistici: includere e non assimilare.

Riferimenti

De Mauro Tullio, In Europa son già 103. Troppe lingue per una democrazia? Bari, Laterza 2014;
Poggeschi, G. I diritti linguistici – un’analisi comparata, Carocci, Roma 2015;
Agresti, G. Intelligence artificielle et langues minoritaires: du bon ménage? Quelques pistes de reflexión, 2022.