giovedì , Marzo 23 2023

Italiano e lingue europee a rischio di estinzione digitale

Due terzi degli idiomi dell’Ue potrebbero scomparire dalla rete, dove domina l’inglese. Lo rivela un’indagine dell’Ilc-Cnr nell’ambito della ricerca Meta-Net a cui hanno lavorato più di 200 esperti

bandiere mondoL’italiano, come la maggioranza delle lingue europee, rischia di scomparire da Internet, anche se la sua presenza in rete è tutt’altro che marginale. A dirlo è il rapporto ‘La lingua italiana nell’era digitale’ dell’Istituto di linguistica computazionale del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr), parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti.

“La percentuale di pagine web in italiano a livello mondiale è raddoppiata passando dall’1,5% nel 1998 al 3,05% nel 2005”, spiega Nicoletta Calzolari dell’Ilc-Cnr. “È stato stimato che nel 2004 in tutto il mondo ci fossero 30,4 milioni di parlanti italiani online. Al di fuori dei confini dell’Unione Europea, parlano italiano 520.000 americani, 200.000 svizzeri e 100.000 australiani. Il numero di navigatori italiani negli ultimi cinque anni è però rimasto stabile, contrariamente il numero di quelli dei paesi in via di sviluppo aumenta notevolmente, cosicché la proporzione di coloro che parlano la nostra lingua subirà una forte diminuzione e potremmo andare incontro a un rischio di sotto-rappresentazione, specialmente in confronto all’inglese”. Secondo i dati raccolti dai ricercatori, la penetrazione del web in Italia si attesta al 51,7%, con 30 milioni di internauti (circa il 6,3% di quelli dell’Ue) su 58 milioni di cittadini: la loro crescita è stata del 127,5% tra il 2000 e il 2010.

Se questo è il quadro per la nostra lingua, possiamo immaginare quale sia per quelle che hanno un numero di parlanti molto inferiore. “Il dato è preoccupante”, prosegue Claudia Soria dell’Ilc-Cnr, “perché dal momento che le tecnologie linguistiche usate in Internet si basano su approcci statistici, se i dati messi a disposizione in una lingua sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua”.

Lo studio condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler (Bernardo Magnini e Manuela Speranza) fa parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti e documentata in 30 volumi della Collana di libri bianchi di Meta-Net (disponibile a stampa da Springer e online all’indirizzo http://www.meta-net.eu/whitepapers): “21 lingue su 30 analizzate si collocano al livello più basso, con un supporto digitale ‘debole o assente’ in almeno una delle aree tecnologiche prese in esame (correttori ortografici e grammaticali, assistenti personali interattivi su smartphones, sistemi di traduzione automatica, motori di ricerca, etc.)”, spiega Soria. “L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. Anche basco, bulgaro, catalano, greco, ungherese e polacco, con ‘supporto frammentario’, si collocano tra le lingue ad alto rischio. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo, con ‘supporto modesto’. Nessuna lingua, però, ottiene ‘supporto eccellente’”.

“Sono risultati allarmanti”, conclude Hans Uszkoreit, coordinatore di Meta-Net. “La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro”.

Check Also

Cambiamenti climatici? Il ghiaccio marino risponde subito

Uno studio condotto da due istituti di ricerca del Consiglio nazionale delle ricerche in collaborazione …