• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Google diventa più multilingue, ma otterrà la sfumatura?

    Uno studente colora una volpe durante la lezione di lingua indigena Quechua incentrata sui nomi degli animali in una scuola primaria pubblica a Licapa, Perù, mercoledì 1 settembre 2021. Circa 10 milioni di persone parlano Quechua, ma cercano di tradurre automaticamente e-mail e messaggi di testo nella famiglia linguistica indigena più parlata nelle Americhe era quasi impossibile prima che Google la introducesse nel suo servizio di traduzione digitale mercoledì 11 maggio 2022. Il gigante di Internet afferma che la nuova tecnologia di intelligenza artificiale gli consente di espandere notevolmente il repertorio di Google Translate del mondo lingue, aggiungendone altre 24 questa settimana, tra cui il quechua e altre lingue indigene sudamericane come il guaranì e l'aymara. Credito:AP Photo/Martin Mejia, File

    Circa 10 milioni di persone parlano quechua, ma cercare di tradurre automaticamente e-mail e messaggi di testo nella famiglia delle lingue indigene più parlata nelle Americhe è stato per molto tempo quasi impossibile.

    La situazione è cambiata mercoledì, quando Google ha aggiunto il quechua e una varietà di altre lingue al suo servizio di traduzione digitale.

    Il gigante di Internet afferma che la nuova tecnologia di intelligenza artificiale gli consente di espandere notevolmente il repertorio di lingue del mondo di Google Translate. Questa settimana ne ha aggiunti 24, tra cui il quechua e altre lingue indigene sudamericane come il guaranì e l'aymara. Sta inoltre aggiungendo una serie di lingue dell'Africa e dell'Asia meridionale ampiamente parlate che sono mancate nei prodotti tecnologici popolari.

    "Abbiamo esaminato le lingue con popolazioni molto numerose e sottoservite", ha detto ai giornalisti Isaac Caswell, ricercatore di Google.

    Le notizie dalla vetrina annuale della tecnologia I/O dell'azienda californiana possono essere celebrate in molti angoli del mondo. Ma probabilmente attirerà anche critiche da coloro frustrati dai precedenti prodotti tecnologici che non sono riusciti a capire le sfumature della loro lingua o cultura.

    Il quechua era la lingua franca dell'Impero Inca, che si estendeva da quella che oggi è la Colombia meridionale al Cile centrale. Il suo status iniziò a declinare dopo la conquista spagnola del Perù più di 400 anni fa.

    Aggiungerlo alle lingue riconosciute da Google è una grande vittoria per gli attivisti della lingua quechua come Luis Illaccanqui, un peruviano che ha creato il sito web Qichwa 2.0, che include dizionari e risorse per l'apprendimento della lingua.

    "Aiuterà a mettere quechua e spagnolo sullo stesso status", ha affermato Illaccanqui, che non è stato coinvolto nel progetto di Google.

    Illaccanqui, il cui cognome in quechua significa "tu sei il fulmine", ha affermato che il traduttore aiuterà anche a mantenere viva la lingua con una nuova generazione di giovani e adolescenti, "che parlano quechua e spagnolo allo stesso tempo e sono affascinati da social network."

    L'insegnante Carmen Cazorla scrive nella lingua indigena quechua durante una lezione sulle piante medicinali in una scuola primaria pubblica a Licapa, Perù, mercoledì 1 settembre 2021. Circa 10 milioni di persone parlano quechua, ma cercano di tradurre automaticamente e-mail e messaggi di testo in la famiglia linguistica indigena più parlata nelle Americhe era quasi impossibile prima che Google la introducesse nel suo servizio di traduzione digitale mercoledì 11 maggio 2022. Il gigante di Internet afferma che la nuova tecnologia di intelligenza artificiale gli sta consentendo di espandere notevolmente il repertorio di Google Translate delle lingue del mondo , aggiungendone altre 24 questa settimana, tra cui il quechua e altre lingue indigene sudamericane come il guaranì e l'aymara. Credito:AP Photo/Martin Mejia

    Caswell ha definito la notizia un "grande passo avanti tecnologico" perché fino a poco tempo non era possibile aggiungere lingue se i ricercatori non riuscivano a trovare una quantità sufficiente di testo online, come libri digitali, giornali o post sui social media, per il loro Sistemi di intelligenza artificiale da cui imparare.

    I giganti della tecnologia statunitense non hanno una grande esperienza nel far funzionare bene la loro tecnologia linguistica al di fuori dei mercati più ricchi, un problema che ha anche reso più difficile per loro rilevare la pericolosa disinformazione sulle loro piattaforme. Fino a questa settimana, Google Translate era offerto in lingue europee come frisone, maltese, islandese e corso, ciascuna con meno di 1 milione di parlanti, ma non in lingue dell'Africa orientale come l'oromo e il tigrino, che hanno milioni di parlanti.

    Le nuove lingue verranno lanciate questa settimana. Non saranno ancora capiti dall'assistente vocale di Google, che per ora li limita alle traduzioni da testo a testo. Google ha affermato che sta lavorando per aggiungere il riconoscimento vocale e altre funzionalità, come la possibilità di tradurre un segno puntando una telecamera verso di esso.

    Ciò sarà importante per le lingue ampiamente parlate come il quechua, soprattutto nel campo della salute, perché molti medici e infermieri peruviani che parlano solo spagnolo lavorano nelle zone rurali e "non sono in grado di capire i pazienti che parlano principalmente il quechua", ha affermato Illaccanqui.

    "La prossima frontiera, o sfida, è lavorare sulla parola", ha affermato Arturo Oncevay, un ricercatore peruviano di traduzione automatica presso l'Università di Edimburgo che ha co-fondato una coalizione di ricerca per migliorare la tecnologia delle lingue indigene nelle Americhe. "Le lingue native delle Americhe sono tradizionalmente orali."

    Nel suo annuncio, Google ha avvertito che la qualità delle traduzioni nelle lingue appena aggiunte "è ancora molto indietro rispetto alle altre lingue supportate, come inglese, spagnolo e tedesco, e ha notato che i modelli "commetteranno errori e mostreranno i propri pregiudizi. " Ma l'azienda ha aggiunto lingue solo se i suoi sistemi di intelligenza artificiale hanno raggiunto una certa soglia di competenza, ha affermato Caswell.

    "Se c'è un numero significativo di casi in cui è molto sbagliato, non lo includeremmo", ha detto. "Anche se il 90% delle traduzioni è perfetto, ma il 10% sono sciocchezze, per noi è un po' troppo."

    Google ha affermato che i suoi prodotti ora supportano 133 lingue. Gli ultimi 24 sono il lotto singolo più grande da aggiungere da quando Google ha incorporato 16 nuove lingue nel 2010. Ciò che ha reso possibile l'espansione è ciò che Google chiama un modello di traduzione automatica "zero-shot" o "zero-risorse", uno che impara a tradurre in un'altra lingua senza mai vederne un esempio.

    L'anno scorso, la società madre di Facebook e Instagram, Meta, ha introdotto un concetto simile chiamato Universal Speech Translator.

    Libri scritti nella lingua indigena quechua siedono dietro uno studente durante una lezione sulle piante medicinali, in una scuola primaria pubblica a Licapa, Perù, mercoledì 1 settembre 2021. Circa 10 milioni di persone parlano quechua, ma cercano di tradurre automaticamente le e-mail e messaggi di testo nella famiglia linguistica indigena più parlata nelle Americhe era quasi impossibile prima che Google lo introducesse nel suo servizio di traduzione digitale mercoledì 11 maggio 2022. Il gigante di Internet afferma che la nuova tecnologia di intelligenza artificiale gli consente di espandere notevolmente il repertorio di Google Translate di lingue del mondo, aggiungendone altre 24 questa settimana, tra cui il quechua e altre lingue indigene sudamericane come il guaranì e l'aymara. Credito:AP Photo/Martin Mejia

    Il modello di Google funziona addestrando un "unico gigantesco modello di intelligenza artificiale neurale" su circa 100 lingue ricche di dati e quindi applicando ciò che ha appreso a centinaia di altre lingue che non conosce, ha affermato Caswell. "Immagina se sei un grande poliglotta e poi inizi a leggere romanzi in un'altra lingua, puoi iniziare a mettere insieme cosa potrebbe significare in base alla tua conoscenza della lingua in generale", ha detto.

    Ha affermato che il nuovo gruppo spazia da lingue più piccole come il mizo, parlato nell'India nord-orientale da circa 800.000 persone, a lingue più diffuse come il lingala, parlato da circa 45 milioni di persone in tutta l'Africa centrale.

    Sono trascorsi più di 15 anni fa, nel 2006, da quando Microsoft ha ottenuto un'attenzione positiva in Sud America con una funzionalità software che traduceva i menu e i comandi Microsoft familiari in quechua. Ma questo era prima dell'attuale ondata di progressi dell'IA nella traduzione in tempo reale.

    Lo studioso di lingue dell'Università di Harvard Américo Mendoza-Mori, che parla quechua, ha affermato che ottenere l'attenzione di Google porta la necessaria visibilità alla lingua in luoghi come il Perù, dove i parlanti quechua sono ancora privi di molti servizi pubblici. La sopravvivenza di molte di queste lingue "dipenderà dal loro utilizzo nei contesti digitali", ha affermato.

    Un altro studioso di lingue, Roberto Zariquiey, si è detto scettico sul fatto che Google possa creare uno strumento di rivitalizzazione linguistica efficace per quechua, aymara o guarani senza una più stretta partecipazione dei gruppi della comunità nella regione.

    "Le lingue sono profondamente legate alle vite, alle culture, ai gruppi etnici e alle organizzazioni politiche", ha affermato Zariquiey, linguista della Pontificia Università Cattolica del Perù. "Questo dovrebbe essere preso in considerazione."

    —-

    Le nuove lingue aggiunte sono:Assamese, Aymara, Bambara, Bhojpuri, Dhivehi, Dogri, Ewe, Guarani, Ilocano, Konkani, Krio, Lingala, Luganda, Maithili, Meiteilon (Manipuri), Mizo, Oromo, Quechua, Sanscrito, Sepedi, Sorani Curdo, Tigrino, Tsonga e Twi.

    © Scienza https://it.scienceaq.com