L'apprendimento automatico tramite l'intelligenza artificiale ha migliorato la traduzione al computer negli ultimi dieci anni, ma gli articoli scientifici che utilizzano un gergo specializzato rappresentano ancora una sfida per la traduzione automatica. Tuttavia, gli scienziati dovrebbero dare la priorità alla traduzione di articoli in più lingue per fornire un panorama equo per gli scienziati in erba di tutto il mondo, sostengono i ricercatori della UC Berkeley. Credito:Valeria Ramírez-Castañeda, UC Berkeley
Mentre era ancora al liceo, Xinyi Liu ha lavorato brevemente in un laboratorio dell'Università Beihang di Pechino ed è rimasta sorpresa nel vedere ricercatori cinesi utilizzare regolarmente Google Translate per generare la prima bozza di articoli scientifici in inglese. La traduzione è d'obbligo se gli scienziati vogliono sottoporsi a riviste di alto profilo, quasi tutte in inglese.
"Era normale che i dottorandi usassero Google Translate per tradurre prima tutto e poi per modificarlo e perfezionarlo. Ma dopo la prima traduzione, l'intero articolo non aveva senso", ha affermato Liu, uno studente in ascesa presso l'Università della California , Berkeley, che si sta specializzando in biologia molecolare e cellulare. "Letteralmente, tutte le parole, tutti i termini erano incollati insieme in modo casuale."
Ci doveva essere un modo migliore, pensò.
Così l'anno scorso, quando ha visto un nuovo seminario tenuto da Rebecca Tarvin sull'infrangere le barriere linguistiche nella scienza, si è iscritta.
Quella classe, che sarà tenuta all'Università di Berkeley per la terza volta nella primavera del 2023, è stata una prova per Tarvin, un assistente professore di biologia integrativa. Con il rinnovato interesse in tutto il campus per la diversità, l'equità e l'inclusione, lei e i gruppi di lavoro all'interno del suo dipartimento hanno pensato che la classe potesse aiutare la UC Berkeley ad affrontare un problema di vecchia data nel campo della scienza:l'inglese, la lingua dominante della scienza, è un grosso ostacolo alla scienziati che non sono madrelingua inglese.
Non sono solo gli studenti e gli scienziati stranieri ad essere svantaggiati quando la scienza viene comunicata principalmente in inglese. Così sono molti studenti nati in America. Nell'autunno 2020, circa il 40% delle matricole dell'UC Berkeley erano studenti universitari di prima generazione e, all'interno del sistema a 10 campus dell'Università della California, il 39% degli studenti di prima generazione è cresciuto con una lingua diversa dall'inglese come prima lingua.
"Molti dei nostri studenti della California sono cresciuti traducendo per i loro genitori", ha detto Tarvin. "La traduzione fa parte della loro vita sin da quando erano molto piccoli."
Per Tarvin, il corso — Abbattere le barriere linguistiche nell'evoluzione e nell'ecologia — è stata "un'opportunità sia per insegnare agli studenti le abilità nell'alfabetizzazione traduttiva, sia per incoraggiare gli studenti a essere attivisti in questo regno di cambiamento strutturale. E in effetti, ho visto un accoglienza davvero positiva di questo tipo di attivismo da parte degli studenti, poiché tutti sembrano concordare sul fatto che affrontare le barriere linguistiche sia davvero importante dopo aver frequentato il corso."
La classe ha portato Tarvin e alcuni studenti laureati presso l'UC Berkeley, insieme a collaboratori in Canada, Israele e Ungheria, a scrivere un articolo scientifico valutando nuovi strumenti di traduzione automatica che possono essere utilizzati da persone in tutto il mondo per rendere i loro articoli scientifici accessibili a chi non parla inglese . Il documento è apparso online questo mese sulla rivista BioScience . Sono online anche le traduzioni in spagnolo, francese, portoghese e ungherese, le lingue dei coautori.
"L'idea qui è che stiamo cercando di dare alle persone gli strumenti e la motivazione per tradurre la propria ricerca scientifica", ha detto Tarvin. "Non è necessario che la scienza si basi su un'unica lingua. E ci sono molti vantaggi aggiuntivi che derivano dall'incorporazione di approcci multilingue in ogni fase della scienza. Ad esempio, la pubblicazione in più lingue andrà a beneficio della società grazie a una migliore comunicazione scientifica."
"La lingua può essere una barriera, oltre che uno strumento fantastico, per riunire le persone", ha sottolineato Emma Steigerwald, che è la prima autrice del documento e una studentessa laureata in scienze ambientali, politica e gestione dell'Università di Berkeley. "È una barriera che possiamo superare utilizzando questa nuova tecnologia. Spieghiamo la tecnologia e come può essere implementata e le cose di cui dobbiamo essere consapevoli quando utilizziamo la tecnologia e tutti i modi meravigliosi e positivi che la comunicazione scientifica può essere trasformato mettendo in pratica questa nuova tecnologia."
Verso una rete scientifica multilingue
Fino a poco tempo, la traduzione al computer era oggetto di battute. Le persone hanno condiviso esempi divertenti di traduzioni errate, che spesso sembravano denigrare lingue diverse dall'inglese e, di conseguenza, altre culture.
Ma l'apprendimento automatico, o intelligenza artificiale, ha notevolmente aumentato l'accuratezza della traduzione al punto che i turisti utilizzano servizi Internet come Google Traduttore per comunicare con le persone nei paesi che visitano.
Ma per il testo che contiene molto gergo, in gran parte scientifico, ma anche da molti altri campi accademici, Google Traduttore è terribilmente inadeguato.
"La qualità della traduzione non è per un diario", ha affermato Ixchel Gonzalez Ramirez, uno dei tutor del corso per studenti laureati. "Molte volte, le persone devono pagare per farsi tradurre il proprio lavoro da un traduttore professionista, ed è molto costoso."
Il nuovo documento mette in evidenza alcuni dei numerosi servizi, la maggior parte dei quali gratuiti, che possono convertire la scrittura scientifica inglese in altre lingue. Oltre alla famosa piattaforma Google Translate, questi includono DeepL, che utilizza le reti neurali e afferma di essere molte volte più accurato dei concorrenti quando traduce l'inglese in cinese, giapponese, lingue romanze o tedesco e viceversa; Baidu Translate, un servizio della società Internet cinese Baidu che inizialmente si concentrava sulla traduzione tra inglese e cinese; Naver Pagago, traduttore multilingue creato da un'azienda della Corea del Sud; e Yandex.Translate, che utilizza la traduzione automatica statistica e si concentra principalmente su russo e inglese.
"La traduzione sta diventando sempre più alla portata di qualsiasi persona. Che tu sia un esperto o meno, che tu sia bilingue o meno, la capacità di tradurre è così accelerata da così tante delle tecnologie che abbiamo oggi a disposizione", ha detto Steigerwald. "E quindi, come possiamo integrarlo nel nostro flusso di lavoro come scienziati e in che modo questo cambia le aspettative che circondano la comunicazione scientifica?"
L'approfondimento automatico delle tecnologie di intelligenza artificiale ha migliorato la traduzione e il calcolo nell'ultimo periodo. Sin embargo, los artículos científicos que emplean terminology especializada siguen siendo un reto para la traducción automática. No obstante, la comunidad científica debería dar prioridad a la traducción de artículos e vari idiomi per ofrecer un panorama equitativo a los científicos e las científicas en formación de todo el mundo, afirman los investigadores de la UC Berkeley. Credito:Valeria Ramírez-Castañeda, UC Berkeley
L'inglese è la lingua franca della scienza
L'interesse di Tarvin per la traduzione è nato da una delle sue studentesse laureate, Valeria Ramírez Castañeda, che nel 2020 ha pubblicato un articolo in cui descriveva i costi sostenuti dai suoi colleghi dottorandi colombiani che volevano pubblicare o interagire con i colleghi in un mondo dominato dall'inglese.
In qualità di biologa evoluzionista interessata a come alcuni animali sono arrivati a usare il veleno, Tarvin ha deciso di concentrare il suo nuovo seminario sulla traduzione di documenti nei campi dell'evoluzione e dell'ecologia, anche se gli studenti che si sono iscritti alla fine hanno tracciato i propri corsi. Ha cercato in particolare studenti, come Liu, e mentori, come Gonzalez Ramirez, che fossero bilingue o multilingue.
"Tutti nella classe hanno avuto una sorta di relazione familiare con la lingua", ha detto Tarvin.
Tarvin ha anche chiesto a Mairi-Louise McLaughlin, professoressa di francese e linguistica alla UC Berkeley ed esperta di traduzione giornalistica e letteraria, di parlare alla classe di come i professionisti si avvicinano alla traduzione e di come la traduzione influisca sul significato. Quel soggetto ha avuto risonanza con gli studenti quando hanno provato a tradurre abstract scientifici e talvolta interi articoli.
Ruoming Cui, al secondo anno in ascesa che ha frequentato il corso nella primavera del 2022, ha scelto Baidu per tradurre abstract scientifici. Ha subito scoperto che le frasi lunghe e complesse dell'inglese e l'uso di più parole per descrivere un concetto sembravano ridondanti se tradotte in cinese.
"Di solito non lo facciamo in cinese perché renderebbe ogni frase molto lunga ed è molto noioso", ha detto.
Liu ha aggiunto che senza una notevole rifinitura, molte traduzioni in inglese vengono confuse, ha detto.
"Ho sentito dire che anche se il tuo risultato è sorprendente, se scrivi un documento confuso a causa della traduzione, le persone si infastidiscono perché non riescono a capire cosa stai facendo", ha detto Liu. "E ciò influenzerà notevolmente il modo in cui le persone convalideranno la ricerca o se la leggeranno. Penso che sia una grande barriera nel mondo scientifico".
Steigerwald, Tarvin e i loro coautori si sono anche resi conto che scrivere articoli scientifici in un inglese più semplice, cosa che i non scienziati incoraggiano da molto tempo, giova allo stesso modo a chi non parla inglese.
"Se la tua prima lingua non è l'inglese, e stai solo cercando di leggere la versione in lingua inglese del giornale, sembrerà molto meno ambiguo e molto più leggibile quando lo scrittore ha usato un linguaggio semplice", ha detto Steigerwald. "Ma anche, cosa molto importante, quando andrai a tradurre quel pezzo di testo, gli strumenti di apprendimento automatico avranno un tempo molto più facile per tradurre qualcosa che è scritto in un linguaggio semplice. Quindi, questo è un po' a prova di futuro per la tua scrittura, quindi che se qualcuno vuole tradurlo in un milione di lingue, sarà molto più facile quando sarà scritto in quel modo."
Permangono ostacoli alla traduzione diffusa di articoli scientifici, compreso dove renderli disponibili e come gestire i diritti d'autore. La maggior parte delle riviste non accetta nemmeno articoli che non siano in inglese e pochi consentono esplicitamente la co-pubblicazione di articoli con una traduzione. Tarvin ha scoperto che poche riviste hanno delle politiche sulle traduzioni e, a causa delle restrizioni generali sul copyright, molti editori addebitano commissioni esorbitanti per pubblicare una traduzione online dopo la pubblicazione.
"È piuttosto sbalorditivo quante riviste non ti permettano di pubblicare liberamente traduzioni dopo la pubblicazione e quante poche abbiano il supporto della piattaforma in cui potresti avere anche solo un abstract in una seconda o terza lingua", ha detto Tarvin. "Penso che un grosso ostacolo a questo sia costituito dalle piattaforme web; non solo le regole di pubblicazione e copyright, ma anche la funzionalità della piattaforma."
Con il seminario Breaking Barriers e ora la BioScience documento, Tarvin e i suoi colleghi sperano di cambiare gradualmente la norma scientifica per non tradurre gli articoli in altre lingue, in particolare la lingua del paese in cui è stata condotta la ricerca e le lingue dei coautori.
E più traduzioni ci sono, più materiale c'è per addestrare i sistemi di traduzione automatica a fare un lavoro migliore, aumentando gradualmente la qualità della traduzione scientifica.
"Nel mio laboratorio, stiamo traducendo molte delle nostre ricerche e ora anche le persone nel laboratorio di Emma lo stanno facendo", ha detto. "Penso che condividere il nostro atteggiamento positivo nei confronti di questo e di come possa fare la differenza per le persone abbia influenzato un piccolo, ma in crescita, gruppo di persone che stanno iniziando a incorporare la traduzione nel loro flusso di lavoro scientifico."
Ulteriori coautori di BioScience il documento include le studentesse di dottorato Valeria Ramírez-Castañeda e Débora Brandt dell'UC Berkeley; András Báldi dell'Istituto di Ecologia e Botanica del Centro di Ricerca Ecologica di Vácrátót, Ungheria; la borsista post-dottorato Julie Teresa Shapiro dell'Università Ben-Gurion del Negev a Be'er Sheva, Israele; e Lynne Bowker, professoressa di traduzione e interpretazione presso l'Università di Ottawa in Canada. + Esplora ulteriormente