• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • I ricercatori di Facebook usano la matematica per traduzioni migliori

    I social network come Facebook stanno cercando una traduzione automatica efficiente per tutte le lingue del mondo e l'intelligenza artificiale potrebbe contenere la risposta

    I progettisti di strumenti di traduzione automatica si affidano ancora principalmente ai dizionari per rendere comprensibile una lingua straniera. Ma ora c'è un nuovo modo:i numeri.

    I ricercatori di Facebook affermano che trasformare le parole in cifre e sfruttare le somiglianze matematiche tra le lingue è una strada promettente, anche se un comunicatore universale alla Star Trek rimane un sogno lontano.

    Una potente traduzione automatica è una grande priorità per i giganti di Internet. Consentire a quante più persone possibile in tutto il mondo di comunicare non è solo un obiettivo altruistico, ma anche un buon affare.

    Facebook, Google e Microsoft, oltre alla russa Yandex, Baidu e altri cinesi cercano costantemente di migliorare i propri strumenti di traduzione.

    Facebook ha esperti di intelligenza artificiale al lavoro in uno dei suoi laboratori di ricerca a Parigi.

    Attualmente su Facebook vengono utilizzate fino a 200 lingue, disse Antoine Bordes, Co-direttore europeo della ricerca fondamentale sull'IA per i social network.

    La traduzione automatica si basa attualmente sull'avere grandi database di testi identici in entrambe le lingue su cui lavorare. Ma per molte coppie linguistiche non ci sono abbastanza testi paralleli.

    Ecco perché i ricercatori hanno cercato un altro metodo, come il sistema sviluppato da Facebook che crea una rappresentazione matematica delle parole.

    Ogni parola diventa un "vettore" in uno spazio di diverse centinaia di dimensioni. Anche le parole che hanno strette associazioni nella lingua parlata si trovano vicine l'una all'altra in questo spazio vettoriale.

    Dal basco all'amazzonico?

    "Per esempio, se prendi le parole "gatto" e "cane", semanticamente, sono parole che descrivono una cosa simile, quindi saranno estremamente vicini fisicamente" nello spazio vettoriale, disse Guillaume Lampe, uno dei progettisti del sistema.

    "Se prendi parole come Madrid, Londra, Parigi, quali sono le capitali europee, è la stessa idea."

    Queste mappe linguistiche possono quindi essere collegate l'una all'altra utilizzando algoritmi, inizialmente approssimativamente, ma alla fine diventando più raffinato, fino a quando intere frasi possono essere abbinate senza troppi errori.

    Lampe ha detto che i risultati sono già promettenti.

    Per la coppia linguistica inglese-rumeno, L'attuale sistema di traduzione automatica di Facebook è "uguale o forse un po' peggiore" del sistema vettoriale di parole, disse Lampo.

    Ma per la coppia linguistica più rara inglese-urdu, dove il sistema tradizionale di Facebook non ha molti testi bilingue a cui fare riferimento, la parola sistema vettoriale è già superiore, Egli ha detto.

    Ma potrebbe il metodo consentire la traduzione da, dire, Basco nella lingua di una tribù amazzonica?

    In teoria, sì, disse Lampo, ma in pratica è necessario un ampio corpus di testi scritti per mappare la lingua, qualcosa che manca nelle lingue tribali amazzoniche.

    "Se hai solo decine di migliaia di frasi, non funzionerà. Hai bisogno di diverse centinaia di migliaia, " Egli ha detto.

    'Santo Graal'

    Gli esperti del centro scientifico nazionale francese del CNRS hanno affermato che l'approccio adottato da Lample per Facebook potrebbe produrre risultati utili, anche se non porta a traduzioni perfette.

    Thierry Poibeau del laboratorio Lattice del CNRS, che fa anche ricerche sulla traduzione automatica, chiamato la parola approccio vettoriale "una rivoluzione concettuale".

    Ha detto che "tradurre senza dati paralleli" - dizionari o versioni degli stessi documenti in entrambe le lingue - "è qualcosa del Santo Graal" della traduzione automatica.

    "Ma la domanda è quale livello di prestazioni ci si può aspettare" dalla parola metodo vettoriale, disse Poibeau.

    Il metodo "può dare un'idea del testo originale" ma la capacità di una buona traduzione ogni volta rimane da dimostrare.

    Francois Yvon, ricercatore presso il Laboratorio di Informatica per la Meccanica e le Scienze dell'Ingegneria del CNRS, ha detto che "il collegamento delle lingue è molto più difficile" quando sono molto lontane l'una dall'altra.

    "Il modo di denotare i concetti in cinese è completamente diverso dal francese, " Ha aggiunto.

    Tuttavia anche traduzioni imperfette possono essere utili, disse Yvon, e potrebbe rivelarsi sufficiente per monitorare l'incitamento all'odio, una priorità assoluta per Facebook.

    © 2019 AFP




    © Scienza https://it.scienceaq.com