Ydych chi'n siarad Cymraeg? Credito:Golden Sikorka/Shutterstock
Le tecnologie pionieristiche per la casa intelligente e gli assistenti vocali no, di regola, parlare gallese, anche se il governo gallese ora mira a cambiare la situazione attraverso il piano d'azione per la tecnologia della lingua gallese. Ma il loro scopo è fattibile, è necessario, e come si può fare?
Gli strumenti vocali di intelligenza artificiale (come Pixelbuds di Google) dipendono fortemente dall'uso di set di big data per imparare una lingua, la sua pronuncia, grammatica e semantica. L'abilità o la qualità degli strumenti risultanti è principalmente limitata dalla quantità di dati disponibili (e da quanto è "buona"). Ciò significa che, almeno in teoria, gli strumenti per una lingua minoritaria come il gallese non possono diventare capaci come quelli per una lingua tradizionale.
Le lingue con quantità limitate di dati disponibili sulla buona formazione sono chiamate lingue a "risorse basse". Rispetto all'inglese, Le risorse gallesi sono scarse, ma ci sono diverse migliaia di lingue con meno parlanti, e molto probabilmente risorse molto più povere, rispetto al gallese.
Fortunatamente si sta facendo una buona ricerca su una tecnica di apprendimento automatico chiamata "apprendimento per trasferimento". Ciò consente ai sistemi di apprendere utilizzando un insieme di dati e di applicare quindi questa conoscenza in un altro. In Cina viene utilizzato per il riconoscimento vocale automatico (ASR) del tibetano, che non ha praticamente dati disponibili per la formazione. Il sistema ASR ha imparato il cinese - che è linguisticamente molto diverso dal tibetano - ed è stato poi riqualificato o perfezionato per "capire" il tibetano. In realtà c'è molta comunanza tra molte lingue – parole condivise o prese in prestito e modelli di pronuncia – che aiuta questo tipo di tecnica.
Riqualificazione dell'IA in gallese
Quindi non c'è motivo per cui i sistemi di intelligenza artificiale non possano essere prodotti per conversare in gallese o in altre lingue minoritarie. Ma c'è qualche motivo per cui dovrebbe? Tutta la tecnologia vocale, case intelligenti e sistemi di interazione vocale utilizzati oggi sono i prodotti della ricerca commerciale. Per dirla senza mezzi termini, esistono per fare soldi dai tuoi dati, per venderti più beni e servizi, o per influenzare il tuo pensiero. Nessuna di queste IA esiste per il bene pubblico.
Realizzare un sistema che funzioni bene con il gallese potrebbe non essere facile come progettare tutto in inglese. Con la tecnologia attuale, saranno necessari esperti di IA vocale (e noi siamo costosi). Ci sarà bisogno di materiale di formazione e test gallese, e tester di lingua gallese devono essere coinvolti. I pericoli di non avere parlanti gallesi coinvolti nel processo di traduzione sono stati ampiamente dimostrati in passato, quando una risposta via e-mail fuori sede è finita su un cartello stradale
A meno che non ci sia un argomento economico abbastanza forte, non aspettarti che le grandi aziende si precipitino a produrre gallese, Sistemi vocali gaelici o della Cornovaglia. Persino il gigante della tecnologia Samsung non è ancora riuscito a produrre una versione inglese-britannica del loro assistente Bixby (gli anglofoni internazionali devono parlargli con falsi accenti americani per farlo funzionare). Anche la versione USA-Inglese è stata ritardata a causa della mancanza di risorse.
E fintanto che i parlanti gallesi saranno felici di utilizzare i sistemi di intelligenza artificiale in lingua inglese, potrebbe non esserci un argomento economico - a meno che il governo gallese non decida di pagare per farlo accadere, cosa che finora non ha fatto (il piano d'azione è un "impegno" in questa fase).
AI in soccorso
La tecnologia avanza e tecniche come l'apprendimento per trasferimento stanno diventando ogni giorno più capaci. Ciò ha consentito di aggiornare ed estendere le precedenti ricerche sull'adattamento linguistico nello sviluppo di tecniche di deep learning multilingue. Nel frattempo, l'uso crescente di altri tipi di tecnologia digitale da parte di parlanti gallesi ha migliorato la raccolta di risorse nella lingua, così come la TV e la radio gallesi. Questi progressi significano che il costo dei sistemi di localizzazione per il gallese (e altre lingue minoritarie) si sta riducendo.
La ricerca su algoritmi di apprendimento simili al cervello potrebbe essere la chiave qui. Questa è una tecnologia che può imparare continuamente durante l'uso, proprio come gli umani imparano a parlare una nuova lingua. È diverso dalla maggior parte degli attuali sistemi di intelligenza artificiale addestrati in laboratorio, prima di essere liberati in natura – a parte poche eccezioni alcuni, come Tay di Microsoft, notevoli per i loro fallimenti spettacolari. I sistemi futuri saranno in grado di acquisire gradualmente competenze in una seconda lingua semplicemente facendo in modo che gli utenti introducano gradualmente sempre più quella lingua nelle loro interazioni quotidiane. Piuttosto che finanziare la ricerca sull'intelligenza artificiale del linguaggio gallese, il governo gallese potrebbe fare di meglio sostenendo la ricerca su questo nuovo tipo di tecnologia di apprendimento adattivo.
Poiché tutti gli attuali sistemi di intelligenza artificiale del parlato gestiscono il parlato in modo centralizzato (non viene eseguito nel dispositivo, ma in una server farm remota), questi sistemi potrebbero raccogliere dati da centinaia di utenti in tutto il mondo (o in tutto il Galles) per apprendere rapidamente. Quindi il messaggio per gli oratori gallesi oggi potrebbe essere quello di non comprare quel Google Home o Amazon Alexa in lingua inglese se vuoi che Google o Amazon producano un sistema che funzioni in gallese. Ma se ne hai uno, man mano che il suo software si sviluppa nei prossimi anni, prova a parlargli il più possibile in gallese. Potrebbe sorprendere te e Siaradwch â chi yn Gymraeg.
Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.