Il pianeta Dalì. Credito:Il Museo Dalí
Un visitatore del Museo Dalí di San Pietroburgo, Florida suona un campanello accanto a uno schermo scuro a grandezza naturale. Una figura oscurata che indossa un abito elegante e sfoggia baffi a matita lascia lentamente il cavalletto e viene verso di lei nella luce.
È, Certo, Salvador Dalì, che guarda il visitatore e parla della sua arte e del suo museo. Quando il visitatore sta per partire, appare di nuovo. Le chiede se le piacerebbe una foto, poi tira fuori il cellulare e si fa un selfie con lei.
La cosa affascinante di questo incontro è che in realtà è Dalí stesso. Com'è possibile che il grande surrealista spagnolo possa interagire con il pubblico anni dopo la sua morte, anche usando un telefono che non esisteva quando era vivo? Benvenuto nel mondo dei deepfake, una tecnologia inquietante con un alto potenziale di inganno e anche alcuni usi inaspettatamente positivi.
I deepfake sono una nuova e potente tecnica per creare contenuti video o audio realistici ma falsi. Per dare vita a Dalí, il museo ha utilizzato il deep learning per consentire a un computer di scambiare senza soluzione di continuità il volto di un attore vivente che si vestiva e si comportava come Dalí con un'immagine generata digitalmente del volto e delle espressioni dell'artista.
Ciò comporta un "processo di addestramento" in cui algoritmi avanzati di apprendimento automatico setacciano le riprese di Dalí e dell'attore per imparare a generare nuove immagini facciali dall'aspetto reale di entrambi gli uomini. Impara anche a prendere un'immagine esistente di uno dei due uomini e generare un'immagine dell'altro che corrisponda perfettamente alle espressioni facciali e alla postura della testa del primo.
Ciò consente di generare volti di Dalí che corrispondono ai movimenti dell'attore, che vengono poi automaticamente inseriti nel nuovo video, creando un'illusione di Dalí stesso. Ci sono più dettagli qui per coloro che sono interessati.
L'opportunità bussa
Ad oggi, la maggior parte dei produttori di deepfake ha sfruttato il lato oscuro della tecnologia. Questo ha spaziato dalla satira, come questa clip del primo di aprile che mostra Mark Zuckerberg che annuncia che sta cancellando Facebook; a filmati dannosi per la reputazione di star di Hollywood che presumibilmente recitano in film porno; alla frode, come imitare la voce di un amministratore delegato per richiedere il trasferimento di una grossa somma di denaro.
I rischi dei deepfake sono innegabili. Eppure l'esempio di Dalí illustra che è impossibile essere in bianco e nero su questa tecnologia. Nella nostra ricerca, raggruppiamo i deepfake in cinque categorie:scambio di voci, sintesi vocale, scambio di volti video, burattini per tutto il corpo e sincronizzazione labiale. In ogni categoria, vediamo chiare opportunità di business. Alcuni devono ancora materializzarsi mentre altri si stanno già realizzando.
1. Ventriloquismo 2.0
Lo scambio di voci può cambiare la voce di una persona o farla imitare quella di qualcun altro. Può essere manipolato per sembrare più giovane o più vecchio, maschio o femmina, e con diversi dialetti o accenti. I possibili usi includono un narratore di audiolibri che parla con le voci di diversi personaggi, o usando una persona famosa come narratore senza che debbano prendersi la briga di leggere l'intera storia.
Apre anche affascinanti possibilità per assistenti virtuali come Siri. Piuttosto che dover registrare doppiatori con accenti e generi diversi, lo scambio di voci audio rende possibile farlo con una sola voce:qualcuno sente che sta arrivando un'app di successo?
2. Restituire le voci
Per molti anni è stato possibile far parlare un computer digitando del testo in un'applicazione. Ora esiste la tecnologia deepfake per farlo con la voce di una persona in particolare anche dove non hanno precedentemente registrato le parole in questione. Questa sta diventando una tecnologia che cambia la vita per le persone che hanno perso la capacità di parlare in modo intelligibile, come quelli che hanno avuto ictus o hanno una malattia progressiva come la sclerosi laterale amiotrofica, vedere la clip qui sotto.
Altri possibili usi di questa tecnologia audio-text-to-speech includono la correzione di parole errate in una voce fuori campo piuttosto che dover chiedere alla persona di registrarla di nuovo.
3. "Stai parlando con me?"
Come abbiamo visto con l'esempio di Dalí, lo scambio di volti video può sostituire il volto di una persona in un video con il volto di qualcun altro. Questo ha un grande potenziale nei film.
Ad esempio, un artista professionista del deepfake ha dimostrato come tecniche simili al Museo Dalí avrebbero potuto essere usate per svecchiare Robert De Niro in The Irishman, piuttosto che la costosa e dispendiosa CGI che ha contribuito a portare il costo di produzione totale del film a 175 milioni di dollari (135 milioni di sterline). La clip qui sotto mostra come la tecnologia deepfake può raggiungere una qualità simile. Un altro possibile utilizzo di questa tecnologia è rappresentato da controfigure più realistiche.
4. Partita in corso
Le marionette video a corpo intero possono trasporre il movimento dal corpo di una persona a quello di un'altra. I possibili usi includono videogiochi più coinvolgenti in cui i giocatori possono inserirsi nell'azione, con le proprie caratteristiche di andatura e movimento; e film in cui gli attori non ballerini possono apparentemente ballare usando filmati di ballerini professionisti.
5. Sottotitoli RIP
La sincronizzazione labiale audio e video può modificare i movimenti della bocca e le parole pronunciate in un video. Presto sarà possibile rendere conveniente, traduzioni di film di alta qualità, Programmi TV e altri video. Un algoritmo addestrato imiterebbe la voce dell'attore originale ma in una lingua diversa, con il movimento delle labbra in sincronia con le nuove parole.
Quindi, sebbene sia chiaro che i deepfake possono e vengono utilizzati in modo deleterio, la stessa tecnologia di deep learning sta aprendo anche molte applicazioni aziendali innovative. Molte possibilità creative e produttive stanno diventando evidenti, e senza dubbio molte altre che le persone non hanno ancora individuato.
Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.