Flusso del processo di algoritmo. Tre fasi principali caratterizzano il flusso di lavoro:(a) calcolo del segnale temporale da patch facciali e denoising; (b) normalizzazione del segnale; e (c) estrazione delle caratteristiche e classificazione SVM. Credito:Bonomi e Boato
I recenti progressi nella computer grafica stanno rendendo possibile la creazione di rappresentazioni generate al computer (CG) di esseri umani che sono difficili da distinguere dalle loro controparti del mondo reale. "Rilevamento digitale del volto umano in sequenze video tramite un'analisi del segnale fisiologico, "un documento pubblicato oggi nel Journal of Electronic Imaging (JEI) , presenta un modo innovativo per discernere tra umani naturali (NAT) e volti CG nel contesto della medicina legale multimediale, utilizzando la frequenza cardiaca degli individui come caratteristica discriminante. JEI è co-pubblicato da SPIE, la società internazionale di ottica e fotonica, e dalla Society for Imaging Science and Technology (IS&T).
Gli esseri umani presentano un segnale a impulsi che può essere estratto automaticamente da una sequenza video; gli umani virtuali no. Nella loro carta, Mattia Bonomi e Giulia Boato dimostrano che concentrandosi su un algoritmo per la stima della frequenza cardiaca da volti umani e calcolando le statistiche da quella frequenza cardiaca, possono classificare la faccia di input come CG o NAT.
"I recenti progressi nell'apprendimento automatico e nella computer grafica hanno portato al rapido sviluppo di 'deepfake, ' in cui il volto di una persona reale in un video è sostituito da uno generato dal computer, " osserva Karén Egiazarian, caporedattore di JEI. "Questa tecnologia è apertamente disponibile al giorno d'oggi, e, insieme al suo ampio utilizzo nell'industria cinematografica e nella pubblicità, è stato utilizzato anche da truffatori. Ma come distinguere un volto umano da uno generato al computer? Bonomi e Boato affrontano questa domanda proponendo e applicando un'analisi del segnale fisiologico, estraendo la frequenza cardiaca dal video del volto umano, e usandolo come fattore discriminante".
Gli autori dell'articolo sono Mattia Bonomi e Giulia Boato, sia dell'Università di Trento, Dipartimento di Ingegneria e Informatica, Trento, Italia.