Facce pubblicitarie trasformate in 5 diverse categorie. Credito:Thomas &Kovashka
I ricercatori dell'Università di Pittsburgh hanno recentemente sviluppato un autoencoder variazionale condizionale in grado di produrre volti unici per gli annunci pubblicitari. Il loro studio si basa sul loro lavoro precedente, che ha esplorato metodi automatizzati per una migliore comprensione della pubblicità.
"Nel nostro progetto passato, volevamo vedere se le macchine potevano decodificare la complessa retorica visiva che si trova negli annunci, "Cristoforo Tommaso, uno dei ricercatori che ha condotto lo studio, ha detto a Tech Xplore. "Gli annunci contengono giochi di parole, metafore, e altri dispositivi retorici persuasivi difficili da comprendere per le macchine. In questo documento, non volevamo solo capire gli annunci, ma volevamo vedere se tali contenuti persuasivi potevano essere generati automaticamente dai computer".
La missione principale dell'industria pubblicitaria è promuovere prodotti o trasmettere idee utilizzando un linguaggio e immagini persuasivi. volti, un aspetto fondamentale degli annunci, sono spesso rappresentati in modo diverso a seconda del prodotto pubblicizzato e del messaggio comunicato.
In collaborazione con la collega Adriana Kovashka, Thomas ha utilizzato l'apprendimento automatico per generare volti persuasivi che avrebbero funzionato bene per diversi tipi di pubblicità. Hanno usato autoencoder variazionali condizionali, o "modelli generativi, " modelli di machine learning che imparano a generare dati sintetici simili a quelli su cui è addestrato.
Facce pubblicitarie trasformate in 17 diverse categorie. Credito:Thomas &Kovashka
"Nella visione artificiale, gli autoencoder funzionano prendendo un'immagine e imparando a rappresentare quell'immagine come pochi numeri, " disse Tommaso. "Allora, un secondo pezzo del modello, il decodificatore, impara a prendere quei numeri ea riprodurne l'immagine originale. Puoi quasi pensarlo come una forma di compressione, in cui una grande immagine è rappresentata da pochi numeri."
Quando questo tipo di modello di machine learning viene addestrato su un set di dati sufficientemente grande, inizia a rappresentare aspetti semantici all'interno dei numeri. Ad esempio, nel modello sviluppato da Thomas e Kovashka, un numero controllerà la forma di una faccia, un'altra l'ombra della pelle, e così via per altre caratteristiche semantiche.
Però, se i ricercatori volevano che il modello catturasse se una persona indossa gli occhiali, ma il set di dati di allenamento non conteneva abbastanza immagini di persone con gli occhiali, questa proprietà andrebbe persa quando l'immagine viene ricostruita. Così, hanno sviluppato un autoencoder condizionale, nel senso che potevano aggiungere altri numeri al modello che non aveva acquisito da solo, che rappresentano caratteristiche semantiche che potrebbero essere rilevanti per particolari annunci pubblicitari.
"La parte interessante di questo è che una volta addestrato il modello a rappresentare i volti in 100 numeri, se poi cambiamo alcuni di quei numeri e li "decodifichiamo", possiamo cambiare volto, " ha detto Thomas. "Possiamo così trasformare i volti esistenti in modo che abbiano lo stesso aspetto ma abbiano attributi diversi, come occhiali da vista, sorridere o no, eccetera., semplicemente cambiando alcuni dei numeri che il nostro modello usa per rappresentarli."
Facce pubblicitarie trasformate in 5 diverse categorie. Credito:Thomas &Kovashka
La formazione di modelli generativi per la visione artificiale può essere un compito impegnativo, richiedono grandi set di dati di immagini e spesso falliscono quando vengono addestrati su dati molto diversi, come gli annunci. Thomas e Kovashka hanno superato queste limitazioni utilizzando un codificatore automatico che richiedeva meno dati e poteva far fronte alla notevole variazione riscontrata nella pubblicità.
"Comunque, perché non c'erano abbastanza dati, non sempre catturava i concetti che volevamo nelle sue rappresentazioni, "dice Tommaso. "Così, abbiamo deliberatamente iniettato la semantica nella sua rappresentazione, che ha migliorato significativamente i risultati."
I loro risultati suggeriscono che in futuro, gli inserzionisti saranno in grado di creare annunci personalizzati e mirati su misura per i singoli clienti. Ad esempio, potrebbero generare volti con caratteristiche facciali che corrispondono a quelle dello spettatore, in modo che si identifichino di più con il soggetto.
"Questo tipo di automatico, la personalizzazione fine degli annunci potrebbe avere enormi implicazioni per gli inserzionisti online, "dice Thomas. "Inoltre, un inserzionista che non desidera assumere un modello aggiuntivo per il proprio annuncio o eseguire modifiche manuali può essere in grado di trasformare un volto esistente da un altro annuncio in un volto appropriato per il proprio tipo di annuncio".
Facce pubblicitarie trasformate in 17 diverse categorie. Credito:Thomas &Kovashka
I ricercatori stanno ora esplorando modi in cui potrebbero migliorare le loro immagini generate in modo che corrispondano alla qualità di quelle prodotte utilizzando maggiori quantità di dati. Per fare questo, dovranno progettare altri modelli generativi che siano più robusti se addestrati su dati molto vari e limitati.
"Un'altra possibile linea di ricerca è la generazione di altri oggetti oltre ai volti, o addirittura generare interi annunci significativi e interessanti, " dice Thomas. "Ciò richiederebbe lo sviluppo di nuove tecniche per modellare la struttura retorica in un quadro generativo, combinato con la comprensione e la generazione del testo."
© 2018 Tech Xplore