• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • PizzaGAN ottiene l'immagine su come fare una pizza

    Niente è sacro? Chi oserebbe anche solo tentare di parlare di un esperimento di apprendimento automatico che porta alla pizza perfetta (senza fiato)? È difficile contemplare, ma un quintetto di ricerca non ha evitato di provare, e hanno lavorato per insegnare a una macchina come fare un'ottima torta.

    Saluta PizzaGAN, un modello generativo compositivo a strati che mirava a rispecchiare la procedura passo-passo della preparazione della pizza.

    Il loro obiettivo era insegnare alla macchina costruendo un modello generativo che rispecchiasse un insieme ordinato di istruzioni. Come hanno proceduto:"Ogni operatore è concepito come un Generative Adversarial Network (GAN). Data solo una debole supervisione a livello di immagine, gli operatori sono formati per generare un livello visivo che deve essere aggiunto o rimosso dall'immagine esistente. Il modello proposto è in grado di scomporre un'immagine in una sequenza ordinata di livelli applicando in sequenza nel giusto ordine i corrispondenti moduli di rimozione".

    (Le reti generative avversarie possono fare molte cose, Victoria Song ha osservato in Gizmodo . Ha detto che era "fondamentalmente il tipo di apprendimento automatico utilizzato per generare volti realistici di intelligenza artificiale e deepfake.")

    Risultati? Basti dire che hanno riferito di aver realizzato un modello con loro soddisfazione. "I risultati sperimentali su immagini di pizza sintetiche e reali dimostrano che il nostro modello proposto è in grado di:(1) segmentare i condimenti per pizza in modo debolmente controllato, (2) rimuoverli rivelando ciò che è occluso sotto di essi (cioè, in pittura), e (3) dedurre l'ordine dei condimenti senza alcuna supervisione dell'ordine in profondità."

    Il team ha parlato dei loro set di dati sulla pizza sintetici e reali.

    "La pizza è il cibo più fotografato su Instagram con oltre 38 milioni di post utilizzando l'hashtag #pizza, " hanno detto. Hanno scaricato mezzo milione di immagini da Instagram utilizzando diversi hashtag popolari relativi alla pizza. Hanno filtrato le immagini indesiderate utilizzando un classificatore basato sulla CNN addestrato su una serie di immagini pizza/non pizza etichettate manualmente.

    Hanno raccolto etichette a livello di immagine per i condimenti della pizza su Amazon Mechanical Turk (AMT) per 9, 213 immagini di pizza.

    Per il loro set di dati sulla pizza sintetica, hanno usato immagini di pizza in stile clip art. "Ci sono due vantaggi principali nel creare un set di dati con pizze sintetiche. Primo, ci permette di generare un insieme arbitrariamente grande di esempi di pizza con zero costi di annotazione umana. Secondo e più importante, abbiamo accesso a informazioni precise sull'ordine di base e alla segmentazione pixel multistrato dei condimenti."

    Così, nell'immagine più grande, che contributo hanno dato, se del caso, all'umanità? Victoria Song ha fatto un punto, quando ha scritto, "A lungo termine, si potrebbe immaginare una rete neurale in grado di scansionare una foto e sputare una ricetta abbastanza accurata basata sugli ingredienti, quanto bene è cotto, e persino spezie appena visibili."

    Dopo tutto è detto (e fatto), "la ricerca sta principalmente solo dimostrando la capacità di un'intelligenza artificiale di distinguere tra una pila confusa di ingredienti". Lo sapevano quando hanno deciso di concentrarsi sulla pizza. Pensa all'"esempio archetipico" di qualcosa che richiede l'aggiunta sequenziale di ingredienti in un ordine specifico.

    Nell'immagine più grande, la pizza non è l'unico elemento che potrebbe utilizzare il loro approccio. "Anche se abbiamo valutato il nostro modello solo nell'ambito della pizza, riteniamo che un approccio simile sia promettente per altri tipi di alimenti che sono naturalmente stratificati come hamburger, panini, e insalate».

    Per ulteriori informazioni sulla loro ricerca, il loro articolo è intitolato, "Come fare una pizza:imparare un modello GAN compositivo a strati, " di Dim Papadopoulos, Youssef Tamaazousti, Ferda Ofli, Ingmar Weber e Antonio Torralba. Il documento è su arXiv. Il documento è stato presentato all'inizio di questo mese.

    © 2019 Science X Network




    © Scienza https://it.scienceaq.com