• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • I ricercatori esplorano l'elaborazione di cartoni animati utilizzando descrizioni testuali

    Data una nuova descrizione, Craft compone in sequenza un layout di scena e recupera entità da un database video per creare video di scena complessi. Attestazione:arXiv:1804.03608 [cs.CV]

    E se ti dicessero che puoi creare cartoni semplicemente lavorando su descrizioni di testo?

    I rapporti sono che un gruppo di ricercatori ha svelato un'intelligenza artificiale in grado di realizzare video originali di "The Flintstones" dalle descrizioni del testo.

    Sì, queste sono scene create da un'intelligenza artificiale. Considera la descrizione di una scena:Fred indossa un cappello blu e parla con Wilma in soggiorno. Wilma poi si siede su un divano.

    Composizione, Rete di recupero e fusione, o ARTIGIANATO, è il nome del loro modello. Gli autori hanno notato che hanno mostrato CRAFT su Flintstones, un set di dati con oltre 2, 500 video e ciascuno lungo 75 fotogrammi.

    Hanno scritto un documento, intitolato "Imagine This! Scripts to Compositions to Videos" ed è su arXiv. I cinque ricercatori sono Tanmay Gupta, Dustin Schwenk, Ali Farhadi, Derek Hoiem e Aniruddha Kembhavi. Le affiliazioni degli autori includono The Allen Institute for Artificial Intelligence (AI2), L'Università dell'Illinois Urbana-Champaign e l'Università di Washington.

    Gli autori hanno detto che una volta data una nuova descrizione, "Craft compone in sequenza un layout di scena e recupera entità da un database video per creare video di scena complessi."

    Tristan Greene, Il prossimo Web , ha spiegato come funziona la tecnologia:"Craft utilizza le annotazioni dei video per determinare come le immagini originali corrispondono alle parole usate per descriverle. Alla fine costruisce una serie di parametri che gli consentono di 'capire' cosa rende i singoli personaggi e oggetti da i cartoni corrispondono alle loro controparti in linguaggio semplice. Una volta compresa questa relazione, è in grado di generare video clip basati su nuovi input di testo che assomigliano molto al cartone animato su cui è stato addestrato."

    Gli autori hanno anche discusso il loro modello basato sul testo:

    "A differenza degli approcci alla generazione di pixel, il nostro modello di aspetto si basa sul recupero di segmenti da testo a entità da un database video. I segmenti spazio-temporali vengono estratti dai video recuperati e fusi insieme per generare il video finale. La composizione del layout e il recupero delle entità funzionano in modo sequenziale determinato dall'input della lingua."

    Gli autori hanno affermato che "CRAFT supera gli approcci di generazione diretta di pixel".

    interessante, gli spettatori dei video hanno scritto risposte che vanno da wow a tiepido a confuso.

    Molti pensavano che fosse Fantastico; uno ha osservato che era "più avanzato di quanto avrei immaginato" e un altro ha detto "sembra ancora che qualcuno abbia provato ad animare per la prima volta su un software demo. Sembra che abbia del potenziale, anche se."

    Un altro osservatore era più confuso che sorpreso. "Sono confuso. La mia comprensione è che l'intelligenza artificiale ha imparato 25k cartoni completamente annotati. E poi i ricercatori hanno digitato uno scenario di testo, e l'intelligenza artificiale ha appena trovato immagini corrispondenti? Non è solo un semplice recupero dello snippet video corrispondente basato su una ricerca di testo dal database annotato? Cosa mi manca?"

    Gli scrittori sui siti tecnologici hanno offerto il loro punto di vista su questa ricerca. Facendo riferimento ai video, Il prossimo Web è intervenuto. OK è un "piccolo clip glitch, " come ha detto Tristan Greene. Comunque, Ha aggiunto, "La piccola clip glitch di oggi, generato da semplici frasi di testo, potrebbe portare l'intrattenimento di domani a essere creato da zero dall'intelligenza artificiale invece che da studi pieni di persone".

    Andrew Liszewski in Gizmodo allo stesso modo ha scoperto che la qualità delle animazioni generate era "orribile nella migliore delle ipotesi" e "nessuno sarà ingannato nel pensare che questi siano gli originali di Hanna-Barbera". Ciò nonostante, Ha aggiunto, vedere un'intelligenza artificiale generare un cartone animato, con personaggi iconici, tutto da solo, era "un'affascinante anticipazione su come alcuni film e programmi TV potrebbero essere realizzati un giorno".

    Lucy Black ha scritto domenica, in io programmatore che "Questo è più di un semplice trucco intelligente con le reti neurali. È un segno che l'intelligenza artificiale si sta muovendo verso sistemi più grandi in cui le reti neurali profonde svolgono lavori diversi e lavorano insieme per creare la soluzione. Si potrebbe chiamare la seconda fase della tecnologia neurale profonda". reti".

    OK, domanda senza risposta:gli animatori perderebbero il lavoro. Nero ha detto, "Sì, suppongo che con il tempo e lo sforzo qualcosa come CRAFT potrebbe essere sviluppato in un generatore di cartoni animati e far perdere il lavoro a migliaia di animatori, ma la computer grafica sta già intaccando quel mercato del lavoro."

    © 2018 Tech Xplore




    © Scienza https://it.scienceaq.com