• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Indagare le migliori caratteristiche per prevedere un genere di film e il budget stimato

    Fotogrammi di esempio dai trailer video di Moviescope che mostrano la diversità nel set di dati proposto. Credito:Sitaraman et al.

    Un team di ricercatori dell'Università della Virginia ha recentemente effettuato un'analisi su larga scala volta a identificare le caratteristiche nei trailer dei film che meglio predicono il genere di un film e il budget stimato. Nel loro studio, delineato in un documento pre-pubblicato su arXiv, i ricercatori hanno confrontato in modo specifico l'efficacia della visualizzazione, Audio, testo, e funzionalità basate sui metadati.

    "La comprensione del video è la prossima frontiera dopo la comprensione dell'immagine, " Vicente Ordonez, uno dei ricercatori che ha condotto lo studio, detto TechXplore . "Però, molto lavoro sulla comprensione dei video si è finora concentrato su brevi clip con un essere umano che esegue una singola azione. Volevamo qualcosa di più lungo, ma c'è anche il problema della potenza di calcolo. I trailer video sembravano un compromesso intermedio, mentre mostrano una moltitudine di cose, da spaventoso a divertente."

    I trailer dei film sono brevi e possono essere facilmente abbinati alle descrizioni dei film. Ordonez e i suoi colleghi si sono resi conto che queste caratteristiche li rendono ideali per indagare sui paralleli tra video e linguaggio.

    Inoltre, studi recenti hanno introdotto diversi strumenti promettenti per l'analisi di immagini abbinate a descrizioni testuali. I ricercatori erano curiosi di valutare alcune di queste tecniche sui compiti di riconoscimento video.

    Inizialmente, quando hanno cercato di applicare metodi consolidati per l'analisi di brevi clip video ai trailer dei film, i risultati sono stati deludenti. Così hanno deciso di condurre un'indagine approfondita per identificare le funzionalità più efficaci per l'analisi dei trailer dei film.

    "Abbiamo scoperto che combinando tutte le modalità (cioè video, testo, audio e metadati), siamo stati in grado di raccogliere preziose informazioni sulle correlazioni previste tra generi specifici e una particolare modalità, Per esempio, che le caratteristiche visive sono più preziose quando si prevede un film come animato o meno, "Paola Cascante-Bonilla, un altro ricercatore coinvolto nello studio, ha detto a TechXplore. "Inoltre, abbiamo scoperto che l'inclusione dell'audio nei nostri esperimenti migliora notevolmente le prestazioni di previsione del genere rispetto all'utilizzo del solo video, testo e metadati."

    I ricercatori hanno osservato che l'analisi dei manifesti cinematografici ha portato a risultati insoddisfacenti, concentrandosi su tutte le caratteristiche del film presentate in un trailer (cioè video, testo, audio e metadati) ha portato a miglioramenti significativi. Questi risultati sono particolarmente degni di nota, in quanto potrebbero aiutare a sviluppare strumenti più efficaci per analizzare i film e servire come base per futuri studi di ricerca.

    interessante, quando ci si concentra sul video, dati testuali e audio estratti dai trailer, Ordonez, Cascante-Bonilla e i loro colleghi sono stati in grado di stimare il genere di un film con un'accuratezza paragonabile a quella ottenuta analizzando i metadati del film (cioè informazioni sui suoi attori, direttore, eccetera.). Le tecniche utilizzate dai ricercatori nel loro studio, che combinano diverse caratteristiche/modalità, potrebbe quindi essere utilizzato per analizzare una gamma più ampia di film.

    Nel loro studio, il team ha anche introdotto un nuovo set di dati per la formazione e la valutazione degli strumenti per analizzare i film. Questo insieme di dati, chiamato Moviescope, include 5, 000 film, insieme ai loro rimorchi corrispondenti, locandine di film, trame dei film e relativi metadati.

    "I nostri risultati suggeriscono che solo il riassunto testuale di un film non è sufficiente per distinguere tra un film d'animazione e un film di un altro genere, " disse Siva Sivaraman, un altro ricercatore coinvolto nello studio che ora lavora in Microsoft. "Devi "vedere" il trailer per poter decidere se un determinato film è animato o meno. La tecnica di attenzione modale che abbiamo utilizzato ci consente di identificare e analizzare le caratteristiche a cui il modello presta maggiore attenzione quando prevede un particolare genere. Come avevamo previsto, il modello impara a soppesare la caratteristica visiva rispetto ad altre caratteristiche mentre fa previsioni per il genere di animazione."

    I risultati raccolti da questo team di ricercatori potrebbero avere importanti implicazioni sia per l'analisi dei film che per la pubblicità cinematografica. Nel futuro, altri gruppi di ricerca potrebbero utilizzare queste osservazioni per sviluppare strumenti più efficaci per prevedere aspetti specifici dei film. Inoltre, le tecniche utilizzate da Ordonez e dai suoi colleghi potrebbero informare l'industria pubblicitaria su come creare trailer di maggiore impatto.

    "Ora stiamo pianificando di utilizzare trame e poster cinematografici per analizzare il modo in cui i film vengono pubblicizzati e formulare raccomandazioni su come massimizzare l'efficacia della pubblicità cinematografica sia dal punto di vista dei consumatori che dei distributori, " ha detto Ordonez.

    © 2019 Science X Network




    © Scienza https://it.scienceaq.com