• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Una rete di attenzione guidata con maschera multi-scala per la reidentificazione della persona

    Immagine 1:Possiamo prestare maggiore attenzione al corpo umano, corpo superiore e corpo inferiore. Credito:Cai, Wang &Cheng.

    La reidentificazione della persona comporta l'identificazione automatica della stessa persona in più immagini provenienti da fotocamere diverse e con sfondi diversi, angoli o posizioni. Nonostante i recenti progressi nel campo dell'intelligenza artificiale (AI), la reidentificazione della persona rimane un compito molto impegnativo, soprattutto a causa delle numerose variazioni nella posa di una persona, così come altre differenze associate all'illuminazione, occlusione, disallineamento e disordine sullo sfondo.

    I ricercatori del Centro di ricerca e sviluppo Suning negli Stati Uniti hanno recentemente sviluppato una nuova tecnica per la reidentificazione della persona basata su una rete di attenzione guidata da maschere per parti del corpo (MMGA) multi-scala. La loro carta, pre-pubblicato su arXiv, sarà presentato durante la presentazione dei riflettori del CVPR Workshop 2019 a giugno.

    "La reidentificazione della persona sta diventando un compito sempre più importante a causa della sua vasta gamma di potenziali applicazioni, come le indagini penali, sicurezza pubblica e recupero dell'immagine, "Honglong Cai, uno dei ricercatori che ha condotto lo studio, detto TechXplore . "Però, resta un compito impegnativo, per occlusione, disallineamento, variazione di pose e disordine sullo sfondo. Nel nostro recente studio, il nostro team ha cercato di sviluppare un metodo per superare queste sfide".

    Invece di concentrarti su immagini intere, Cai e i suoi colleghi hanno sviluppato un modello per la reidentificazione della persona che presta attenzione solo alla persona di interesse, ignorando lo sfondo. Portando questa idea un passo avanti, il loro modello analizza diverse parti del corpo della persona in una data immagine.

    "Per realizzare la nostra idea, abbiamo proposto in modo creativo una rete di attenzione guidata con maschera multi-scala, Cai ha detto. “Applichiamo maschere per il corpo per guidare la formazione del nostro modello in modo che possa prestare maggiore attenzione al corpo umano nell'immagine. Il nostro modello contiene due parti:un estrattore di funzionalità e un modulo di attenzione".

    I primi 5 risultati di recupero per le immagini di query sono tutti corretti. Credito:Cai, Wang &Cheng.

    Il componente estrattore di caratteristiche del modello ideato da Cai e dai suoi colleghi può estrarre dalle immagini le caratteristiche discriminanti dei corpi delle persone. Il modulo di attenzione del modello, d'altra parte, guida la rete MMGA, evidenziando le aree dell'immagine (cioè i pixel) a cui dovrebbe prestare maggiore attenzione.

    I ricercatori hanno utilizzato maschere per il corpo per guidare l'addestramento del modulo di attenzione del loro modello, in quanto ciò gli consente di discernere i corpi umani dalle informazioni di base. Inoltre, dividono le maschere del corpo in maschere per la parte superiore e inferiore del corpo, in modo che il modulo di attenzione possa imparare a distinguere tra le parti superiori e inferiori del corpo di una persona.

    "Diversamente dalla maggior parte degli attuali metodi di reidentificazione delle persone, che dividono le immagini in diapositive fisse, il nostro modello può dire esattamente dove si trovano la parte superiore e inferiore del corpo, " spiegò Cai. "Inoltre, le maschere per il corpo vengono utilizzate solo nella fase di allenamento, e non abbiamo bisogno di maschere per il corpo nella fase di inferenza, il che rende il nostro modello molto efficiente nelle applicazioni pratiche."

    Per valutare il loro modello, Cai e i suoi colleghi hanno effettuato una serie di esperimenti testandone le prestazioni su due set di dati, vale a dire i set di dati Market-1501 e DukeMTMC-reID. Hanno scoperto che il loro modello può ridurre gli effetti negativi delle variazioni nella posa di una persona, disallineamento e disordine sullo sfondo, superando i metodi di reidentificazione all'avanguardia.

    I risultati raccolti dai ricercatori suggeriscono che i meccanismi di attenzione possono migliorare significativamente l'accuratezza delle reti di reidentificazione delle persone. Inoltre, il loro studio ha introdotto un metodo di addestramento all'attenzione della guida della maschera che può migliorare ulteriormente questa precisione.

    "Nel nostro recente lavoro, le maschere per la parte superiore del corpo e le maschere per la parte inferiore del corpo sono utilizzate per guidare l'allenamento del modulo di attenzione, "Cai ha detto. "In futuro, vorremmo provare a dividere le maschere per il corpo in dettagli più fini come testa, mano, braccio, gamba, eccetera., in quanto ciò potrebbe migliorare ulteriormente l'accuratezza della reidentificazione della persona".

    © 2019 Scienza X Rete




    © Scienza https://it.scienceaq.com