Credito:CC0 Dominio pubblico
L'intelligenza artificiale viene sempre più utilizzata per aiutare gli operatori umani a gestire enormi quantità di immagini da CCTV e altre fonti di sicurezza. La reidentificazione della persona (ReID) è un metodo in cui un'intelligenza artificiale è in grado di riconoscere le immagini della stessa persona scattate da fotocamere diverse o in occasioni diverse. Questo aiuta a tracciare i sospetti attraverso una rete CCTV che copre un ampio spazio pubblico, come una rete sotterranea. ReID è una sfida per le macchine in quanto devono considerare e differenziare la stessa persona sotto diverse fonti di luce, pose e cambiamenti nell'aspetto come i loro vestiti.
In un documento che sarà presentato alla Conferenza Internazionale sulla Computer Vision di quest'anno a Seoul, Corea del Sud, la più prestigiosa conferenza di visual AI, esperti del Centro per la visione del Surrey, Speech and Signal Processing (CVSSP) spiega in dettaglio come hanno sviluppato un sistema unico chiamato OSNet che ha superato molti sistemi di identificazione popolari già in uso.
Il team CVSSP ha dimostrato che OSNet è in grado di approfondire le informazioni da una varietà di scale spaziali per aiutare a fare una reidentificazione accurata, dai più piccoli dettagli come il logo su una t-shirt ad altri, fattori più ampi come il tipo di cappotto indossato dal sospettato.
Incredibilmente, OSNet richiede solo 2,2 milioni di parametri, un numero molto piccolo nel contesto di modelli di reti neurali profonde, per superare molti dei suoi concorrenti basati sulla popolare infrastruttura ResNet50 che utilizza 24 milioni di parametri, suggerendo che OSNet potrebbe diventare lo standard nella tecnologia di riconoscimento visivo. Una dimensione del parametro così piccola significa che il modello può essere distribuito "sul bordo, " il che significa che il pesante sollevamento computazionale può essere eseguito sulla telecamera stessa piuttosto che in un data center remoto, risparmio di larghezza di banda per la trasmissione di grandi quantità di dati video dalle telecamere ai server di dati.
Tao Xiang, Distinguished Professor di Computer Vision e Machine Learning presso CVSSP, ha detto:"Con OSNet, abbiamo deciso di sviluppare uno strumento in grado di superare molti dei problemi di reidentificazione della persona che devono affrontare altri set-up, ma i risultati hanno superato di gran lunga le nostre aspettative. La precisione ReID raggiunta da OSNet ha chiaramente superato quella degli operatori umani.
"OSNet non solo dimostra di essere in grado di superare le sue controparti su molti problemi di reidentificazione, ma i risultati sono tali che riteniamo che possa essere utilizzata come tecnologia di riconoscimento visivo a sé stante".
Professor Adrian Hilton, Direttore del CVSSP, ha dichiarato:"Questo è un risultato considerevole del Prof Xiang e del suo team nel raggiungimento di una tecnologia di reidentificazione leader a livello mondiale. Il loro lavoro su OSNet ha il potenziale per essere innovativo e potrebbe aiutare a plasmare il campo del riconoscimento visivo per gli anni a venire. Questo è un ottimo esempio di AI e Machine Perception a beneficio della società che fornisce tecnologie abilitanti per spazi pubblici più sicuri."