I ricercatori hanno registrato suoni simili a colpi di arma da fuoco in luoghi in cui c'era la probabilità che venissero sparati armi, incluso un parco all'aperto. Credito:Florida Atlantic University
Secondo il Gun Violence Archive, ci sono state 296 sparatorie di massa negli Stati Uniti quest'anno. Purtroppo, il 2021 è destinato a diventare l'anno più mortale di violenza armata in America negli ultimi due decenni.
Discernere tra un evento audio pericoloso come lo sparo di una pistola e un evento non pericoloso per la vita, come lo scoppio di un sacchetto di plastica, può fare la differenza tra la vita e la morte. Inoltre, può anche determinare se schierare o meno operatori di pubblica sicurezza. Gli esseri umani, così come i computer, spesso confondono i suoni di un sacchetto di plastica che scoppia con i suoni di spari reali.
Negli ultimi anni, c'è stata una certa esitazione sull'implementazione di alcuni dei noti sistemi acustici di rilevamento di colpi di arma da fuoco disponibili poiché possono essere costosi e spesso inaffidabili.
In uno studio sperimentale, i ricercatori del College of Engineering and Computer Study della Florida Atlantic University si sono concentrati sull'affrontare l'affidabilità di questi sistemi di rilevamento in relazione al tasso di falsi positivi. La capacità di un modello di discernere correttamente i suoni, anche negli scenari più sottili, differenzierà un modello ben addestrato da uno poco efficiente.
Con l'arduo compito di tenere conto di tutti i suoni simili a quelli di uno sparo, i ricercatori hanno creato un nuovo set di dati composto da registrazioni audio di esplosioni di sacchetti di plastica raccolte in una varietà di ambienti e condizioni, come le dimensioni del sacchetto di plastica e la distanza dalla registrazione microfoni. Le registrazioni dei clip audio avevano una durata compresa tra 400 e 600 millisecondi.
I ricercatori hanno anche sviluppato un algoritmo di classificazione basato su una rete neurale convoluzionale (CNN), come riferimento, per illustrare l'importanza di questo sforzo di raccolta dei dati. I dati sono stati quindi utilizzati, insieme a un set di dati sui suoni di arma da fuoco, per addestrare un modello di classificazione basato su una CNN per differenziare eventi di arma da fuoco pericolosi per la vita da eventi di esplosione di sacchetti di plastica non pericolosi per la vita.
I ricercatori hanno utilizzato una camera anecoica come uno degli ambienti, che fornisce campioni "puri" indisturbati che a loro volta hanno aggiunto molte informazioni alla CNN, rendendo il modello più robusto. Credito:Florida Atlantic University
I risultati dello studio, pubblicati sulla rivista Sensors, dimostrano come i falsi suoni di sparo possono facilmente confondere un sistema di rilevamento del suono di sparo. Il settantacinque percento dei suoni pop dei sacchetti di plastica sono stati classificati erroneamente come suoni di spari. Il modello di classificazione basato sull'apprendimento profondo addestrato con un popolare set di dati di suoni urbani contenente suoni di arma da fuoco non è stato in grado di distinguere i suoni pop dei sacchetti di plastica dai suoni di arma da fuoco. Tuttavia, una volta che i suoni pop del sacchetto di plastica sono stati iniettati nell'addestramento del modello, i ricercatori hanno scoperto che il modello di classificazione della CNN si comportava bene nel distinguere i suoni reali degli spari dai suoni del sacchetto di plastica.
"Come esseri umani, utilizziamo input sensoriali aggiuntivi ed esperienze passate per identificare i suoni. I computer, d'altra parte, sono addestrati a decifrare informazioni che sono spesso irrilevanti o impercettibili per le orecchie umane", ha affermato Hanqi Zhuang, Ph.D., autore senior , professore e cattedra, Dipartimento di Ingegneria Elettrica e Informatica, College of Engineering and Computer Science. "Simile al modo in cui i pipistrelli si aggirano intorno agli oggetti mentre trasmettono onde sonore acute che rimbalzano su di loro a intervalli di tempo diversi, abbiamo utilizzato ambienti diversi per dare all'algoritmo di apprendimento automatico un migliore senso di percezione della differenziazione dei suoni strettamente correlati. "
Per lo studio, sono stati registrati suoni simili a colpi di arma da fuoco in luoghi in cui c'era la probabilità che venissero sparati armi, che includevano un totale di otto luoghi interni ed esterni. Il processo di raccolta dati è iniziato con la sperimentazione di diverse tipologie di sacchi, con i cestini per i rifiuti selezionati come i più idonei. La maggior parte delle clip audio è stata catturata utilizzando sei dispositivi di registrazione. Per verificare fino a che punto un modello di classificazione del suono potrebbe essere confuso da falsi colpi di pistola, i ricercatori hanno addestrato il modello senza esporlo ai suoni di scoppi di sacchetti di plastica.
C'erano 374 campioni di arma da fuoco inizialmente utilizzati per addestrare il modello, che sono stati ottenuti dal database del suono urbano. I ricercatori hanno utilizzato 10 classi dal database (colpo di pistola, cane che abbaia, bambini che giocano, clacson, aria condizionata, musica di strada, sirena, motore al minimo, martello pneumatico e perforazione). Dopo l'allenamento, il modello è stato quindi utilizzato per testare la sua capacità di rifiutare i suoni dei sacchetti di plastica come veri e propri suoni di sparo.
"L'elevata percentuale di errata classificazione indica che è molto difficile per un modello di classificazione discernere suoni simili a colpi di arma da fuoco come quelli dei suoni pop di sacchetti di plastica e suoni di spari reali", ha affermato Rajesh Baliram Singh, primo autore e Ph.D. studente presso il Dipartimento di Ingegneria Elettrica e Informatica della FAU. "Questo garantisce il processo di sviluppo di un set di dati contenente suoni simili ai veri suoni di spari".
Nel rilevamento degli spari, avere un database di un suono particolare che può essere confuso con il suono degli spari ma è ricco di diversità può portare a un sistema di rilevamento degli spari più efficace. Questo concetto ha motivato i ricercatori a creare un database di suoni di esplosione di sacchetti di plastica. Maggiore è la diversità dello stesso suono, maggiore è la probabilità che l'algoritmo di apprendimento automatico rilevi correttamente quel suono specifico.
"Il miglioramento delle prestazioni di un algoritmo di rilevamento di colpi di arma da fuoco, in particolare per ridurre il suo tasso di falsi positivi, ridurrà le possibilità di trattare eventi di innesco audio innocuo come eventi audio pericolosi che coinvolgono armi da fuoco", ha affermato Stella Batalama, Ph.D., preside del College di Ingegneria e Informatica. "Questo set di dati sviluppato dai nostri ricercatori, insieme al modello di classificazione che hanno addestrato per i suoni di arma da fuoco e simili a colpi di arma da fuoco, è un passo importante che porta a molti meno falsi positivi e al miglioramento della sicurezza pubblica generale schierando personale critico solo quando necessario".