Un'illustrazione dell'architettura DeepCrack proposta. In questa architettura, non ci sono strati completamente collegati, gli strati di uscita laterale sono inseriti dopo gli strati convoluzionali, viene applicata una supervisione approfondita a ciascun livello di uscita laterale e quindi tutti sono concatenati per formare un'uscita fusa finale. In questo modo, lo strato di output finale acquisisce caratteristiche multiscala e multilivello man mano che la dimensione del piano dell'input degli strati di output laterale diventa più piccola e la dimensione del campo recettivo diventa più grande. La previsione fusa viene affinata mediante filtraggio guidato con il primo strato di uscita laterale. Credito:Liu et al.
Rilevare e analizzare le crepe nelle strutture artificiali è un compito importante che può aiutare a garantire che gli edifici siano sicuri e ben mantenuti. Poiché impiegare lavoratori umani per ispezionare regolarmente gli edifici può essere molto costoso, i ricercatori hanno cercato di sviluppare strumenti in grado di rilevare automaticamente le crepe.
Ricercatori del laboratorio di visione artificiale e telerilevamento (CVRS) dell'Università di Wuhan, in Cina, hanno sviluppato una nuova rete neurale convoluzionale gerarchica profonda (CNN) per prevedere la segmentazione delle crepe pixel-wise. Il loro approccio, chiamato DeepCrack, è delineato in un articolo recentemente pubblicato in Neuroinformatica .
"Proponiamo una rete neurale convoluzionale gerarchica profonda (CNN) chiamata DeepCrack per prevedere la segmentazione delle crepe pixel-wise in un metodo end-to-end, " hanno scritto i ricercatori nel loro articolo. "Durante l'allenamento, il modello elaborato apprende e aggrega caratteristiche multiscala e multilivello dagli strati convoluzionali bassi agli strati convoluzionali di alto livello, che è diverso dagli approcci standard di utilizzare solo l'ultimo strato convoluzionale."
Il rilevamento di crepe nelle immagini naturali richiede in genere diversi "livelli" di elaborazione visiva. Perciò, la progettazione di un metodo universale in grado di rilevare le crepe in una varietà di scene si è finora rivelata piuttosto impegnativa.
Gli studi precedenti hanno introdotto numerosi metodi di visione artificiale per il rilevamento di crepe, che possono essere raggruppati in due grandi categorie:approcci basati su funzionalità locali e approcci basati su funzionalità globali. I metodi basati sulle caratteristiche locali funzionano sfruttando le caratteristiche locali come l'intensità, pendenza, varianza locale e anisotropia della tessitura locale, mentre i metodi basati sulle caratteristiche globali estraggono le curve di fessura in una vista complessiva dell'edificio tramite la programmazione dinamica, ottimizzare le funzioni target in base a criteri specifici. Nonostante i promettenti risultati ottenuti da alcuni di questi metodi, non sempre affrontano bene il rumore causato dalle macchie, macchie, scarsa illuminazione, sfocatura e altri fattori.
Studi recenti hanno scoperto che le reti neurali convoluzionali (CNN) possono raggiungere prestazioni all'avanguardia in una varietà di attività avanzate di visione artificiale, compreso il riconoscimento delle immagini, rilevamento di oggetti e segmentazione semantica. Le CNN possono aggregare più livelli visivi, quindi potrebbe essere particolarmente efficace per il rilevamento e la segmentazione delle crepe.
Il team di ricercatori dell'Università di Wuhan ha proposto un nuovo metodo di segmentazione delle crepe basato sulle CNN, che può apprendere efficacemente le caratteristiche gerarchiche delle crepe in più scene e su scale diverse. Per perfezionare la previsione delle loro CNN, i ricercatori hanno utilizzato tecniche di filtraggio guidato (GF) e di campi casuali condizionali (CRF).
DeepCrack, il nuovo approccio introdotto dai ricercatori, consiste di reti completamente convoluzionali estese (FCN) e reti a supervisione profonda (DSN). Il componente DSN del loro modello fornisce la supervisione diretta per l'apprendimento delle funzionalità multilivello, facilitando l'apprendimento delle caratteristiche di ogni strato convoluzionale.
Nel loro studio, i ricercatori hanno anche introdotto un set di dati di benchmark pubblico con immagini annotate manualmente di crepe, che può essere utilizzato per valutare i sistemi di rilevamento delle crepe. Inoltre, hanno stabilito metriche complete per valutare i sistemi di rilevamento delle crepe, come i test di segmentazione semantica, una curva di richiamo di precisione e una curva caratteristica operativa del ricevitore (ROC).
I ricercatori hanno valutato DeepCrack e lo hanno confrontato con altri approcci per la segmentazione delle crepe, utilizzando il set di dati e le metriche da loro ideate. In queste valutazioni, il loro metodo eseguito così come altre tecniche all'avanguardia. Ora stanno progettando di sviluppare ulteriormente il loro metodo, aggiungendo anche più immagini di regioni di false crepe al loro set di dati di riferimento, per renderlo più completo.
© 2019 Science X Network