Reti neurali insegnate a riconoscere oggetti simili sui video senza degrado della precisione

L'intelligenza artificiale servirà a sviluppare un sistema di controllo della rete che non solo rileva e reagisce ai problemi, ma può anche prevederli ed evitarli. Credito:CC0 Dominio Pubblico

Andrey Savchenko, Professore presso la Higher School of Economics (HSE University), ha sviluppato un metodo che può aiutare a migliorare l'identificazione delle immagini sui video. Nel suo progetto, una rete è stata insegnata da un nuovo algoritmo e ora può prendere decisioni sul riconoscimento e la classificazione delle immagini a una velocità 10 volte più veloce di prima. Questa ricerca è stata presentata nell'articolo "Sequential threeway decision in multi-category image recognition with deep features based on distance factor" pubblicato in Scienze dell'informazione .

Le reti neurali hanno imparato a identificare gli esseri umani e gli animali nei video molto tempo fa. I neuroni artificiali possono imparare ricordando come appare un determinato oggetto in un'immagine. Generalmente, ricercatori prendono un database aperto di foto (ad es. ImageNet, Luoghi, ecc.) e utilizzarlo per insegnare una rete neurale. Per accelerare il processo decisionale, il nostro algoritmo è impostato per selezionare solo alcune delle immagini di esempio, o concentrarsi su un numero limitato di tratti. Possono sorgere complicazioni quando oggetti di classi diverse sono nella stessa foto, e ci sono solo un piccolo numero di esempi di formazione per ogni categoria.

Il nuovo algoritmo ora è in grado di riconoscere le immagini senza un significativo degrado della precisione attraverso l'applicazione di un metodo decisionale sequenziale a tre vie. Utilizzando questo approccio, una rete neurale può analizzare immagini semplici in un modo per oggetti chiaramente riconoscibili, mentre gli oggetti difficili da identificare possono essere oggetto di un esame più dettagliato.

"Ogni foto può essere descritta letteralmente da migliaia di funzioni. Quindi, non avrebbe molto senso confrontare tutte le caratteristiche di una data immagine di input con quelle di un esempio di formazione di base, poiché la maggior parte dei campioni non sarebbe simile all'immagine analizzata. Così, inizialmente abbiamo confrontato solo alcune delle caratteristiche importanti, e metti da parte le istanze di addestramento, che ovviamente non possono essere trattate come soluzioni finali. Di conseguenza, il campione di addestramento diventa più piccolo e rimangono solo pochi esempi. Nella fase successiva, aumenteremmo il numero di funzioni per le immagini rimanenti, e poi ripeti questo processo finché non rimane una sola classe, " ha osservato il prof. Savchenko.

Questo approccio ha ridotto il tempo per il riconoscimento da 1,5 a 10 volte, rispetto ai classificatori regolari e alle note decisioni sequenziali a tre vie multicategoria. Di conseguenza, questa tecnologia potrebbe essere utilizzata in futuro su dispositivi mobili e altri gadget di base.

Apple afferma che i dazi statunitensi sulla Cina si ritorceranno contro

Come il 5G potrebbe democratizzare l'industria delle telecomunicazioni

Elettronica

Esercitazioni militari per robot

Apple Music arriva sui dispositivi Alexa di Amazon

I veicoli elettrici inviano dati in tempo reale al governo cinese

Scienza

I giovani brasiliani in lotta per l'Amazzonia

Amazzonia, Walmart si fa beffe delle tasse, salari

La meta-superficie corregge le aberrazioni cromatiche su tutti i tipi di obiettivi