un, Illustrazione dell'array di fotodiodi ANN. Tutti i subpixel con lo stesso colore sono collegati in parallelo per generare M correnti di uscita. B, Schema circuitale di un singolo pixel nell'array di fotodiodi. C, D, Schemi del classificatore (c) e dell'autoencoder (d). Sotto l'illustrazione dell'autoencoder, mostrato è un esempio di codifica/decodifica di una lettera di 28 × 28 pixel dal database di cifre scritte a mano MNIST. L'immagine originale è codificata in 9 neuroni del livello di codice e quindi decodificata nuovamente in un'immagine. Credito: Natura (2020). DOI:10.1038/s41586-020-2038-x
Applicando l'elaborazione in-sensor di dati analogici, un team di ricercatori dell'Istituto di fotonica dell'Università di tecnologia di Vienna ha sviluppato un modo per accelerare la visione artificiale. Nel loro articolo pubblicato sulla rivista Natura , il gruppo descrive il loro design e come si è comportato durante i test. Yang Chai con la Hong Kong Polytechnic University ha pubblicato un articolo su News &Views nello stesso numero della rivista che descrive il lavoro del team.
Con la tecnologia attuale, la visione artificiale viene eseguita utilizzando un sistema di base che prevede un dispositivo con un sensore di immagine che risponde alla luce. I dati dal sensore di immagine vengono convertiti da un segnale analogico a un segnale digitale con un altro dispositivo. I dati digitali vengono poi elaborati da un ulteriore dispositivo, in locale o nel cloud. Questo sistema funziona ragionevolmente bene per le applicazioni attuali, ma non sarà adatto a quelli in futuro a causa del ritardo nella lettura e nell'elaborazione di enormi quantità di dati di immagine. In questo nuovo sforzo, i ricercatori hanno proposto un nuovo tipo di sensore di immagine in grado di elaborare i dati analogici in misura limitata.
Il sensore di immagine previsto dal team in Austria consiste nell'incorporare trii di fotodiodi su un chip in modo da aumentare o diminuire la loro sensibilità alla luce utilizzando una tensione applicata, una configurazione che consente di sintonizzare o pesare individualmente ciascun diodo. In una tale configurazione, i diodi agiscono in modo simile ai nervi dell'occhio umano. Quando le immagini vengono presentate al dispositivo, tutti i diodi reagiscono in base alla loro sintonizzazione:insieme, fungono da processore di visione di rete. Quando la luce arriva al sensore, viene elaborato sommando l'intensità della luce da ciascuna delle colonne e righe che compongono l'array di sensori. L'array di diodi viene quindi addestrato per un'attività modificando ogni membro individualmente in base a un risultato desiderato. La fase di apprendimento iniziale richiede un breve lasso di tempo, ma una volta che la rete è stata addestrata, l'elaborazione avviene ad una velocità pari al tempo di reazione dei fotodiodi.
Il dispositivo immaginato dai ricercatori non aveva lo scopo di produrre immagini. Anziché, filtra i dati non necessari ed esegue un ordinamento iniziale. Per provarlo, i ricercatori hanno insegnato al loro dispositivo a ordinare tre lettere semplificate. Lo hanno anche usato per eseguire una codifica automatica di base basata sulle caratteristiche chiave di una determinata immagine. Notano che il loro design e il loro dispositivo sono ancora in fase di proof-of-concept, ma dicono che i loro risultati finora sono incoraggianti.
© 2020 Scienza X Rete