I ricercatori del MIT Media Lab hanno sviluppato una nuova tecnica che rende l'acquisizione delle immagini utilizzando il rilevamento compresso 50 volte più efficiente. Nel caso della fotocamera a pixel singolo, potrebbe ridurre il numero di esposizioni da migliaia a dozzine. Esempi di questa tecnica di imaging ultraveloce a compressione sono mostrati nelle righe inferiori. Credito:Massachusetts Institute of Technology
Il rilevamento compresso è una nuova entusiasmante tecnica computazionale per estrarre grandi quantità di informazioni da un segnale. In una dimostrazione di alto profilo, ad esempio, i ricercatori della Rice University hanno costruito una fotocamera in grado di produrre immagini 2-D utilizzando solo un singolo sensore di luce anziché i milioni di sensori di luce presenti in una fotocamera comune.
Ma l'uso del rilevamento compresso per l'acquisizione delle immagini è inefficiente:quella "fotocamera a pixel singolo" aveva bisogno di migliaia di esposizioni per produrre un'immagine ragionevolmente chiara. Riportare i loro risultati sulla rivista Transazioni IEEE su imaging computazionale , i ricercatori del MIT Media Lab ora descrivono una nuova tecnica che rende l'acquisizione di immagini utilizzando il rilevamento compresso 50 volte più efficiente. Nel caso della fotocamera a pixel singolo, potrebbe ridurre il numero di esposizioni da migliaia a dozzine.
Un aspetto interessante dei sistemi di imaging a rilevamento compresso è che, a differenza delle fotocamere convenzionali, non richiedono lenti. Ciò potrebbe renderli utili in ambienti difficili o in applicazioni che utilizzano lunghezze d'onda della luce al di fuori dello spettro visibile. L'eliminazione dell'obiettivo apre nuove prospettive per la progettazione di sistemi di imaging.
"In precedenza, l'imaging richiedeva una lente, e l'obiettivo mapperebbe i pixel nello spazio sui sensori in una matrice, con tutto esattamente strutturato e progettato, "dice Guy Satat, uno studente laureato al Media Lab e primo autore del nuovo articolo. "Con l'imaging computazionale, abbiamo cominciato a chiederci:è necessaria una lente? Il sensore deve essere un array strutturato? Quanti pixel deve avere il sensore? È sufficiente un singolo pixel? Queste domande essenzialmente abbattono l'idea fondamentale di cosa sia una fotocamera. Il fatto che sia richiesto solo un singolo pixel e non sia più necessaria una lente riduce i principali vincoli di progettazione, e consente lo sviluppo di nuovi sistemi di imaging. L'utilizzo del rilevamento ultraveloce rende la misurazione significativamente più efficiente."
Applicazioni ricorsive
Uno dei coautori di Satat sul nuovo articolo è il suo relatore di tesi, professore associato di arti e scienze dei media Ramesh Raskar. Come molti progetti del gruppo di Raskar, la nuova tecnica di rilevamento della compressione dipende dall'imaging a tempo di volo, in cui un breve lampo di luce viene proiettato in una scena, e i sensori ultraveloci misurano quanto tempo impiega la luce a riflettersi.
La tecnica utilizza l'imaging a tempo di volo, ma un po' circolarmente, una delle sue potenziali applicazioni è il miglioramento delle prestazioni delle telecamere a tempo di volo. Potrebbe quindi avere implicazioni per una serie di altri progetti del gruppo di Raskar, come una telecamera in grado di vedere dietro gli angoli e sistemi di imaging a luce visibile per la diagnosi medica e la navigazione veicolare.
Molti sistemi prototipo del gruppo Camera Culture di Raskar presso il Media Lab hanno utilizzato telecamere time-of-flight chiamate telecamere streak, che sono costosi e difficili da usare:catturano solo una riga di pixel dell'immagine alla volta. Ma gli ultimi anni hanno visto l'avvento di telecamere commerciali per il tempo di volo chiamate SPAD, per diodi a valanga a fotone singolo.
Anche se non così veloce come le telecamere streak, Gli SPAD sono ancora abbastanza veloci per molte applicazioni time-of-flight, e possono catturare un'immagine 2D completa in una singola esposizione. Per di più, i loro sensori sono costruiti utilizzando tecniche di produzione comuni nell'industria dei chip per computer, quindi dovrebbero essere convenienti per la produzione di massa.
Con SPAD, l'elettronica necessaria per pilotare ogni pixel del sensore occupa così tanto spazio che i pixel finiscono molto distanti l'uno dall'altro sul chip del sensore. In una fotocamera convenzionale, questo limita la risoluzione. Ma con il rilevamento compresso, anzi lo aumenta.
Ottenere una certa distanza
Il motivo per cui la fotocamera a pixel singolo può accontentarsi di un sensore di luce è che la luce che la colpisce è modellata. Un modo per modellare la luce è mettere un filtro, una specie di scacchiera casuale in bianco e nero, davanti al flash che illumina la scena. Un altro modo è far rimbalzare la luce di ritorno su una serie di minuscoli microspecchi, alcuni dei quali sono mirati al sensore di luce e altri no.
Il sensore effettua una sola misurazione:l'intensità cumulativa della luce in ingresso. Ma se ripete la misurazione abbastanza volte, e se la luce ha ogni volta uno schema diverso, il software può dedurre le intensità della luce riflessa dai singoli punti della scena.
La fotocamera a pixel singolo è stata una dimostrazione adatta ai media, ma infatti, il rilevamento compresso funziona meglio quanto più pixel ha il sensore. E più distanti sono i pixel, minore è la ridondanza nelle misurazioni che effettuano, in modo molto simile a come vedi di più la scena visiva davanti a te se fai due passi alla tua destra anziché uno. E, Certo, più misurazioni esegue il sensore, maggiore è la risoluzione dell'immagine ricostruita.
Economie di scala
L'imaging del tempo di volo trasforma essenzialmente una misurazione, con un modello di luce, in dozzine di misurazioni, separati da trilionesimi di secondo. Inoltre, ogni misurazione corrisponde solo a un sottoinsieme di pixel nell'immagine finale, quelli che raffigurano oggetti alla stessa distanza. Ciò significa che ci sono meno informazioni da decodificare in ogni misurazione.
Nella loro carta, Seduto al, Raskar, e Matteo Tancik, uno studente laureato del MIT in ingegneria elettrica e informatica, presentare un'analisi teorica del rilevamento compresso che utilizza le informazioni sul tempo di volo. La loro analisi mostra quanto efficacemente la tecnica possa estrarre informazioni su una scena visiva, a diverse risoluzioni e con diverso numero di sensori e distanze tra loro.
Descrivono anche una procedura per calcolare i modelli di luce che riduce al minimo il numero di esposizioni. E, utilizzando dati sintetici, confrontano le prestazioni del loro algoritmo di ricostruzione con quelle degli algoritmi di rilevamento compresso esistenti. Ma nel lavoro in corso, stanno sviluppando un prototipo del sistema in modo che possano testare il loro algoritmo su dati reali.