"Vedere" attraverso gli occhi dei robot. Credito:Shutterstock/Trifonenko Ivan
Vision è una delle incredibili creazioni della natura che è stata con noi per centinaia di milioni di anni. È un senso chiave per gli umani, ma che spesso diamo per scontato:cioè, finché non iniziamo a perderlo o non proviamo a ricrearlo per un robot.
Molti laboratori di ricerca (compreso il nostro) hanno modellato aspetti dei sistemi di visione presenti negli animali e negli insetti per decenni. Attingiamo molto a studi come quelli fatti sulle formiche, nelle api e persino nei roditori.
Per modellare un sistema biologico e renderlo utile per i robot, in genere è necessario comprendere entrambi i comportamentale e neurale base di quel sistema di visione.
La componente comportamentale è ciò che osservi fare l'animale e come questo comportamento cambia quando si scherza con ciò che può vedere, ad esempio provando diverse configurazioni di punti di riferimento. I componenti neurali sono i circuiti nel cervello dell'animale alla base dell'apprendimento visivo per i compiti, come la navigazione.
Riconoscere i volti
Il riconoscimento è un processo visivo fondamentale per tutti gli animali e i robot. È la capacità di riconoscere le persone familiari, animali, oggetti e punti di riferimento nel mondo.
Per la sua importanza, il riconoscimento facciale viene in parte "incorporato" a sistemi naturali come un bambino. Siamo in grado di riconoscere i volti abbastanza presto.
Lungo quelle linee, alcuni sistemi di riconoscimento facciale artificiale si basano su come si pensa che funzionino i sistemi biologici. Per esempio, i ricercatori hanno creato serie di reti neurali che imitano diversi livelli della gerarchia di elaborazione visiva nei primati per creare un sistema in grado di riconoscere i volti.
Riconoscere visivamente un luogo è semplice... fino a quando l'aspetto di quel luogo non cambia drasticamente. Credito:Michael Milford
Riconoscere i luoghi
Il riconoscimento visivo del luogo è un processo importante per tutto ciò che si muove nel mondo.
Il riconoscimento del luogo è il processo mediante il quale un robot o un animale guarda il mondo che lo circonda ed è in grado di riconciliare ciò che sta attualmente vedendo con qualche ricordo passato di un luogo, o nel caso degli esseri umani, una descrizione o un'aspettativa di quel luogo.
Prima dell'avvento della navigazione GPS, potremmo aver ricevuto istruzioni come "guida finché non vedi la chiesa sulla sinistra e prendi la prossima svolta a destra". Sappiamo che aspetto ha una chiesa tipica e quindi possiamo riconoscerne una quando la vediamo.
Questo riconoscimento del luogo può sembrare un compito facile, fino a quando non si incontrano sfide come il cambiamento dell'aspetto, ad esempio il cambiamento dell'aspetto causato dai cicli giorno-notte o da condizioni meteorologiche avverse.
Un'altra sfida nel riconoscere visivamente un luogo è cambio di punto di vista :cambia l'aspetto di un luogo se lo guardi da una prospettiva diversa.
Visto da punti di vista opposti, lo stesso posto appare molto diverso. Credito:neyro2008 / Alexander Zelnitskiy / Maxim Popov / 123rf.com / 1 anno, 1, 000 km:il set di dati di Oxford RobotCar
Un esempio estremo di ciò si incontra quando si ripercorre per la prima volta un percorso lungo una strada:si sta incontrando tutto nell'ambiente dal punto di vista opposto.
La creazione di un sistema robotico in grado di riconoscere questo luogo nonostante queste sfide richiede che il sistema di visione abbia una comprensione più profonda di ciò che è nell'ambiente circostante.
Capacità di rilevamento
L'hardware di rilevamento visivo è progredito rapidamente negli ultimi dieci anni, in parte guidato dalla proliferazione di fotocamere ad alta capacità negli smartphone. Le fotocamere moderne ora stanno eguagliando o superando anche i più capaci sistemi di visione naturale, almeno in certi aspetti.
Per esempio, una fotocamera consumer può ora vedere così come un occhio umano regolato al buio.
Le nuove fotocamere per smartphone possono anche registrare video a 1, 000 fotogrammi al secondo, consentendo il potenziale per i sistemi di visione robotica che operano a una frequenza più elevata rispetto a un sistema di visione umana.
Il rilevamento della visione robotica specializzato come il sensore di visione dinamico (DVS) è ancora più veloce ma segnala solo il modificare nella luminosità di un pixel, piuttosto che il suo colore assoluto. Puoi vedere la differenza qui in una passeggiata per Hyde Park a Londra:
Non tutte le telecamere robot devono essere come le telecamere convenzionali:i robotisti usano telecamere specializzate basate su come animali come le formiche vedono il mondo.
Risoluzione richiesta?
Una delle domande fondamentali in tutta la ricerca basata sulla visione per robot e animali è quale risoluzione visiva (o acuità visiva) è necessaria per "portare a termine il lavoro".
Per molti insetti e animali come i roditori, a relatively low visual resolution is all they have access to—equivalent to a camera with a few thousand pixels in many cases (compared with a modern smartphone which has camera resolutions ranging from 8 Megapixels to 40 Megapixels).
The required resolution varies greatly depending on the task—for some navigation tasks, only a few pixels are required for both animals such as ants and bees and robots.
But for more complex tasks—such as self-driving cars—much higher camera resolutions are likely to be required.
If cars are ever to reliably recognise and predict what a human pedestrian is doing, or intending to do, they will likely require high resolution visual sensing systems that can pick up subtle facial expressions and body movement.
A tension between bio-inspiration and pragmatism
For roboticists looking to nature for inspiration, there is a constant tension between mimicking biology and capitalising on the constant advances in camera technology.
While biological vision systems were clearly superior to cameras in the past, constant rapid advancement in technology has resulted in cameras with superior sensing capabilities to natural systems in many instances. It's only sensible that these practical capabilities should be exploited in the pursuit of creating high performance and safe robots and autonomous vehicles.
But biology will still play a key role in inspiring roboticists. The natural kingdom is superb at making highly capable vision systems that consume minimal space, computational and power resources, all key challenges for most robotic systems.
Bees navigate effectively using a relatively low resolution visual sensing capability. Credit:Bogdan Mircea Hoda / 123rf.com
Questo articolo è stato originariamente pubblicato su The Conversation. Leggi l'articolo originale.