• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Aiutare i computer a vedere le strutture 3D

    Credito:CC0 Dominio Pubblico

    Se riesci a riconoscere le strutture intorno a te mentre cammini per una strada cittadina, hai gli occhi per ringraziare. Gli esseri umani possono percepire automaticamente la struttura 3D nel mondo identificando linee, forme, simmetrie e i modelli e le relazioni tra di loro in cose come edifici, marciapiedi e oggetti di uso quotidiano. Ma si può insegnare a un computer a fare lo stesso?

    Zihan Zhou, assistente professore di scienze e tecnologia dell'informazione alla Penn State, si propone di esplorare questa domanda grazie a una recente sovvenzione della National Science Foundation.

    "Vogliamo che un computer veda lo spazio 3D come fanno gli umani, " ha detto Zhou. "Questo particolare premio e progetto riguarda la percezione della struttura, che è stato ampiamente ignorato nella visione 3D. Questo è qualcosa che non è stato fatto prima".

    La percezione della struttura è la capacità degli occhi di un essere umano di organizzare dati o schemi e raggrupparli in determinati modi. Per esempio, un essere umano può guardare un disegno a tratteggio di un edificio e visualizzare le porte, finestre e pareti.

    "Ci sono molti tipi di queste relazioni nel mondo reale, e gli umani usano queste relazioni per percepire lo spazio 3-D, " ha detto. "Gli occhi umani possono facilmente percepire questo tipo di cose. La domanda ora è:il computer può avere la capacità di percepire queste cose come fa un essere umano?"

    Per rispondere a questa domanda, Zhou prevede di sviluppare un nuovo framework basato sui dati per la scoperta di strutture, sfruttando la disponibilità di enormi dati visivi e i recenti progressi nelle tecniche di apprendimento automatico.

    Queste tecniche potrebbero quindi essere applicate a un ampio spettro di problemi di visione artificiale del mondo reale, compresa la modellazione 3D di ambienti urbani, realtà virtuale e aumentata, e guida autonoma. La ricerca potrebbe avere un impatto anche sulle scienze cognitive, suggerendo nuovi meccanismi computazionali per la comprensione dell'immagine; e interazione uomo-robot, consentendo ai robot di ragionare in termini di forma geometrica, fisica e dinamica.

    "Se un robot riconosce qualcosa come un tipo specifico di struttura, poi sa come interagire con esso, " disse Zhou. "Per esempio, se un robot è in grado di riconoscere una struttura con la sommità piatta, saprebbe che potrebbe metterci sopra un oggetto come una tazza."

    Inoltre, il quadro può avere un impatto sul lavoro degli architetti, progettisti e ingegneri.

    "Se pensi a quegli architetti, lavorano con modelli 3D ogni giorno, " disse Zhou. "Se costruiscono qualcosa, prima creano disegni al tratto. Quindi, se un computer può capire porte e finestre nei disegni, sarebbe molto utile per la progettazione architettonica e l'ingegneria."

    Zhou ha sviluppato un interesse per questo argomento mentre era uno stagista laureato presso Adobe. Nel suo tirocinio, ha studiato la relazione tra il movimento della macchina da presa e l'ambiente, che potrebbe aiutare l'industria cinematografica ad analizzare le scene.

    "Ho cercato di estrarre alcuni tipi di strutture dai video e dalla sequenza della telecamera, " ha detto. "A quel punto si trattava di analizzare la traiettoria della telecamera per l'industria cinematografica, ma in seguito ci siamo resi conto che era più sistematico".

    Ora, a Penn State, Zhou spera di sfruttare la rete interdisciplinare per far progredire il suo lavoro.

    "IST ha persone che lavorano in diverse aree, e molti di loro possono essere influenzati da questo tipo di lavoro, " ha detto. "Questo ha generato molto interesse in diverse aree. Stiamo cercando di estenderlo oltre e di trovare applicazioni per renderlo più collaborativo".

    "Circa il 70% delle informazioni che otteniamo proviene da segnali visivi dai nostri occhi, " ha concluso. "Ovviamente abbiamo aree come l'elaborazione del linguaggio naturale per aiutare a capire il parlato e i suoni, ma la visione umana è il fattore dominante nel modo in cui comprendiamo questo mondo. Fare in modo che il computer veda il mondo come lo vediamo noi è una delle aree più entusiasmanti dell'intelligenza artificiale e dell'informatica".


    © Scienza https://it.scienceaq.com