• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • La tecnologia avanzata può indicare come il cervello apprende i volti

    Mondo reale, immagini non vincolate come queste (a) vengono utilizzate per addestrare le reti di riconoscimento facciale. I test per lo studio sono stati eseguiti su dati di scansione laser altamente controllati che variano in base al punto di vista (b, colonne), illuminazione (b, righe) e forza identitaria caricaturale (c). Credito:Università del Texas a Dallas

    La tecnologia di riconoscimento facciale è progredita rapidamente negli ultimi cinque anni. Mentre i ricercatori dell'Università del Texas a Dallas cercano di determinare in che modo i computer sono diventati bravi quanto le persone nel compito, stanno anche facendo luce su come il cervello umano ordina le informazioni.

    Gli scienziati di UT Dallas hanno analizzato le prestazioni dell'ultimo scaglione di algoritmi di riconoscimento facciale, rivelando il modo sorprendente in cui questi programmi, basati sull'apprendimento automatico, funzionano. Il loro studio, pubblicato online il 12 novembre in Intelligenza della macchina della natura , mostra che questi sofisticati programmi per computer, chiamati reti neurali convoluzionali profonde (DCNN), hanno capito come identificare i volti in modo diverso da quanto previsto dai ricercatori.

    "Negli ultimi 30 anni, le persone hanno supposto che i sistemi visivi basati su computer si sbarazzassero di tutte le informazioni specifiche dell'immagine:angolo, illuminazione, espressione e così via, " ha detto la dottoressa Alice O'Toole, autore senior dello studio e professore di Aage e Margareta Møller presso la School of Behavioral and Brain Sciences. "Anziché, gli algoritmi mantengono tali informazioni mentre rendono l'identità più importante, che è un modo fondamentalmente nuovo di pensare al problema".

    Nell'apprendimento automatico, i computer analizzano grandi quantità di dati per imparare a riconoscere schemi, con l'obiettivo di essere in grado di prendere decisioni con il minimo input umano. O'Toole ha affermato che i progressi compiuti dall'apprendimento automatico per il riconoscimento facciale dal 2014 hanno "cambiato tutto con passi da gigante".

    "Cose che non erano mai possibili prima, che hanno ostacolato la tecnologia di visione artificiale per 30 anni, è diventato non solo fattibile, ma abbastanza facile, " O'Toole ha detto. "Il problema è che nessuno ha capito come funziona."

    Gli algoritmi della generazione precedente erano efficaci nel riconoscere i volti che presentavano solo lievi modifiche rispetto all'immagine che già conoscevano. Tecnologia attuale, però, conosce un'identità abbastanza bene da superare i cambiamenti di espressione, punto di vista o aspetto, come togliere gli occhiali.

    "Questi nuovi algoritmi funzionano più come te e me, " O'Toole ha detto. "Questo è in parte perché hanno accumulato un'enorme quantità di esperienza con variazioni nel modo in cui un'identità può apparire. Ma non è tutto qui".

    Il team di O'Toole ha iniziato a imparare come funzionano gli algoritmi di apprendimento, sia per confermare la fiducia riposta nei loro risultati sia, come ha spiegato l'autore principale Matthew Hill, per far luce su come la corteccia visiva del cervello umano svolge lo stesso compito.

    "La struttura di questo tipo di rete neurale è stata originariamente ispirata dal modo in cui il cervello elabora le informazioni visive, "disse Collina, uno studente di dottorato in cognizione e neuroscienze. "Perché eccelle nel risolvere gli stessi problemi del cervello, può dare un'idea di come il cervello risolve il problema".

    Le origini del tipo di algoritmo di rete neurale che il team ha studiato risalgono al 1980, ma il potere delle reti neurali è cresciuto esponenzialmente più di 30 anni dopo.

    "All'inizio di questo decennio, sono accadute due cose:Internet ha fornito a questo programma milioni di immagini e identità con cui lavorare - quantità incredibili di dati facilmente disponibili - e la potenza di calcolo è cresciuta, affinché, invece di avere due o tre strati di "neuroni" nella rete neurale, puoi avere più di 100 livelli, come fa questo sistema ora, " ha detto O'Toole.

    Nonostante lo scopo previsto dell'algoritmo, la scala dei suoi calcoli, che ammontano almeno a decine di milioni, significa che gli scienziati non sono in grado di capire tutto ciò che fa.

    "Anche se l'algoritmo è stato progettato per modellare il comportamento dei neuroni nel cervello, non possiamo tenere traccia di tutto ciò che è stato fatto tra input e output, " ha detto Connor Parde, un autore del documento e uno studente di dottorato in cognizione e neuroscienze. "Quindi dobbiamo concentrare la nostra ricerca sull'output".

    Per dimostrare le capacità dell'algoritmo, il team ha utilizzato caricature, versioni estreme di un'identità, quale Y. Ivette Colón BS'17, un assistente di ricerca e un altro autore dello studio, descritto come "la versione più 'tu' di te".

    "Le caricature esagerano la tua identità unica rispetto a quella di tutti gli altri, " O'Toole ha detto. "In un certo senso, questo è esattamente ciò che l'algoritmo vuole fare:evidenziare ciò che ti rende diverso da tutti gli altri."

    Con sorpresa dei ricercatori, il DCNN in realtà eccelleva nel collegare le caricature alle loro identità corrispondenti.

    "Date queste immagini distorte con caratteristiche sproporzionate, la rete comprende che queste sono le stesse caratteristiche che rendono distintiva un'identità e collega correttamente la caricatura all'identità, "Ha detto O'Toole. "Vede quell'identità distintiva in modi che nessuno di noi si aspettava."

    Così, quando i sistemi informatici iniziano a eguagliare e, all'occasione, superare:le prestazioni di riconoscimento facciale degli umani, la base dell'algoritmo per l'ordinamento delle informazioni potrebbe assomigliare a ciò che fa il cervello umano?

    Per scoprirlo, è necessaria una migliore comprensione della corteccia visiva umana. Le informazioni più dettagliate disponibili sono tramite immagini ottenute tramite risonanza magnetica funzionale, che può essere utilizzato per visualizzare l'attività del cervello mentre un soggetto sta svolgendo un compito mentale. Hill ha descritto la risonanza magnetica come "troppo rumorosa" per vedere i piccoli dettagli.

    "La risoluzione di una fMRI non è affatto vicina a ciò di cui hai bisogno per vedere cosa sta succedendo con l'attività dei singoli neuroni, " Hill ha detto. "Con queste reti, hai ogni calcolo. Questo ci permette di chiederci:le identità potrebbero essere organizzate in questo modo nelle nostre menti?"

    Il laboratorio di O'Toole affronterà questa domanda in seguito, grazie a una recente sovvenzione di oltre $ 1,5 milioni in quattro anni dal National Eye Institute of the National Institutes of Health.

    "Il NIH ci ha incaricato della domanda biologica:quanto sono rilevanti questi risultati per la percezione visiva umana?" lei disse. "Abbiamo quattro anni di finanziamenti per trovare una risposta".


    © Scienza https://it.scienceaq.com