Credito:IBM
Sei mai stato trattato ingiustamente? Come ti ha fatto sentire? Probabilmente non troppo buono. La maggior parte delle persone generalmente concorda sul fatto che un mondo più giusto è un mondo migliore, e i nostri ricercatori di intelligenza artificiale non potrebbero essere più d'accordo. Ecco perché stiamo sfruttando il potere della scienza per creare sistemi di intelligenza artificiale più equi e accurati.
Molti dei nostri recenti progressi nell'intelligenza artificiale hanno prodotto notevoli capacità per i computer di svolgere compiti sempre più sofisticati e importanti, come tradurre il discorso attraverso le lingue per collegare le comunicazioni tra le culture, migliorare le interazioni complesse tra persone e macchine, e il riconoscimento automatico dei contenuti video per assistere nelle applicazioni di sicurezza.
Gran parte della potenza dell'AI oggi deriva dall'uso del deep learning basato sui dati per addestrare modelli sempre più accurati utilizzando quantità crescenti di dati. Però, la forza di queste tecniche può anche essere una debolezza. I sistemi di intelligenza artificiale imparano ciò che gli viene insegnato, e se non vengono insegnati con set di dati robusti e diversificati, l'accuratezza e l'equità potrebbero essere a rischio. Per tale motivo, IBM, insieme agli sviluppatori di intelligenza artificiale e alla comunità di ricerca, dobbiamo essere attenti a quali dati utilizziamo per la formazione. IBM rimane impegnata nello sviluppo di sistemi di intelligenza artificiale per rendere il mondo più equo.
La sfida nella formazione dell'IA si manifesta in modo molto evidente e profondo con la tecnologia di riconoscimento facciale. Oggi, possono esserci difficoltà nel realizzare sistemi di riconoscimento facciale che soddisfino le aspettative di equità. Il cuore del problema non è la tecnologia AI in sé, di per sé, ma con il modo in cui vengono addestrati i sistemi di riconoscimento facciale basati sull'intelligenza artificiale. Affinché i sistemi di riconoscimento facciale funzionino come desiderato e i risultati diventino sempre più accurati, i dati di allenamento devono essere diversi e offrire un'ampia copertura. Per esempio, i set di dati di addestramento devono essere sufficientemente grandi e diversi da consentire alla tecnologia di apprendere tutti i modi in cui i volti differiscono per riconoscere con precisione tali differenze in una varietà di situazioni. Le immagini devono riflettere la distribuzione dei lineamenti nei volti che vediamo nel mondo.
Credito:IBM
Come misuriamo e garantiamo la diversità per i volti umani? Da una parte, sappiamo come i volti differiscano per età, Genere, e il tono della pelle, e come i diversi volti possono variare in alcune di queste dimensioni. Gran parte dell'attenzione sulla tecnologia di riconoscimento facciale è stata su come si comporta all'interno di questi attributi. Ma, come hanno dimostrato studi precedenti, questi attributi sono solo un pezzo del puzzle e non del tutto adeguati per caratterizzare la piena diversità dei volti umani. Dimensioni come la simmetria del viso, contrasto facciale, la posa in cui è il viso, la lunghezza o la larghezza degli attributi del viso (occhi, naso, fronte, ecc.) sono importanti.
Oggi, IBM Research sta rilasciando un nuovo set di dati ampio e diversificato chiamato Diversity in Faces (DiF) per far progredire lo studio dell'equità e dell'accuratezza nella tecnologia di riconoscimento facciale. Il primo del suo genere a disposizione della comunità di ricerca globale, DiF fornisce un set di dati di annotazioni di 1 milione di immagini facciali umane. Utilizzando immagini pubblicamente disponibili dal set di dati YFCC-100M Creative Commons, abbiamo annotato i volti utilizzando 10 schemi di codifica consolidati e indipendenti dalla letteratura scientifica. [1-10] Gli schemi di codifica includono principalmente misure oggettive di volti umani, come le caratteristiche craniofacciali, così come annotazioni più soggettive, come le previsioni di età e sesso etichettate dall'uomo. Riteniamo che estraendo e rilasciando queste annotazioni dello schema di codifica facciale su un ampio set di dati di 1 milione di immagini di volti, accelereremo lo studio della diversità e della copertura dei dati per i sistemi di riconoscimento facciale AI per garantire sistemi AI più equi e accurati. Il rilascio di oggi è semplicemente il primo passo.
Riteniamo che il set di dati DiF e i suoi 10 schemi di codifica offrano un punto di partenza per i ricercatori di tutto il mondo che studiano la tecnologia di riconoscimento facciale. I 10 metodi di codifica facciale includono craniofacciale (ad es. lunghezza della testa, lunghezza del naso, altezza della fronte), rapporti facciali (simmetria), attributi visivi (età, Genere), e posa e risoluzione, tra gli altri. Questi schemi sono tra i più forti individuati dalla letteratura scientifica, costruire una solida base per la nostra conoscenza collettiva.
La nostra analisi iniziale ha dimostrato che il set di dati DiF fornisce una distribuzione più equilibrata e una copertura più ampia delle immagini facciali rispetto ai set di dati precedenti. Per di più, le intuizioni ottenute dall'analisi statistica dei 10 schemi di codifica iniziali sul set di dati DiF hanno approfondito la nostra comprensione di ciò che è importante per caratterizzare i volti umani e ci hanno permesso di continuare importanti ricerche sui modi per migliorare la tecnologia di riconoscimento facciale.
Il set di dati è oggi disponibile su richiesta per la comunità di ricerca globale. IBM è orgogliosa di renderlo disponibile e il nostro obiettivo è quello di aiutare ulteriormente la nostra ricerca collettiva e contribuire alla creazione di sistemi di intelligenza artificiale più equi.
Mentre IBM Research è impegnata a continuare lo studio e l'indagine su sistemi di riconoscimento facciale più equi, non crediamo di potercela fare da soli. Con l'uscita di oggi, esortiamo altri a contribuire al crescente corpo di ricerca ea far avanzare questa importante agenda scientifica.
Per richiedere l'accesso al dataset DiF, visita la nostra pagina web. Per saperne di più su DiF, leggi il nostro giornale, "Diversità nei volti".
Questa storia è stata ripubblicata per gentile concessione di IBM Research. Leggi la storia originale qui.