Previsione dell'accuratezza di una rete neurale prima dell'allenamento

Credito:CC0 Dominio pubblico

La costruzione di un modello di rete neurale per ogni nuovo set di dati è l'incubo definitivo per ogni scienziato di dati. E se potessi prevedere prima l'accuratezza della rete neurale grazie all'esperienza accumulata e all'approssimazione? Questo era l'obiettivo di un recente progetto presso IBM Research e il risultato è TAPAS o Train-less Accuracy Predictor for Architecture Search (clicca per la demo). Il suo trucco è che può stimare, in frazioni di secondo, prestazioni di classificazione per set di dati di input non visti, senza formazione per la classificazione di immagini e testi.

Contrariamente agli approcci proposti in precedenza, TAPAS non è solo calibrato sulle informazioni della rete topologica, ma anche sulla caratterizzazione della difficoltà del dataset, che ci permette di risintonizzare il pronostico senza alcun addestramento.

Questo compito è stato particolarmente impegnativo a causa dell'eterogeneità dei set di dati utilizzati per l'addestramento delle reti neurali. Possono avere classi completamente diverse, strutture, e dimensioni, aggiungendo alla complessità di venire con un'approssimazione. Quando io e i miei colleghi abbiamo pensato a come affrontare questo problema, abbiamo cercato di non pensare a questo come un problema per un computer, ma invece di pensare a come un umano avrebbe previsto l'accuratezza.

Abbiamo capito che se chiedessi a un essere umano con una certa conoscenza del deep learning se una rete sarebbe buona o cattiva, quella persona avrebbe naturalmente un'intuizione al riguardo. Per esempio, riconosceremmo che due tipi di strati non si mescolano, o che dopo un tipo di strato, ce n'è sempre un altro che segue e migliora la precisione. Quindi abbiamo considerato se l'aggiunta di funzionalità simili a queste intuizioni umane in un computer potesse aiutarlo a fare un lavoro ancora migliore. E avevamo ragione.

Credito:IBM

Abbiamo testato TAPAS su due set di dati eseguiti in 400 secondi su una singola GPU, e le nostre reti più scoperte hanno raggiunto una precisione del 93,67% per CIFAR-10 e dell'81,01% per CIFAR-100, verificato dalla formazione. Queste reti funzionano in modo competitivo con altre reti all'avanguardia scoperte automaticamente, ma aveva bisogno solo di una piccola frazione del tempo per la soluzione e le risorse computazionali. Il nostro predittore raggiunge prestazioni che superano le 100 reti al secondo su una singola GPU, creando così l'opportunità di eseguire ricerche di architetture su larga scala in pochi minuti. Crediamo che questo sia il primo strumento in grado di fare previsioni basate su dati non visti.

TAPAS è uno dei motori di intelligenza artificiale nella nuova capacità rivoluzionaria di IBM chiamata NeuNetS come parte di AI OpenScale, che può sintetizzare reti neurali personalizzate sia in domini di testo che di immagini.

In NeuNetS, gli utenti caricheranno i propri dati su IBM Cloud e quindi TAPAS può analizzare i dati e valutarli su una scala da 0 a 1 in termini di complessità dell'attività, 0 significa difficile e 1 è semplice. Successivamente TAPAS inizia a raccogliere conoscenze dalla sua libreria di riferimento alla ricerca di set di dati simili basati su ciò che l'utente ha caricato. Allora in base a questo, TAPAS può prevedere con precisione come si comporterà una nuova rete sul nuovo set di dati, molto simile a come lo determinerebbe un essere umano.

La domanda odierna di competenze di data science supera già l'offerta attuale, diventando un vero ostacolo all'adozione dell'IA nell'industria e nella società. TAPAS è una tappa fondamentale verso la demolizione di questo muro. IBM e il Laboratorio di ricerca di Zurigo stanno lavorando per rendere le tecnologie AI facili da usare, come pochi clic del mouse. Ciò consentirà agli utenti non esperti di creare e distribuire modelli di intelligenza artificiale in una frazione del tempo necessario oggi e senza sacrificare la precisione. Inoltre, questi strumenti impareranno gradualmente sull'utilizzo in domini specializzati e miglioreranno automaticamente nel tempo, sempre meglio.

Questa storia è stata ripubblicata per gentile concessione di IBM Research. Leggi la storia originale qui.

Nessuna prova di spionaggio Huawei, dice il cane da guardia IT tedesco

Progetto fantasma:lo studente 3D stampa il primo essere umano completo per la ricerca sulla radioterapia

Elettronica