Dai dati (punti) dati al robot scientifico, è in grado di trovare la legge che meglio li descrive (superficie blu) e la loro esatta espressione matematica. Credito:URV
Ora è possibile prevedere chi sia il miglior candidato per ricevere un trapianto d'organo, sapere se i clienti di una banca restituiranno i prestiti richiesti, scegliere i film che meglio coincidono con gli interessi dei consumatori, o anche selezionare il partner ideale di qualcuno. Gli algoritmi matematici analizzano costantemente milioni di elementi di dati, identificare modelli e fare previsioni su tutte le aree della vita. Ma nella maggior parte dei casi, i risultati danno poco più di una previsione chiusa che non può essere interpretata e che è spesso influenzata da distorsioni nei dati originali.
Ora, un team del gruppo di ricerca SEES:lab del Dipartimento di Ingegneria Chimica dell'Universitat Rovira I Virgili e ICREA ha fatto un passo avanti con lo sviluppo di un nuovo algoritmo che fa previsioni più accurate e genera modelli matematici che permettano anche di capire queste previsioni. I risultati di questa ricerca sono stati appena pubblicati sulla rivista Progressi scientifici .
"Lo scopo del nostro studio era creare quello che è noto come un robot scientifico, un algoritmo in grado di applicare la conoscenza e l'esperienza che un ricercatore ha per interpretare i dati, " spiega Marta Sales-Pardo, uno degli autori del saggio. I risultati forniti dall'algoritmo sono caratterizzati dal fatto di essere interpretabili. "E' come se qualcuno avesse stilato una legge o una teoria sul sistema che si sta studiando. L'algoritmo ti dà le relazioni matematiche tra le variabili che ha analizzato e lo fa in maniera del tutto indipendente, " aggiunge Roger Guimerà, un ricercatore ICREA dello stesso gruppo.
Quando un'azienda dispone di un'enorme quantità di dati che desidera sfruttare, può farlo impiegando qualcuno per provare vari modelli, proporre formule e trovare quella che funziona meglio effettuando esperimenti per validarle. Questo porterà ad una formula matematica che permette di modellare il sistema ma comporta un notevole investimento di tempo e denaro.
Un'altra possibilità è trovare uno specialista in machine learning, una disciplina scientifica nel campo dell'intelligenza artificiale che crea sistemi che identificano modelli complessi in enormi set di dati, imparare automaticamente e produrre un modello "black-box" in grado di fare previsioni. Però, questi sistemi non forniscono altre informazioni e se la previsione fallisce è impossibile sapere dove si trova l'errore e cosa bisogna fare per prevenirlo.
L'algoritmo sviluppato presso l'URV prende il meglio dei due casi:elabora i dati automaticamente, in modo rapido e affidabile, come fa il sistema di apprendimento automatico, e produce anche un risultato che è un modello interpretabile.
L'algoritmo può essere utilizzato per analizzare e interpretare i dati di qualsiasi disciplina in un processo molto più agile ed efficiente di quelli esistenti fino ad oggi. Ma il vero valore aggiunto sono le informazioni che il sistema fornisce. "In medicina, Per esempio, se devi prendere una decisione basata sui dati è molto importante capire perché ogni decisione è stata presa e il rischio di sbagliare, " spiega Guimerà. "Sebbene l'algoritmo abbia anche dimostrato di essere molto accurato, la cosa più importante è che tu possa capire i risultati perché hai costruito uno scienziato meccanico che, senza alcuna conoscenza precedente, può prendere una serie di dati e sviluppare una teoria che risolva il problema posto, " aggiunge Ignasi Reichardt, un altro ricercatore del team.
In questo studio, l'algoritmo è stato applicato ad un problema fondamentale della fisica dei fluidi con la collaborazione del gruppo di ricerca Sperimentazione, Calcolo e Modellazione in Meccanica dei Fluidi e Turbolenza del Dipartimento di Ingegneria Meccanica dell'URV.