Un nuovo algoritmo traduce la conoscenza simbolica in spazi vettoriali per combinare il ragionamento deduttivo con l'apprendimento automatico. Attestazione:Maxat Kulmanov
Un team KAUST ha sviluppato un quadro matematico che colma il divario tra la conoscenza leggibile dall'uomo di alto livello e i dati statistici e si prevede che migliorerà l'apprendimento automatico.
Gli umani si affidano a schemi, etichette e ordine per dare un senso al mondo. classifichiamo, classificare e creare collegamenti tra cose e idee correlate, creando simboli che possiamo usare per condividere informazioni. Intelligenza artificiale, d'altra parte, viene addestrato in modo più efficace utilizzando dati numerici grezzi. Come, poi, possono gli algoritmi di intelligenza artificiale utilizzare la nostra vasta riserva di conoscenza simbolica? Questo è un problema fastidioso e uno che, se rotto, potrebbe aprire una nuova enorme libreria multidimensionale per l'apprendimento automatico e l'intelligenza artificiale.
Robert Hoehndorf, Maxat Kulmanov e i loro collaboratori presso il Computational Bioscience Research Center di KAUST e l'Università di Halifax, Canada, hanno sviluppato un ponte matematico tra queste forme di informazione apparentemente incompatibili.
"C'è un grande divario nella ricerca sull'intelligenza artificiale tra gli approcci basati su rappresentazioni simboliche di alto livello comprensibili dagli esseri umani e gli approcci subsimbolici utilizzati per addestrare le reti neurali artificiali, " spiega Kulmanov. "Gli approcci simbolici sono costruiti su relazioni logiche, mentre gli approcci subsimbolici si basano su statistiche e spazi vettoriali continui con numeri reali."
I ricercatori hanno deciso di sviluppare una funzione di "incorporamento" che mappa una struttura matematica a un'altra in modo da preservare alcune delle caratteristiche della prima struttura.
"Si usano gli incastri perché la seconda struttura può essere più adatta per alcune operazioni, " dice Hoehndorf. "In questo lavoro, abbiamo mappato un linguaggio formale, chiamata logica descrittiva, in uno spazio vettoriale di numeri reali, che può essere utilizzato più facilmente per l'apprendimento automatico, come il calcolo della somiglianza e l'esecuzione di operazioni predittive".
Le logiche descrittive sono ampiamente utilizzate in biologia e biomedicina per descrivere teorie formalizzate, come le funzioni dei geni e la terminologia utilizzata nella diagnosi medica.
"Logica, come la logica descrittiva, sono stati la base per i sistemi di intelligenza artificiale dagli anni '60 e sono stati studiati in matematica per più di 100 anni, " dice Hoehndorf. "Sulla base di questa storia della ricerca, abbiamo creato una funzione di inclusione che non solo proietta i simboli in uno spazio vettoriale, ma genera anche modelli algebrici per catturare la semantica dei simboli all'interno della logica descrittiva."
La chiave per il successo del team è collegare l'incorporamento alla teoria dei modelli, che ha permesso di attingere a conoscenze consolidate e creare il primo embedding che preserva la semantica.
"Il nostro metodo è direttamente applicabile a centinaia di teorie formalizzate nella ricerca biologica e biomedica e centinaia di database biologici, " dice Kulmanov. "In futuro, applicheremo il nostro metodo a più problemi in biologia, che speriamo migliorerà le applicazioni biomediche dell'intelligenza artificiale".