Credito:CC0 Dominio Pubblico
Le cause dei problemi del mondo reale in economia e salute pubblica possono essere notoriamente difficili da determinare. Spesso, si sospettano molteplici cause, ma non sono disponibili grandi set di dati con dati in sequenza temporale. I modelli precedenti non potevano analizzare in modo affidabile queste sfide. Ora, i ricercatori hanno testato il primo modello di intelligenza artificiale per identificare e classificare molte cause nei problemi del mondo reale senza dati in sequenza temporale, utilizzando una struttura causale multi-nodale e Grafici Aciclici Diretti.
Quando succede qualcosa di brutto, è naturale cercare di capire perché è successo. Cosa l'ha causato? Se la causa è determinata, potrebbe essere possibile evitare lo stesso risultato la volta successiva. Però, alcuni dei modi in cui gli umani cercano di comprendere gli eventi, come il ricorso alla superstizione, non può spiegare cosa sta realmente accadendo. Né la correlazione, che può solo dire che l'evento B è avvenuto nello stesso periodo dell'evento A.
Per sapere veramente cosa ha causato un evento, dobbiamo guardare alla causalità:come l'informazione fluisce da un evento all'altro. È il flusso di informazioni che mostra che c'è un nesso causale:quell'evento A ha causato l'evento B. Ma cosa succede quando manca il flusso di informazioni sequenziato nel tempo dall'evento A all'evento B? La causalità generale è necessaria per identificare le cause.
I modelli matematici per la causalità generale sono stati molto limitati, lavorando per un massimo di due cause. Ora, in una svolta dell'intelligenza artificiale, i ricercatori hanno sviluppato il primo modello robusto per la causalità generale che identifica più connessioni causali senza dati sulla sequenza temporale, il modello additivo multivariato del rumore (MANM).
Ricercatori dell'Università di Johannesburg, Sud Africa, e Istituto Nazionale di Tecnologia Rourkela, India, sviluppato il modello e testato su simulazioni, set di dati del mondo reale. La ricerca è pubblicata sulla rivista Reti neurali .
"Unicamente, il modello può identificare più, fattori causali gerarchici. Funziona anche se i dati con sequenza temporale non sono disponibili. Il modello crea opportunità significative per analizzare fenomeni complessi in aree quali economia, epidemie di malattie, cambiamento climatico e conservazione, "dice il prof. Tshilidzi Marwala, un professore di intelligenza artificiale, ed esperto di intelligenza artificiale ed economia globale presso l'Università di Johannesburg, Sud Africa.
"Il modello è particolarmente utile a livello regionale, livello nazionale o globale dove non sono possibili esperimenti controllati o naturali, " aggiunge Marvala.
Superstizione e correlazione verso la causalità
"Se un gatto nero attraversa la strada, o un gufo ulula su un tetto, alcune persone sono convinte che accadrà qualcosa di veramente brutto. Una persona può pensare che ci sia una connessione tra vedere il gatto o il gufo e quello che è successo dopo. Però, dal punto di vista dell'intelligenza artificiale, diciamo che non ci sono nessi causali tra il gatto, il gufo, e cosa succede alle persone che li vedono. Il gatto o il gufo sono stati visti poco prima dell'evento, ma sono semplicemente correlati nel tempo con ciò che accadde dopo, "dice il prof Marwala.
Nel frattempo, dentro la casa dove è stato avvistato il gufo, potrebbe succedere qualcosa di più sinistro. La famiglia all'interno potrebbe essere sempre più indebitata. Una tale situazione finanziaria può imporre gravi restrizioni alla famiglia, alla fine diventando una trappola dalla quale si scappa poco. Ma le persone che vivono lì capiscono le effettive connessioni causali tra ciò che accade loro, cosa fanno, e i loro livelli di debito?
Causalità a livello familiare
Le cause del persistente indebitamento delle famiglie sono un buon esempio di ciò di cui è capace il nuovo modello, afferma il ricercatore post-dottorato Dr. Pramod Kumar Parida, autore principale dell'articolo di ricerca.
"A livello di famiglia ci si può chiedere:la famiglia ha perso parte o tutto il suo reddito? Alcuni o tutti i membri spendono oltre il loro reddito? È successo qualcosa ai membri della famiglia che sta costringendo a spendere enormi come fatture mediche o di invalidità? Stanno consumando i loro risparmi o investimenti, che ora sono esauriti? Sta accadendo una combinazione di queste cose, se è così, quali sono le cause più dominanti del debito?"
Se sono disponibili dati sufficienti sulle transazioni finanziarie della famiglia, completo di informazioni su data e ora, è possibile per qualcuno capire le effettive connessioni causali tra reddito, Spendere, risparmio, investimenti e debito.
In questo caso, la semplice teoria della causalità è sufficiente per scoprire perché questa famiglia sta lottando.
Causalità generale a livello sociale
Ma, dice Paride, "Quali sono le vere ragioni per cui la maggior parte delle persone in una città o in una regione stanno lottando finanziariamente? Perché non escono dal debito?" Ora, non è più possibile per un team di persone capirlo dai dati disponibili, e si apre una nuova sfida matematica.
"Soprattutto se si vogliono le effettive connessioni causali tra reddito familiare, Spendere, risparmi e debiti per la città o la regione, piuttosto che congetture esperte o "ciò che la maggior parte delle persone crede, "" Aggiunge.
"Qui, la teoria della causalità fallisce, perché i dati delle transazioni finanziarie per le famiglie nella città o nella regione saranno incompleti. Anche, le informazioni su data e ora mancheranno per alcuni dati. Lotta finanziaria in basso, le famiglie a reddito medio e alto possono essere molto diverse, quindi vorrai vedere le diverse cause dall'analisi, "dice Paride.
"Con questo modello, è possibile identificare in grado di identificare più fattori determinanti principali che causano il debito delle famiglie. Nel modello, chiamiamo questi fattori le connessioni causali dei genitori indipendenti. Puoi anche vedere quali connessioni causali sono più dominanti delle altre. Con un secondo passaggio attraverso i dati, puoi anche vedere i fattori di guida minori, ciò che chiamiamo connessioni causali figlio indipendenti. In questo modo, è possibile individuare una possibile gerarchia di nessi causali".
Analisi causale notevolmente migliorata
Il Multivariate Additive Noise Model (MANM) fornisce un'analisi causale significativamente migliore su set di dati del mondo reale rispetto ai modelli standard del settore attualmente in uso, afferma il coautore Prof Snehashish Chakraverty, presso il Gruppo di Matematica Applicata, Dipartimento di Matematica, Istituto Nazionale di Tecnologia Rourkela, India.
"Al fine di migliorare un problema regionale complesso come il debito delle famiglie o le sfide sanitarie, potrebbe non essere sufficiente conoscere i modelli del debito, o di malattia e l'esposizione. Anzi, dovremmo capire perché esistono tali modelli, per avere il modo migliore per cambiarli. I modelli precedenti sviluppati dai ricercatori hanno lavorato con un massimo di due fattori causali, cioè erano modelli bivariati, che semplicemente non riusciva a trovare più criteri di dipendenza dalle funzionalità, " lui dice.
Grafici Aciclici Diretti
"MANM si basa su Grafici Aciclici Diretti (DAG), che può identificare una struttura causale multinodale. MANM può stimare ogni possibile direzione causale in insiemi di caratteristiche complesse, senza indicazioni mancanti o sbagliate."
L'uso di DAG è una delle ragioni principali per cui MANM supera in modo significativo i modelli precedentemente sviluppati da altri, che si basavano sull'analisi delle componenti indipendenti (ICA), come il Modello Aciclico Lineare Non Gaussiano (ICA-LiNGAM), Greedy DAG Search (GDS) e regressione con test indipendente successivo (RESIT), lui dice.
"Un'altra caratteristica chiave del MANM è il Fattore di influenza causale proposto (CIF), per la scoperta riuscita di direzioni causali nel sistema multivariato. Il punteggio CIF fornisce un indicatore affidabile della qualità dell'inferenza casuale, che consente di evitare la maggior parte delle direzioni mancanti o sbagliate nella struttura causale risultante, " conclude Chakraverty.
Se è disponibile un set di dati esistente, MANM ora rende possibile identificare più strutture causali multi-nodali all'interno dell'insieme. Come esempio, Il MANM può identificare le molteplici cause del persistente debito delle famiglie per bassi, famiglie a reddito medio e alto di una regione.