Figura 1:Le caratteristiche derivate dagli indicatori vengono quindi inviate a un modello che genera previsioni insieme a intervalli di confidenza. Credito:IBM
I governi di tutto il mondo si sono riuniti a Marrakech lo scorso dicembre per ratificare un patto per migliorare la cooperazione sulla migrazione internazionale. Tra gli altri obiettivi, il Global Compact for Migration cerca di utilizzare "dati accurati e disaggregati come base per politiche basate sull'evidenza". In che modo le tecnologie di apprendimento automatico possono aiutare con questioni sociali profondamente polarizzanti come la migrazione?
All'inizio del 2018, con il supporto di IBM Corporate Citizenship e del Ministero degli Affari Esteri danese, IBM e il Consiglio danese per i rifugiati (DRC) hanno avviato una partnership mirata proprio alla necessità di comprendere meglio i driver della migrazione e una guida politica basata su prove per una serie di parti interessate. Al recente keynote di THINK Copenhagen, il Segretario Generale della RDC, Christian Friis Bach, presentato i primi risultati di questo sforzo.
Se siamo in grado di prevedere i flussi migratori e di rifugiati, possiamo prevenire e migliorare la protezione delle persone in movimento. Ottima partnership con @IBM sulla modellazione predittiva. Presentati i primi risultati al #THINK2018CPH! pic.twitter.com/x1JDyI8s6L
— Christian Friis Bach (@christianfbach) 7 novembre, 2018
In questo post, Illustrerò lo sviluppo di un sistema di apprendimento automatico che fornisce previsioni strategiche di migrazione mista insieme all'analisi degli scenari. La migrazione mista si riferisce a movimenti transfrontalieri di persone motivate da una molteplicità di fattori a spostarsi, compresi i rifugiati in fuga da persecuzioni e conflitti, vittime di tratta, e persone in cerca di vite e opportunità migliori. Tali popolazioni hanno una gamma di status legali, alcuni dei quali non si riflettono nelle statistiche ufficiali del governo.
Comprendere le dinamiche e i fattori di migrazione è intrinsecamente complesso. Le circostanze variano da persona a persona. La domanda "perché hai deciso di trasferirti?" non è semplice per le persone rispondere. Però, nella misura in cui le decisioni individuali riflettono fattori strutturali della società, la dinamica può essere parzialmente spiegata da misure aggregate. Ad esempio, ci si può aspettare che i driver economici per il movimento siano correlati alle opportunità di lavoro e quindi agli indicatori macro sull'occupazione. Queste sfide sono aggravate dalla disponibilità di dati e dalla copertura su indicatori specifici.
Il sistema di previsione
Abbiamo iniziato facendo leva sul programma di monitoraggio 4MI gestito dalla RDC attraverso il quale vengono intervistate migliaia di migranti in movimento. L'analisi dei dati del sondaggio rivela cluster di alto livello di driver per la migrazione. Questi cluster variavano dalla mancanza di diritti e di altri servizi sociali, alla necessità economica e al conflitto. Questi driver vengono quindi mappati su indicatori quantitativi. Le caratteristiche derivate da questi indicatori vengono quindi inviate a un modello che genera previsioni insieme a intervalli di confidenza (Figura 1). Inoltre, il sistema genera anche il contesto per ogni previsione mostrando driver specifici che hanno contribuito alla previsione.
Utilizzando questi indicatori, abbiamo sviluppato un modello di insieme per fare previsioni strategiche annuali per flussi bilaterali su volumi di migrazione mista ogni anno. Le nostre valutazioni mostrano che i tassi di errore sono entro poche migliaia di persone all'anno anche per i paesi con condizioni volatili. Il sistema consente inoltre l'analisi di scenari, dove i cambiamenti relativi nei fattori di influenza possono essere modellati per fare previsioni aggiustate.
Da tale analisi emergono interessanti dinamiche controintuitive. Ad esempio, i tassi di disoccupazione in Etiopia sono superiori alla media rispetto ai paesi subsahariani. Un gran numero di etiopi si reca in Arabia Saudita per lavoro. L'aumento dei tassi di occupazione fino al miglior quinto della regione si tradurrà in una maggiore migrazione verso il Regno Unito (aumento del 2%), Svezia (aumento del 2%) e Arabia Saudita (aumento dell'8%). Ciò riflette una maggiore capacità e mezzi degli etiopi per soddisfare le loro aspirazioni all'estero. Se la disoccupazione aumenta ai livelli peggiori, il modello prevede un aumento della migrazione verso il Sudafrica (aumento del 3%) e l'Arabia Saudita (aumento del 4%), con destinazioni UE largamente invariate all'aumento della disoccupazione.
Figura 2:Matrice di correlazione per tutte le caratteristiche considerate nel modello (nessun effetto temporale). Credito:IBM
In precedenza tale analisi quantitativa dettagliata non era disponibile per le parti interessate che avevano bisogno di formulare risposte politiche.
Inferenza causale
Il sistema di previsione sopra descritto è puramente basato sui dati in cui ci affidiamo al modello per derivare le relazioni tra tutte le variabili. In alternativa, se cerchiamo di sfruttare le competenze in materia e includere approfondimenti specifici nel sistema, potremmo adottare l'approccio dei modelli grafici probabilistici.
In un workshop tenuto presso IBM Research - Irlanda, esperti in materia del Mixed Migration Centre di Ginevra e della Repubblica Democratica del Congo hanno elaborato la rete "spaghetti" mostrando come si aspettano che i cluster di indicatori siano collegati causalmente. Usandolo come input, abbiamo quindi combinato la loro opinione di esperti con i dati. Abbiamo usato una tecnica chiamata apprendimento della struttura per sviluppare una rete di questo tipo.
Le previsioni che utilizzano tali reti in genere non funzionano così come gli approcci puramente basati sui dati presentati sopra; tuttavia, aiutano nell'analisi degli scenari e nell'analisi delle politiche.
Qual è il prossimo?
Figura 3:rete causale (a sinistra) disegnata da esperti e rete (a destra) appresa sulla base dell'opinione degli esperti e delle prove basate sui dati per tutta l'Africa subsahariana. Credito:IBM
Questi sono i primi passi verso un futuro in cui i responsabili politici hanno accesso immediato alle prove quando e dove sono necessarie e dove le relazioni complesse possono essere esplorate facilmente per fornire maggiori informazioni che guidano una politica migliore.
Per adesso, stiamo continuando a migliorare il sistema e raccogliere feedback degli utenti con esperti in materia all'interno della RDC. Dopo una convalida più dettagliata, cercheremo di espandere l'ambito geografico e le capacità di analisi degli scenari.
Questa storia è stata ripubblicata per gentile concessione di IBM Research. Leggi la storia originale qui.