I ricercatori del MIT hanno impiegato una nuova tecnica di apprendimento automatico per ridurre sostanzialmente i falsi positivi nelle tecnologie di rilevamento delle frodi. Credito:Chelsea Turner
Hai mai usato la tua carta di credito in un nuovo negozio o luogo solo per vederla rifiutata? È mai stata bloccata una vendita perché hai addebitato un importo superiore al solito?
Le carte di credito dei consumatori vengono rifiutate sorprendentemente spesso nelle transazioni legittime. Una delle cause è che le tecnologie di rilevamento delle frodi utilizzate dalla banca di un consumatore hanno erroneamente segnalato la vendita come sospetta. Ora i ricercatori del MIT hanno impiegato una nuova tecnica di apprendimento automatico per ridurre drasticamente questi falsi positivi, risparmiare denaro alle banche e alleviare la frustrazione dei clienti.
L'utilizzo dell'apprendimento automatico per rilevare le frodi finanziarie risale ai primi anni '90 ed è progredito nel corso degli anni. I ricercatori addestrano modelli per estrarre modelli comportamentali da transazioni passate, chiamato "caratteristiche, " quel segnale di frode. Quando fai scorrere la tua carta, la scheda esegue il ping del modello e, se le caratteristiche corrispondono a comportamenti fraudolenti, la vendita viene bloccata.
Dietro le quinte, però, gli scienziati dei dati devono inventare queste caratteristiche, che si concentrano principalmente su regole generali per quantità e posizione. Se un determinato cliente spende più di, dire, $ 2, 000 su un acquisto, o effettua numerosi acquisti nello stesso giorno, possono essere segnalati. Ma poiché le abitudini di spesa dei consumatori variano, anche nei conti individuali, questi modelli sono a volte imprecisi:un rapporto del 2015 di Javelin Strategy and Research stima che solo una previsione di frode su cinque è corretta e che gli errori possono costare a una banca 118 miliardi di dollari di mancati guadagni, poiché i clienti rifiutati si astengono dall'utilizzare tale carta di credito.
I ricercatori del MIT hanno sviluppato un approccio di "ingegneria delle funzionalità automatizzate" che estrae più di 200 funzionalità dettagliate per ogni singola transazione, ad esempio se un utente era presente durante gli acquisti, e l'importo medio speso in determinati giorni presso determinati fornitori. Facendo così, può individuare meglio quando le abitudini di spesa di uno specifico titolare della carta si discostano dalla norma.
Testato su un set di dati di 1,8 milioni di transazioni da una grande banca, il modello ha ridotto le previsioni false positive del 54% rispetto ai modelli tradizionali, che i ricercatori stimano avrebbe potuto salvare la banca 190, 000 euro (circa $220, 000) in mancati guadagni.
"La grande sfida in questo settore sono i falsi positivi, "dice Kalyan Veeramachaneni, un ricercatore principale presso il Laboratory for Information and Decision Systems (LIDS) del MIT e coautore di un articolo che descrive il modello, presentato alla recente European Conference for Machine Learning. "Possiamo dire che esiste una connessione diretta tra l'ingegneria delle funzionalità e la [riduzione] dei falsi positivi... Questa è la cosa più efficace per migliorare la precisione di questi modelli di apprendimento automatico".
I coautori dell'articolo sono:l'autore principale Roy Wedge, un ex ricercatore nel Data to AI Lab del LIDS; James Max Kanter '15, SM '15; e Santiago Moral Rubio e Sergio Iglesias Perez del Banco Bilbao Vizcaya Argentaria.
Estrazione di caratteristiche "profonde"
Tre anni fa, Veeramachaneni e Kanter hanno sviluppato Deep Feature Synthesis (DFS), un approccio automatizzato che estrae funzionalità altamente dettagliate da qualsiasi dato, e ha deciso di applicarlo alle transazioni finanziarie.
Le aziende a volte ospitano concorsi in cui forniscono un set di dati limitato insieme a un problema di previsione come la frode. Gli scienziati dei dati sviluppano modelli di previsione, e un premio in denaro va al modello più accurato. I ricercatori hanno partecipato a una di queste competizioni e hanno ottenuto i punteggi migliori con DFS.
Però, si sono resi conto che l'approccio poteva raggiungere il suo pieno potenziale se addestrato su diverse fonti di dati grezzi. "Se guardi a quali dati rilasciano le aziende, è una minuscola scheggia di ciò che effettivamente hanno, " Veeramachaneni dice. "La nostra domanda era, 'Come adottiamo questo approccio per le aziende reali?'"
Sostenuto dal programma Data-Driven Discovery of Models della Defense Advanced Research Projects Agency, Kanter e il suo team di FeatureLabs, uno spin-out che commercializza la tecnologia, hanno sviluppato una libreria open source per l'estrazione automatizzata delle funzionalità, chiamati Featuretools, che è stato utilizzato in questa ricerca.
I ricercatori hanno ottenuto un dataset triennale fornito da una banca internazionale, che includeva informazioni granulari sull'importo della transazione, volte, posizioni, tipi di fornitori, e terminali utilizzati. Conteneva circa 900 milioni di transazioni da circa 7 milioni di singole carte. Di quelle operazioni, circa 122, 000 sono stati confermati come frode. I ricercatori hanno addestrato e testato il loro modello su sottoinsiemi di tali dati.
In allenamento, il modello cerca modelli di transazioni e tra le carte che corrispondono a casi di frode. Quindi combina automaticamente tutte le diverse variabili che trova in funzionalità "profonde" che forniscono uno sguardo altamente dettagliato su ogni transazione. Dal set di dati, il modello DFS ha estratto 237 funzionalità per ogni transazione. Rappresentano variabili altamente personalizzate per i titolari di carta, Veeramachaneni dice. "Dire, di venerdì, è normale che un cliente spenda $ 5 o $ 15 dollari da Starbucks, " dice. "Quella variabile assomiglierà a, 'Quanti soldi sono stati spesi in una caffetteria il venerdì mattina?'"
Quindi crea un albero decisionale if/then per quell'account di funzionalità che puntano e non puntano alla frode. Quando una nuova transazione viene eseguita attraverso l'albero decisionale, il modello decide in tempo reale se la transazione è fraudolenta o meno.
Contrapposta a un modello tradizionale utilizzato da una banca, il modello DFS ha generato circa 133, 000 falsi positivi contro 289, 000 falsi positivi, circa il 54% in meno di incidenti. Quella, insieme a un numero inferiore di falsi negativi rilevati, una frode effettiva che non è stata rilevata, potrebbe far risparmiare alla banca circa 190, 000 euro, stimano i ricercatori.
Impilamento di primitive
La spina dorsale del modello è costituita da "primitivi" impilati in modo creativo, " semplici funzioni che prendono due input e danno un output. Ad esempio, calcolare una media di due numeri è una primitiva. Può essere combinato con una primitiva che esamina il timestamp di due transazioni per ottenere un tempo medio tra le transazioni. Impilare un'altra primitiva che calcola la distanza tra due indirizzi da quelle transazioni fornisce un tempo medio tra due acquisti in due posizioni specifiche. Un'altra primitiva potrebbe determinare se l'acquisto è stato effettuato in un giorno feriale o nel fine settimana, e così via.
"Una volta che abbiamo quei primitivi, non c'è modo di fermarci per impilarli ... e inizi a vedere queste variabili interessanti a cui non avevi pensato prima. Se approfondisci l'algoritmo, i primitivi sono la salsa segreta, " dice Veeramachaneni.
Una caratteristica importante che il modello genera, Veeramachaneni note, sta calcolando la distanza tra quei due luoghi e se sono accaduti di persona o da remoto. Se qualcuno che compra qualcosa a, dire, lo Stato Center di persona e, mezz'ora dopo, compra qualcosa di persona a 200 miglia di distanza, allora c'è un'alta probabilità di frode. Ma se un acquisto è avvenuto tramite telefono cellulare, la probabilità di frode diminuisce.
"Ci sono così tante funzionalità che puoi estrarre che caratterizzano i comportamenti che vedi nei dati passati che si riferiscono a casi d'uso di frode o non frode, " dice Veeramachaneni.
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.