Credito:CC0 Dominio pubblico
I mercati finanziari sono tra i sistemi complessi più studiati e attentamente osservati esistenti. Questa ricca letteratura sulla modellazione e analisi del mercato ha portato a molte importanti innovazioni, quali strumenti automatizzati per rilevare la manipolazione del mercato. Ma esiste ancora un grande divario tra l'attuale stato dell'arte e le potenti intuizioni necessarie per comprendere appieno le complesse dimensioni del comportamento del mercato.
In definitiva, questi modelli richiedono enormi volumi di dati, oltre a ciò che viene prodotto da ordini di azioni reali. I dati sugli ordini di azioni del mondo reale offrono ai ricercatori solo un limitato, vista storica del comportamento che il mercato può mostrare. I modelli richiedono anche scenari ipotetici e possibilità di ramificazione per informare una ricerca più approfondita.
Un team dell'Università del Michigan ha fornito una risposta a questa esigenza sotto forma di dati falsi. Il gruppo, guidato da Lynn A. Conway Professore di informatica e ingegneria Michael Wellman, propone un approccio alla generazione di dati di borsa realistici e ad alta fedeltà basato su una tecnica di deep learning chiamata reti generative avversarie (GAN). I flussi di ordini sintetici risultanti aprono molte porte ai ricercatori finanziari che necessitano di enormi set di dati per studiare le complesse relazioni di causa ed effetto che si verificano ogni giorno nei mercati reali.
In poche parole, I GAN funzionano mettendo due modelli di apprendimento l'uno contro l'altro, uno chiamato il "generatore" e l'altro il "discriminatore". I due operano in un rapporto competitivo, dove il generatore impara a sputare dati sintetici in base a ciò che viene alimentato, mentre il discriminatore impara a distinguere tra i flussi di dati reali e falsi.
Man mano che il discriminatore migliora nel catturare i falsi, il generatore migliora nel rendere più convincenti i suoi falsi. Il risultato finale è un generatore in grado di imitare molto da vicino i dataset di destinazione; in questo caso, flussi di ordini di azioni.
Chiamato Stock-GAN, l'istanza utilizzata dal team del Michigan è stata addestrata su due tipi di set di dati composti da ordini di azioni:uno da un simulatore di mercato basato su agenti e un altro da un mercato azionario reale. Hanno valutato i dati generati utilizzando una varietà di statistiche, quali la distribuzione del prezzo e la quantità degli ordini, tempi di inter-arrivo degli ordini, e l'evoluzione della migliore offerta e della migliore richiesta nel tempo. I risultati hanno mostrato che i dati generati corrispondevano strettamente alle statistiche corrispondenti nei dati reali, sia per il mercato simulato che per quello reale.
Sebbene questo lavoro sia solo un primo passo verso la generazione di flussi di ordini realistici, dice Xintong Wang, un dottorato di ricerca studente della squadra, "Avere questo compito può aiutare a preparare set di dati che possono rendere possibili altri compiti".
In particolare, nuovi algoritmi di apprendimento automatico specializzati nel trading automatico possono essere addestrati e convalidati sui set di dati generati, e il rilevamento automatico delle anomalie potrebbe essere reso possibile confrontando i dati generati con il mercato reale.
Come dice Wang, questo sistema consente essenzialmente ai ricercatori finanziari di intraprendere alt-storia, o controfattuale, ricerca, una tecnica che non è possibile se limitata ai flussi di ordini del mondo reale.
"Vero, i dati storici di mercato possono essere visti come uno dei tanti possibili risultati realizzati dalla natura, " lei spiega, "e Stock-GAN può generarne molti di più a basso costo."
Oltre a cambiare la storia, dati sintetici completamente realizzati possono anche aiutare i ricercatori finanziari a esplorare scenari ipotetici, inserendo dati specifici in flussi di ordine e osservando le permutazioni risultanti dei dati futuri.
"Questo ci consente in linea di principio di iniettare eventi nel sistema e osservare un'evoluzione controfattuale del mercato, "Wang dice, "che è qualcosa che non possiamo mai ottenere direttamente dai dati osservativi".
Oltre a rilevare comportamenti fraudolenti o manipolativi, i modelli formati su questi dati potrebbero offrire ai ricercatori informazioni sui diversi tipi di pratiche commerciali legittime esercitate nei mercati e sui risultati che ne derivano.
"Vorremmo essere in grado di capire più in generale che tipo di strategie stanno usando i trader, " dice Wellman. "Con questa conoscenza, potremmo determinare quando un flusso di ordini contiene determinate strategie."
I ricercatori notano inoltre che l'esecuzione di ricerche finanziarie su dati sintetici supera i problemi di privacy e sicurezza associati alla pubblicità di dati di trading reali.
"Globale, " scrivono gli autori, "il nostro lavoro fornisce un terreno fertile per la ricerca futura all'intersezione tra deep learning e finanza".
Questa ricerca è stata pubblicata nel documento "Generating Realistic Stock Market Order Streams" alla conferenza 2020 dell'Associazione per l'avanzamento dell'intelligenza artificiale (AAAI).