Credito:CC0 Dominio Pubblico
Le condizioni croniche come le malattie cardiache e il diabete sono in aumento da decenni. Sono la prima causa di morte e disabilità negli Stati Uniti oggi e uno dei motivi per cui i costi dell'assistenza sanitaria sono fuori controllo.
Quindi identificare le persone a rischio di malattie croniche prima che si ammalino ha molto senso. Proprio alla fine, un intervento precoce può spesso rallentare il ritmo della malattia e migliorare la qualità della vita dei pazienti, e così facendo, potenzialmente risparmiare miliardi di dollari in spese mediche.
Ecco perché molti datori di lavoro, circa il 50%, secondo un rapporto RAND, sponsorizza programmi di benessere incentivati per i propri lavoratori. Insieme agli sconti in palestra, questi programmi in genere includono una valutazione del rischio per la salute sotto forma di test di laboratorio utilizzati per calcolare i fattori di rischio di ogni persona per malattie comuni. Alle persone a rischio vengono quindi offerte cure preventive e supervisione extra.
Sfortunatamente, i benefici attesi non sempre si concretizzano, dice Mohsen Bayati, un professore associato di operazioni, informazione, e tecnologia alla Stanford Graduate School of Business. Diversi studi hanno scoperto che tali programmi possono finire per costare più denaro di quanto risparmiano. Una probabile ragione, lui dice, è che le stesse valutazioni del rischio non sono poi così accurate.
"Se identifichi erroneamente qualcuno come ad alto rischio, un cosiddetto 'falso positivo', paghi per servizi non necessari, " Dice Bayati. "E se ti manca qualcuno che è veramente a rischio - un falso negativo - allora sarai comunque colpito da quelle enormi spese mediche in futuro".
Una soluzione, lui dice, sarebbe quello di eseguire un pannello di test più elaborato. Ma questo aumenterebbe anche i costi. "I test di laboratorio sono costosi. Le aziende lo fanno per molti dipendenti, quindi esaminano un insieme abbastanza piccolo di biomarcatori standard. E poi la capacità di rilevamento non è molto forte".
Anziché, Bayati dice, la chiave per far funzionare questi programmi di prevenzione è migliorare la selezione dei biomarcatori. Ma come lo fai? Per dirla in modo più rigoroso:come si sceglie un set minimo di marcatori che massimizzi il potere diagnostico su una serie di malattie?
Questo è l'enigma che Bayati ha affrontato in un recente articolo, di cui è stato coautore con due colleghi di Stanford:Sonia Bhaskar, dottorato di ricerca, un ex assistente di ricerca di Stanford che ora lavora come data scientist presso Netflix, e Andrea Montanari, un professore di statistica ed ingegneria elettrica. Utilizzando alcuni jujitsu tecnici dal campo dell'apprendimento automatico, hanno sviluppato un metodo che può essere utilizzato per qualsiasi gruppo di malattie target o livello di budget del programma.
Quando l'hanno testato su cartelle cliniche per circa 75 persone, 000 pazienti, hanno scoperto che potrebbe prevedere un gruppo di nove malattie gravi con una precisione inaspettata. "Siamo rimasti sorpresi, " dice Bayati. Rispetto a un'ipotetica valutazione Cadillac-care senza limiti sul numero di biomarcatori, il loro costerebbe molto meno, eppure hanno quasi lo stesso livello di potere predittivo.
E forse c'è una lezione generale qui, in questa era di Big Data. "Devi chiederti, " riflette Bayati. "In ogni settore, le aziende stanno investendo risorse per raccogliere sempre più dati. Stiamo mettendo sensori su tutto, solo perché possiamo, e francamente, non è tutto necessario o utile."
Troppe informazioni
Tradizionalmente, Le valutazioni del rischio per la salute sono state progettate individuando i migliori indicatori per ciascuna malattia isolatamente e aggiungendoli a un elenco. "Gli ospedali stanno diventando più sofisticati nel modo in cui identificano i biomarcatori, con statistiche avanzate e ora AI, " dice Bayati. "Ma è tutto fatto una malattia alla volta."
Potresti potenzialmente costruire un pannello di test efficace in questo modo, lui dice, ma richiederebbe troppi biomarcatori. Quindi in pratica, vengono fatti dei compromessi e la precisione diminuisce. Anziché, Bayati e i suoi colleghi hanno aggiunto un secondo passo all'analisi:"Abbiamo detto, iniziamo con quell'elenco completo e poi vediamo se possiamo semplificarlo in un modo migliore per ridurre al minimo la perdita di potenza diagnostica".
Fare quello, hanno attinto ad alcune tecniche da statistiche ad alta dimensionalità utilizzate nell'apprendimento automatico. "La domanda fondamentale è se hai troppe informazioni, come puoi restringere il campo al più piccolo insieme di informazioni più utili? Come si riducono le dimensioni del set di dati?"
La matematica è coinvolta, ma in fondo, la chiave per risolvere il problema "TMI" è ottimizzare congiuntamente la selezione dei biomarcatori. Invece di trovare i migliori per ogni malattia separatamente, decidi prima quanti biomarcatori vuoi - i ricercatori hanno optato per 30 - e poi massimizza il potere predittivo, su tutte le possibili combinazioni, per l'intera serie di malattie in una volta.
Il modello funziona perché molti biomarcatori segnalano più di una malattia. Glicemia alta, ad esempio, può essere un segno di diabete, ma anche malattie renali, malattia del fegato, o malattie cardiache. Livelli anormali di fosfatasi alcalina sono associati a malattie cardiache, malattia del fegato, e cancro. "Se il tuo processo di selezione non tiene conto di queste sovrapposizioni, stai buttando via informazioni, "dice Bayati.
Nessun limite agli obiettivi
Il potere del metodo delineato da Bayati e dai suoi colleghi è che può essere utilizzato per perseguire più obiettivi contemporaneamente. Cosa c'è di più importante nelle valutazioni del rischio per la salute:accuratezza o costo? Entrambi, Certo. Vogliamo prevedere l'Alzheimer o la malattia arteriosa? Sì.
"Non c'è limite al numero di gol, " dice Bayati. "Potresti elencarne 20, 30, 100 obiettivi su cui vuoi ottimizzare. E poi puoi restringere le informazioni che devi raccogliere, perché a un certo punto, l'aggiunta di obiettivi non richiede dati aggiuntivi."
Se aiuta a mantenere la promessa dei programmi di benessere aziendale, questo è un grosso problema per l'assistenza sanitaria. Ma questo approccio può essere utilizzato anche per migliorare una serie di operazioni commerciali e di politica pubblica. Ciò che è cruciale, Bayati dice, è essere chiari sugli obiettivi. I computer possono fare l'analisi, ma gli umani devono dire loro cosa ottimizzare.
E questo è un passo, lui pensa, le aziende troppo spesso sorvolano. "A volte sembra che le aziende si stiano semplicemente affrettando ad accumulare dati e porre domande in seguito. Ma più informazioni non sono necessariamente migliori. Ciò che conta è sapere cosa guardare. Il nostro documento è un passo in quella direzione".