I ricercatori del MIT hanno sviluppato un modello di apprendimento automatico che raggruppa i pazienti in sottopopolazioni in base allo stato di salute per prevedere meglio il rischio di morte di un paziente durante la permanenza in terapia intensiva. Questa tecnica supera i modelli di previsione della mortalità "globali" e rivela le disparità di prestazioni di tali modelli tra specifiche sottopopolazioni di pazienti. Credito:Massachusetts Institute of Technology
Nelle unità di terapia intensiva, dove i pazienti entrano con una vasta gamma di condizioni di salute, il triage si basa molto sul giudizio clinico. Il personale della terapia intensiva esegue numerosi test fisiologici, come analisi del sangue e controllo dei segni vitali, per determinare se i pazienti sono a rischio immediato di morte se non trattati in modo aggressivo.
Inserisci:apprendimento automatico. Negli ultimi anni sono stati sviluppati numerosi modelli per aiutare a prevedere la mortalità dei pazienti in terapia intensiva, in base a vari fattori di salute durante il soggiorno. Questi modelli, però, presentano inconvenienti prestazionali. Un tipo comune di modello "globale" viene addestrato su un'unica vasta popolazione di pazienti. Questi potrebbero funzionare bene in media, ma male su alcune sottopopolazioni di pazienti. D'altra parte, un altro tipo di modello analizza diverse sottopopolazioni, ad esempio, quelli raggruppati per condizioni simili, età del paziente, o reparti ospedalieri, ma spesso dispongono di dati limitati per la formazione e i test.
In un documento presentato di recente alla conferenza Proceedings of Knowledge Discovery and Data Mining, I ricercatori del MIT descrivono un modello di apprendimento automatico che funziona come il meglio di entrambi i mondi:si allena specificamente su sottopopolazioni di pazienti, ma condivide anche i dati tra tutte le sottopopolazioni per ottenere previsioni migliori. Così facendo, il modello può prevedere meglio il rischio di mortalità di un paziente durante i primi due giorni in terapia intensiva, rispetto a modelli strettamente globali e di altro tipo.
Il modello prima elabora i dati fisiologici nelle cartelle cliniche elettroniche di pazienti precedentemente ricoverati in terapia intensiva, alcuni che erano morti durante il loro soggiorno. Così facendo, apprende alti predittori di mortalità, come la frequenza cardiaca bassa, alta pressione sanguigna, e vari risultati di test di laboratorio:alti livelli di glucosio e conta dei globuli bianchi, tra gli altri, nei primi giorni e suddivide i pazienti in sottopopolazioni in base al loro stato di salute. Dato un nuovo paziente, il modello può guardare i dati fisiologici di quel paziente dalle prime 24 ore e, usando ciò che ha appreso attraverso l'analisi di quelle sottopopolazioni di pazienti, stimare meglio la probabilità che anche il nuovo paziente muoia nelle successive 48 ore.
Inoltre, i ricercatori hanno scoperto che valutare (testare e convalidare) il modello per sottopopolazioni specifiche evidenzia anche le disparità di prestazioni dei modelli globali nella previsione della mortalità tra sottopopolazioni di pazienti. Si tratta di informazioni importanti per lo sviluppo di modelli che possono funzionare in modo più accurato con pazienti specifici.
"Le unità di terapia intensiva hanno una larghezza di banda molto elevata, con molti pazienti, " dice il primo autore Harini Suresh, uno studente laureato nel Laboratorio di Informatica e Intelligenza Artificiale (CSAIL). "È importante capire con largo anticipo quali pazienti sono effettivamente a rischio e hanno più bisogno di cure immediate".
I coautori del documento sono la studentessa laureata CSAIL Jen Gong, e John Guttag, il Dugald C. Jackson Professor in Ingegneria Elettrica.
Multitasking e sottopopolazioni di pazienti
Un'innovazione chiave del lavoro è che, durante l'allenamento, il modello separa i pazienti in sottopopolazioni distinte, che coglie aspetti dello stato generale di salute e dei rischi di mortalità di un paziente. Lo fa calcolando una combinazione di dati fisiologici, ripartito a ore. I dati fisiologici includono, Per esempio, livelli di glucosio, potassio, e azoto, così come la frequenza cardiaca, pH del sangue, saturazione di ossigeno, e frequenza respiratoria. L'aumento della pressione sanguigna e dei livelli di potassio, un segno di insufficienza cardiaca, può indicare problemi di salute rispetto ad altre sottopopolazioni.
Prossimo, il modello utilizza un metodo di apprendimento multitasking per costruire modelli predittivi. Quando i pazienti vengono suddivisi in sottopopolazioni, a ciascuna sottopopolazione vengono assegnati modelli sintonizzati in modo diverso. Ogni modello variante può quindi fare previsioni più accurate per il suo gruppo personalizzato di pazienti. Questo approccio consente inoltre al modello di condividere i dati tra tutte le sottopopolazioni durante l'esecuzione delle previsioni. Quando viene dato un nuovo paziente, abbinerà i dati fisiologici del paziente a tutte le sottopopolazioni, trova la soluzione migliore, e quindi stimare meglio il rischio di mortalità da lì.
"Stiamo utilizzando tutti i dati dei pazienti e condividiamo le informazioni tra le popolazioni laddove è rilevante, "Suresh dice. "In questo modo, siamo in grado di... non soffrire di problemi di scarsità di dati, tenendo conto delle differenze tra le diverse sottopopolazioni di pazienti".
"I pazienti ricoverati in terapia intensiva spesso differiscono per il motivo per cui sono lì e per il loro stato di salute. Per questo motivo, saranno trattati in modo molto diverso, " Gong aggiunge. Gli aiuti al processo decisionale clinico "dovrebbero tenere conto dell'eterogeneità di queste popolazioni di pazienti ... e assicurarsi che ci siano dati sufficienti per previsioni accurate".
Un'intuizione chiave di questo metodo, Gong dice, derivava dall'utilizzo di un approccio multitasking per valutare anche le prestazioni di un modello su sottopopolazioni specifiche. I modelli globali sono spesso valutati in termini di prestazioni complessive, tra intere popolazioni di pazienti. Ma gli esperimenti dei ricercatori hanno mostrato che questi modelli in realtà hanno prestazioni inferiori alle sottopopolazioni. Il modello globale testato nel documento prevedeva la mortalità in modo abbastanza accurato nel complesso, ma è sceso di diversi punti percentuali in termini di accuratezza quando testato su singole sottopopolazioni.
Tali disparità di prestazioni sono difficili da misurare senza valutare per sottopopolazioni, Gong dice:"Vogliamo valutare l'efficacia del nostro modello, non solo su un'intera coorte di pazienti, ma anche quando lo scomponiamo per ogni coorte con caratteristiche mediche diverse. Ciò può aiutare i ricercatori a migliorare la formazione e la valutazione dei modelli predittivi".
Ottenere risultati
I ricercatori hanno testato il loro modello utilizzando i dati del database MIMIC Critical Care, che contiene decine di dati su popolazioni di pazienti eterogenee. Di circa 32, 000 pazienti nel set di dati, più di 2, 200 sono morti in ospedale. Hanno usato l'80 percento del set di dati per addestrare, e il 20 percento per testare il modello.
Utilizzando i dati delle prime 24 ore, il modello ha raggruppato i pazienti in sottopopolazioni con importanti differenze cliniche. Due sottopopolazioni, ad esempio, conteneva pazienti con pressione sanguigna elevata nelle prime ore, ma uno è diminuito nel tempo, mentre l'altro ha mantenuto l'elevazione per tutto il giorno. Questa sottopopolazione aveva il più alto tasso di mortalità.
Usando queste sottopopolazioni, il modello prevedeva la mortalità dei pazienti nelle successive 48 ore con elevata specificità e sensibilità, e varie altre metriche. Il modello multitasking ha superato in modo significativo un modello globale di diversi punti percentuali.
Prossimo, i ricercatori mirano a utilizzare più dati dalle cartelle cliniche elettroniche, come i trattamenti che i pazienti stanno ricevendo. sperano anche nel futuro, addestrare il modello a estrarre parole chiave da note cliniche digitalizzate e altre informazioni.
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.