Valutazione del set di prova. Confronto della valutazione originale del radiologo interpretante con la valutazione del modello di apprendimento profondo (DL) per la classificazione della densità del seno (a) binaria e (c) a quattro vie. (B, d) Corrispondenti esempi di mammografie con valutazioni concordanti e discordanti da parte del radiologo e con il modello DL. Credito:Società radiologica del Nord America
I ricercatori del MIT e del Massachusetts General Hospital hanno sviluppato un modello automatizzato che valuta il tessuto mammario denso nelle mammografie, che è un fattore di rischio indipendente per il cancro al seno, con la stessa affidabilità dei radiologi esperti.
È la prima volta che un modello di deep learning nel suo genere è stato utilizzato con successo in una clinica su pazienti reali, secondo i ricercatori. Con ampia attuazione, i ricercatori sperano che il modello possa contribuire a conferire maggiore affidabilità alle valutazioni della densità del seno in tutta la nazione.
Si stima che oltre il 40% delle donne statunitensi abbia un tessuto mammario denso, che da solo aumenta il rischio di cancro al seno. Inoltre, il tessuto denso può mascherare i tumori sulla mammografia, rendendo più difficile lo screening. Di conseguenza, 30 Stati degli Stati Uniti impongono che le donne debbano essere informate se le loro mammografie indicano che hanno un seno denso.
Ma le valutazioni della densità del seno si basano sulla valutazione soggettiva umana. A causa di molti fattori, i risultati variano, a volte in modo drammatico, tra i radiologi. I ricercatori del MIT e dell'MGH hanno addestrato un modello di deep learning su decine di migliaia di mammografie digitali di alta qualità per imparare a distinguere i diversi tipi di tessuto mammario, da grasso a estremamente denso, sulla base di valutazioni di esperti. Data una nuova mammografia, il modello può quindi identificare una misurazione della densità che si allinea strettamente con l'opinione degli esperti.
"La densità del seno è un fattore di rischio indipendente che guida il modo in cui comunichiamo alle donne il loro rischio di cancro. La nostra motivazione era quella di creare uno strumento accurato e coerente, che possono essere condivisi e utilizzati tra i sistemi sanitari, " dice il secondo autore Adam Yala, un dottorato di ricerca studente presso il Laboratorio di Informatica e Intelligenza Artificiale del MIT (CSAIL).
Gli altri coautori sono la prima autrice Constance Lehman, professore di radiologia alla Harvard Medical School e direttore dell'imaging mammario al MGH; e l'autore senior Regina Barzilay, il Delta Electronics Professor al CSAIL e il Dipartimento di Ingegneria Elettrica e Informatica del MIT.
Densità di mappatura
Il modello è costruito su una rete neurale convoluzionale (CNN), che viene utilizzato anche per compiti di visione artificiale. I ricercatori hanno addestrato e testato il loro modello su un set di dati di oltre 58, 000 mammografie selezionate casualmente da più di 39, 000 donne sottoposte a screening tra il 2009 e il 2011. Per la formazione, hanno usato circa 41, 000 mammografie e, per il test, circa 8, 600 mammografie.
Ogni mammografia nel set di dati ha una valutazione della densità del seno standard (BI-RADS) per l'imaging del seno e il sistema di dati in quattro categorie:grasso, sparse (densità diffusa), eterogeneo (per lo più denso), e denso. Sia nell'addestramento che nei test mammografici, circa il 40% è stato valutato come eterogeneo e denso.
Durante il percorso formativo, al modello vengono fornite mammografie casuali da analizzare. Impara a mappare la mammografia con valutazioni di densità di esperti radiologi. seno denso, ad esempio, contengono tessuto connettivo ghiandolare e fibroso, che appaiono come reti compatte di spesse linee bianche e solide macchie bianche. Le reti di tessuto adiposo appaiono molto più sottili, con zona grigia dappertutto. Nella prova, il modello osserva nuove mammografie e prevede la categoria di densità più probabile.
Valutazioni corrispondenti
Il modello è stato implementato presso la divisione di imaging del seno di MGH. In un flusso di lavoro tradizionale, quando viene eseguita una mammografia, viene inviato a una stazione di lavoro per essere valutato da un radiologo. Il modello dei ricercatori è installato in una macchina separata che intercetta le scansioni prima che raggiunga il radiologo, e assegna a ciascuna mammografia un punteggio di densità. Quando i radiologi eseguono una scansione alle loro postazioni di lavoro, vedranno la valutazione assegnata al modello, che poi accettano o rifiutano.
"Ci vuole meno di un secondo per immagine ... [e può essere] facilmente ed economicamente ridimensionato in tutti gli ospedali". Yala dice.
Su oltre 10, 000 mammografie al MGH da gennaio a maggio di quest'anno, il modello ha raggiunto un accordo del 94% tra i radiologi dell'ospedale in un test binario, determinando se i seni erano eterogenei e densi, o grasso e sparso. In tutte e quattro le categorie BI-RADS, corrispondeva alle valutazioni dei radiologi al 90%. "MGH è un centro di imaging mammario di prim'ordine con un elevato accordo inter-radiologo, e questo set di dati di alta qualità ci ha permesso di sviluppare un modello forte, " dice Yala.
In test generali utilizzando il set di dati originale, il modello corrispondeva alle interpretazioni degli esperti umani originali al 77% in quattro categorie BI-RADS e, nei test binari, corrispondeva alle interpretazioni all'87 per cento.
Rispetto ai modelli di previsione tradizionali, i ricercatori hanno utilizzato una metrica chiamata punteggio kappa, dove 1 indica che le previsioni concordano ogni volta, e qualsiasi valore inferiore indica meno istanze di accordi. I punteggi Kappa per i modelli di valutazione automatica della densità disponibili in commercio ottengono un punteggio massimo di circa 0,6. Nell'applicazione clinica, il modello dei ricercatori ha ottenuto un punteggio kappa di 0,85 e, in prova, ha segnato un 0,67. Ciò significa che il modello effettua previsioni migliori rispetto ai modelli tradizionali.
In un ulteriore esperimento, i ricercatori hanno testato l'accordo del modello con il consenso di cinque radiologi MGH da 500 mammografie casuali. I radiologi hanno assegnato la densità del seno alle mammografie senza conoscere la valutazione originale, o le valutazioni dei loro pari o del modello. In questo esperimento, il modello ha ottenuto un punteggio kappa di 0,78 con il consenso del radiologo.
Prossimo, i ricercatori mirano a scalare il modello in altri ospedali. "Sulla base di questa esperienza traslazionale, esploreremo come trasferire gli algoritmi di apprendimento automatico sviluppati al MIT in clinica a beneficio di milioni di pazienti, " Dice Barzilay. "Questo è uno statuto del nuovo centro del MIT, la Clinica Abdul Latif Jameel per l'apprendimento automatico in sanità del MIT, che è stato lanciato di recente. E siamo entusiasti delle nuove opportunità aperte da questo centro".