I ricercatori del MIT descrivono un algoritmo di apprendimento automatico in grado di registrare scansioni cerebrali e altre immagini 3D più di 1, 000 volte più rapidamente utilizzando nuove tecniche di apprendimento. Credito:Massachusetts Institute of Technology
La registrazione di immagini mediche è una tecnica comune che prevede la sovrapposizione di due immagini, come le scansioni di risonanza magnetica (MRI), per confrontare e analizzare le differenze anatomiche in grande dettaglio. Se un paziente ha un tumore al cervello, ad esempio, i medici possono sovrapporre una scansione cerebrale di diversi mesi fa a una scansione più recente per analizzare piccoli cambiamenti nel progresso del tumore.
Questo processo, però, spesso possono volerci due ore o più, poiché i sistemi tradizionali allineano meticolosamente ciascuno dei potenziali milioni di pixel nelle scansioni combinate. In un paio di documenti per conferenze imminenti, I ricercatori del MIT descrivono un algoritmo di apprendimento automatico in grado di registrare scansioni cerebrali e altre immagini 3D più di 1, 000 volte più rapidamente utilizzando nuove tecniche di apprendimento.
L'algoritmo funziona "apprendendo" registrando migliaia di coppie di immagini. Così facendo, acquisisce informazioni su come allineare le immagini e stima alcuni parametri di allineamento ottimali. Dopo l'allenamento, utilizza questi parametri per mappare tutti i pixel di un'immagine su un'altra, tutto in una volta. Ciò riduce il tempo di registrazione a un minuto o due utilizzando un normale computer, o meno di un secondo utilizzando una GPU con una precisione paragonabile a quella dei sistemi all'avanguardia.
"I compiti di allineamento di una risonanza magnetica cerebrale non dovrebbero essere così diversi quando si allinea un paio di risonanza magnetica cerebrale o un altro, " dice il coautore di entrambi gli articoli Guha Balakrishnan, uno studente laureato in Computer Science and Artificial Intelligence Laboratory (CSAIL) del MIT e Dipartimento di Ingegneria e Informatica (EECS). "Ci sono informazioni che dovresti essere in grado di trasferire nel modo in cui esegui l'allineamento. Se sei in grado di imparare qualcosa dalla precedente registrazione dell'immagine, puoi svolgere un nuovo compito molto più velocemente e con la stessa precisione."
I documenti vengono presentati alla Conferenza sulla visione artificiale e il riconoscimento dei modelli (CVPR), tenuto questa settimana, e al Medical Image Computing and Computer Assisted Interventions Conference (MICCAI), tenuto nel mese di settembre. I coautori sono:Adrian Dalca, un postdoc presso il Massachusetts General Hospital e CSAIL; Amy Zhao, uno studente laureato in CSAIL; Mert R. Sabuncu, un ex postdoc CSAIL e ora professore alla Cornell University; e John Guttag, il Dugald C. Jackson Professor in Ingegneria Elettrica al MIT.
Conservazione delle informazioni
Le scansioni MRI sono fondamentalmente centinaia di immagini 2-D impilate che formano enormi immagini 3-D, chiamato "volumi, " contenente un milione o più di pixel 3D, chiamati "voxel". Perciò, è molto dispendioso in termini di tempo allineare tutti i voxel del primo volume con quelli del secondo. Inoltre, le scansioni possono provenire da macchine diverse e avere orientamenti spaziali diversi, il che significa che la corrispondenza dei voxel è ancora più complessa dal punto di vista computazionale.
"Hai due immagini diverse di due cervelli diversi, metterli uno sopra l'altro, e inizi a dimenarti uno finché uno non si adatta all'altro. Matematicamente, questa procedura di ottimizzazione richiede molto tempo, "dice Dalca, autore senior dell'articolo CVPR e autore principale dell'articolo MICCAI.
Questo processo diventa particolarmente lento quando si analizzano le scansioni di grandi popolazioni. Neuroscienziati che analizzano le variazioni nelle strutture cerebrali in centinaia di pazienti con una particolare malattia o condizione, ad esempio, potrebbe richiedere centinaia di ore.
Questo perché quegli algoritmi hanno un grosso difetto:non imparano mai. Dopo ogni registrazione, eliminano tutti i dati relativi alla posizione del voxel. "Essenzialmente, ripartono da zero regalando un nuovo paio di immagini, " dice Balakrishnan. "Dopo 100 registrazioni, dovresti aver imparato qualcosa dall'allineamento. Questo è ciò che sfruttiamo".
L'algoritmo dei ricercatori chiamato "VoxelMorph, " è alimentato da una rete neurale convoluzionale (CNN), un approccio di apprendimento automatico comunemente utilizzato per l'elaborazione delle immagini. Queste reti sono costituite da molti nodi che elaborano immagini e altre informazioni attraverso diversi livelli di calcolo.
Nel documento CVPR, i ricercatori hanno addestrato il loro algoritmo su 7, 000 scansioni cerebrali MRI pubblicamente disponibili e poi testato su 250 scansioni aggiuntive.
Durante l'allenamento, le scansioni cerebrali sono state inserite nell'algoritmo a coppie. Utilizzando una CNN e un livello di calcolo modificato chiamato trasformatore spaziale, il metodo cattura le somiglianze dei voxel in una scansione MRI con i voxel nell'altra scansione. Così facendo, l'algoritmo apprende informazioni su gruppi di voxel, come forme anatomiche comuni a entrambe le scansioni, che utilizza per calcolare parametri ottimizzati che possono essere applicati a qualsiasi coppia di scansioni.
Quando vengono alimentate due nuove scansioni, una semplice "funzione" matematica utilizza quei parametri ottimizzati per calcolare rapidamente l'esatto allineamento di ogni voxel in entrambe le scansioni. In breve, il componente CNN dell'algoritmo acquisisce tutte le informazioni necessarie durante l'addestramento in modo che, durante ogni nuova registrazione, l'intera registrazione può essere eseguita utilizzando uno, valutazione di funzioni facilmente calcolabili.
I ricercatori hanno scoperto che il loro algoritmo potrebbe registrare con precisione tutte le loro 250 scansioni cerebrali di prova, quelle registrate dopo il set di allenamento, entro due minuti utilizzando un'unità di elaborazione centrale tradizionale, e in meno di un secondo utilizzando un'unità di elaborazione grafica.
È importante sottolineare che l'algoritmo è "non supervisionato, " significa che non richiede informazioni aggiuntive oltre ai dati dell'immagine. Alcuni algoritmi di registrazione incorporano modelli CNN ma richiedono una "verità fondamentale, " significa che viene eseguito prima un altro algoritmo tradizionale per calcolare registrazioni accurate. L'algoritmo dei ricercatori mantiene la sua accuratezza senza quei dati.
Il documento MCCAI sviluppa un raffinato algoritmo VoxelMorph che "dice quanto siamo sicuri di ogni registrazione, " dice Balakrishnan. Garantisce anche la "morbidezza" della registrazione, " nel senso che non produce pieghe, buchi, o distorsioni generali nell'immagine composita. Il documento presenta un modello matematico che convalida l'accuratezza dell'algoritmo utilizzando qualcosa chiamato punteggio di dadi, una metrica standard per valutare l'accuratezza delle immagini sovrapposte. In 17 regioni del cervello, il raffinato algoritmo VoxelMorph ha ottenuto la stessa precisione di un algoritmo di registrazione all'avanguardia comunemente usato, fornendo allo stesso tempo miglioramenti metodologici e di runtime.
Oltre le scansioni cerebrali
L'algoritmo veloce ha una vasta gamma di potenziali applicazioni oltre all'analisi delle scansioni cerebrali, dicono i ricercatori. colleghi del MIT, ad esempio, are currently running the algorithm on lung images.
The algorithm could also pave the way for image registration during operations. Various scans of different qualities and speeds are currently used before or during some surgeries. But those images are not registered until after the operation. When resecting a brain tumor, ad esempio, surgeons sometimes scan a patient's brain before and after surgery to see if they've removed all the tumor. If any bit remains, they're back in the operating room.
With the new algorithm, Dalca says, surgeons could potentially register scans in near real-time, getting a much clearer picture on their progress. "Oggi, they can't really overlap the images during surgery, because it will take two hours, and the surgery is ongoing" he says. "However, if it only takes a second, you can imagine that it could be feasible."
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.