I processi biologici sono inquadrati dal contesto in cui si svolgono. Un nuovo strumento sviluppato dal gruppo Stegle dell'EMBL Heidelberg e dal Centro tedesco per la ricerca sul cancro (DKFZ) aiuta a inserire i risultati della ricerca di biologia molecolare in un contesto migliore dell'ambiente cellulare, integrando forme diverse di dati spaziali.
In un tessuto, ogni singola cellula è circondata da altre cellule e tutte interagiscono costantemente tra loro per dare origine alla funzione biologica. Per capire come funzionano o come funzionano male i tessuti in malattie come il cancro, è fondamentale non solo conoscere le caratteristiche di ogni cellula, ma anche tenere conto del loro contesto spaziale. La caratterizzazione quantitativa delle cellule nel contesto dello spazio fisico in cui vivono è la chiave per comprendere i sistemi complessi.
Le tecnologie che consentono questi tipi di esplorazione sono chiamate tecnologie omiche spaziali e il loro progressivo sviluppo sta contribuendo all’aumento della popolarità della biologia spaziale. Tali tecnologie possono fornire informazioni dettagliate sulla composizione molecolare delle singole cellule e sulla loro disposizione spaziale.
Tuttavia, queste tecnologie si concentrano su diverse caratteristiche di una cellula, come i livelli di RNA o proteine, e i set di dati risultanti vengono gestiti e archiviati in diversi modi. Per risolvere questa sfida, un progetto collaborativo guidato dallo Stegle Group ha sviluppato SpatialData, uno standard di dati e un framework software che consente agli scienziati di rappresentare i dati provenienti da un'ampia gamma di tecnologie omiche spaziali in modo unificato.
Sviluppo tecnologico per la biologia spaziale
Negli ultimi dieci anni, numerose tecnologie sono state sviluppate sia dal mondo accademico che dall’industria per la visualizzazione spaziale di tessuti, cellule e compartimenti subcellulari. Tuttavia, ciascuna tecnica si concentra su un numero limitato di caratteristiche desiderabili e presenta i relativi compromessi. Ad esempio, Visium di 10x Genomics acquisisce informazioni sull'espressione di tutti i geni in un tessuto, ma non fornisce la risoluzione di una singola cellula.
Al contrario, il test 10x Genomics Xenium, MERFISH o la piattaforma MERSCOPE di Vizgen producono mappe a grana fine dell'espressione genica con risoluzione subcellulare. Tuttavia, questi test sono attualmente limitati a poche centinaia di geni preselezionati. E l'elenco di tali tecnologie, ciascuna delle quali fornisce una piccola parte del quadro completo, continua a crescere.
Sfide delle tecnologie omiche spaziali
Questa eterogeneità delle tecnologie si riflette sul lato computazionale in un'eterogeneità ancora maggiore dei formati di file:ciascuna tecnologia è dotata del proprio formato di archiviazione e spesso i dati generati dalla stessa tecnologia possono essere archiviati in più formati.
In pratica, ciò comporta diverse sfide per l’analisi dei dati omici spaziali. I metodi di visualizzazione e analisi sono generalmente adattati a una tecnologia specifica, il che limita la compatibilità dei dati e rende difficile integrare metodi diversi in un'unica pipeline di analisi. Tuttavia, per una comprensione olistica di un sistema biologico, è importante esaminare contemporaneamente diverse caratteristiche cellulari o campioni provenienti da luoghi diversi.
Le tecnologie omiche generano enormi quantità di dati (terabyte di immagini, milioni di cellule, miliardi di singole molecole), richiedendo soluzioni ingegneristiche ottimizzate. Pertanto, la biologia spaziale ha urgente bisogno di un quadro universale in grado di integrare i dati provenienti da esperimenti e tecnologie e fornire approfondimenti olistici sulla salute e sulla malattia. È qui che entra in gioco SpatialData.
SpatialData:una struttura per unirli tutti
"C'è una forte necessità di stabilire soluzioni comunitarie per la gestione e l'archiviazione dei dati di omica spaziale. In particolare, c'è la necessità di sviluppare nuovi standard di dati e basi computazionali che consentano di unificare approcci di analisi attraverso l'intero spettro delle diverse tecnologie di omica spaziale che stanno emergendo", ha affermato Oliver Stegle, capogruppo presso l'EMBL nell'Unità di biologia genomica e capo della divisione di genomica computazionale e genetica dei sistemi presso il Centro tedesco di ricerca sul cancro (DKFZ).
"Un primo passo importante in questa direzione è SpatialData, uno standard di dati e un framework software che collega e adatta i precedenti concetti di gestione dei dati dalla multi-omica a cella singola al dominio spaziale."
SpatialData unifica e integra dati provenienti da diverse tecnologie omiche, collegando tecnologie all'avanguardia con un framework che consente l'accesso e la manipolazione dei dati con prestazioni computazionali.
Questo strumento è stato introdotto in Metodi naturali pubblicazione, scritta da Luca Marconato durante il suo dottorato di ricerca. all'EMBL nello Stegle Group, un titolo congiunto con la Facoltà di Bioscienze dell'Università di Heidelberg.
"Abbiamo sviluppato il framework SpatialData per alleviare le sfide della rappresentazione dei dati durante lo studio della biologia spaziale, in modo che il ricercatore possa concentrarsi sull'analisi biologica, piuttosto che essere rallentato da noiose manipolazioni dei dati, altrimenti necessari anche solo per visualizzare i dati. Il framework fornisce una rappresentazione unificata e implementa operazioni ergonomiche per un'elaborazione conveniente dei dati omici spaziali," ha affermato Marconato.
Lo strumento consente a qualsiasi ricercatore di importare i propri dati ed eseguire attività come la rappresentazione, l'elaborazione e la visualizzazione dei dati. Inoltre, offre la possibilità di annotare in modo interattivo i dati e salvarli in un formato indipendente dal linguaggio, facilitando l'emergere di strategie di analisi che combinano metodi di diversi linguaggi di programmazione o comunità di analisi.
Il quadro è stato sviluppato come progetto di collaborazione tra più istituzioni come il DKFZ, l'Università Tecnica di Monaco, il Centro Helmholtz di Monaco, German BioImaging, l'ETH di Zurigo, il Centro VIB per la ricerca sull'infiammazione in Belgio, nonché Huber e Saka gruppi all'EMBL.
"Abbiamo condotto la nostra ricerca e sviluppo tecnologico tenendo presente il vantaggio per la più ampia comunità scientifica", ha affermato Giovanni Palla, co-primo autore e Ph.D. studente presso il Centro Helmholtz di Monaco.
"Non solo abbiamo creato un progetto di collaborazione interdisciplinare tra istituti di ricerca, ma abbiamo anche lavorato a stretto contatto con sviluppatori che lavorano con diverse tecnologie spaziali e in diversi linguaggi di programmazione per affrontare il problema dell'interoperabilità. Di conseguenza, il nostro framework è compatibile con la stragrande maggioranza delle omiche spaziali analisi dal mondo accademico e industriale.
"Essendo pubblicati apertamente, altri ricercatori possono ora utilizzare liberamente SpatialData per gestire i propri dati e avere l'opportunità di collaborare su varie tecnologie e argomenti di ricerca."
"Nel nostro articolo illustriamo tre importanti caratteristiche di SpatialData", ha spiegato Kevin Yamauchi, co-primo autore e ricercatore post-dottorato presso l'ETH di Zurigo.
"In primo luogo, presentiamo un'interfaccia standardizzata e un formato di archiviazione unificato (basato su OME-NGFF) per tutte le tecnologie di omica spaziale. In secondo luogo, utilizzando la rappresentazione unificata, integriamo segnali da più modalità. Qui trasferiamo annotazioni tra modalità e quantifichiamo i segnali utilizzando queste annotazioni trasferite, infine, presentiamo un modo per annotare in modo interattivo le immagini (patologiche) e utilizzare le annotazioni per analizzare i profili molecolari associati."
SpatialData fornisce una rappresentazione interattiva dei dati, sia sul disco rigido che sulla RAM del computer, che consente l'analisi di dati di imaging di grandi dimensioni o di più geometrie o celle.
Altre importanti caratteristiche chiave sono la capacità del framework di allineare e annotare i dati omici in un sistema di coordinate comune. Pertanto, SpatialData consente la gestione e la manipolazione efficiente di set di dati spaziali, inclusa la definizione di un sistema di coordinate comune tra tecnologie basate sul sequenziamento e sull'imaging.
Applicazione nel cancro al seno
Il team interdisciplinare ha utilizzato il framework SpatialData per rianalizzare un set di dati multimodali sul cancro al seno da 10X Genomics come prova di concetto. Questo set di dati comprende sezioni consecutive dello stesso blocco di cancro al seno, in cui ciascuna sezione viene analizzata utilizzando tecnologie diverse, come Visium, Xenium, e un set di dati scRNA-seq separato.
Lo studio dimostra la natura complementare di queste tecnologie. "Integrando 10X Xenium e scRNAseq, abbiamo mappato i tipi di cellule nello spazio", ha affermato Elyas Heidari, Ph.D. candidato presso DKFZ e uno degli autori dello studio.
"Successivamente, abbiamo utilizzato 10X Visium per identificare i cloni tumorali nello spazio. Questo può essere fatto perché disponiamo di letture a livello di trascrittoma. Infine, abbiamo utilizzato le immagini microscopiche colorate con H&E per identificare le regioni di interesse per le annotazioni istopatologiche. Questa analisi ha mostrato con successo un'analisi unica applicazione di SpatialData per sbloccare analisi multimodali di set di dati risolti spazialmente."
In futuro, il tumore di un paziente potrebbe essere analizzato con diverse tecnologie comunemente utilizzate in clinica, con i dati poi unificati da SpatialData per ottenere una comprensione olistica del tumore. Inoltre, l'interfaccia interattiva consentirebbe al medico di annotare i dati, consentendo così un'analisi dettagliata di specifiche regioni e caratteristiche del tumore, portando potenzialmente ad approcci terapeutici personalizzati.