Previsione del comportamento cellulare in silico:formazione su dati che catturano gli effetti di stimolazione per un insieme di tipi di cellule, scGen può essere utilizzato per modellare le risposte cellulari in un nuovo tipo di cellula. Credito:Helmholtz Zentrum München
Presto saranno disponibili atlanti su larga scala di organi sani, in particolare, l'Atlante delle cellule umane. Questo è un passo significativo per una migliore comprensione delle cellule, tessuti e organi in buono stato e fornisce un riferimento per la diagnosi, monitoraggio e trattamento delle malattie. Però, a causa del gran numero di possibili combinazioni di trattamento e condizioni di malattia, espandere questi dati per caratterizzare le malattie e il trattamento delle malattie nei tradizionali laboratori di scienze della vita è laborioso e costoso, e quindi non scalabile.
Modellazione accurata della risposta cellulare alle perturbazioni (ad es. malattia, composti, interventi genetici) è un obiettivo centrale della biologia computazionale. Sebbene esistano modelli basati su approcci statistici e meccanicistici, non è ancora disponibile una soluzione basata sull'apprendimento automatico per i fenomeni ad alta dimensionalità non osservati. Inoltre, scGen è il primo strumento che prevede la risposta cellulare fuori campione. Ciò significa che scGen, se addestrato su dati che catturano l'effetto delle perturbazioni per un dato sistema, è in grado di fare previsioni affidabili per un sistema diverso. "Per la prima volta, abbiamo l'opportunità di utilizzare i dati generati in un sistema modello come il topo e utilizzare i dati per prevedere la malattia o la risposta alla terapia nei pazienti umani, " disse Mohammad Lotfollahi, dottorato di ricerca studente (Helmholtz Zentrum München e Technische Universität München).
scGen è un modello di deep learning generativo che sfrutta le idee dall'immagine, elaborazione della sequenza e del linguaggio, e, per la prima volta, applica queste idee per modellare il comportamento di una cellula in silico. Il prossimo passo per il team riguarda il miglioramento di scGen verso una formulazione completamente basata sui dati, aumentando il suo potere predittivo per consentire lo studio di combinazioni di perturbazioni. "Ora possiamo iniziare a ottimizzare scGen per rispondere a domande sempre più complesse sulle malattie, " ha detto Alex Lupo, Guida del gruppo, e Fabian Theis, Direttore dell'Institute of Computational Biology e Chair of Mathematical Modeling of Biological Systems presso la Technische Universität München.