• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  Science >> Scienza >  >> Biologia
    Il nuovo framework di deep learning multi-task integra dati di proteomica e trascrittomica su larga scala di singole cellule
    Integrazione dell'atlante cellulare COVID-19. Credito:Scienza avanzata (2024). DOI:10.1002/advs.202307835

    Il progresso esponenziale nelle tecnologie multi-omiche a cella singola ha portato all’accumulo di set di dati multi-omici ampi e diversificati. Tuttavia, l’integrazione dei dati di proteomica e trascrittomica (o epigenomica) di un’unica cellula rappresenta una sfida significativa per i metodi esistenti. Diversi modelli basati su trasformatore, come Geneformer, hanno cambiato significativamente il paradigma dell'analisi del trascrittoma di una singola cellula. Tuttavia, questi metodi richiedono notevoli risorse computazionali.

    Per affrontare queste sfide, i ricercatori del Giardino Botanico di Wuhan dell’Accademia cinese delle Scienze hanno sviluppato un metodo basato su Transformer, chiamato scmFormer, per integrare dati di proteomica e trascrittomica su larga scala utilizzando un trasformatore multi-task. Lo studio intitolato "scmFormer Integrates Large‐Scale Single‐Cell Proteomics and Transcriptomics Data by Multi‐Task Transformer” è stato pubblicato su Advanced Science .

    I ricercatori hanno presentato una valutazione completa e realizzato casi di studio di questo metodo, i risultati hanno mostrato che scmFormer ha mostrato una notevole competenza nell'armonizzare set di dati omici a singola cellula su larga scala più set di dati proteomici sia a livello di tipo cellulare che a livello cellulare su scala più fine con risorse informatiche limitate.

    Inoltre, scmFormer possiede la capacità di integrare più set di dati multimodali accoppiati a singola cellula, con il duplice vantaggio di ridurre i costi elevati e migliorare le informazioni biologiche.

    Inoltre, scmFormer mostra un'eccezionale capacità di eliminare le differenze tecniche tra le diverse modalità omiche preservando al contempo le informazioni biologiche sottostanti inerenti ai dati, abbracciando sia i tipi di cellule che le condizioni sperimentali.

    L'applicazione di scmFormer per l'integrazione di due set di dati COVID-19 con 1,48 milioni di celle ha ulteriormente dimostrato il netto vantaggio di scmFormer nella gestione di set di dati di grandi dimensioni su normali laptop.

    Ulteriori informazioni: Jing Xu et al, scmFormer integra dati di proteomica e trascrittomica a singola cellula su larga scala mediante Multi-Task Transformer, Advanced Science (2024). DOI:10.1002/advs.202307835

    Informazioni sul giornale: Scienza avanzata

    Fornito dall'Accademia cinese delle scienze




    © Scienza https://it.scienceaq.com