Un software di riconoscimento di nanopori e immagini può sequenziare un glicosaminoglicano solfato in tempo reale. Credito:Rensselaer Polytechnic Institute
Utilizzando un nanoporo, i ricercatori hanno dimostrato il potenziale per ridurre il tempo necessario per il sequenziamento di un glicosaminoglicano, una classe di molecole di zucchero a catena lunga importanti per la nostra biologia quanto il DNA, da anni a minuti.
Come pubblicato questa settimana nel Atti delle Accademie Nazionali delle Scienze , un team del Rensselaer Polytechnic Institute ha dimostrato che il software di apprendimento automatico e riconoscimento delle immagini potrebbe essere utilizzato per identificare rapidamente e accuratamente le catene di zucchero, in particolare, quattro eparan solfati sintetici, basati sui segnali elettrici generati mentre passavano attraverso un minuscolo foro in un wafer di cristallo.
"I glicosaminoglicani sono un complesso repertorio di sequenze, come l'opera di Shakespeare o una poesia di Yates è una complessa raccolta di lettere. Ci vuole un esperto per scriverli e un esperto per leggerli, " ha detto Robert Linhardt, capo ricercatore e professore di chimica e biologia chimica al Rensselaer Polytechnic Institute. "Abbiamo addestrato una macchina a leggere rapidamente l'equivalente di parole con quattro lettere come "ababab" o "bcbcbc". Queste sono semplici sequenze che non hanno alcun significato, ma ci mostrano che alla macchina si può insegnare a leggere. Se estendiamo e sviluppiamo questa tecnologia, ha il potenziale per sequenziare i glicani o anche le proteine in tempo reale, eliminando anni di sforzi."
I dispositivi di sequenziamento dei nanopori commerciali vengono utilizzati per sequenziare il DNA, che è composto da quattro unità di acido nucleico, conosciuto con le lettere A, C, G, e T, messi insieme in un'infinita varietà di configurazioni. Il dispositivo si basa su una corrente ionica che scorre attraverso un foro largo solo pochi miliardesimi di metro in una membrana. I filamenti di DNA sono posti su un lato del foro, e trascinato dal flusso della corrente. Ogni acido nucleico ostruisce un po' il foro mentre lo attraversa, interrompendo la corrente e producendo un particolare segnale associato a quell'acido nucleico. I dispositivi, attualmente utilizzato per il lavoro sul campo, sono solo una delle numerose tecniche relativamente rapide e automatizzate per il sequenziamento del DNA.
Glicosaminoglicani, o GAG, sono una classe strutturalmente complessa di glicani, gli zuccheri essenziali presenti negli organismi viventi, che si trovano sulle superfici cellulari e sulla matrice extracellulare di tutti gli animali e svolgono molte funzioni nella crescita cellulare e nella segnalazione, anticoagulazione e riparazione delle ferite, e il mantenimento dell'adesione cellulare. GAG, attualmente estratti da animali macellati, sono usati come farmaci e nutraceutici.
come il DNA, I GAG possono essere suddivisi nelle loro unità di zucchero disaccaride costituenti. Ma mentre il DNA è composto da sole quattro lettere in una stringa lineare, questi glicani hanno dozzine di unità di base, alcuni con annessi gruppi solfati, gruppi acidi, e gruppi ammidici. Per esempio, anche una molecola relativamente piccola di eparan solfato naturale di sei unità di zucchero potrebbe avere 32, 768 possibili sequenze. A causa della sfida, il sequenziamento del glicano rimane oneroso, basandosi su un accurato lavoro di laboratorio e su analisi sofisticate, che coinvolgono tecniche con nomi come cromatografia liquida-spettrometria di massa tandem e spettroscopia di risonanza magnetica nucleare.
Come parte del suo lavoro, Linhardt, un esperto di glicani che ha sviluppato una variante sintetica della comune eparina anticoagulante, sequenze GAG per comprendere le forme naturali e sviluppare varianti sintetiche.
"Utilizzando metodi analitici standard, ci sono voluti due anni per sequenziare il primo semplice GAG, " ha detto Linhardt, membro del Rensselaer Center for Biotechnology and Interdisciplinary Studies. "Ne abbiamo un altro su cui abbiamo lavorato per la maggior parte della sequenza, e ci sono voluti più di cinque anni e probabilmente ci vorranno altri cinque anni per finirlo, "
Ragionando sul fatto che il sequenziamento dei nanopori potrebbe essere utilizzato per identificare le unità disaccaridiche in un GAG, il team di ricerca ha costruito il proprio dispositivo a nanopori e ha sintetizzato quattro catene GAG di eparan solfato utilizzando il processo chemoenzimatico sviluppato dal Linhardt Lab. È importante sottolineare che questi quattro eparan solfati erano molto semplici, realizzati con combinazioni di soli quattro diversi tipi di unità di zucchero, assemblati in una catena lunga circa 40 unità, e con una composizione e una sequenza attentamente controllate.
Il team ha passato ciascun eparan solfato attraverso il nanoporo e ha prodotto un grafico che rappresenta la tensione nel tempo in uscita dal dispositivo. Ognuna delle quattro varianti è stata eseguita attraverso il dispositivo più di 2, 000 volte, aumentando la probabilità statistica di una lettura accurata data la progettazione rudimentale del nanoporo sperimentale.
"Il dispositivo ha sequenziato l'eparan solfato più semplice in tempo reale e ha prodotto uno schema che i nostri occhi potevano facilmente riconoscere subito per ciascuno dei quattro campioni, "Ha detto Linhardt. "Si può immediatamente dire che sono diversi."
Per garantire un'analisi imparziale, il team ha inserito i risultati in un software gratuito di apprendimento automatico e riconoscimento delle immagini utilizzando la rete neurale profonda di Google, addestrare il software a distinguere tra i quattro diversi modelli e identificare ciascuna variante di eparan solfato. Il modello di apprendimento automatico di maggior successo ha prodotto un'analisi accurata quasi al 97%.
"Il contenuto di informazioni in una sequenza GAG può superare di gran lunga quello di una quantità simile di DNA o RNA, il che significa che la capacità di leggere rapidamente le sequenze GAG apre una nuova finestra di comprensione nella complessa biochimica della vita", ha affermato Curt Breneman, preside della Rensselaer School of Science. "Questo studio proof of concept collega metodi innovativi di nanorilevazione con strumenti di apprendimento automatico all'avanguardia, e mostra il potere del pensiero interdisciplinare per espandere le frontiere della conoscenza."
Ridurre la velocità con cui i GAG passano attraverso il nanoporo potrebbe aumentare la precisione, e il dispositivo può essere addestrato su unità di zucchero aggiuntive, e sequenze più complesse, che sono tutti obiettivi di ricerca futuri. Linhardt ha detto che la macchina dovrebbe imparare da 10 a 20 unità di zucchero per sequenziare completamente un GAG.
"Questa è una prova del concetto; l'abbiamo fatta leggere parole di due lettere, "Ha detto Linhardt. "Una volta che gli insegniamo l'intero alfabeto, sarà in grado di leggere ogni sequenza diversa. Sarà in grado di leggere tutte le parole".