I ricercatori del MIT hanno combinato la chimica sperimentale con l'intelligenza artificiale per scoprire non tossici, peptidi altamente attivi che possono essere attaccati agli oligomeri morfolino fosforodiamidato (PMO) per favorire la somministrazione del farmaco. Sviluppando queste nuove sequenze, i ricercatori sperano di accelerare rapidamente lo sviluppo di terapie geniche per la distrofia muscolare di Duchenne e altre malattie. Credito:Massachusetts Institute of Technology
Distrofia muscolare di Duchenne (DMD), una malattia genetica rara di solito diagnosticata nei ragazzi giovani, indebolisce gradualmente i muscoli in tutto il corpo fino a quando il cuore o i polmoni non cedono. I sintomi si manifestano spesso all'età di 5 anni; man mano che la malattia progredisce, i pazienti perdono la capacità di camminare intorno ai 12 anni. Oggi, l'aspettativa di vita media per i pazienti con DMD si aggira intorno ai 26 anni.
Era una grande notizia, poi, quando Cambridge, Sarepta Therapeutics, con sede nel Massachusetts, ha annunciato nel 2019 un farmaco rivoluzionario che prende di mira direttamente il gene mutato responsabile della DMD. La terapia utilizza oligomeri antisenso fosforodiamidate morfolino (PMO), una grande molecola sintetica che permea il nucleo cellulare per modificare il gene della distrofina, consentendo la produzione di una proteina chiave che normalmente manca nei pazienti con DMD. "Ma c'è un problema con il PMO di per sé. Non è molto bravo a entrare nelle cellule, "dice Carly Schissel, un dottorato di ricerca candidato al Dipartimento di Chimica del MIT.
Per aumentare la consegna al nucleo, i ricercatori possono apporre peptidi che penetrano nelle cellule (CPP) al farmaco, aiutandolo così ad attraversare la cellula e le membrane nucleari per raggiungere il suo obiettivo. Quale sequenza peptidica è la migliore per il lavoro, però, è rimasta una domanda incombente.
I ricercatori del MIT hanno ora sviluppato un approccio sistematico per risolvere questo problema combinando la chimica sperimentale con l'intelligenza artificiale per scoprire, peptidi altamente attivi che possono essere attaccati al PMO per favorire il rilascio. Sviluppando queste nuove sequenze, sperano di accelerare rapidamente lo sviluppo di terapie geniche per la DMD e altre malattie.
I risultati del loro studio sono stati ora pubblicati sulla rivista Chimica della natura in un articolo condotto da Schissel e Somesh Mohapatra, un dottorato di ricerca studente presso il Dipartimento di Scienza e Ingegneria dei Materiali del MIT, chi sono gli autori principali. Rafael Gomez Bombarelli, assistente professore di scienza e ingegneria dei materiali, e Bradley Penteluto, professore di chimica, sono gli autori senior del documento. Altri autori includono Justin Wolfe, Colin Fadzen, Kamela Bellovoda, Chia-Ling Wu, Jenna Wood, Annika Malmberg, e Andrei Loas.
"Proporre nuovi peptidi con un computer non è molto difficile. A giudicare se sono buoni o no, questo è ciò che è difficile, " dice Gomez-Bombarelli. "L'innovazione chiave sta usando l'apprendimento automatico per collegare la sequenza di un peptide, in particolare un peptide che include amminoacidi non naturali, all'attività biologica misurata sperimentalmente."
Dati del sogno
I CPP sono catene relativamente corte, composto da cinque a 20 amminoacidi. Mentre un CPP può avere un impatto positivo sulla somministrazione del farmaco, diversi collegati tra loro hanno un effetto sinergico nel portare la droga oltre il traguardo. Queste catene più lunghe, contenente da 30 a 80 amminoacidi, sono chiamate miniproteine.
Prima che un modello possa fare previsioni utili, i ricercatori sul lato sperimentale avevano bisogno di creare un solido set di dati. Mescolando e abbinando 57 diversi peptidi, Schissel e i suoi colleghi sono stati in grado di costruire una libreria di 600 miniproteine, ciascuno collegato al PMO. Con un saggio, il team è stato in grado di quantificare quanto bene ogni miniproteina potesse spostare il suo carico attraverso la cellula.
La decisione di testare l'attività di ogni sequenza, con PMO già allegato, era importante. Poiché un dato farmaco probabilmente cambierà l'attività di una sequenza CPP, è difficile riutilizzare i dati esistenti, e dati generati in un unico laboratorio, sulle stesse macchine, dalle stesse persone, soddisfare un gold standard per la coerenza nei set di dati di apprendimento automatico.
Uno degli obiettivi del progetto era creare un modello che potesse funzionare con qualsiasi amminoacido. Mentre solo 20 amminoacidi si trovano naturalmente nel corpo umano, altre centinaia esistono altrove, come un pacchetto di espansione di aminoacidi per lo sviluppo di farmaci. Per rappresentarli in un modello di machine learning, i ricercatori in genere utilizzano la codifica one-hot, un metodo che assegna ogni componente a una serie di variabili binarie. Tre aminoacidi, Per esempio, sarebbe rappresentato come 100, 010, e 001. Per aggiungere nuovi amminoacidi, il numero di variabili dovrebbe aumentare, il che significa che i ricercatori rimarrebbero bloccati a dover ricostruire il loro modello ad ogni aggiunta.
Anziché, il team ha scelto di rappresentare gli amminoacidi con fingerprinting topologico, che essenzialmente crea un codice a barre univoco per ogni sequenza, con ogni riga nel codice a barre che denota la presenza o l'assenza di una particolare sottostruttura molecolare. "Anche se il modello non ha mai visto [una sequenza] prima, possiamo rappresentarlo come un codice a barre, che è coerente con le regole che il modello ha visto, "dice Mohapatra, che ha guidato gli sforzi di sviluppo del progetto. Utilizzando questo sistema di rappresentazione, i ricercatori sono stati in grado di espandere la loro cassetta degli attrezzi di possibili sequenze.
Il team ha addestrato una rete neurale convoluzionale sulla libreria di miniproteine, con ciascuna delle 600 miniproteine etichettate con la sua attività, indicando la sua capacità di permeare la cellula. All'inizio, il modello proposto miniproteine cariche di arginina, un amminoacido che fa un buco nella membrana cellulare, che non è l'ideale per mantenere in vita le cellule. Per risolvere questo problema, i ricercatori hanno utilizzato un ottimizzatore per decentivizzare l'arginina, impedire al modello di barare.
Alla fine, la capacità di interpretare le previsioni proposte dal modello è stata fondamentale. "Di solito non è sufficiente avere una scatola nera, perché i modelli potrebbero fissarsi su qualcosa che non è corretto, o perché potrebbe sfruttare un fenomeno in modo imperfetto, "Dice Gomez-Bombarelli.
In questo caso, i ricercatori potrebbero sovrapporre le previsioni generate dal modello con il codice a barre che rappresenta la struttura della sequenza. "Fare ciò mette in evidenza alcune regioni che secondo il modello svolgono il ruolo più importante nell'alta attività, " dice Schissel. "Non è perfetto, ma ti dà regioni focalizzate con cui giocare. That information would definitely help us in the future to design new sequences empirically."
Delivery boost
In definitiva, the machine-learning model proposed sequences that were more effective than any previously known variant. One in particular can boost PMO delivery by 50-fold. By injecting mice with these computer-suggested sequences, the researchers validated their predictions and demonstrated that the miniproteins are nontoxic.
It is too early to tell how this work will affect patients down the line, but better PMO delivery will be beneficial in several ways. If patients are exposed to lower levels of the drug, they may experience fewer side effects, Per esempio, or require less-frequent doses (PMO is administered intravenously, often on a weekly basis). The treatment may also become less costly. As a testament to the concept, recent clinical trials demonstrated that a proprietary CPP from Sarepta Therapeutics could decrease exposure to PMO by 10-fold. Anche, PMO is not the only drug that stands to be improved by miniproteins. In additional experiments, the model-generated miniproteins carried other functional proteins into the cell.
Noticing a disconnect between the work of machine-learning researchers and experimental chemists, Mohapatra has posted the model on GitHub, along with a tutorial for experimentalists who have their own list of sequences and activities. He notes that over a dozen people from across the world have adopted the model so far, repurposing it to make their own powerful predictions for a wide range of drugs.
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.