Un programma di apprendimento automatico sviluppato da un team internazionale di ricercatori può aiutare le aziende farmaceutiche a produrre quantità maggiori di farmaci all'avanguardia necessari per i trattamenti medici.
In uno studio, il team ha sviluppato un algoritmo informatico utilizzando i dati di espressione genica delle cellule ovariche di criceto cinese, una linea cellulare spesso utilizzata dai ricercatori biofarmaceutici per la ricerca medica, per ottimizzare la produzione di proteine in quelle cellule.
"L'industria farmaceutica in genere si basa sulle cellule ovariche di un criceto cinese, le cellule CHO, per la ricerca volta a creare farmaci efficaci, ma, perché le cellule non producono molte proteine per cellula, richiede una produzione su larga scala, " disse Claudio Angione, docente universitario di informatica, Università di Teesside. "Ciò che mostriamo è che, rispetto ad altri metodi, combinare questo modello metabolico con metodi basati sui dati potrebbe essere un grande miglioramento per l'automazione della progettazione delle culture, identificando con precisione le condizioni di crescita ottimali per la produzione di composti terapeutici target".
I ricercatori, che hanno riportato i loro risultati alla Seconda Conferenza Elettronica Internazionale sulla Metabolomica, apprendimento automatico combinato e un modello computazionale che ricostruisce il metabolismo delle cellule ovariche di criceto cinese, CHO, per massimizzare l'efficienza della cellula.
"Questo è un passo nuovo perché, per la prima volta, stiamo combinando due metodologie solitamente utilizzate singolarmente negli studi sui bioprocessi, " disse Angione.
I ricercatori sono stati in grado di prevedere la produzione di lattato, un prodotto di scarto tossico, all'interno delle cellule, sia dal punto di vista genetico che metabolico.
"La produzione di lattato è generalmente indesiderata in quanto ostacola la crescita cellulare e di conseguenza limita la resa dei prodotti desiderati, " disse Macauley Coggins, assistente ricercatore, Università di Teesside. "Prevedendo le condizioni cellulari in cui l'accumulo di lattato è ridotto al minimo, è possibile ridurre, o forse evitare, lunghe serie di prove sperimentali".
proteine terapeutiche, come quelli prodotti nelle cellule CHO, hanno una vasta gamma di applicazioni in medicina.
"Alcuni di questi sono usati nei vaccini e proteggono da agenti infettivi come virus, "aggiunse Guido Zampieri, dottorando in genomica e bioinformatica, Centro Biotecnologie CRIBI, Università di Padova. "Altre proteine con attività di targeting speciale possono essere utilizzate per trattare i pazienti che mancano di tali proteine a causa di condizioni genetiche. I farmaci antitumorali sono un altro esempio".
L'apprendimento automatico è un campo che esplora come i computer possono imparare a risolvere problemi e svolgere compiti specifici senza essere programmati, secondo Coggins. Per fare questo, i ricercatori di solito sviluppano un algoritmo per addestrare un computer a riconoscere schemi, una tecnica di apprendimento automatico spesso definita apprendimento supervisionato.
"È molto simile al modo in cui insegni a un bambino a riconoscere forme diverse mostrando loro che cos'è ogni forma e che aspetto ha"
Nel futuro, questo metodo potrebbe essere utilizzato per ottimizzare altri metaboliti o proteine, suggeriscono i ricercatori. La produzione di maggiori quantità di farmaci potrebbe anche portare a cure meno costose.
"Vediamo diverse direzioni di ricerca interessanti, — disse Angione. — In primo luogo, miriamo a promuovere l'integrazione di diverse metodologie computazionali come l'apprendimento automatico e la modellazione biologica. Questo è importante in quanto possiedono diversi punti di forza, che se combinate potrebbero consentire di adottare interventi di bioingegneria più precisi.
Particolarmente, l'apprendimento automatico può estrarre conoscenze utili da dati sperimentali, mentre la modellazione metabolica fornisce approfondimenti sui meccanismi locali e globali nelle reti biochimiche.
"Vogliamo anche esplorare altre fasi della bioingegneria che potrebbero trarre vantaggio da questa ottimizzazione integrata. L'obiettivo finale è ottenere una serie di strumenti computazionali in grado di guidare i processi industriali su più livelli".
I ricercatori hanno utilizzato i dati di un set di dati di espressione genica su larga scala disponibile pubblicamente da due diverse linee cellulari CHO con 295 profili di microarray con valori di espressione per 3592 geni da 121 colture cellulari CHO. Per la ricostruzione del genoma, the researchers used a recently developed genome-scale metabolic model—GSMM—used to accurately predict growth phenotypes. The model is currently the largest reconstruction of CHO metabolism.
They then combined the model of CHO cell metabolism with the gene expression data to create condition and cell line-specific polyomics models.