L'algoritmo di apprendimento automatico aiuta nella ricerca di nuovi farmaci

Credito:CC0 Dominio Pubblico

I ricercatori hanno progettato un algoritmo di apprendimento automatico per la scoperta di farmaci che ha dimostrato di essere due volte più efficiente dello standard del settore, che potrebbe accelerare il processo di sviluppo di nuovi trattamenti per la malattia.

I ricercatori, guidato dall'Università di Cambridge, hanno usato il loro algoritmo per identificare quattro nuove molecole che attivano una proteina ritenuta rilevante per i sintomi del morbo di Alzheimer e della schizofrenia. I risultati sono riportati sulla rivista PNAS .

Un problema chiave nella scoperta di farmaci è prevedere se una molecola attiverà un particolare processo fisiologico. È possibile costruire un modello statistico cercando modelli chimici condivisi tra molecole note per attivare quel processo, ma i dati per costruire questi modelli sono limitati perché gli esperimenti sono costosi e non è chiaro quali modelli chimici siano statisticamente significativi.

"L'apprendimento automatico ha compiuto progressi significativi in aree come la visione artificiale in cui i dati sono abbondanti, " ha detto il dottor Alpha Lee del Cavendish Laboratory di Cambridge, e l'autore principale dello studio. "La prossima frontiera sono le applicazioni scientifiche come la scoperta di farmaci, dove la quantità di dati è relativamente limitata ma abbiamo informazioni fisiche sul problema, e la domanda diventa come coniugare i dati con la chimica e la fisica fondamentali".

L'algoritmo sviluppato da Lee e dai suoi colleghi, in collaborazione con l'azienda biofarmaceutica Pfizer, usa la matematica per separare i modelli chimici farmacologicamente rilevanti da quelli irrilevanti.

È importante sottolineare che l'algoritmo esamina sia le molecole note per essere attive che le molecole note per essere inattive, e impara a riconoscere quali parti delle molecole sono importanti per l'azione del farmaco e quali no. Un principio matematico noto come teoria della matrice casuale fornisce previsioni sulle proprietà statistiche di un set di dati casuale e rumoroso, che viene quindi confrontato con le statistiche delle caratteristiche chimiche delle molecole attive/inattive per distillare quali modelli chimici sono veramente importanti per il legame rispetto al sorgere semplicemente per caso.

Questa metodologia consente ai ricercatori di estrarre importanti modelli chimici non solo da molecole attive, ma anche da molecole inattive, in altre parole, esperimenti falliti possono ora essere sfruttati con questa tecnica.

I ricercatori hanno costruito un modello partendo da 222 molecole attive, e sono stati in grado di esaminare computazionalmente altri sei milioni di molecole. Da questa, i ricercatori hanno acquistato e selezionato le 100 molecole più rilevanti. Da questi, hanno identificato quattro nuove molecole che attivano il recettore CHRM1, una proteina che può essere rilevante per la malattia di Alzheimer e la schizofrenia.

"La capacità di estrarre quattro molecole attive da sei milioni è come trovare un ago in un pagliaio, " ha detto Lee. "Un confronto testa a testa mostra che il nostro algoritmo è due volte più efficiente dello standard del settore".

Realizzare molecole organiche complesse è una sfida significativa in chimica, e potenziali farmaci abbondano nello spazio di molecole ancora non trasformabili. I ricercatori di Cambridge stanno attualmente sviluppando algoritmi che prevedono modi per sintetizzare molecole organiche complesse, oltre ad estendere la metodologia di apprendimento automatico alla scoperta dei materiali.

La ricerca è stata supportata dal Winton Program for the Physics of Sustainability.

Idrogel anti-fatica-frattura

Le proteine funzionanti fanno buon uso della frustrazione

Chimica