Utilizzando l'analisi computazionale, i ricercatori hanno scoperto che molte sequenze ripetitive sono condivise tra le proteine e sono simili nelle specie, dai batteri all'uomo. Credito:Byron Lee et al, eLife (2022). DOI:10.7554/eLife.77058
Circa il 70% di tutte le proteine umane include almeno una sequenza costituita da un singolo amminoacido ripetuto molte volte, con alcuni altri amminoacidi spruzzati. Queste "regioni a bassa complessità" si trovano anche nella maggior parte degli altri organismi.
Le proteine che contengono queste sequenze hanno molte funzioni diverse, ma i biologi del MIT hanno ora escogitato un modo per identificarle e studiarle come un gruppo unificato. La loro tecnica consente loro di analizzare somiglianze e differenze tra LCR di specie diverse e li aiuta a determinare le funzioni di queste sequenze e le proteine in cui si trovano.
Utilizzando la loro tecnica, i ricercatori hanno analizzato tutte le proteine trovate in otto specie diverse, dai batteri all'uomo. Hanno scoperto che mentre gli LCR possono variare tra proteine e specie, spesso condividono un ruolo simile, aiutando la proteina in cui si trovano a unirsi a un assemblaggio su scala più ampia come il nucleolo, un organello che si trova in quasi tutte le cellule umane.
"Invece di esaminare specifici LCR e le loro funzioni, che potrebbero sembrare separate perché coinvolte in processi diversi, il nostro approccio più ampio ci consente di vedere somiglianze tra le loro proprietà, suggerendo che forse le funzioni degli LCR non sono così disparate dopo tutto ", afferma Byron Lee, uno studente laureato del MIT.
I ricercatori hanno anche riscontrato alcune differenze tra gli LCR di specie diverse e hanno dimostrato che queste sequenze LCR specifiche per specie corrispondono a funzioni specie-specifiche, come la formazione di pareti cellulari vegetali.
Lee e la studentessa laureata Nima Jaberi-Lashkari sono gli autori principali dello studio, che appare oggi in eLife . Eliezer Calo, assistente professore di biologia al MIT, è l'autore senior dell'articolo.
Studio su larga scala
Ricerche precedenti hanno rivelato che gli LCR sono coinvolti in una varietà di processi cellulari, tra cui l'adesione cellulare e il legame al DNA. Questi LCR sono spesso ricchi di un singolo amminoacido come alanina, lisina o acido glutammico.
Trovare queste sequenze e poi studiarne le funzioni individualmente è un processo che richiede tempo, quindi il team del MIT ha deciso di utilizzare la bioinformatica, un approccio che utilizza metodi computazionali per analizzare grandi insiemi di dati biologici, per valutarli come un gruppo più ampio.
"Quello che volevamo fare era fare un passo indietro e invece di guardare i singoli LCR, provare a dare un'occhiata a tutti loro e vedere se potevamo osservare alcuni modelli su scala più ampia che potrebbero aiutarci a capire quale sia il quelli a cui sono state assegnate funzioni stanno facendo e ci aiutano anche a imparare qualcosa su cosa stanno facendo quelli a cui non sono state assegnate funzioni", afferma Jaberi-Lashkari.
Per fare ciò, i ricercatori hanno utilizzato una tecnica chiamata dotplot matrix, che è un modo per rappresentare visivamente le sequenze di amminoacidi, per generare immagini di ciascuna proteina in studio. Hanno quindi utilizzato metodi di elaborazione computazionale delle immagini per confrontare migliaia di queste matrici contemporaneamente.
Utilizzando questa tecnica, i ricercatori sono stati in grado di classificare gli LCR in base a quali amminoacidi sono stati ripetuti più frequentemente nell'LCR. Hanno anche raggruppato le proteine contenenti LCR in base al numero di copie di ciascun tipo di LCR trovato nella proteina. L'analisi di questi tratti ha aiutato i ricercatori a saperne di più sulle funzioni di questi LCR.
Come dimostrazione, i ricercatori hanno scelto una proteina umana, nota come RPA43, che ha tre LCR ricchi di lisina. Questa proteina è una delle tante subunità che compongono un enzima chiamato RNA polimerasi 1, che sintetizza l'RNA ribosomiale. I ricercatori hanno scoperto che il numero di copie degli LCR ricchi di lisina è importante per aiutare la proteina a integrarsi nel nucleolo, l'organello responsabile della sintesi dei ribosomi.
Assemblaggi biologici
In un confronto tra le proteine trovate in otto specie diverse, i ricercatori hanno scoperto che alcuni tipi di LCR sono altamente conservati tra le specie, il che significa che le sequenze sono cambiate molto poco su scale temporali evolutive. Queste sequenze tendono a trovarsi in proteine e strutture cellulari che sono anche altamente conservate, come il nucleolo.
"Queste sequenze sembrano essere importanti per l'assemblaggio di alcune parti del nucleolo", afferma Lee. "Alcuni dei principi noti per essere importanti per l'assemblaggio di ordine superiore sembrano essere in gioco perché il numero di copie, che potrebbe controllare quante interazioni può fare una proteina, è importante affinché la proteina si integri in quel compartimento."
I ricercatori hanno anche trovato differenze tra gli LCR osservati in due diversi tipi di proteine coinvolte nell'assemblaggio del nucleolo. Hanno scoperto che una proteina nucleolare nota come TCOF contiene molti LCR ricchi di glutammina che possono aiutare a sostenere la formazione di assemblaggi, mentre le proteine nucleolari con solo alcuni di questi LCR ricchi di acido glutammico potrebbero essere reclutate come clienti (proteine che interagiscono con lo scaffold ).
Un'altra struttura che sembra avere molti LCR conservati è la macchiolina nucleare, che si trova all'interno del nucleo cellulare. I ricercatori hanno anche trovato molte somiglianze tra gli LCR coinvolti nella formazione di assiemi su larga scala come la matrice extracellulare, una rete di molecole che fornisce supporto strutturale alle cellule di piante e animali.
Il team di ricerca ha anche trovato esempi di strutture con LCR che sembrano divergere tra le specie. Ad esempio, le piante hanno sequenze LCR distintive nelle proteine che usano per impalcare le pareti cellulari e questi LCR non si vedono in altri tipi di organismi.
I ricercatori ora hanno in programma di espandere la loro analisi LCR ad altre specie.
"C'è così tanto da esplorare, perché possiamo espandere questa mappa praticamente a qualsiasi specie", afferma Lee. "Questo ci dà l'opportunità e la struttura per identificare nuovi gruppi biologici". + Esplora ulteriormente
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca, l'innovazione e l'insegnamento del MIT.