Le unità di archiviazione flash modificate dei ricercatori del MIT promettono di dimezzare l'energia e lo spazio fisico necessari per archiviare e gestire i dati degli utenti nei data center affamati di energia. Credito:Massachusetts Institute of Technology
I ricercatori del MIT hanno progettato un nuovo sistema di archiviazione flash che potrebbe dimezzare l'energia e lo spazio fisico necessari per uno dei componenti più costosi dei data center:l'archiviazione dei dati.
I data center sono server farm che facilitano la comunicazione tra utenti e servizi web, e sono alcune delle strutture che consumano più energia al mondo. In loro, migliaia di server assetati di energia memorizzano i dati degli utenti, e server separati eseguono servizi app che accedono a tali dati. Altri server a volte facilitano il calcolo tra questi due cluster di server.
La maggior parte dei server di archiviazione oggi utilizza unità a stato solido (SSD), che utilizzano l'archiviazione flash, microchip di memoria programmabili elettronicamente e cancellabili senza parti mobili, per gestire le richieste di dati ad alta velocità di trasmissione. In un documento presentato all'ACM International Conference on Architectural Support for Programming Languages and Operating Systems, i ricercatori descrivono un nuovo sistema chiamato LightStore che modifica gli SSD per connettersi direttamente alla rete di un data center, senza bisogno di altri componenti, e per supportare operazioni di archiviazione dei dati computazionalmente più semplici ed efficienti. Ulteriori innovazioni software e hardware integrano perfettamente il sistema nell'infrastruttura del data center esistente.
Negli esperimenti, i ricercatori hanno trovato un gruppo di quattro unità LightStore, chiamati nodi di archiviazione, ha funzionato in modo due volte più efficiente rispetto ai server di archiviazione tradizionali, misurato dal consumo energetico necessario per soddisfare le richieste di dati. Il cluster richiedeva inoltre meno della metà dello spazio fisico occupato dai server esistenti.
I ricercatori hanno suddiviso il risparmio energetico per singole operazioni di archiviazione dei dati, come un modo per catturare meglio il risparmio energetico completo del sistema. Nei dati di "scrittura casuale", ad esempio, che è l'operazione più impegnativa dal punto di vista computazionale nella memoria flash, LightStore funzionava quasi otto volte in modo più efficiente rispetto ai server tradizionali.
La speranza è che, un giorno, I nodi LightStore potrebbero sostituire i server affamati di energia nei data center. "Stiamo sostituendo questa architettura con una più semplice, soluzione di archiviazione più economica ... che richiederà metà dello spazio e metà della potenza, ma fornire le stesse prestazioni di capacità di throughput, " dice il co-autore Arvind, il Johnson Professor in Computer Science Engineering e un ricercatore nel Computer Science and Artificial Intelligence Laboratory. "Questo ti aiuterà nelle spese operative, in quanto consuma meno energia, e spese in conto capitale, perché il risparmio energetico nei data center si traduce direttamente in risparmio di denaro."
Insieme ad Arvind sul giornale ci sono:il primo autore Chanwoo Chung, uno studente laureato presso il Dipartimento di Ingegneria Elettrica e Informatica; e gli studenti laureati Jinhyung Koo e Junsu Im, e il professor Sungjin Lee, tutto il Daegu Gyeongbuk Institute of Science and Technology (DGIST).
Aggiungere "valore" al flash
Uno dei principali problemi di efficienza dei data center odierni è che l'architettura non è cambiata per adattarsi allo storage flash. Anni fa, i server di archiviazione dati erano costituiti da dischi rigidi relativamente lenti, insieme a molti circuiti di memoria dinamica ad accesso casuale (DRAM) e unità di elaborazione centrale (CPU) che aiutano a elaborare rapidamente tutti i dati che arrivano dai server delle app.
Oggi, però, i dischi rigidi sono stati per lo più sostituiti con unità flash molto più veloci. "La gente ha appena collegato il flash al punto in cui si trovavano i dischi rigidi, senza cambiare nient'altro, " Dice Chung. "Se puoi semplicemente connettere le unità flash direttamente a una rete, non avrai affatto bisogno di questi costosi server di archiviazione."
Per LightStore, i ricercatori hanno prima modificato gli SSD a cui accedere in termini di "coppie chiave-valore, " un protocollo molto semplice ed efficiente per il recupero dei dati. Fondamentalmente, le richieste dell'utente vengono visualizzate come chiavi, come una stringa di numeri. Le chiavi vengono inviate a un server, che rilascia i dati (valore) associati a quella chiave.
Il concetto è semplice, ma le chiavi possono essere estremamente grandi, quindi il calcolo (ricerca e inserimento) solo in SSD richiede molta potenza di calcolo, che viene utilizzato dal tradizionale "livello di traduzione flash". Questo software abbastanza complesso viene eseguito su un modulo separato su un'unità flash per gestire e spostare i dati. I ricercatori hanno utilizzato alcune tecniche di strutturazione dei dati per eseguire questo software di gestione flash utilizzando solo una frazione della potenza di calcolo. Così facendo, hanno scaricato il software interamente su un minuscolo circuito nell'unità flash che funziona in modo molto più efficiente.
Questo scaricamento libera CPU separate già sull'unità, progettate per semplificare ed eseguire più rapidamente il calcolo, per eseguire il software LightStore personalizzato. Questo software utilizza tecniche di strutturazione dei dati per elaborare in modo efficiente le richieste di coppie chiave-valore. Essenzialmente, senza modificare l'architettura, i ricercatori hanno convertito un'unità flash tradizionale in un'unità chiave-valore. "Così, stiamo aggiungendo questa nuova funzionalità per flash, ma in realtà non stiamo aggiungendo nulla, "dice Arvind.
Adattamento e ridimensionamento
La sfida consisteva quindi nel garantire che i server delle app potessero accedere ai dati nei nodi LightStore. Nei data center, le app accedono ai dati attraverso una varietà di protocolli strutturali, come file system, banche dati, e altri formati. I server di archiviazione tradizionali eseguono un software sofisticato che fornisce l'accesso ai server delle app tramite tutti questi protocolli. Ma questo utilizza una buona quantità di energia di calcolo e non è adatto per essere eseguito su LightStore, che si basa su risorse computazionali limitate.
I ricercatori hanno progettato un software molto leggero dal punto di vista computazionale, chiamato "adattatore, " che traduce tutte le richieste degli utenti dai servizi dell'app in coppie chiave-valore. Gli adattatori utilizzano funzioni matematiche per convertire le informazioni sui dati richiesti, come i comandi dei protocolli specifici e i numeri di identificazione del server dell'app, in una chiave. Quindi invia quella chiave al nodo LightStore appropriato, che trova e rilascia i dati accoppiati. Poiché questo software è computazionalmente più semplice, può essere installato direttamente sui server delle app.
"Qualunque sia il dato a cui accedi, facciamo una traduzione che mi dice la chiave e il valore ad essa associato. Così facendo, Sto anche eliminando un po' di complessità dai server di archiviazione, "dice Arvind.
Un'ultima innovazione è che l'aggiunta di nodi LightStore a un cluster si ridimensiona in modo lineare con il throughput dei dati, la velocità con cui i dati possono essere elaborati. Tradizionalmente, le persone impilano gli SSD nei data center per affrontare un throughput più elevato. Ma, mentre la capacità di archiviazione dei dati può aumentare, il throughput si stabilizza dopo solo poche unità aggiuntive. Negli esperimenti, i ricercatori hanno scoperto che quattro nodi LightStore superano i livelli di throughput della stessa quantità di SSD.
Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.