Densità di probabilità per prestazioni ottenibili (GFlop/s) utilizzando 1024 campioni con tassellature e dimensioni del problema diverse. Con eDRAM (DRAM =memoria dinamica ad accesso casuale), la curva della funzione nel suo complesso si sposta in alto a destra, implicando che più campioni possono raggiungere il picco prossimo (ad esempio, 90%) prestazioni. In altre parole, disporre di eDRAM aumenta la possibilità per le applicazioni meno ottimizzate di raggiungere prestazioni "rivendicate dal fornitore". Però, il confine giusto si sposta solo un po', indicando che l'eDRAM non può migliorare significativamente le prestazioni di picco grezze. Credito:Dipartimento dell'Energia degli Stati Uniti
La memoria a larghezza di banda elevata può migliorare le prestazioni di un computer. La memoria on-package (OPM) è un'opzione popolare in molti sistemi commerciali. Prima di questo sforzo, si sapeva poco delle implicazioni dell'OPM sulla velocità e sul consumo di energia. Il team ha caratterizzato e analizzato sperimentalmente lo storage OPM moderno. Hanno fornito linee guida sull'ottimizzazione della memoria per accelerare le applicazioni di calcolo ad alte prestazioni (HPC).
Questo studio sugli OPM è essenziale e fondamentale per far progredire i sistemi informatici. Per esempio, motiva l'esplorazione del co-design dell'architettura software. Ulteriore, valida modelli e simulazioni. Ha anche portato a linee guida generali per l'ottimizzazione. Il lavoro mostra come mettere a punto applicazioni e architetture per le migliori prestazioni su piattaforme con determinati OPM.
I ricercatori hanno condotto un'approfondita valutazione sperimentale per discernere come i moderni OPM hanno influenzato le prestazioni e l'efficienza energetica di importanti kernel scientifici HPC, che compongono il sistema operativo principale di un computer. Hanno esaminato diverse modalità di ottimizzazione di OPM e come hanno influenzato l'ottimizzazione delle applicazioni per le migliori prestazioni del sistema. Il team del Pacific Northwest National Laboratory, Università di Copenaghen, e Virginia Tech hanno valutato diversi kernel HPC su due Intel OPM, eDRAM su Broadwell multicore e MCDRAM su Knights Landing multicore, con un ampio insieme delle loro matrici di input rappresentative (ad esempio, 968 matrici per kernel sparse). Questo studio ha permesso al team di derivare un modello analitico visivo intuitivo per spiegare meglio scenari architettonici complessi, oltre a fornire linee guida generali per future ottimizzazioni dell'architettura e ottimizzazione dell'efficienza.