20年難有進步 DRAM延遲問題終于得到優(yōu)化

責任編輯:editor006

作者:謝濤編譯

2017-12-27 15:39:24

摘自:it168網(wǎng)站

DRAM的延遲正在變高,因為隨著芯片密度的增加,需要更新更多的隊列,32Gb的芯片上可能降低將近20%的性能。Chang提出了兩種機制,即通過對bank和子陣列的內(nèi)存訪問進行并行刷新來隱藏刷新延遲。

卡內(nèi)基梅隆大學的Kevin K. Chang發(fā)表了一篇亮眼、出色的博士論文——《理解和改進基于DRAM的內(nèi)存系統(tǒng)的延遲》(Understanding and Improving the Latency of DRAM-Based Memory Systems),解決了DRAM問題,并提出了一些新的架構(gòu)改進辦法,以在DRAM延遲方面做出實質(zhì)性的改進。

三個問題

Kevin將DRAM延遲問題分成四個部分,筆者將在這里總結(jié)其中三個:

·低效的批量數(shù)據(jù)移動。

·DRAM刷新干擾。當DRAM正在刷新時,它不能全部被訪問。

·單元格(Cell)潛伏期的變化——由于制造變異性。

至于第四個問題:延遲所帶來的影響,有興趣的朋友可以一起討論。

過去20年難有進步 DRAM延遲終于得到優(yōu)化

  1.低效的批量數(shù)據(jù)移動

在內(nèi)存和存儲代價高昂的時候,數(shù)據(jù)移動被限制在一個寄存器大小的塊中,或者最多是來自磁盤的512字節(jié)塊。但如今,在存儲容量達千兆字節(jié)的存儲空間和海量內(nèi)存的情況下,海量數(shù)據(jù)移動變得越來越普遍。

但數(shù)據(jù)移動的架構(gòu)——從內(nèi)存到CPU,再到有限的內(nèi)存總線——都沒有改變。Chang的建議是一種新型的、高帶寬的存儲器子陣列之間的數(shù)據(jù)通路,利用幾個隔離晶體管在同一存儲器中的子陣列之間創(chuàng)建寬——8192位寬——并行總線。

2.DRAM刷新干擾

DRAM內(nèi)存單元需要刷新以保存數(shù)據(jù),這就是為什么它被稱為動態(tài)RAM。DRAM刷新是成隊列,而不是一次性刷新的,因為這樣做需要太多的能耗。但是,當一個隊列被刷新時,它不能被訪問,這會造成延遲。

DRAM的延遲正在變高,因為隨著芯片密度的增加,需要更新更多的隊列,32Gb的芯片上可能降低將近20%的性能。

Chang提出了兩種機制,即通過對bank和子陣列的內(nèi)存訪問進行并行刷新來隱藏刷新延遲。一個是使用無序的per-bank刷新,使內(nèi)存控制器可以指定一個空閑的bank來刷新,而不是常規(guī)的嚴格循環(huán)順序。第二種策略是寫-刷新操作并行化,使刷新延遲和寫延遲重疊。

在他的測試中,使用8核CPU,這些策略提高了超過27%的加權(quán)內(nèi)存性能。

過去20年難有進步 DRAM延遲終于得到優(yōu)化

  3.單元格延遲變化

得益于制造工藝的提升,記憶單元格可以有大量性能提升,隨著密度的增加而增加。但是DRAM被指定以最慢的單元的速度可靠運行,這意味著如果使用最快的單元格,就會有顯著的性能上升。

Chang在論文中提出了兩種利用這種變化的機制,獲得的速度提升從13%提高到了幾乎20%。

探索與優(yōu)化

在系統(tǒng)架構(gòu)中,探索瓶頸和修復瓶頸的工作是沒有終點的。過去20年內(nèi),DRAM一度被認為難有進步,但我們看到,其延遲水平也會被改變。

隨著越來越多的晶體管、專業(yè)指令集和諸如此類的性能的提高,降低DRAM延遲也將成為性能改進的主要目標。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號