Nimble公司人員談NVMe的下一波發(fā)展趨勢。
存儲(chǔ)領(lǐng)域正掀起新一波變革浪潮,特別是由NVMe驅(qū)動(dòng)器與光纖連接衍生的新方案,已經(jīng)成為對抗數(shù)據(jù)訪問延遲及進(jìn)一步推進(jìn)數(shù)據(jù)與服務(wù)器間應(yīng)用運(yùn)行速度層面的主力軍。
目前我們面對的變化在于由以往的光纖通道或iSCSI型SAS/SATA驅(qū)動(dòng)器陣列到NVMe結(jié)構(gòu)配合NVMe驅(qū)動(dòng)器的新型訪問機(jī)制。另外亦有一種新的變革傾向,即依賴于超融合型基礎(chǔ)設(shè)施(簡稱HCI)系統(tǒng)配合虛擬——而非物理——SAN。盡管此類HCI系統(tǒng)將蠶食大部分物理SAN市場,但其仍不太可能將其徹底摧毀,意味著SAN還將在未來幾年內(nèi)繼續(xù)保持活力,特別是考慮到其數(shù)據(jù)訪問延遲劣勢將很快得到解決。
NVMe存儲(chǔ)迎來了涅槃重生,即將NVMe訪問型驅(qū)動(dòng)器與NVMe over Fabrics訪問型存儲(chǔ)陣列相結(jié)合——這絕不是一種簡單的即插即用型變革。我們需要采取一系列步驟以構(gòu)建通往NVMe的階梯,并借此實(shí)現(xiàn)NVMe存儲(chǔ)機(jī)制的全面應(yīng)用。就這一議題,我們與存儲(chǔ)從業(yè)者進(jìn)行了探討,希望了解在他們眼中NVMe存儲(chǔ)的實(shí)現(xiàn)與部署將以怎樣的方式進(jìn)行。
我們正在聯(lián)系的供應(yīng)商包括戴爾-EMC、E8、HDS、HPE、華為、IBM、Kaminario、聯(lián)想、Mangstor、NetApp、Nimble、Pure、Tegile以及Tintri,它們?nèi)繉儆诠蚕硎酱鎯?chǔ)陣列供應(yīng)商。
Dimitris Krekoukias.是Nimble Storage公司的全球技術(shù)與戰(zhàn)略架構(gòu)師,以下為他對于 NVMe在采用方面的觀點(diǎn)。他專門強(qiáng)調(diào)稱,這些只是他的個(gè)人觀點(diǎn),并不代表Nimble Storage公司在計(jì)劃或者意圖方面的立場。
記者 NVMe的優(yōu)勢有哪些?
Dimitris Krekoukias NVMe是一種相對較新的標(biāo)準(zhǔn),其專門面向經(jīng)由PCI總線連接的設(shè)備所開發(fā)。其相較于SCSI擁有多種特定優(yōu)勢,具體包括更低延遲水平與更強(qiáng)大的IOPS表現(xiàn)。連續(xù)數(shù)據(jù)通量可得到顯著提升。其具備更高的CPU資源利用效率,只需要更小且更為簡單的驅(qū)動(dòng)程序即可支持——該標(biāo)準(zhǔn)只需要13條命令,亦可用于部分光纖通道或者以太網(wǎng)網(wǎng)絡(luò)(NVMe over Fabrics)。相較于DAS,采用這種結(jié)構(gòu)只會(huì)給整體堆棧帶來較低的額外延遲。
記者 我們?yōu)楹我褂肗VMe驅(qū)動(dòng)器,又該將其用于何處?
Dimitris Krekoukias NVMe驅(qū)動(dòng)器屬于系統(tǒng)當(dāng)中的簡單因素,類似于筆記本以及DASD/內(nèi)部服務(wù)器。一般來講,此類因素之上只需要運(yùn)行少量簡單(通常為單一設(shè)備)數(shù)據(jù)服務(wù)……利用更強(qiáng)大的介質(zhì)+接口的方式取代單純介質(zhì)是種理想的設(shè)計(jì)思路。
不過對于企業(yè)級陣列而言,相關(guān)考慮則有所不同。
記者 NVMe驅(qū)動(dòng)器在共享式驅(qū)動(dòng)器陣列當(dāng)中為何會(huì)引發(fā)問題?
Dimitris Krekoukias NVMe性能測試結(jié)果顯示,單一NVMe設(shè)備的速度要高于單一SAS或者SATA SSD。不過存儲(chǔ)陣列通常并不會(huì)只采用單一設(shè)備,因此驅(qū)動(dòng)器性能并非制約整體陣列的瓶頸所在。
陣列當(dāng)中的主要性能瓶頸在于陣列控制器,而非SSD(這主要是因?yàn)閿?shù)十塊現(xiàn)代SAS/SATA SSD已經(jīng)足以為大多數(shù)系統(tǒng)提供充足的性能)。采用NVMe SSD將意味著這些控制器僅需要10塊NVMe SSD即可達(dá)到性能飽和。舉例來說,單一NVMe驅(qū)動(dòng)器的連續(xù)讀取能力為3 GBps,而單一SATA驅(qū)動(dòng)器則為500 MBps。將24塊NVMe驅(qū)動(dòng)器納入控制器并不意味著該控制器的數(shù)據(jù)交付能力可瞬間提升至72 GBps。同樣的,單一SATA SSD的隨機(jī)小型塊讀取IOPS可能為10萬,而NVMe的同項(xiàng)指標(biāo)則可達(dá)到40萬。然而,這亦不意味著同樣的控制器在配合24塊NVMe SSD的情況下能夠提供960萬IOPS!
記者 NVMe驅(qū)動(dòng)器在陣列層面是否還存在其它問題?
Dimitris Krekoukias 目前的NVMeF陣列優(yōu)先強(qiáng)調(diào)性能,而不太關(guān)注高可用性、強(qiáng)RAID、多層級校驗(yàn)、加密、壓縮、數(shù)據(jù)削減、復(fù)制、快照、克隆、熱固件更新乃至動(dòng)態(tài)實(shí)現(xiàn)系統(tǒng)擴(kuò)展的能力。
雙端口SSD是實(shí)現(xiàn)理想高可用性水平的關(guān)鍵所在。不過目前雙端口NVMe SSD在每TB使用成本要遠(yuǎn)高于現(xiàn)有SAS/SATA SSD。
記者 我們該如何解決這些問題?
Dimitris Krekoukias 考慮到NVMe接口所能提供的極高速度,即使是考慮到未來包含有FPGA的CPU產(chǎn)品,大多數(shù)CPU與PCI交換機(jī)都需要?jiǎng)?chuàng)建起一套更具可擴(kuò)展性的系統(tǒng)方可充分利用此類SSD的性能優(yōu)勢(并繼續(xù)維持原有企業(yè)級功能),這也進(jìn)一步解決了為什么大多數(shù)NVMe解決方案在用途方面仍然比較有限。
另外,其在客戶端層面亦會(huì)帶來挑戰(zhàn)。
記者 客戶端層面存在哪些挑戰(zhàn)?
Dimitris Krekoukias 利用NVMe over Fabrics通常意味著購買新的HBA與交換機(jī),同時(shí)亦需要處理各組件間的沖突。舉例來說,在需要使用RoCE DCB交換機(jī)的情況下,端到端擁塞管理就將成為一大挑戰(zhàn),而且其路由能力也需要到v2版本時(shí)方可實(shí)現(xiàn)。
記者 那么我們該如何在保證企業(yè)關(guān)鍵性能力的同時(shí),發(fā)揮NVMe的性能優(yōu)勢?
Dimitris Krekoukias 大多數(shù)客戶還沒有準(zhǔn)備好采用主機(jī)端NVMe連接——因此在控制器采用一套高速字節(jié)可尋址設(shè)備以增加內(nèi)存緩沖區(qū)(例如3D XPoint之于DIMM)就非常必要,或者在無法實(shí)現(xiàn)這種能力時(shí)將下一代NVMe驅(qū)動(dòng)器作為緩存。這將能夠幫助客戶端實(shí)現(xiàn)顯著的速度提升,且不需要在客戶端側(cè)進(jìn)行任何修改。
變革的另一大選項(xiàng)在于變更一切指向NVMe的內(nèi)部驅(qū)動(dòng)器,但這項(xiàng)工作的實(shí)施當(dāng)中要求具備大量極具成本效益的雙端口設(shè)備。需要注意的是,少量SSD(低于12塊)即可幫助客戶在無需于主機(jī)側(cè)部署NVMe接口的情況下提升速度表現(xiàn),但隨著其規(guī)模的擴(kuò)大,性能收益將快速遞減——除非相關(guān)控制器能夠得到顯著改進(jìn)。
記者 那么客戶何時(shí)才會(huì)做好采用NVMe over Fabrics的準(zhǔn)備或者說抱有這一意愿?
Dimitris Krekoukias 在這方面,首先需要調(diào)整的是將陣列連接指向外部世界。單憑這一點(diǎn)即可在不經(jīng)大規(guī)模修改的前提下實(shí)現(xiàn)現(xiàn)代系統(tǒng)的速度提升。
變革的下一步則取決于雙端口NVMe設(shè)備的實(shí)際成本效益。不過為了能夠更為廣泛地實(shí)現(xiàn)性能提升,CPU與PCI交換機(jī)數(shù)量的增加同樣非常重要,這將給存儲(chǔ)系統(tǒng)帶來更為可觀的變化規(guī)模(并拉高實(shí)現(xiàn)成本)。
評論意見光纖通道SAN在過去十年當(dāng)中已經(jīng)為我們帶來無數(shù)助益,但其畢竟誕生于磁盤與前虛擬化服務(wù)器時(shí)代。面對如今的虛擬機(jī)與廣泛存在的容器化服務(wù)器世界,其中的多插槽、多核心CPU與閃存驅(qū)動(dòng)器,光纖通道與磁盤驅(qū)動(dòng)器接口已經(jīng)無法適應(yīng)時(shí)代的要求。
NVMe驅(qū)動(dòng)器承諾取代SAS與SATA接口介質(zhì),而NVMe over Fabrics則承諾取代光纖通道甚至是iSCSI。目前我們正站在歷史的十字路口,如果NVMe能夠成功上位,那么未來的存儲(chǔ)世界將呈現(xiàn)出完全不同的新面貌。