一般來說,有兩種公認的擴展存儲架構的方法:縱向擴展和橫向擴展??v向擴展主要通過增加單個硬件平臺的容量和功能來工作,而橫向擴展通過額外的服務器或節(jié)點提高功能。從歷史上看,橫向擴展實施起來比較復雜,但隨著NVMe over Fabrics的出現,這可能會發(fā)生變化。
為了降低光纖網絡的性能開銷,可以使用NVMe over Fabrics來解決某些橫向擴展存儲架構所面臨的限制。隨著越來越多的組織尋求高可擴展性,供應商開始將NVMe over Fabrics技術融入其產品中,以降低橫向擴展存儲所涉及的復雜性。
橫向擴展存儲的挑戰(zhàn)
橫向擴展存儲往往分為兩類:
(1)緊密耦合:存儲節(jié)點或服務器彼此緊密結合,具有共享內存和專有高速背板等功能。人們認為是單片或向上擴展的一些產品實際上是橫向擴展架構,例如Dell EMC的PowerMax。
(2)松散耦合:在這種情況下,很多節(jié)點沒有緊密綁定在一起,但可以單獨操作。節(jié)點使用一些高速網絡連接(通常是以太網),不直接內置在平臺中。NetApp的SolidFire就是一個很好的例子,它使用多個1U服務器和標準萬兆以太網(GbE)網絡。
NVMe開發(fā)的下一個合乎邏輯的步驟是通過結構或網絡啟用協議。
緊密耦合的橫向擴展產品通常提供更高級別的彈性和更加一致的性能,而松散耦合的體系結構可以擴展得更多,但必須處理存儲驅動器和節(jié)點故障的影響。
實施橫向擴展存儲是一項挑戰(zhàn),因為數據需要受到保護和保持一致。這意味著在平臺中實施技術以檢測節(jié)點何時發(fā)生故障,并在設備或節(jié)點發(fā)生故障時通過橫向擴展集群重新保護數據。
什么是NVMe over Fabrics?
隨著數據中心性能需求的增加,存儲一直是提供快速高效應用程序的瓶頸。NVMe是一種旨在通過固態(tài)介質降低存儲協議性能開銷的技術?;贜VMe的SSD硬盤使用外圍組件互連高速(PCIe)連接到服務器,在IOPS和吞吐量方面提供更大的帶寬,并且比SAS和SATA SSD硬盤具有更低的延遲。
NVMe over Fabrics的工作原理
NVMe開發(fā)的下一個合乎邏輯的步驟是通過結構或網絡啟用協議。NVMe over Fabrics描述了一些已經開發(fā)的標準,這些標準是為通過光纖通道(FC),以太網或InfiniBand網絡傳輸NVMe協議而開發(fā)的。 NVM express傳輸是一個提供NVMe命令和數據傳輸抽象協議層。
如今,NVMe over FC和NVMe over Fabrics的存儲產品通過融合以太網(RoCE),NVMe over InfiniBand和NVMe/TCP使用標準以太網網絡接口卡進行遠程直接內存訪問。
NVMe over Fabrics如何為實現橫向擴展存儲提供幫助?
人們看到的一種情況是典型存儲設備中的組件分解。該架構支持主機和存儲介質之間更直接的路徑,從而無需通過集中控制器傳輸數據。即使是目前的橫向擴展存儲產品也存在這種限制,這可能導致不能充分利用SSD硬盤的能力。通過提供更直接的I/O路徑,單個主機可以與多個驅動器通信,反之亦然。這減少了延遲并增加了橫向擴展能力。
NVMe規(guī)范的一部分提供了使這些工具工作的功能集。使用SAS和SATA驅動器,I/O堆疊在一個隊列中,在讀取內部NAND介質時會產生瓶頸。NVMe引入了65,535個隊列的功能,每個隊列最多可容納65,535個隊列元素。這使得在主機和驅動器之間實現高度并行的多對多的體系結構成為可能,并為每個主機/驅動器關系提供單獨的隊列。
在實施這種技術的供應商中,E8 Storage公司提供E8 NVMe設備和基于主機的軟件驅動程序。該設備充當元數據服務器和以太網到PCIe橋,將傳統(tǒng)存儲任務(如快照)加載到每個連接的主機。
Excelero公司擁有一個基于軟件的產品,可將許多服務器連接到一個存儲消費者和提供商網絡中。NVMesh軟件使任何存儲消費者都可以訪問任何服務器中的任何驅動器,而無需采用目標服務器CPU。其結果是一種可以實現額外容量增加的架構,而現有應用程序的開銷幾乎可以忽略不計。
WekaIO公司使用類似的技術來提供稱為Matrix的橫向擴展文件系統(tǒng)架構。NVMe跨網絡的低延遲以及分布式處理使得Matrix文件系統(tǒng)能夠以比本地驅動器更快的速度運行。
關注的硬件重點
供應商還專注于構建只支持高可擴展性的硬件工具。Pavilion Data Systems公司開發(fā)了一個平臺,該平臺使用多達20個自定義硬件刀片服務器和72個NVMe驅動器來創(chuàng)建機架級架構,能夠在100微秒時支持每秒120千兆字節(jié)的帶寬。應用程序主機使用標準的40 GbE或100 GbE RoCE網絡適配器和NVMe over Fabrics驅動程序。
Vexata公司開發(fā)了一種架構,該架構使用商用硬件組件來擴展以太網中的容量和性能。后端可擴展性通過基于硬件的企業(yè)存儲模塊(ESM)實現,而前端連接提供NVMe over Fabrics功能和帶有I/O模塊(IOM)的直接硬件I/O路徑?,F有的實現目前提供多達16個企業(yè)存儲模塊(ESM)和兩個I/O模塊(IOM),盡管該體系結構可以擴展到更多。
Apeiron Data Systems公司是一家遵循硬件模型的初創(chuàng)公司。Apeiron ADS1000平臺使用NVMe over Ethernet和自定義主機總線適配器,提供橫向擴展架構,可在單一配置中增長,支持數千個驅動器。
NVMe over Fabrics提供了消除傳統(tǒng)架構約束的能力,并創(chuàng)建了更具分布性的產品。所有這些供應商產品的共同點是減少從主機到介質的I/O路徑的長度和影響。這將成為未來存儲設計的一個特征,因為延遲仍然是存儲技術需要克服的最大挑戰(zhàn)。