混合存儲是否正在走向滅亡?混合存儲的HDD硬盤是否確實是一款垂死的產(chǎn)品品種?業(yè)界又將如何審視和面臨今天的閃存數(shù)據(jù)存儲所帶來的存儲簡化這一挑戰(zhàn)呢?此外,對象級存儲越來越多地日漸普及的深層原因又是什么呢?
混合存儲陣列走向滅亡的謠言可能不只是炒作
鑒于全閃存陣列市場在當前的高速增長,以及某些AFA(全閃存陣列)供應廠商對于其首次公開募股(IPO)的高調(diào)炒作,直接導致了“混合存儲是否正在走向滅亡”的這一問題的提出;也使得企業(yè)的IT存儲管理員們也在努力試圖捋清這一切。這個問題看似簡單;然而,答案絕對是否定的!
讓我們從這一定義開始探討吧:究竟什么是混合存儲?目前,對于一個混合存儲陣列(也被稱為混合閃存陣列)的傳統(tǒng)定義是——作為一款存儲數(shù)據(jù)管理系統(tǒng),其使用Flash閃存的組合,如固態(tài)驅(qū)動器(SSD)和較慢的硬盤驅(qū)動器(HDD)來控制操作內(nèi)存,進而提供最符合成本效益的高性能I/O?;旌洗鎯L試通過I/O性能需求來平衡存儲介質(zhì)的成本。Flash閃存可以設(shè)置作為一個讀緩存、讀寫緩存或者作為一個高性能存儲層,基于諸如數(shù)據(jù)的年齡、訪問頻率或數(shù)據(jù)的重要性等策略,以捕獲所有的寫操作和數(shù)據(jù)移動到硬盤驅(qū)動器的操作。
Flash SSD固態(tài)驅(qū)動器容量能力的快速增長,以及每TB存儲成本定價的同步快速下跌正為HDD硬盤能否繼續(xù)作為一種可行的存儲介質(zhì)帶來了巨大的市場壓力。高容量的Flash SSD固態(tài)驅(qū)動器和高容量的HDD硬盤之間的價格差距正在縮小。并且,由于Flash NAND 3D技術(shù)的顯著進步,使得這一價格差距縮小的速度比從前預期的要快得多的多。
最高容量的2.5英寸小尺寸規(guī)格(SFF)的Flash SSD固態(tài)驅(qū)動器是在2015年正式上市推出的,約為4 TB。而在2016年年初,小尺寸規(guī)格Flash SSD固態(tài)驅(qū)動器的容量約為16 TB,并將在今年年底迅速達到約32 TB。相比之下,3.5英寸的大型封裝HDD硬盤的容量則在2015年和2016年突破了10 TB。
混合存儲陣列的核心問題
關(guān)于大容量的Flash SSD固態(tài)驅(qū)動器有一個陷阱。許多高容量的Flash SSD將基于三級單元(Triple Level Cell,TLC)NAND技術(shù)。 今天,TLC是最為明確的成本最低的Flash技術(shù),但其有一些顯著的問題,例如其相對較短的磨損壽命期限。要知道,F(xiàn)lash SSD讀取對于存儲驅(qū)動器的壽命而言幾乎沒有成本,反而是寫操作會有成本。每次執(zhí)行寫操作,都會對存儲材料或多或少的造成一定程度的損耗。磨損壽命期限是編程/擦除(PE)的周期數(shù);而較之多層單元閃存(multi-level cell,MLC),TLC至少具有一個數(shù)量級的較低數(shù)目的PE周期數(shù)。
TLC的寫入和讀取速度也比MLC相對要慢一些,但他們較之HDD仍然至少有10倍的性能優(yōu)勢。這意味著基于TLC 3D NAND的小尺寸規(guī)格SSD固態(tài)硬盤更適合讀取,而非通常與Flash SSD閃存相關(guān)的高強度寫操作。對于這種低成本、高容量、高密度,較慢的Flash SSD閃存而言,目前最適合的工作負載與當前正被用在一個混合存儲陣列的HDD硬盤是一樣的。
混合存儲陣列正在從一個內(nèi)存、閃存SSD和高容量HDD的組合演變?yōu)橐粋€內(nèi)存的混合;高性能、寫入優(yōu)化的閃存SSD;大容量、讀取優(yōu)化的閃存SSD固態(tài)硬盤。而思考未來的混合存儲的另一種方式是將其視為一個多層次的全閃存陣列?;旌洗鎯Ρ澈蟮脑瓌t和邏輯是相同的——并非所有的數(shù)據(jù)都具有相同的價值,并且這些數(shù)據(jù)的價值應與其所存儲的存儲介質(zhì)的成本相匹配。
因此,盡管HDD硬盤混合存儲是一個垂死的產(chǎn)品品種,但我們可以期待混合多閃存仍然還會有較長的壽命。
簡化數(shù)據(jù)存儲技術(shù)是很難的
我曾經(jīng)想當然的認為,數(shù)據(jù)存儲是一項簡單的技術(shù),具有相當合乎邏輯的替代品。然而,事實證明,我當時只是:“圖樣圖森破!”當我了解到當前數(shù)據(jù)存儲的現(xiàn)狀之后,我懷疑自己為何曾經(jīng)一直那樣天真。這該死的東西真的是越來越復雜了。
我曾經(jīng)寫過關(guān)于在剛剛過去的幾年中數(shù)據(jù)存儲領(lǐng)域的可選方案如何獲得了急劇性的增長的文章,使得現(xiàn)如今有了比以往任何時候都更多的存儲選擇,來幫助您解決數(shù)據(jù)存儲問題。各種不同的數(shù)據(jù)存儲技術(shù)運行在從傳統(tǒng)媒介到陣列設(shè)計、再到以軟件為中心的方法,以及再到全新的架構(gòu)。不久前的一段時間,我第一次撰寫了關(guān)于這一新的數(shù)據(jù)存儲現(xiàn)狀的文章,但其只是變得越來越復雜了——這無疑進一步突顯了數(shù)據(jù)存儲的發(fā)展演變過程中既有好消息,也有壞消息。
有選擇當然是不錯的。因此這是一個好消息。但是,選擇太多也可能會讓人感覺撲朔迷離。這可以說是壞消息——至少部分而言是壞消息。許多新的數(shù)據(jù)存儲技術(shù),一旦他們在數(shù)據(jù)中心實踐操作層面完全部署開始采用,可能會對其它部分的存儲基礎(chǔ)設(shè)施產(chǎn)生反射的效果。這是一種類似于打鼴鼠游戲的效果:當舊的問題被消除后,又會導致新的瓶頸問題的彈出。
存儲市場的變化
退后一步,看起來似乎數(shù)據(jù)存儲行業(yè)仍在努力適應新的“解決方案”。根據(jù)IDC的最近報道,全球企業(yè)級存儲系統(tǒng)的銷售與去年同期相比下降了7%(僅僅只有82億美元)。通過對全球總出貨量的考察測得,該行業(yè)遭遇了4%的低迷下滑。在所有的存儲巨頭中,只有惠普企業(yè)公司在2016年第一季度獲得營收增長(11%)。
而與此同時,鑒于大數(shù)據(jù)和物聯(lián)網(wǎng)已經(jīng)開始主宰了人們的IT交流話題,似乎企業(yè)組織實際上正在購買更少的存儲是不可思議的。但事實的確如此。我們可以回顧所有這些新的數(shù)據(jù)存儲技術(shù),來看看為什么會發(fā)生這樣的事情。當前的企業(yè)組織機構(gòu)固然可能比以往任何時候所存儲的數(shù)據(jù)都多——盡管容量圖的曲線從來沒有向下彎曲,但企業(yè)組織在這方面所做的工作更好了,而且也更有效率了。
閃存和超融合存儲所帶來的影響
例如,全閃存陣列(AFA)通常被認為是一個純粹的性能發(fā)揮。因為其圍繞著旋轉(zhuǎn)磁盤運行。但是,當一家企業(yè)通過將其從一個基于磁盤的陣列遷移到全閃存系統(tǒng),以提升一款關(guān)鍵應用程序的性能時,可能也會帶來一個安裝容量能力的下降。Short-stroked傳統(tǒng)硬盤擠出了最后的性能,老硬盤陣列的容量很可能過度配置了。而新的AFA則提供了良好的性能,同時無需過度配置。事實上,因為其甚至能抽出幾個周期來對其數(shù)據(jù)執(zhí)行重復數(shù)據(jù)刪除,則使得閃存陣列所需要的容量可能要少得多。
同樣,我們也可以看到諸如超融合基礎(chǔ)架構(gòu)這樣的新架構(gòu)是如何基于其模塊化和易于規(guī)模化的特點而帶來更高效的存儲空間利用的?;诜掌鞔鎯Φ?、內(nèi)置的PCIe和非易失性存儲器標準(Non-Volatile Memory Express)閃存的重生,也有助于通過集中于容量和性能,特別是在其需要方面,來降低容量需求。
最近,Evaluator Group公司與存儲網(wǎng)絡行業(yè)協(xié)會合作,共同發(fā)布了一項關(guān)于超融合技術(shù)的調(diào)查結(jié)果。該調(diào)查報告指出,在所有的調(diào)查受訪者中,“47%的受訪者表示說,他們所在的企業(yè)正在計劃使用一種超融合的解決方案,以整合基礎(chǔ)設(shè)施,并取代傳統(tǒng)的計算和存儲。”
您企業(yè)的數(shù)據(jù)已經(jīng)不會再老位置了
當然,有些數(shù)據(jù)根本就不再企業(yè)內(nèi)部存儲了。雖然這一數(shù)字有時似乎言過其實,但很明顯的是,當前的企業(yè)組織機構(gòu)已經(jīng)開始更頻繁,更深入地采用云存儲,進而得以能夠?qū)⑺麄冏约旱臄?shù)據(jù)中心存儲從單調(diào)乏味的日常數(shù)據(jù)處理瑣事如存儲存檔中解放出來。這大大幫助減少了企業(yè)組織數(shù)據(jù)中心存儲的開銷,而隨著人們對于云存儲的信心逐步增長,這方面的削減很可能會更令人震驚。
使用SaaS和基于云的應用程序,如Salesforce和無數(shù)其他類似服務的增加,也有助于將遷移的數(shù)據(jù)遷出數(shù)據(jù)中心存儲系統(tǒng)。如果您企業(yè)不是通過將數(shù)據(jù)復制到數(shù)據(jù)中心來備份這些應用程序的話,您企業(yè)將創(chuàng)造大量根本不需要任何內(nèi)部存儲的新數(shù)據(jù)。
這些只是少數(shù)幾個新的數(shù)據(jù)存儲技術(shù)已經(jīng)接管替代了傳統(tǒng)的存儲產(chǎn)品的例子。您企業(yè)還可以添加軟件定義的存儲、對象、融合等等新的技術(shù)到這一不斷增長的名單。
有時,簡單即復雜
具有諷刺意味的 是,盡管很多新的數(shù)據(jù)存儲技術(shù)和架構(gòu)可能在部署、使用和管理方面更為簡單和容易,但它們可能會在無意中增加了整體存儲的復雜性。而且因為很多較新的替代品的設(shè)計旨在解決具體問題或工作負荷,很可能最終會導致您企業(yè)孤立應用程序和數(shù)據(jù)的增加,因為您企業(yè)需要部署更多的專用系統(tǒng)。
備份也需要一定的反思,特別是如果您所在的企業(yè)堅持執(zhí)著于“經(jīng)典的”應用程序備份方式的話。借助這一新的多樣的存儲系統(tǒng)和架構(gòu),備份數(shù)據(jù)可能會有很大的困難,這可能會有助于說服您企業(yè)開始考慮使用新的數(shù)據(jù)保護技術(shù)和工具,如flat備份,云到云的備份和擦除編碼。
對象級別存儲的采用獲得迅速普及的九大原因分析
現(xiàn)如今,對象級存儲比以往任何時候都獲得了更為普及的采用。從遵守合規(guī)性要求到可擴展性問題和預算限制,對象存儲已被充分證明是對傳統(tǒng)的文件存儲的一種有效的替代方案。如下,有九大原因解釋了為什么當前有越來越多的企業(yè)組織正在轉(zhuǎn)向采用對象存儲技術(shù)。
原因1:非結(jié)構(gòu)化數(shù)據(jù)的增長
根據(jù)IDC的調(diào)研數(shù)據(jù)顯示,非結(jié)構(gòu)化數(shù)據(jù)的復合年均增長率約為62%。面向?qū)ο蟠鎯Φ募毩6鹊姆椒?,使其成為了一種有價值的資源,用于處理大量的非結(jié)構(gòu)化的數(shù)據(jù)。
原因2:可擴展性
對象存儲可以規(guī)?;瘮U展到幾十乃至幾百艾字節(jié)的可用容量,而且對于為什么對象級存儲不能規(guī)?;綕勺止?jié),甚至堯字節(jié)并不存在什么技術(shù)方面的原因。其利用了最高密度的存儲,無論是硬盤驅(qū)動器,固態(tài)驅(qū)動器或兩者兼而有之。
原因3:無需遷移數(shù)據(jù)
基于對象的存儲是一個無共享的向外擴展的系統(tǒng),所以其不需要傳統(tǒng)意義上的技術(shù)更新。當硬件需要更新時,其只是涉及到需要添加新的對象存儲節(jié)點到通常與標準以太網(wǎng)網(wǎng)絡連接的系統(tǒng)中。隨之需要的是從系統(tǒng)上刪除舊的節(jié)點,一次刪除一個。無需遷移數(shù)據(jù)。除了自愈算法,擦除編碼或多拷貝鏡像,在新的節(jié)點上再次創(chuàng)建所需的數(shù)據(jù)。隨著容量的增加,數(shù)據(jù)跨所有的對象存儲節(jié)點自動被調(diào)整。
原因4:與Hadoop和NoSQL的兼容性
對于Hadoop或NoSQL,對象級的存儲往往是一個很好的存儲選項。取決于供應商的不同,某些供應商,如Caringo和Cloudian公司,甚至在其對象存儲產(chǎn)品本身內(nèi)置了分析功能。
原因5:取代了傳統(tǒng)的文件存儲
對象存儲獲得迅速普及的另一個原因是,其被認為是下一代的文件存儲。今天市面上的大多數(shù)對象存儲系統(tǒng)包括NFS、SMB和內(nèi)置到系統(tǒng)中的iSCSI接口。地理分布功能和分析功能使對象存儲作為文件存儲是非常有用和有價值的。
原因6:比磁帶效率更高,但成本仍然較低
較之磁帶,對象存儲是最具成本效益的數(shù)據(jù)存儲方式。不過,盡管磁帶對于大多數(shù)分析、活動歸檔或從備份中快速恢復而言太慢了,對象存儲則速度太快了。不像磁帶,對象存儲也非常擅長于在地理上分散的人員之間,及使用Hadoop基礎(chǔ)設(shè)施工作的人員之間共享非結(jié)構(gòu)化數(shù)據(jù),并能夠非常好的保持所有數(shù)據(jù)超過30年。磁帶和對象存儲都可以實現(xiàn)一次寫入,多次讀取技術(shù),但只有對象存儲可以限制對某對象或文件的訪問。
原因7:即時一致性的改進
對象級存儲的一個缺點是,其是最終一致的。由于數(shù)據(jù)同時在兩個不同的節(jié)點或地理位置被更新,這可能會導致錯誤。然而,幾家對象存儲提供商,例如Caringo、Cloudian、HGST和三星旗下的Joyent公司,現(xiàn)在均借助對象存儲技術(shù)提供即時一致性。
原因8:更快的閃存SSD性能
對象存儲也容易受到高延遲和較慢的響應時間的影響。更快的戰(zhàn)略實施,相對較低的成本,密集的大容量閃存SSD硬盤基于多層存儲單元和3D TLC(Triple-Level Cell)已經(jīng)消除了這一弱點。
原因9:標準化
也許對象級存儲的采用迅速被普及的最為突出的原因是亞馬遜網(wǎng)絡服務(AWS)和亞馬遜簡單存儲服務(S3)的興起。 Amazon S3是AWS的對象存儲,而該S3應用程序編程接口已經(jīng)成為事實上的標準對象存儲API。所有的對象存儲供應商——即使是OpenStack Swift和Ceph這樣的開源項目甚至也進行了變化——都在一定程度上采用了S3 API,以便使自己能夠與那些已經(jīng)在使用它的應用程序兼容。這帶來了大批新的為實現(xiàn)與AWS S3兼容的私有對象存儲的應用程序的編寫。