摘要:和從前對(duì)于應(yīng)用幾乎是瞎子的數(shù)據(jù)塊存儲(chǔ)相比,今天的數(shù)據(jù)感知存儲(chǔ)產(chǎn)品直接就能從內(nèi)部追蹤存儲(chǔ)操作相關(guān)的全部新型元數(shù)據(jù)。
更聰明的存儲(chǔ)
和從前對(duì)于應(yīng)用幾乎是瞎子的數(shù)據(jù)塊存儲(chǔ)相比,今天的數(shù)據(jù)感知存儲(chǔ)產(chǎn)品直接就能從內(nèi)部追蹤存儲(chǔ)操作相關(guān)的全部新型元數(shù)據(jù)。今天的存儲(chǔ)可能天生就知道哪個(gè)應(yīng)用程序在創(chuàng)建、擁有和訪(fǎng)問(wèn)存儲(chǔ)數(shù)據(jù)的每個(gè)數(shù)據(jù)塊;這些數(shù)據(jù)需要什么級(jí)別的安全和保護(hù);應(yīng)如何實(shí)現(xiàn)應(yīng)用程序I/O性能(通過(guò)緩存、分層規(guī)劃等等)和容量成本(各種壓縮和重復(fù)數(shù)據(jù)消除措施)之間的最佳平衡;甚至?xí)滥男┯脩?hù)在訪(fǎng)問(wèn)、共享和、或者可能很快再次請(qǐng)求哪一個(gè)比特的數(shù)據(jù)。存儲(chǔ)平臺(tái)可能還會(huì)在內(nèi)部索引文本數(shù)據(jù)、分析存儲(chǔ)內(nèi)數(shù)據(jù)的法規(guī)遵從性(或安全漏洞)、自動(dòng)翻譯外國(guó)文字、轉(zhuǎn)碼數(shù)據(jù)內(nèi)嵌的媒體,甚至主動(dòng)學(xué)習(xí)不同分類(lèi)的數(shù)據(jù)內(nèi)容。
Qumulo也為前線(xiàn)運(yùn)行的產(chǎn)品支持提供一套Call Home服務(wù),但它真正的亮點(diǎn)是,他們的存儲(chǔ)會(huì)追蹤數(shù)據(jù)真實(shí)存儲(chǔ)過(guò)程的性能指標(biāo)?;谄浞植际降捏w系結(jié)構(gòu),Qumulo可以為存儲(chǔ)的每個(gè)文件和對(duì)象高效地報(bào)告歷史性能和其他關(guān)鍵指標(biāo),這有助于迅速捕獲新的使用模式、行為異常和性能影響熱點(diǎn),即使是數(shù)十億的對(duì)象規(guī)模也能輕松管理。
Data Gravity在其常規(guī)的備份控制器內(nèi)嵌入了一套搜索引擎,為陣列內(nèi)存儲(chǔ)的所有數(shù)據(jù)建立索引,已經(jīng)成功用于數(shù)據(jù)的監(jiān)管和電子發(fā)現(xiàn)場(chǎng)景。同時(shí),Reduxio提供幾乎無(wú)限的版本控制和按需快照,通過(guò)保存有關(guān)每個(gè)數(shù)據(jù)塊最后修改時(shí)間的元數(shù)據(jù),存儲(chǔ)允許回滾到過(guò)去的任意一秒——可以視為一個(gè)細(xì)粒度的企業(yè)數(shù)據(jù)塊存儲(chǔ)時(shí)間機(jī)器,能有效抵御惡意病毒對(duì)數(shù)據(jù)的破壞。
融合處理
存儲(chǔ)和服務(wù)器在很多場(chǎng)景下會(huì)融合成為緊密合作的整體。融合的目的在于規(guī)避昂貴和龜速的遠(yuǎn)程數(shù)據(jù)訪(fǎng)問(wèn),確保計(jì)算過(guò)程盡可能地貼近需要處理的數(shù)據(jù)。這至少是Hadoop分布式文件系統(tǒng)大數(shù)據(jù)存儲(chǔ)和VMware的虛擬化平臺(tái)集成的vSAN存儲(chǔ)的主要原理。類(lèi)似Nutanix和Simplivity的完整超融合平臺(tái)會(huì)將軟件定義的存儲(chǔ)系統(tǒng)緊密融入優(yōu)化的數(shù)據(jù)處理裝置,可以利用運(yùn)行在應(yīng)用服務(wù)器資源上的內(nèi)置分析驅(qū)動(dòng)算法獲得更大的優(yōu)化。Datrium的“開(kāi)放融合”機(jī)制會(huì)區(qū)分處理性能和容量?jī)?yōu)化、持續(xù)執(zhí)行計(jì)算密集型存儲(chǔ)的優(yōu)化分析,發(fā)現(xiàn)每臺(tái)服務(wù)器主機(jī)內(nèi)消耗閃存的存儲(chǔ)熱點(diǎn),同時(shí)通過(guò)網(wǎng)絡(luò)共享冷容量來(lái)實(shí)現(xiàn)數(shù)據(jù)容災(zāi)保護(hù)。
所有這些架構(gòu)雖然實(shí)現(xiàn)了更優(yōu)化的融合,但在存儲(chǔ)和客戶(hù)端應(yīng)用程序之間仍然會(huì)保持傳統(tǒng)的I/O傳輸方式。容器化和微服務(wù)技術(shù)已經(jīng)開(kāi)始實(shí)現(xiàn)計(jì)算節(jié)和數(shù)據(jù)存儲(chǔ)的分離,催生 新的(無(wú)服務(wù)器計(jì)算)方法,可以直接對(duì)通過(guò)的數(shù)據(jù)流進(jìn)行處理。盡管最近亞馬遜的lambda云計(jì)算服務(wù)又成為熱門(mén),實(shí)際上lambda體系結(jié)構(gòu)在很久以前就存在了,那就是在許多已部署的企業(yè)數(shù)據(jù)庫(kù)中能見(jiàn)到的“存儲(chǔ)過(guò)程”,直接在數(shù)據(jù)庫(kù)內(nèi)部(而不是在應(yīng)用程序代碼內(nèi)部)執(zhí)行由事件觸發(fā)的簡(jiǎn)短的遠(yuǎn)程代碼。然而,在存儲(chǔ)層面支持容器化插件的新型存儲(chǔ)產(chǎn)品打開(kāi)了無(wú)限的可能,可以實(shí)現(xiàn)新一代的高效、可擴(kuò)展的、實(shí)時(shí)的分析和優(yōu)化。一些存儲(chǔ)供應(yīng)商正在研發(fā)的支持容器化應(yīng)用程序的新型存儲(chǔ)產(chǎn)品,甚至很多存儲(chǔ)產(chǎn)品自身就是用容器應(yīng)用程序代碼編寫(xiě)而成。例如,新興的開(kāi)源對(duì)象存儲(chǔ)Minio由于采用了現(xiàn)代的容器架構(gòu),很容易實(shí)現(xiàn)極高的擴(kuò)展性和原生lambda計(jì)算功能。Minio對(duì)象存儲(chǔ)可以包含嵌入的lambda功能,實(shí)現(xiàn)搜索、內(nèi)存緩存、消息流、模式識(shí)別、內(nèi)容轉(zhuǎn)換,以及能直接在數(shù)據(jù)存儲(chǔ)層中高效運(yùn)行的其它功能。
全面的云管理
分析功能會(huì)讓IT運(yùn)維更強(qiáng)、更快、更智能。我堅(jiān)信,我們會(huì)看到,在貼近數(shù)據(jù)存儲(chǔ)位置的存儲(chǔ)層,以及在云內(nèi)實(shí)現(xiàn)的由許多存儲(chǔ)系統(tǒng)的元數(shù)據(jù)組成的大規(guī)模聚合(如同Call home服務(wù)模式),這些地方會(huì)有越來(lái)越多的存儲(chǔ)分析功能出現(xiàn)。
選擇一家基于云的服務(wù)提供商來(lái)全面管理和運(yùn)營(yíng)本地或混合基礎(chǔ)設(shè)施,就可以將不同的存儲(chǔ)世界在管理即服務(wù)(MaaS)產(chǎn)品的層面實(shí)現(xiàn)統(tǒng)一。例如,利用HyperGrid(之前的Gridstore)首創(chuàng)的一套平臺(tái)服務(wù),你能(按需)訂閱和租用原本需要自己整套采購(gòu)的集中化的超融合設(shè)備混合云群集。同樣,Galactic Exchange能以服務(wù)的方式遠(yuǎn)程操作和管理你的大數(shù)據(jù)平臺(tái),而實(shí)際的計(jì)算和數(shù)據(jù)節(jié)點(diǎn)集群可以同時(shí)分布在內(nèi)部或云端。
MaaS存儲(chǔ)的典型例子Igneous會(huì)在客戶(hù)現(xiàn)場(chǎng)提供可訂閱的對(duì)象存儲(chǔ),而這些存儲(chǔ)實(shí)際上以管理即服務(wù)的方式進(jìn)行遠(yuǎn)程操作管理。這種模式有助于IT存儲(chǔ)團(tuán)隊(duì)領(lǐng)悟云計(jì)算與眾不同的市場(chǎng)游戲規(guī)則,服務(wù)在云端,而數(shù)據(jù)的實(shí)際存儲(chǔ)位置仍然在本地?cái)?shù)據(jù)中心。由于MaaS供應(yīng)商能積累和運(yùn)用大量的操作分析經(jīng)驗(yàn),在面對(duì)以數(shù)據(jù)為中心的智能化目標(biāo)時(shí),使用API直接調(diào)用云端服務(wù)(例如lambda計(jì)算或機(jī)器學(xué)習(xí))來(lái)擴(kuò)展MaaS存儲(chǔ)平臺(tái),將會(huì)成為新的機(jī)遇。
數(shù)據(jù)將存到何處?
我們已經(jīng)無(wú)法回避以云為中心的IT世界。我們所有人將來(lái)都必須管理跨越單設(shè)備、數(shù)據(jù)中心和全球云托管的混合存儲(chǔ)。隨著數(shù)據(jù)的繼續(xù)增長(zhǎng)和傳播,我們所有的分析和智能處理能力規(guī)模也必須同步增長(zhǎng)。
在未來(lái)的幾年中,我們將看到由新的物聯(lián)網(wǎng)數(shù)據(jù)源浪潮引發(fā)的數(shù)據(jù)大爆炸。如果沒(méi)有來(lái)自更智能的存儲(chǔ)產(chǎn)品和基于云計(jì)算的專(zhuān)業(yè)管理服務(wù)的大量支持,大多數(shù)IT組織將無(wú)法生存。