云存儲如今已經(jīng)不是什么新鮮的概念。而且,實際上對于用戶來說,也不需要理解這種概念的詳細(xì)內(nèi)容。從使用者的角度來看,其實際上就是一種提供存儲業(yè)務(wù)的服務(wù)。不過,這卻在某種程度上對云存儲服務(wù)供應(yīng)商提出了更高的要求。一方面,云存儲服務(wù)供應(yīng)商需要為每一名用戶提供完善的支持,保證數(shù)百乃至上千用戶的訪問性能,按照服務(wù)級別協(xié)議(SLA)提供服務(wù);另一方面,云存儲服務(wù)供應(yīng)商自己也要關(guān)注存儲成本,以及管理的難易度,這在某種方面來說也是開源節(jié)流的方式之一。
云存儲業(yè)務(wù)模型
如果說云存儲是用戶方便且低成本的存儲選擇,那么,這些存儲難題也可以說是被轉(zhuǎn)嫁到了云存儲服務(wù)供應(yīng)商身上。
在這種情形下,幾乎所有的云存儲供應(yīng)商都將目光轉(zhuǎn)到了集群NAS上。
什么是集群NAS?
一般來說,集群NAS是一種松散耦合的計算節(jié)點集合。這里所說的松散耦合,其實基本理念同軟件工程里的概念有些相似。在集群NAS中,最小的單位個體是文件而非數(shù)據(jù)塊,每個節(jié)點都是獨立的實體且擁有無法被其它節(jié)點所訪問的一個或者多個卷。當(dāng)用戶存儲數(shù)據(jù)時,數(shù)據(jù)會以文件形式存放于某個節(jié)點之上。出于數(shù)據(jù)保護(hù)的考慮,同一集群的其它節(jié)點上可能會有文件副本,但是卻無法以文件實例的形式提供給用戶。也就是說,集群NAS對節(jié)點的相互依賴和順序沒有特殊要求。這同數(shù)據(jù)塊方式操作的集群系統(tǒng)有著一定的區(qū)別。
這種工作方式對于大型的應(yīng)用具有很高的實用價值,特別是連續(xù)的文件數(shù)據(jù)流。通過文件系統(tǒng)的調(diào)度算法,其可以將整個應(yīng)用隔離成較小且并行的獨立任務(wù),并將文件數(shù)據(jù)分配到各個集群節(jié)點上。目前,我們常見到其被應(yīng)用于大型的數(shù)據(jù)庫查詢搜索、密集型的計算、生命科學(xué)、能源勘探以及動畫制作等領(lǐng)域。
對于集群NAS來說,硬件只是其中的一個部件,文件系統(tǒng)以及應(yīng)用同樣是其有價值的組成部分。目前我們能夠經(jīng)常見到的集群NAS產(chǎn)品包括,BlueArc的Titan和Mercury系列、HP的Ibrix系列、IBM的SoNAS、Isilon的IQ系列、NetApp的OntapGX等等。
集群NAS架構(gòu)如何適應(yīng)云存儲需求?
今年的集群NAS市場一掃往日的低迷,看起來一片紅火景象,這主要得益于一些大廠的切入,比如說戴爾,比如說HP,比如說IBM。
那么,這些大廠為什么會愿意同集群NAS扯上關(guān)系呢?我們可以從IBM對SoNAS的構(gòu)想中得到一些答案。在同IBM系統(tǒng)與科技部大中華區(qū)存儲產(chǎn)品經(jīng)理金微的交流中,他首先就把SoNAS同云存儲聯(lián)系到了一起。他認(rèn)為,在目前的存儲形勢下,一方面大量非結(jié)構(gòu)化數(shù)據(jù)持續(xù)增長,對于存儲系統(tǒng)的要求越來越高;另一方面,云存儲大規(guī)模的數(shù)據(jù)訪問也對存儲系統(tǒng)提出了要求。此外,包括賽門鐵克、Isilon等在內(nèi)的其它廠商也都將集群NAS的應(yīng)用領(lǐng)域提到了云存儲的級別上。
在當(dāng)前各類產(chǎn)品都同云計算、云存儲扯上關(guān)系的時候,集群NAS應(yīng)該是比較靠譜的應(yīng)用選擇之一。
[page]
我們以SoNAS舉例,來看一下其在云存儲環(huán)境下的架構(gòu)模型。不同廠商的架構(gòu)盡管會有差異,但是出入不會太大。
SoNAS在內(nèi)部數(shù)據(jù)交換方面采用了Infinband網(wǎng)絡(luò),包含InterfaceNode、StorageNode和ManagementNode三種處理節(jié)點,分別負(fù)責(zé)數(shù)據(jù)對外交換、數(shù)據(jù)存儲以及數(shù)據(jù)管理工作。在這其中,InterfaceNode承擔(dān)著數(shù)據(jù)交換的重任,最小為2個節(jié)點,最大為30個。
我們前面已經(jīng)說過,集群NAS的主要部件之一就是其文件系統(tǒng)。IBM在SoNAS上所采用的分布式文件系統(tǒng)叫做GPFS,用戶可以通過常見的文件訪問協(xié)議、TSM歸檔軟件接口來操作數(shù)據(jù)。目前,市場上除了SoNAS這類整合文件系統(tǒng)、x86硬件以及網(wǎng)絡(luò)設(shè)備的產(chǎn)品外,還有單純的文件系統(tǒng)產(chǎn)品,比如賽門鐵克的FileStore。
由于系統(tǒng)的優(yōu)勢,集群NAS系統(tǒng)可存儲的文件數(shù)量一般都在億級以上,對于實際應(yīng)用來說,文件數(shù)量限制基本可以忽略不計。同時,全局命名空間的大小也都為數(shù)個PB以上,某些廠商的全局空間容量甚至可以達(dá)到10PB。
目前,所有廠商的集群NAS設(shè)備都可以實現(xiàn)同原有系統(tǒng)的完美過渡,用戶實際上只需要進(jìn)行本地或者遠(yuǎn)程遷移就可以將數(shù)據(jù)轉(zhuǎn)移到集群NAS系統(tǒng)中。這種方便的新舊轉(zhuǎn)換也使得很多CIO在構(gòu)建私有云時開始考慮利用集群NAS產(chǎn)品。可以說,云存儲市場的被發(fā)掘,為集群NAS拓展出了一個更為廣大的應(yīng)用領(lǐng)域,這使得越來越多的廠商開始推出相應(yīng)的產(chǎn)品。