華為OceanStor N9000存儲系統(tǒng)技術(shù)漫談(一)

責任編輯:editor003

2012-12-12 16:42:30

摘自:存儲在線

大數(shù)據(jù)時代,數(shù)據(jù)成爆炸式增長,數(shù)據(jù)總量ZB級,對我們的IT系統(tǒng)提出了更大的容量存儲能力和更高的系統(tǒng)性能要求。

大數(shù)據(jù)時代,數(shù)據(jù)成爆炸式增長,數(shù)據(jù)總量ZB級,對我們的IT系統(tǒng)提出了更大的容量存儲能力和更高的系統(tǒng)性能要求。華為OceanStor N9000存儲系統(tǒng)(以下簡稱N9000系統(tǒng))采用Scale-Out架構(gòu),通過服務(wù)器的集群方式構(gòu)建,可自由橫向擴展,提供統(tǒng)一命名空間,這個統(tǒng)一的命名空間可以提供高達170GBps的總帶寬,超過300萬的OPS,以及很低的時延。N9000系統(tǒng)是如何達到這樣的卓越性能的呢?

SSD加速

在一個系統(tǒng)中,我們把用來描述數(shù)據(jù)的數(shù)據(jù)稱為元數(shù)據(jù),元數(shù)據(jù)管理真正的數(shù)據(jù)。元數(shù)據(jù)的特征是數(shù)據(jù)量不大,但訪問頻繁且離散。我們在并發(fā)訪問數(shù)據(jù)的時候,需要先訪問元數(shù)據(jù),以獲得數(shù)據(jù)的大小,路徑等信息再通過這些信息訪問數(shù)據(jù)的內(nèi)容。傳統(tǒng)機械硬盤,順序訪問性能可達100MB級別,但小文件隨機訪問的性能極低。用傳統(tǒng)機械硬盤來存儲元數(shù)據(jù),元數(shù)據(jù)往往就成為了整個系統(tǒng)的性能瓶頸。

近幾年固態(tài)硬盤(SSD)技術(shù)突飛猛進,SSD存儲小文件隨機訪問的性能有目共睹。就存儲介質(zhì)而言,SSD以其高性能引領(lǐng)著存儲行業(yè)的變革方向。但它同時也面臨著高成本和低容量的尷尬困境,而這恰恰是傳統(tǒng)硬盤的長項。就目前SSD的發(fā)展程度,在大數(shù)據(jù)時代,面對大容量和低成本的要求,所有場景全部采用SSD的方案是不現(xiàn)實的。

N9000系統(tǒng)基于分布式架構(gòu),數(shù)據(jù)和元數(shù)據(jù)分開管理,系統(tǒng)智能控制元數(shù)據(jù)的分布位置。同時,N9000系統(tǒng)的高性能節(jié)點配置SSD。這樣,N9000系統(tǒng)把元數(shù)據(jù)存放在SSD上,數(shù)據(jù)放在機械硬盤上,既能提升整系統(tǒng)性能,又能提供大容量空間,還能保持低TCO。

N9000系統(tǒng)不僅僅可以把元數(shù)據(jù)放在SSD上,加速元數(shù)據(jù)訪問速度,還能自動識別小文件,和熱門數(shù)據(jù),并自動把部分小文件和熱數(shù)據(jù)放在SSD上。當SSD空間滿的時候,N9000通過自動的冷熱文件識別,把一部分近期被訪問可能性較低的文件轉(zhuǎn)移到SATA或SAS盤上。這樣的設(shè)計可以讓資源得到充分的利用。

SSD的空間容量畢竟有限,只能放置部分元數(shù)據(jù)和數(shù)據(jù),絕大部分數(shù)據(jù)都放在傳統(tǒng)的,讀寫性能比SSD低很多的機械硬盤上。如果要保證整系統(tǒng)的高性能,僅僅依靠SSD加速還不夠。緩存,一直以來,也是用來提升性能的一大法寶。

全局緩存

在一個系統(tǒng)中,數(shù)據(jù)通常情況下讀要比寫的頻率高,提升數(shù)據(jù)的讀性能,能顯著提升整系統(tǒng)性能。數(shù)據(jù)從緩存中讀出,比從硬盤讀出快很多倍。傳統(tǒng)的做法是盡可能加大節(jié)點的緩存,但單節(jié)點的緩存總是有上限的。而且傳統(tǒng)集群服務(wù)器的緩存往往是各自為政,同一塊數(shù)據(jù)有可能被多個節(jié)點的緩存分別進行緩存處理,隨著節(jié)點的增加,緩存命中率不會得到提高,磁盤的讀性能得不到改善,數(shù)據(jù)的一致性保證機制也會非常復雜,進而消耗過多的系統(tǒng)資源。

N9000系統(tǒng)作為一個分布式,share nothing架構(gòu)的系統(tǒng),每個節(jié)點都對外提供服務(wù)。N9000系統(tǒng)采用全局緩存模式,把所有單節(jié)點的緩存聯(lián)合起來,整合成一個大緩存池,從任一節(jié)點訪問,讀寫均可以在全局緩存池中作統(tǒng)一的命中處理。N9000最高可以擁有超過4TB的超大緩存,大大提高緩存命中率,減少讀盤次數(shù),降低訪問時延,提升系統(tǒng)并發(fā)度、進而提升整系統(tǒng)性能。

把所有單節(jié)點的緩存整合成一個統(tǒng)一的全局緩存池,需要通過系統(tǒng)的內(nèi)部網(wǎng)絡(luò)來完成數(shù)據(jù)的交換,如果內(nèi)部網(wǎng)絡(luò)性能差,時延大,必然影響整體的系統(tǒng)性能。

高速的網(wǎng)絡(luò)互聯(lián)

隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,萬兆以太網(wǎng)出現(xiàn),讓用戶既擁有高速網(wǎng)絡(luò),又擁有以太網(wǎng)的簡單管理。N9000系統(tǒng)支持高速10GE以太網(wǎng),每個節(jié)點可以支持4個10GE端口和4個1GE端口, N9000在低時延、高帶寬、高并發(fā)的場景下都可以獲得卓越的表現(xiàn)。

隨著近幾年Infiniband技術(shù)趨于成熟,多并發(fā)鏈接,高達40Gbps的帶寬,時延低。在一些對性能要求苛刻的場景,Infiniband能夠帶來更高的性能。但Infiniband目前成本還比較高,這是CIO們需要抉擇的地方。

N9000系統(tǒng)同時支持高速10GE以太網(wǎng)和InfiniBand網(wǎng)絡(luò),適配用戶不同的組網(wǎng)需求。通過節(jié)點間高速互聯(lián),盡可能降低系統(tǒng)內(nèi)部時延,從而對外提供卓越性能。

并行訪問

傳統(tǒng)的NAS系統(tǒng)一般采用單NAS引擎Scale-up的方式擴展容量,所有的并發(fā)訪問都需要經(jīng)過NAS引擎,傳統(tǒng)的NAS系統(tǒng),NAS引擎往往成為系統(tǒng)的性能瓶頸。

N9000使用多臺相對廉價的x86服務(wù)器組成一個Scale-out的集群,通過負載均衡,每個訪問均勻地被發(fā)往各個服務(wù)器,這大大提高了N9000并發(fā)訪問的能力,其處理能力隨著集群規(guī)模的增大而線性增長,避免了性能與容量不匹配的尷尬。這也使得N9000可以使用較低配置的硬件達到傳統(tǒng)高端NAS的性能指標。

華為OceanStor N9000存儲系統(tǒng)還通過細粒度鎖,負載均衡,分級存儲等,為用戶提供卓越性能。技術(shù)永無止境,追求永無止境。華為OceanStor N9000存儲系統(tǒng)在技術(shù)上不斷創(chuàng)新,為客戶提供業(yè)界領(lǐng)先的性能,滿足媒資,高性能計算等場景的需求。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號