存儲(chǔ)專(zhuān)欄:無(wú)痛數(shù)流和無(wú)痛人流的異同

責(zé)任編輯:editor004

2014-08-05 10:47:31

摘自:存儲(chǔ)在線

隨著性觀念的開(kāi)放,大家的觀念都很開(kāi)放了,比如現(xiàn)在上海的拆奶罩(ChinaJoy)展會(huì)上,無(wú)數(shù)的ShowGirls的“秀溝”行為,活脫脫的辦成了一個(gè)硅膠展。數(shù)據(jù)遷移市場(chǎng)目前常用的主流手段還是基于主機(jī)的遷移,第二是采用虛擬化網(wǎng)關(guān),第三是用存儲(chǔ)本身的復(fù)制技術(shù)。

隨著性觀念的開(kāi)放,大家的觀念都很開(kāi)放了,比如現(xiàn)在上海的拆奶罩(ChinaJoy)展會(huì)上,無(wú)數(shù)的ShowGirls的“秀溝”行為,活脫脫的辦成了一個(gè)硅膠展。西瓜哥對(duì)這種乳溝隆胸秀的行為非常氣憤,怎么不在北京搞一場(chǎng),弄得我都沒(méi)有機(jī)會(huì)看看。

不說(shuō)了,現(xiàn)在的青年男女嘛也是很開(kāi)放,高校都可以結(jié)婚了。哎,西瓜哥又沒(méi)有趕上好時(shí)候。但年輕人嘛,容易一時(shí)沖動(dòng),偶爾可能邪惡了一把。

但是邪惡過(guò)后發(fā)現(xiàn)慘了,忘記做保護(hù)措施了。因此,做無(wú)痛人流的廣告現(xiàn)在都發(fā)到高校了。當(dāng)然,無(wú)痛人流的廣告也充斥著電視、電梯甚至電線桿。因此,小孩子都懂。網(wǎng)上流傳的一個(gè)笑話是這樣的:

朋友研究生畢業(yè),找不到合適工作,一日在家正發(fā)愁。

小侄子走近說(shuō):“叔叔,你去做個(gè)人流吧。”

朋友驚問(wèn)“為什么?”

答:“廣播上說(shuō)今天做人流明天就可以上班。”……

這個(gè)無(wú)痛人流廣告做的太好了,可把不少人都害慘了。無(wú)數(shù)的慘痛經(jīng)歷告訴我們,還是應(yīng)該選擇正規(guī)的機(jī)構(gòu)。

在存儲(chǔ)界,也上演了相似的一幕。

隨著存儲(chǔ)競(jìng)爭(zhēng)的白熱化,新的存儲(chǔ)廠商采用激進(jìn)的價(jià)格攻勢(shì)和也許夸大的功能搶占市場(chǎng),忽悠用戶拋棄舊的存儲(chǔ),購(gòu)買(mǎi)他們的新存儲(chǔ)。因此,大量的數(shù)據(jù)遷移(數(shù)據(jù)流動(dòng))產(chǎn)生了,就算是同一個(gè)廠商,由于更新?lián)Q代,也可能造成復(fù)雜的數(shù)據(jù)遷移問(wèn)題。隨著存儲(chǔ)技術(shù)的發(fā)展,很多廠商開(kāi)始宣傳無(wú)痛的數(shù)據(jù)遷移過(guò)程,就如無(wú)痛人流一樣,吸引了很多用戶的注意力。

這些新技術(shù)的出現(xiàn),使得“無(wú)痛數(shù)流”成為現(xiàn)實(shí),甚至可以實(shí)現(xiàn)不中斷業(yè)務(wù)的數(shù)據(jù)遷移。今天,西瓜哥就來(lái)談?wù)勈袌?chǎng)上常見(jiàn)的無(wú)痛遷移的技術(shù)。

根據(jù)IDC的統(tǒng)計(jì),大企業(yè)有60%的IT項(xiàng)目是數(shù)據(jù)遷移,其中又只有60%的數(shù)據(jù)遷移項(xiàng)目能夠按時(shí)完成。根據(jù)451 Research公司的研究,企業(yè)有 一半的IT費(fèi)用用在運(yùn)維方面。因此,如何進(jìn)行無(wú)痛的數(shù)據(jù)遷移就是對(duì)企業(yè)非常有意義的一個(gè)話題,怪不得現(xiàn)在無(wú)痛遷移比無(wú)痛人流還火。

數(shù)據(jù)遷移市場(chǎng)目前常用的主流手段還是基于主機(jī)的遷移,第二是采用虛擬化網(wǎng)關(guān),第三是用存儲(chǔ)本身的復(fù)制技術(shù)。

遷移的風(fēng)險(xiǎn),用戶最擔(dān)心的就是非計(jì)劃的停機(jī),第二是遷移的成本超過(guò)預(yù)算,第三是對(duì)公司品牌和公共形象的影響。

從技術(shù)的角度,遷移最頭痛的原因有:

復(fù)雜性。現(xiàn)在的存儲(chǔ)環(huán)境很復(fù)雜,各種網(wǎng)絡(luò)連接技術(shù),陣列上實(shí)現(xiàn)的各種增值功能,使得遷移后能否保持原有功能變得更加不確定。

技術(shù)依賴(lài)性。系統(tǒng)的軟硬件經(jīng)過(guò)多年開(kāi)發(fā)測(cè)試,兼容性很好。如果遷移到新存儲(chǔ),其他相關(guān)的配套硬件和軟件是否可以工作,是一個(gè)問(wèn)題。

業(yè)務(wù)依賴(lài)性。大部分的企業(yè)IT環(huán)境都是全天候工作,一個(gè)應(yīng)用停止工作,可能影響到相關(guān)系統(tǒng)的正常運(yùn)行。

規(guī)模。現(xiàn)在的遷移數(shù)據(jù)量都非常大,經(jīng)常會(huì)達(dá)到PB級(jí)別。這個(gè)對(duì)遷移的時(shí)間和性能都是一個(gè)巨大的挑戰(zhàn)。

成本。遷移的成本是巨大的,經(jīng)常會(huì)超過(guò)購(gòu)買(mǎi)成本的一本以上。這個(gè)成本分析我們以前分享過(guò),具體可以參看西瓜哥以前的帖子。

當(dāng)然,這些問(wèn)題主要是設(shè)備到設(shè)備間遷移的問(wèn)題。如果遷移到公共云上,還有其他的問(wèn)題,如安全問(wèn)題等等。

還好,現(xiàn)在科技在發(fā)展。一些相關(guān)的遷移技術(shù)出現(xiàn)并且逐漸成熟。

陳列到陣列的遷移

陳列間的遷移主要就是塊協(xié)議數(shù)據(jù)的遷移,典型的方法有:

基于主機(jī)。數(shù)據(jù)在主機(jī)級(jí)別進(jìn)行遷移,通過(guò)數(shù)據(jù)的卷到卷的復(fù)制,主機(jī)可以看到老的卷和新的卷。這個(gè)可以利用主機(jī)的邏輯卷管理功能來(lái)實(shí)現(xiàn)。

基于陣列。數(shù)據(jù)的移動(dòng)使用陣列級(jí)的遷移工具。如果新舊設(shè)備是一個(gè)廠商的,用陣列的復(fù)制功能就可以了。如果是異構(gòu)的遷移就比較麻煩了,但也有一些工具,如HP 3PAR Online Import可以支持把第三方的陣列的數(shù)據(jù)遷移到3PAR陣列上。EMC和華為也提供了類(lèi)似的工具。

基于Hypervisor。服務(wù)器虛擬化現(xiàn)在都有能力實(shí)現(xiàn)VM的數(shù)據(jù)遷移,如 VMware's vSphere Storage vMotion和 Microsoft Hyper-V Live Migration?;贖ypervisor的遷移雖然需要增加License費(fèi)用,但可以實(shí)現(xiàn)block到NFS的遷移,對(duì)業(yè)務(wù)的運(yùn)維影響也比較少。

基于虛擬化網(wǎng)關(guān)。IBM的SVC,EMC的VPLEX和華為的VIS這些虛擬化網(wǎng)關(guān)都可以實(shí)現(xiàn)數(shù)據(jù)的遷移。大部分情況下需要中斷一下業(yè)務(wù),把虛擬化網(wǎng)關(guān)接入到數(shù)據(jù)路徑中,然后就可以實(shí)現(xiàn)遷移。現(xiàn)在一些新興的存儲(chǔ)廠商已經(jīng)實(shí)現(xiàn)了無(wú)中斷的數(shù)據(jù)遷移技術(shù),可惜目前這些存儲(chǔ)大廠們都沒(méi)有集成進(jìn)去。具體實(shí)現(xiàn)原理就是利用數(shù)據(jù)的多路徑技術(shù),多條數(shù)據(jù)路徑順序逐步切換,保證系統(tǒng)的連續(xù)性。預(yù)計(jì)這些存儲(chǔ)大廠很快會(huì)收購(gòu)或者自己開(kāi)發(fā)這個(gè)不中斷業(yè)務(wù)的遷移功能,幫助用戶實(shí)現(xiàn)不停機(jī)遷移問(wèn)題。

基于虛擬陣列。這個(gè)也容易理解,就如HDS的高端存儲(chǔ)VSP G1000,本身就集成了虛擬化網(wǎng)關(guān)的功能。

文件到文件的遷移

使用基于文件的協(xié)議,數(shù)據(jù)遷移也一樣復(fù)雜。文件共享一般采用統(tǒng)一命名空間來(lái)進(jìn)行管理,如Microsoft的Distributed File System,抽取文件共享名并且使用全局命名空間,允許無(wú)縫的數(shù)據(jù)遷移。

對(duì)象存儲(chǔ)遷移

對(duì)象存儲(chǔ)現(xiàn)在非常流行,是保存非結(jié)構(gòu)化數(shù)據(jù)的非常理想的方式。不僅僅用在云存儲(chǔ)方面,甚至很多地方也用來(lái)代替NAS設(shè)備。一般對(duì)象存儲(chǔ)都采用REST API接口來(lái)進(jìn)行數(shù)據(jù)訪問(wèn)和遷移。對(duì)象存儲(chǔ)一般采用糾刪碼或者多副本技術(shù),任意節(jié)點(diǎn)的更換都不需要中斷業(yè)務(wù)。

遷移數(shù)據(jù)到公有云

使用混合云的企業(yè)越來(lái)越多。有許多的方法可以使用公有云,包括整個(gè)VM遷移到公有云或者把block或者file級(jí)別的數(shù)據(jù)遷移到云里。

需要云服務(wù)提供商提供VM導(dǎo)入功能,如Amazon Web Services' VM Import功能允許各種VM image導(dǎo)入到AWS中。不幸的是,這種方式限制比較多,因此現(xiàn)在比較常見(jiàn)的還是把數(shù)據(jù)遷移到全新的VM中。

現(xiàn)在EMC收購(gòu)了一個(gè)云網(wǎng)關(guān)產(chǎn)品,將在VMAX3上集成云網(wǎng)關(guān)功能,可以把公有云作為數(shù)據(jù)的一層進(jìn)行分層管理。而NETAPP也集成把數(shù)據(jù)遷移到Azure的能力。因此,傳統(tǒng)陣列和云網(wǎng)關(guān)結(jié)合是一個(gè)大趨勢(shì)。

Scale-out存儲(chǔ)和大數(shù)據(jù)

云和傳統(tǒng)的存儲(chǔ)不再是當(dāng)今唯一的數(shù)據(jù)存儲(chǔ)平臺(tái)。我們看到scale-out存儲(chǔ)和數(shù)據(jù)湖泊(data lake)也用來(lái)存儲(chǔ)大量的數(shù)據(jù)。

開(kāi)源的平臺(tái)如Ceph和Gluster提供scale-out文件和塊能力,數(shù)據(jù)遷移相對(duì)容易。節(jié)點(diǎn)可以按需增加或者減少。

Hadoop是一個(gè)最著名的流行大數(shù)據(jù)平臺(tái),其內(nèi)置工具DistCp可以用來(lái)在Hadoop集群間復(fù)制數(shù)據(jù)。當(dāng)然,Hadoop不是真正為數(shù)據(jù)移動(dòng)而設(shè)計(jì)的,因此把數(shù)據(jù)導(dǎo)入和遷出Hadoop集群不是給用戶一個(gè)文件系統(tǒng)或者LUN那么簡(jiǎn)單。

新的架構(gòu)一樣有新的遷移問(wèn)題

從Facebook的經(jīng)驗(yàn)來(lái)看,大型的數(shù)據(jù)湖泊增長(zhǎng)很快讓物理的數(shù)據(jù)中心空間成為問(wèn)題,而集群的移動(dòng)需要大量的規(guī)劃和努力。這讓我們的討論一下子又回到傳統(tǒng)存儲(chǔ)一樣的問(wèn)題,即如果更簡(jiǎn)單和減少成本。然而,新的存儲(chǔ)技術(shù)在管理數(shù)據(jù)移動(dòng)性方面還相對(duì)幼稚,這將是一個(gè)巨大的創(chuàng)新領(lǐng)域,聚焦這方面的技術(shù)將變得更加流行。

雖然不是小公司看起來(lái)有很好的遷移技術(shù),但遷移過(guò)程其實(shí)比人流還復(fù)雜。人流都需要選擇正規(guī)的機(jī)構(gòu),數(shù)據(jù)的遷移也是如此。技術(shù)是以方面,專(zhuān)業(yè)的遷移規(guī)劃和流程,包括應(yīng)急措施,遷移的經(jīng)驗(yàn)也一樣重要。因此,數(shù)據(jù)遷移請(qǐng)選擇專(zhuān)業(yè)廠商的服務(wù)。

到那個(gè)時(shí)候,也許我們才有可能像無(wú)痛人流的廣告詞一樣說(shuō),“痛苦,再見(jiàn)!幸福重現(xiàn)!“。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)