單中心模式下,關(guān)鍵數(shù)據(jù)面臨風(fēng)險(xiǎn)
盡管災(zāi)備技術(shù)已經(jīng)出現(xiàn)了數(shù)十年,受制于投資和認(rèn)知的限制或出于僥幸心理,仍有相當(dāng)數(shù)量的企業(yè)級數(shù)據(jù)中心基于單中心模式構(gòu)建,而這種模式顯然無法抵御站點(diǎn)級的災(zāi)難。
可以想象,當(dāng)遇到網(wǎng)絡(luò)切斷、宕機(jī)事故或不可抗力時(shí),企業(yè)IT工作人員將不得不一邊與機(jī)房和設(shè)備共存亡,一邊祈禱業(yè)務(wù)中斷期間的損失不要太大。
單數(shù)據(jù)中心面臨站點(diǎn)級風(fēng)險(xiǎn)
還不止如此,對于總部-多分支的組織架構(gòu)而言,獨(dú)立建設(shè)的數(shù)據(jù)中心會形成一個(gè)個(gè)信息“孤島”,造成IT布局分散,無法統(tǒng)一管理,信息資源缺乏共享,嚴(yán)重影響企業(yè)工作效率。
那么,如何避免單中心風(fēng)險(xiǎn)呢?
在現(xiàn)階段,各個(gè)行業(yè)都非常關(guān)注容災(zāi)系統(tǒng)的建設(shè),紛紛出臺針對行業(yè)自身的容災(zāi)要求,用戶遵循行業(yè)要求和自身需求建設(shè)容災(zāi)系統(tǒng)。
而浪潮提出的策略是:構(gòu)建以AS18000為核心的多站點(diǎn)災(zāi)備方案。
這是一套系統(tǒng)的容災(zāi)建設(shè)工程,包含需求分析、策略制定、方案實(shí)施、運(yùn)維管理和增值服務(wù)等多項(xiàng)措施,幫助企業(yè)建立多站點(diǎn)遠(yuǎn)程復(fù)制或級聯(lián)站點(diǎn)遠(yuǎn)程復(fù)制形式的關(guān)鍵業(yè)務(wù)數(shù)據(jù)災(zāi)備體系。
在技術(shù)層面,數(shù)據(jù)復(fù)制技術(shù)是容災(zāi)技術(shù)的基礎(chǔ),高效、可靠的復(fù)制技術(shù)才能保證產(chǎn)生正確的數(shù)據(jù)副本,減少數(shù)據(jù)丟失量,獲得更好的RPO。
這樣一來,企業(yè)數(shù)據(jù)中心的兩中心、兩地三中心、多分支機(jī)構(gòu)、共享式等多形式的災(zāi)備需求都可以通過浪潮多站點(diǎn)容災(zāi)方案得到很好的滿足,即使在毀滅性的站點(diǎn)級災(zāi)難下,也能確保業(yè)務(wù)正常持續(xù)運(yùn)行。
浪潮的多站點(diǎn)災(zāi)備怎么實(shí)現(xiàn)?
通過AS18000的同步/異步遠(yuǎn)程復(fù)制功能,可實(shí)現(xiàn)兩地三中心多站點(diǎn)容災(zāi)方案(一對多站點(diǎn)、一對一對一級聯(lián)站點(diǎn))。
AS18000支持一對多站點(diǎn)容災(zāi)方式(A-B、A-C;1:2;一對多),同時(shí)支持級聯(lián)站點(diǎn)容災(zāi)方式(A-B-C;1:1:1,一對一對一)。值得一提的是,一對多站點(diǎn)容災(zāi),保證了同一份數(shù)據(jù)是從主站點(diǎn)存儲同時(shí)復(fù)制兩份過去到兩個(gè)備站點(diǎn),提高了數(shù)據(jù)安全性,缺點(diǎn)是生產(chǎn)存儲壓力大,消耗很大的生產(chǎn)存儲資源;而一對一對一級聯(lián)站點(diǎn)容災(zāi),把生產(chǎn)存儲的一部分壓力轉(zhuǎn)到第2個(gè)備站點(diǎn)存儲,有效減輕生產(chǎn)存儲的壓力,保證生產(chǎn)中心存儲業(yè)務(wù)的連續(xù)性,所以1:1:1級聯(lián)站點(diǎn)容災(zāi)方式更易受到企業(yè)認(rèn)可。
多站點(diǎn)遠(yuǎn)程復(fù)制方案 級聯(lián)站點(diǎn)遠(yuǎn)程復(fù)制
通過AS18000的同步復(fù)制功能實(shí)現(xiàn)前端業(yè)務(wù)數(shù)據(jù)寫入時(shí),使數(shù)據(jù)保存到兩套存儲,從而保證一套存儲宕機(jī)的情況下,數(shù)據(jù)保持完整性。當(dāng)主存儲宕機(jī)時(shí),只需將業(yè)務(wù)切換到備存儲上,就可以恢復(fù)過來,而不會損失任何數(shù)據(jù)。當(dāng)備存儲宕機(jī)時(shí),不會影響前端業(yè)務(wù)。(同步:兩地距離最好不超過30KM)
同步遠(yuǎn)程復(fù)制分為四個(gè)步驟:1.前端主機(jī)發(fā)出寫操作命令,數(shù)據(jù)先寫到主存儲的Buffer中;2.數(shù)據(jù)從主存儲的Buffer中復(fù)制到備存儲的Buffer中;3.當(dāng)數(shù)據(jù)成功寫到鏡像卷中,備存儲向主存儲返回成功消息;4.主存儲收到備存儲的寫確認(rèn)消息后,向前端主機(jī)發(fā)送寫完成確認(rèn)。
通過AS18000 的FC/IP協(xié)議的遠(yuǎn)程異步復(fù)制功能,安全構(gòu)建災(zāi)備中心,將數(shù)據(jù)從主存儲復(fù)制到備存儲。當(dāng)主機(jī)房發(fā)生災(zāi)難時(shí),只需將業(yè)務(wù)切換到災(zāi)備機(jī)房的存儲上,便可從災(zāi)難中恢復(fù)過來。AS18000的異步復(fù)制周期可靈活調(diào)整(1~120秒)。
異步遠(yuǎn)程復(fù)制需要兩個(gè)步驟:1.數(shù)據(jù)寫入主存儲的生產(chǎn)卷時(shí),復(fù)制一份在備存儲的Buffer(單獨(dú)劃分出的一個(gè)Buffer用于異步傳輸)中;2.定期將數(shù)據(jù)從主存儲傳輸?shù)絺浯鎯Φ膫浞菥碇小?/p>
有讀者朋友可能會問,浪潮多站點(diǎn)容災(zāi)方案是自動切換還是手動切換呢?一般是手動的。對于關(guān)鍵業(yè)務(wù)來說,數(shù)據(jù)的價(jià)值很大,數(shù)據(jù)一致性至關(guān)重要,容災(zāi)站點(diǎn)切換需要執(zhí)行嚴(yán)格的審批流程,因此在產(chǎn)品設(shè)計(jì)的時(shí)候,將容災(zāi)切換功能設(shè)置為手動切換。
同步遠(yuǎn)程復(fù)制技術(shù) 異步遠(yuǎn)程復(fù)制技術(shù)
除了基于同步復(fù)制和異步復(fù)制機(jī)制的容災(zāi)方案,浪潮AS18000還可以提供存儲層級的雙活解決方案,通過雙活功能模塊保證存儲系統(tǒng)層故障的零秒切換,確保零數(shù)據(jù)風(fēng)險(xiǎn)和零資源浪費(fèi),當(dāng)單臺存儲發(fā)生故障時(shí)確保前端應(yīng)用無感知的切換,切換時(shí)間近乎零秒。雙活存儲意味著兩個(gè)存儲設(shè)備同時(shí)工作,均衡業(yè)務(wù)負(fù)載,有效提升存儲資源利用率,避免傳統(tǒng)陣列緩存同步鏡像所采用的一主一備模式的資源浪費(fèi)。
三副本技術(shù),提升數(shù)據(jù)一致性保證
浪潮高端存儲AS18000作為面向用戶核心業(yè)務(wù)的存儲系統(tǒng),承載著客戶最關(guān)鍵數(shù)據(jù),生產(chǎn)中心和災(zāi)備中心的數(shù)據(jù)一致性是衡量災(zāi)備系統(tǒng)的一個(gè)重要指標(biāo)。
數(shù)據(jù)一致性是指關(guān)聯(lián)數(shù)據(jù)之間的邏輯關(guān)系的正確性和完整性。當(dāng)某種異常情況發(fā)生時(shí), 數(shù)據(jù)并沒有按照應(yīng)用程序規(guī)定的邏輯關(guān)系完整的寫入磁盤,應(yīng)用程序讀入的數(shù)據(jù)無法按照原有的邏輯進(jìn)行解析,導(dǎo)致應(yīng)用程序無法啟動。數(shù)據(jù)一致性是容災(zāi)系統(tǒng)業(yè)務(wù)恢復(fù)的關(guān)鍵。
相比其他廠商的兩副本技術(shù)(生產(chǎn)系統(tǒng)緩存一份,災(zāi)備系統(tǒng)一份),在業(yè)務(wù)高峰期或數(shù)據(jù)鏈路不好的情況下,由于生產(chǎn)系統(tǒng)緩存有限,一旦災(zāi)備系統(tǒng)來不及保存生產(chǎn)系統(tǒng)緩存中的數(shù)據(jù),就可能造成生產(chǎn)系統(tǒng)緩存溢出的情況。
浪潮高端存儲AS18000具備獨(dú)特的三副本技術(shù),在生產(chǎn)系統(tǒng)的緩存、硬盤和災(zāi)備系統(tǒng)中各保存一份數(shù)據(jù)的副本,也就是具有2層buffer,一層是cachebuffer,一層是disk poolbuffer,平常鏈路狀態(tài)好的時(shí)候,數(shù)據(jù)能及時(shí)傳輸?shù)絺浯鎯Φ腸ache buffer,但是當(dāng)鏈路狀態(tài)不好的時(shí)候,數(shù)據(jù)不能及時(shí)傳輸過去,傳統(tǒng)的遠(yuǎn)程復(fù)制就會導(dǎo)致主存儲的緩存數(shù)據(jù)積壓,從而引起主存儲IO性能下降的現(xiàn)象,通過創(chuàng)新性的diskpool buffer機(jī)制,可以在鏈路延遲增加時(shí),及時(shí)把cache buffer數(shù)據(jù)下刷到disk pool buffer,當(dāng)鏈路延遲減小時(shí),再由disk pool buffer提升到cache buffer再向備存儲復(fù)制,真正解決了緩存空間不足導(dǎo)致的IO性能下降問題,同時(shí)保證數(shù)據(jù)災(zāi)備RPO=0,避免傳統(tǒng)存儲災(zāi)備依靠緩存鏡像技術(shù)的性能下降問題。AS18000存儲系統(tǒng)的三副本數(shù)據(jù)同步機(jī)制,提升了關(guān)鍵業(yè)務(wù)數(shù)據(jù)的處理效率和可靠性。
打鐵還需自身硬,AS18000具有豐富的數(shù)據(jù)保護(hù)高級功能
高端存儲AS18000具有全共享交換架構(gòu)iMatrix和KB級邏輯卷技術(shù)iRAID,提高了系統(tǒng)自身的數(shù)據(jù)安全性。對于站點(diǎn)級事故而言,高端存儲AS18000擁有快照、卷復(fù)制、多站點(diǎn)級聯(lián)卷鏡像等高級軟件功能和容災(zāi)解決方案,確保用戶數(shù)據(jù)和應(yīng)用在災(zāi)備中心重現(xiàn),可靠性達(dá)到99.99999%。也就是說,在多站點(diǎn)容災(zāi)中,AS18000可保證年均系統(tǒng)中斷時(shí)間小于3秒,前端業(yè)務(wù)零感知。
明天和意外哪個(gè)先來?不必再糾結(jié)
從定義上看,容災(zāi)系統(tǒng)是為小概率事件準(zhǔn)備,但對于企業(yè)而言,容災(zāi)系統(tǒng)就相當(dāng)于人身保險(xiǎn),只有充分做好風(fēng)險(xiǎn)預(yù)估、防患于未然,才能在面臨災(zāi)難時(shí)臨危不懼。
為了讓容災(zāi)系統(tǒng)在小概率事件中能夠真正發(fā)揮作用,浪潮堅(jiān)持“打鐵還需自身硬”的原則,在AS18000產(chǎn)品的日常數(shù)據(jù)一致性保障、豐富的數(shù)據(jù)保護(hù)高級功能上下足工夫,保障數(shù)據(jù)完整性。同時(shí),領(lǐng)先的多站點(diǎn)容災(zāi)設(shè)計(jì),更可全面滿足兩中心、兩地三中心、多分支機(jī)構(gòu)、共享式等多種災(zāi)備場景,為企業(yè)業(yè)務(wù)免除后顧之憂。