但是,IT災(zāi)難不僅限于網(wǎng)絡(luò)攻擊,硬件故障、人為錯(cuò)誤、停電以及颶風(fēng)或地震等自然災(zāi)害也有可能破壞企業(yè)的業(yè)務(wù)流程,并將有價(jià)值的數(shù)據(jù)置于風(fēng)險(xiǎn)之中。
這凸顯了企業(yè)需要采取措施確保最小化停機(jī)時(shí)間的重要性,不過好在很多企業(yè)正在為此做出積極的響應(yīng)。根據(jù)Spiceworks公司最近的一項(xiàng)研究,95%的組織都制定了災(zāi)難恢復(fù)計(jì)劃,其中90%的計(jì)劃包括災(zāi)難恢復(fù)(DR)計(jì)劃中的數(shù)據(jù)完整性和備份。
其他領(lǐng)域包括維護(hù)網(wǎng)絡(luò)和互聯(lián)網(wǎng)連接(62%),電源/電力連續(xù)性(57%)和本地服務(wù)器/應(yīng)用程序正常運(yùn)行時(shí)間(57%)。但是只有28%的企業(yè)表示,在其災(zāi)難恢復(fù)計(jì)劃中包含云計(jì)算或托管服務(wù),考慮到現(xiàn)在有大量的企業(yè)依賴基于云計(jì)算的平臺(tái),這一點(diǎn)令人驚訝。
這表明,災(zāi)難恢復(fù)并沒有一個(gè)萬能的解決方法,企業(yè)需要投資滿足其獨(dú)特需求,并確保選擇最適合其特定需求的災(zāi)難恢復(fù)解決方案。
尋找合適的人選
企業(yè)需要回答的第一個(gè)問題是“災(zāi)難恢復(fù)解決方案如何適合現(xiàn)有的基礎(chǔ)設(shè)施?”。一般來說,大多數(shù)探索和采用災(zāi)難恢復(fù)解決方案的企業(yè)屬于三個(gè)部門之一:擁有物理數(shù)據(jù)中心,并希望其災(zāi)難恢復(fù)服務(wù)基于數(shù)據(jù)中心基礎(chǔ)設(shè)施的組織;擁有物理數(shù)據(jù)中心,但希望其災(zāi)難恢復(fù)解決方案基于云平臺(tái)中的組織;以及希望其數(shù)據(jù)中心基礎(chǔ)設(shè)施和災(zāi)難恢復(fù)解決方案都是基于云計(jì)算的組織。
對(duì)于將數(shù)據(jù)存儲(chǔ)在物理數(shù)據(jù)中心,并希望災(zāi)難恢復(fù)位于數(shù)據(jù)中心基礎(chǔ)設(shè)施上的組織來說,它們通常需要單獨(dú)的副本環(huán)境,以便能夠提供全部或部分客戶的服務(wù)。這可能是一種成本高昂的方法,因?yàn)槠髽I(yè)必須考慮與維護(hù)設(shè)施、支付電力和購買額外硬件相關(guān)的成本。
而擁有物理數(shù)據(jù)中心但希望其災(zāi)難恢復(fù)解決方案位于云平臺(tái)中的組織,以及希望其數(shù)據(jù)中心基礎(chǔ)架構(gòu)和災(zāi)難恢復(fù)解決方案基于云計(jì)算的組織,都依賴云計(jì)算提供商的數(shù)據(jù)中心作為恢復(fù)站點(diǎn)。
雖然每種方法各有利弊,但基于云計(jì)算的系統(tǒng)被證明是最具成本效益和最有效的方法,可以最大限度地減少災(zāi)難事件的影響。但是如前所述,最有效的災(zāi)難恢復(fù)計(jì)劃是滿足業(yè)務(wù)特定需求的計(jì)劃。
可以理解,在這三種環(huán)境中實(shí)施災(zāi)難恢復(fù)所需的流程和解決方案(內(nèi)部部署、混合部署或云計(jì)算)各不相同。企業(yè)可以根據(jù)需求制定計(jì)劃,同時(shí)考慮到需要保護(hù)的不同基礎(chǔ)設(shè)施的性質(zhì)以及停機(jī)對(duì)業(yè)務(wù)的影響。
那么,在制定災(zāi)難恢復(fù)計(jì)劃時(shí),企業(yè)需要記住什么?將如何選擇確保正確的解決方案?
規(guī)劃災(zāi)難恢復(fù)
對(duì)于任何災(zāi)難恢復(fù)策略,第一步是將業(yè)務(wù)應(yīng)用程序與服務(wù)級(jí)別目標(biāo)相匹配,其中有兩個(gè)特定的衡量參數(shù):恢復(fù)點(diǎn)目標(biāo)(RPO)和恢復(fù)時(shí)間目標(biāo)(RTO)。
恢復(fù)點(diǎn)目標(biāo)(RPO)表示發(fā)生災(zāi)難時(shí)業(yè)務(wù)流程的數(shù)據(jù)丟失容限(即數(shù)據(jù)丟失量超出業(yè)務(wù)需求可接受的數(shù)量),而恢復(fù)時(shí)間目標(biāo)(RTO)表示在中斷后恢復(fù)業(yè)務(wù)服務(wù)所需的時(shí)間。不同的應(yīng)用程序?qū)⒏鶕?jù)其重要性和業(yè)務(wù)類型而有不同的要求。例如,eBay公司或亞馬遜公司等主要在線零售商將要求其核心電子商務(wù)系統(tǒng)具有較低的恢復(fù)點(diǎn)目標(biāo)(RPO)和恢復(fù)時(shí)間目標(biāo)(RTO),而規(guī)模較小的企業(yè)中的一些應(yīng)用程序能夠在24小時(shí)內(nèi)脫機(jī)。
通過映射其環(huán)境并分析特定應(yīng)用程序的風(fēng)險(xiǎn)和要求,企業(yè)可以確定最有效地滿足恢復(fù)點(diǎn)目標(biāo)(RPO)和恢復(fù)時(shí)間目標(biāo)(RTO)參數(shù)的災(zāi)難恢復(fù)解決方案。他們可能會(huì)意識(shí)到,內(nèi)部部署方法最符合其未來目標(biāo),或者將所有內(nèi)容移至云端是滿足客戶需求的最佳方式。
企業(yè)可能還必須考慮內(nèi)部可用的技術(shù)技能水平。 雖然這對(duì)于擁有大型IT團(tuán)隊(duì)的大規(guī)模組織來說并不是什么問題,但是那些根本無法獲得所需技能的小規(guī)模組織來說,可能不得不選擇托管的基于云計(jì)算的災(zāi)難恢復(fù)服務(wù)。
最后,重要的是要記住,不同的需求需要不同的方法實(shí)施正確的災(zāi)難恢復(fù)解決方案滿足特定需求,因此企業(yè)必須分析其基礎(chǔ)設(shè)施類型,并將這些需求考慮在內(nèi)。
在這個(gè)持續(xù)可用性預(yù)期的時(shí)代,很多企業(yè)根本無法承受停機(jī)的損失,當(dāng)然必須投資于防止災(zāi)難發(fā)生的解決方案,但當(dāng)這些解決方案無法阻止災(zāi)難發(fā)生時(shí),企業(yè)必須準(zhǔn)備好立即做出反應(yīng),否則將會(huì)面臨客戶投訴的風(fēng)險(xiǎn)。