多年以來,編寫災(zāi)難恢復(fù)計劃一直是IT部門的責(zé)任,但是現(xiàn)在必須重新調(diào)整這些計劃,以針對邊緣計算和云計算環(huán)境進(jìn)行故障轉(zhuǎn)移。有哪些新功能?組織如何修改其計劃?
規(guī)則1:IT團(tuán)隊無法控制邊緣計算
考慮到采用了邊緣計算和其他分布式計算策略,IT團(tuán)隊不能使用圍繞數(shù)據(jù)中心構(gòu)建的標(biāo)準(zhǔn)集中式災(zāi)難恢復(fù)計劃來控制所有這些分布式計算。例如,在使用機(jī)器人技術(shù)和自動化進(jìn)行的日常制造中,由生產(chǎn)線主管和制造人員來運(yùn)行機(jī)器人,并負(fù)責(zé)確保這些資產(chǎn)在不使用時在鎖定區(qū)域內(nèi)安全可靠。在許多情況下,這些制造人員還可能自己安裝和監(jiān)視/維護(hù)設(shè)備,或與供應(yīng)商合作。這些人員在安全性或資產(chǎn)保護(hù)以及維護(hù)/監(jiān)視方面沒有IT背景。同時,在IT之外安裝新的邊緣計算網(wǎng)絡(luò)和解決方案會使可能發(fā)生故障的IT資產(chǎn)數(shù)量成倍增加。需要在某個地方記錄災(zāi)難恢復(fù)和故障轉(zhuǎn)移計劃并對其進(jìn)行培訓(xùn),以便涵蓋這些資產(chǎn)。發(fā)生這種情況的最合邏輯的地方是在IT 災(zāi)難恢復(fù)和業(yè)務(wù)連續(xù)性計劃中。
要修改該計劃,IT團(tuán)隊必須與這些不同的分布式計算小組開展合作。關(guān)鍵是讓每個人都參與進(jìn)來,并致力于記錄災(zāi)難恢復(fù)和故障轉(zhuǎn)移計劃,然后定期參與和測試。
規(guī)則2:云計算應(yīng)用意味著云計算災(zāi)難恢復(fù)交付
在2018年,Rightscale公司對近1,000名IT專業(yè)人員進(jìn)行了調(diào)查,發(fā)現(xiàn)他們所在公司采用的云平臺平均數(shù)量接近4.8個。
有趣的是,會有多少個公司記錄了災(zāi)難恢復(fù)程序來處理云平臺的中斷。當(dāng)專家查看客戶使用的云計算供應(yīng)商時,就想到了這個問題,發(fā)現(xiàn)幾乎所有云計算供應(yīng)商的合同中都有條款,如果發(fā)生災(zāi)難,采用這些條款可以免除責(zé)任。
要點(diǎn):如果企業(yè)的IT部門尚未這樣做,則應(yīng)將其合作的每個云計算供應(yīng)商都寫入災(zāi)難恢復(fù)計劃中。供應(yīng)商承諾進(jìn)行備份和恢復(fù)的服務(wù)等級協(xié)議(SLA)是什么?如果出現(xiàn)故障,企業(yè)(或其供應(yīng)商)的災(zāi)難恢復(fù)計劃是什么?企業(yè)是否與供應(yīng)商達(dá)成協(xié)議,以每年測試企業(yè)在云上用于災(zāi)難恢復(fù)故障轉(zhuǎn)移的應(yīng)用程序?
規(guī)則3:人身安全很重要
企業(yè)的IT團(tuán)隊越傾向于邊緣計算,找到進(jìn)入生產(chǎn)工廠或現(xiàn)場辦公室的途徑,物理安全就越來越與災(zāi)難恢復(fù)聯(lián)系在一起。如果偏遠(yuǎn)沙漠地區(qū)的現(xiàn)場辦公室過熱,服務(wù)器出現(xiàn)故障怎么辦?或者未經(jīng)授權(quán)的員工進(jìn)入制造工廠的重要區(qū)域并篡改機(jī)器人的操作該怎么辦?企業(yè)的災(zāi)難恢復(fù)計劃應(yīng)包括在分布式物理位置(而不僅僅是在中央數(shù)據(jù)中心)對設(shè)備和設(shè)施進(jìn)行定期檢查和測試。
規(guī)則4:災(zāi)難恢復(fù)通信必須變得更好
幾年前,一家銀行的數(shù)據(jù)中心所在地發(fā)生了一次地震,IT部門停機(jī)中斷,雖然數(shù)據(jù)中心受到的損害很小,但是整個區(qū)域的網(wǎng)絡(luò)和通信都已中斷,因此分支機(jī)構(gòu)的員工必須通過保留人工分類帳來處理客戶交易,以便在系統(tǒng)服務(wù)返回時將其輸入系統(tǒng)。
在這段時間里,客戶詢問一名柜員出了什么問題,她表示,“我們的服務(wù)器都受到了影響。”這個消息在整個社區(qū)和媒體中廣泛傳播,很多客戶蜂擁而至,試圖關(guān)閉賬戶。
當(dāng)更多的人控制IT資產(chǎn)(例如邊緣計算)時,這種情況會加劇。這就是為什么擁有良好的溝通如此重要的原因,它解釋了在災(zāi)難中誰與誰溝通了什么內(nèi)容,與誰溝通,并且每個人都堅持這樣做的原因。
通常,溝通行為應(yīng)該是企業(yè)的公共關(guān)系團(tuán)隊實施。該團(tuán)隊與高層管理人員進(jìn)行協(xié)調(diào),并向社區(qū)和媒體發(fā)布有關(guān)災(zāi)難的聲明。
如果在員工心中沒有牢固地建立和鞏固這種溝通渠道,那么企業(yè)可能會發(fā)現(xiàn)與實際的災(zāi)難相比,企業(yè)將更多的時間花在從錯誤的溝通中進(jìn)行災(zāi)難恢復(fù)上。
規(guī)則5:災(zāi)難恢復(fù)必須適用于多個地區(qū)
隨著邊緣計算和遠(yuǎn)程辦公室的興起,毋庸置疑,災(zāi)難恢復(fù)不能集中在一個位置或數(shù)據(jù)中心。特別是如果企業(yè)將云計算用于災(zāi)難恢復(fù),需要選擇具有多個地理位置的云計算提供商。這樣可以在主數(shù)據(jù)中心或云計算數(shù)據(jù)存儲位置發(fā)生故障的情況下,將故障轉(zhuǎn)移到正常運(yùn)行的位置。這些故障轉(zhuǎn)移數(shù)據(jù)中心方案應(yīng)包括在災(zāi)難恢復(fù)計劃中并對其進(jìn)行測試。
規(guī)則6:必須重新校準(zhǔn)災(zāi)難恢復(fù)測試計劃
如果企業(yè)要將更多的IT交付給云計算,并部署更多的邊緣計算,則應(yīng)將新的災(zāi)難恢復(fù)測試方案添加到企業(yè)的計劃中,以確保針對所有這些新位置進(jìn)行災(zāi)難恢復(fù)文檔和測試。企業(yè)想知道其災(zāi)難恢復(fù)必須適用于所有公司的災(zāi)難恢復(fù)方案。
規(guī)則7:首席代表必須為災(zāi)難恢復(fù)提供更多的口頭服務(wù)
向云計算和邊緣計算的遷移使災(zāi)難恢復(fù)變得復(fù)雜。這意味著大多數(shù)組織都需要審查和修訂其災(zāi)難恢復(fù)計劃。對于大多數(shù)組織而言,災(zāi)難恢復(fù)和評審和修訂需要花費(fèi)時間,而這并不是大多數(shù)組織的工作重點(diǎn),而且往往落后于需要退出的大量項目。由于云計算和邊緣計算技術(shù)給IT帶來的變化,首席信息官需要向管理層和董事會說明這些變化對災(zāi)難恢復(fù)的影響,以及需要投入精力和時間修改災(zāi)難恢復(fù)計劃。
規(guī)則8:邊緣計算和云計算供應(yīng)商參與災(zāi)難恢復(fù)應(yīng)該確保安全
如前所述,大多數(shù)云計算供應(yīng)商在合同中并未對災(zāi)難恢復(fù)和故障轉(zhuǎn)移給予太多保證。在與云計算供應(yīng)商簽署合同之前,供應(yīng)商災(zāi)難恢復(fù)承諾和支持應(yīng)成為招標(biāo)書的一部分,也是重要的討論點(diǎn)。
規(guī)則9:網(wǎng)絡(luò)冗余至關(guān)重要
許多組織將重點(diǎn)放在災(zāi)難發(fā)生時的系統(tǒng)和數(shù)據(jù)恢復(fù)上,而很少將重點(diǎn)放在網(wǎng)絡(luò)上。但是,考慮到當(dāng)今全球互聯(lián)網(wǎng)和廣域網(wǎng)的作用,網(wǎng)絡(luò)災(zāi)難恢復(fù)故障轉(zhuǎn)移和冗余也應(yīng)該內(nèi)置到災(zāi)難恢復(fù)計劃中。