AutoNation花費(fèi)了數(shù)年時(shí)間試圖建立一個(gè)能夠激發(fā)信心的災(zāi)難恢復(fù)計(jì)劃。它已經(jīng)經(jīng)歷了多次失敗的迭代嘗試,包括一個(gè)完整的內(nèi)部部署解決方案和一個(gè)完全在云中的解決方案。這家總部位于佛羅里達(dá)州勞德代爾堡的汽車(chē)零售商在全美16個(gè)州經(jīng)營(yíng)著300家門(mén)店,最終發(fā)現(xiàn),它需要的是一種以災(zāi)難恢復(fù)服務(wù)為特色的混合模式。
“內(nèi)部和公共云災(zāi)難恢復(fù)模式都很昂貴,也沒(méi)有經(jīng)過(guò)徹底地測(cè)試,而且往往是那些真正經(jīng)過(guò)規(guī)劃了的災(zāi)難實(shí)施讓我們面臨了風(fēng)險(xiǎn),”AutoNation的信息技術(shù)和運(yùn)營(yíng)副總裁Adam Rasner表示,兩年前,他被請(qǐng)來(lái)對(duì)災(zāi)難恢復(fù)計(jì)劃進(jìn)行修改。
公共云方法的代價(jià)高昂:如果要維持三個(gè)月的災(zāi)難性停機(jī)恢復(fù)服務(wù),估計(jì)需要300萬(wàn)美元。“完全在云計(jì)算中采用災(zāi)難恢復(fù)可能還有點(diǎn)為時(shí)過(guò)早,”Rasner說(shuō),并指出盡管云計(jì)算提供商在最近幾年已經(jīng)相當(dāng)成熟了。
AutoNation還擁有自已的碰撞中心、拍賣(mài)行,并于2018年推出了自己的精密零部件生產(chǎn)線。該公司推出了一項(xiàng)新的災(zāi)難恢復(fù)計(jì)劃,融合了基于主機(jī)托管和即服務(wù)模式的災(zāi)難恢復(fù)功能,75%的應(yīng)用程序?qū)牡し鸬囊粋€(gè)托管設(shè)施恢復(fù),25%的應(yīng)用程序?qū)膩嗰R遜的AWS恢復(fù)。這些環(huán)境是由DRaaS提供商Cohesity及其輔助數(shù)據(jù)管理平臺(tái)進(jìn)行協(xié)調(diào)的,后者可以備份和復(fù)制虛擬服務(wù)器、應(yīng)用程序和數(shù)據(jù)到托管設(shè)施和AWS。Cohesity還可以用于管理故障轉(zhuǎn)移和恢復(fù)。
Rasner說(shuō):“在災(zāi)難中只要按下開(kāi)關(guān)就能自動(dòng)啟動(dòng)虛擬機(jī)的能力讓我能夠在晚上睡得更好。”
什么是災(zāi)難恢復(fù)即服務(wù)?
DRaaS市場(chǎng)是一個(gè)復(fù)雜的環(huán)境。市場(chǎng)上有數(shù)百個(gè)DRaaS提供商,它們都在使用不同的方法和功能來(lái)復(fù)制和托管服務(wù)器和數(shù)據(jù)。
一些DRaaS服務(wù)專注于虛擬服務(wù)器,而另一些也會(huì)使用備份物理服務(wù)器;有些依賴于現(xiàn)場(chǎng)備份設(shè)備,有些則不需要。這是一個(gè)不斷增長(zhǎng)的市場(chǎng),因?yàn)槠髽I(yè)總希望第三方供應(yīng)商在發(fā)生自然災(zāi)害或服務(wù)中斷時(shí)能夠提供更加完美的故障轉(zhuǎn)移服務(wù)。市場(chǎng)研究公司Technavio預(yù)測(cè),2018年至2022年間,全球DRaaS市場(chǎng)將以36%的復(fù)合年增長(zhǎng)率進(jìn)行增長(zhǎng)。
對(duì)于巴爾的摩市Miles & Stockbridge公司的CIO Ken Adams來(lái)說(shuō),DRaaS是一種完全擁抱云計(jì)算的方式,但已經(jīng)可以滿足這家擁有480名員工的律師事務(wù)所的合規(guī)要求了。ISO標(biāo)準(zhǔn)要求律師事務(wù)所需要將數(shù)據(jù)保存在三個(gè)不同的地點(diǎn)。作為云的早期采用者,Adams很早就接受了即服務(wù)模型,并看到了將其用于災(zāi)難恢復(fù)的機(jī)會(huì)。
Miles & Stockbridge使用了ClearSky Data的按需平臺(tái)和設(shè)備來(lái)訪問(wèn)和存儲(chǔ)本地和弗吉尼亞州托管設(shè)施中的虛擬服務(wù)器和數(shù)據(jù),并會(huì)將數(shù)據(jù)發(fā)送到第三個(gè)位置:Amazon AWS上的虛擬緩存服務(wù)器,Adams稱之為他們最后的保險(xiǎn)。
“ClearSky最初只是我們的一個(gè)存儲(chǔ)平臺(tái),后來(lái)我們才決定試著把我們的服務(wù)器放在其具有固態(tài)驅(qū)動(dòng)器的設(shè)備上。并且沒(méi)有對(duì)服務(wù)器的性能造成影響,我們也得到了額外的保護(hù),使服務(wù)器--而不僅僅是數(shù)據(jù)--在多個(gè)位置可用,”他表示。
弗吉尼亞州的設(shè)備幾乎是實(shí)時(shí)更新的,而AWS版本的數(shù)據(jù)會(huì)稍微陳舊一些,以便節(jié)省流量。他說(shuō),災(zāi)難恢復(fù)現(xiàn)在變得很容易了。“你只需按下適用于VMware的ClearSky控制臺(tái)上的一個(gè)按鈕,就可以從一個(gè)環(huán)境轉(zhuǎn)移到另一個(gè)環(huán)境。”
Adams擁有來(lái)自兩個(gè)不同ISP的專用光纖線路來(lái)連接ClearSky設(shè)備,因此它們可以輕松應(yīng)對(duì)訴訟支持等應(yīng)用的苛刻需求。然而,他說(shuō),他們的負(fù)擔(dān)其實(shí)并不像想象的那么大,因?yàn)橐恍?yīng)用程序,比如公司的文檔管理解決方案,已經(jīng)轉(zhuǎn)移到了SaaS上面,這就為他們提供了內(nèi)置的災(zāi)難恢復(fù)功能。
哪些應(yīng)用適合DRaaS?
康涅狄格州斯坦福德的技術(shù)研究和咨詢公司ISG的首席顧問(wèn)Spencer Suderman表示,隨著對(duì)DRaaS興趣的日益濃厚,越來(lái)越多的玩家開(kāi)始進(jìn)入這個(gè)市場(chǎng),IT團(tuán)隊(duì)不得不開(kāi)始考慮服務(wù)器和數(shù)據(jù)的需求。雖然一些服務(wù)器和應(yīng)用程序可能很容易地移植到基于云的“即服務(wù)”災(zāi)難恢復(fù)環(huán)境當(dāng)中,但是其他服務(wù)器和應(yīng)用程序可能會(huì)有所阻滯,因?yàn)樗鼈兪菍S械?,或者與其他應(yīng)用程序高度依賴的。
Suderman說(shuō),如果IT一開(kāi)始就認(rèn)為將應(yīng)用程序放到云中是困難的,那么添加DRaaS肯定也會(huì)是復(fù)雜性的。例如,虛擬服務(wù)器中的容器化應(yīng)用程序可能無(wú)法正確地進(jìn)行故障轉(zhuǎn)移或恢復(fù)。“虛擬服務(wù)器仍然具有一定的依賴性,”他說(shuō)。而且,即使應(yīng)用程序能夠正常工作,數(shù)據(jù)傳輸也可能會(huì)出現(xiàn)問(wèn)題。“假設(shè)你的目標(biāo)恢復(fù)時(shí)間是6小時(shí)。而你在100M bit/sec的鏈路上有TB級(jí)的數(shù)據(jù),那么下載所有的這些數(shù)據(jù)可能需要23個(gè)小時(shí)。你將無(wú)法滿足你的RTO,”他說(shuō)。
AutoNation的Rasner發(fā)現(xiàn),適用于DRaaS的應(yīng)用程序的范圍在汽車(chē)行業(yè)是有限的,在汽車(chē)行業(yè),遺留應(yīng)用程序通常是定制的,或者有很多觸角伸向其他應(yīng)用程序,比如已有13年歷史的AutoNation CRM系統(tǒng)。Rasner表示,AWS最適合于現(xiàn)成的、獨(dú)立的應(yīng)用程序,比如AutoNation的權(quán)益挖掘工具,它可以幫助服務(wù)團(tuán)隊(duì)確定客戶是愿意完成一項(xiàng)昂貴的維修,還是愿意購(gòu)買(mǎi)一輛新車(chē)。AWS還提供超過(guò)40天的備份。Rasner說(shuō),當(dāng)舊應(yīng)用程序被刷新或重構(gòu)時(shí),它們將被添加到AWS的災(zāi)難恢復(fù)環(huán)境中。
ISG的Suderman建議你可以與DRaaS供應(yīng)商進(jìn)行密集的規(guī)劃以及每月,每?jī)蓚€(gè)月或每季度的演練。“災(zāi)難恢復(fù)可能是計(jì)劃中最無(wú)法得到保證的服務(wù)之一,”他預(yù)計(jì),將一些責(zé)任移交給提供商只會(huì)使情況變得更糟。“每個(gè)人都在談?wù)摓?zāi)難恢復(fù),但是你為真正的災(zāi)難所做的計(jì)劃的廣度和深度是什么?對(duì)DRaaS演練將告訴你環(huán)境的真實(shí)可用性。”
注意事項(xiàng):你所有的應(yīng)用程序是否都在一個(gè)地方,并且都位于可以快速啟動(dòng)的虛擬機(jī)上?你的數(shù)據(jù)是最新的嗎?你的組織可以承受多久的停機(jī)時(shí)間,你的提供商是否了解你的應(yīng)用程序和數(shù)據(jù)優(yōu)先級(jí)?
如果你在一個(gè)高度管制的行業(yè)中,可能最重要的問(wèn)題是:你對(duì)災(zāi)難恢復(fù)站點(diǎn)是否具有可視性?“如果您正在使用基于云的基礎(chǔ)架構(gòu),那么你可能無(wú)法確定應(yīng)用程序具體的運(yùn)行位置,”Suderman說(shuō)。
DRaaS入門(mén)
總部位于巴爾的摩的食品制造商TIC Gums的高級(jí)IT經(jīng)理Vishal "Steve" Mathur正在計(jì)劃公司的DRaaS之旅。他的第一步是重做公司的廣域網(wǎng)基礎(chǔ)設(shè)施,該基礎(chǔ)設(shè)施依賴于一條MPLS線路以連接到公司的三個(gè)站點(diǎn)。他表示:“當(dāng)我們的MPLS線路癱瘓時(shí),所有三個(gè)網(wǎng)站都將被關(guān)閉,因?yàn)榇藭r(shí)我們就無(wú)法連接到Office365或Salesforce的互聯(lián)網(wǎng)了。”
現(xiàn)在,TIC Gum已經(jīng)擁有了內(nèi)置的冗余線路,從三個(gè)獨(dú)立的ISP連接過(guò)來(lái)的三條線路,每個(gè)站點(diǎn)上都有獨(dú)立的防火墻,為支持基于云的備份、存儲(chǔ)和災(zāi)難恢復(fù)提供了高可用性。“以我們現(xiàn)有的基礎(chǔ)設(shè)施,恢復(fù)業(yè)務(wù)可能只需要幾天時(shí)間,如果不是幾周的話,”Mathur表示。
盡管該公司最初認(rèn)為它將在AWS或微軟Azure等平臺(tái)上實(shí)現(xiàn)災(zāi)難恢復(fù),但Mathur設(shè)計(jì)了一個(gè)記分卡,將Expective的DRaaS產(chǎn)品的優(yōu)先級(jí)放在了其他產(chǎn)品之前。“我們一直在回答的最大問(wèn)題是:‘我們能從大公司那里得到什么樣的服務(wù)和支持?’”他說(shuō):“從長(zhǎng)遠(yuǎn)來(lái)看,我們想要更多的人際關(guān)系和支持。”
該公司與Expedient進(jìn)行了密切合作,以確定需要恢復(fù)的核心應(yīng)用程序堆棧,重新設(shè)計(jì)這些應(yīng)用程序的工作也已經(jīng)完成了80%。“今年,我們將把這些應(yīng)用遷移到Expedient的數(shù)據(jù)中心,”Mathur說(shuō)。TIC Gums的DRaaS RTO不到兩個(gè)小時(shí)。
“我們將能夠根據(jù)標(biāo)準(zhǔn)的操作程序來(lái)啟動(dòng)災(zāi)難恢復(fù),并能夠通過(guò)一個(gè)電話將所有內(nèi)容重新恢復(fù)到Expedient,”他說(shuō)。
Mathur已經(jīng)制定了每年兩次的測(cè)試DRaaS的目標(biāo),并可以相應(yīng)地調(diào)整標(biāo)準(zhǔn)操作程序。服務(wù)器將根據(jù)演習(xí)的結(jié)果從一層移動(dòng)到另一層(每層表示服務(wù)器可以宕機(jī)多少小時(shí)),演習(xí)是與Expedient合作完成的。Mathur只需要從他的團(tuán)隊(duì)中指定一個(gè)系統(tǒng)管理員:“95%的災(zāi)難恢復(fù)任務(wù)留給了提供商,”他說(shuō)。
AutoNation的Rasner也警告其他IT專業(yè)人士不要過(guò)于大意。“你仍然需要按下按鈕并宣布一場(chǎng)災(zāi)難的發(fā)生。而且還有一些事情需要進(jìn)行測(cè)試、驗(yàn)證,在某些情況下,還需要人工干預(yù),”他說(shuō)。
此外,他說(shuō),“DRaaS也不是萬(wàn)能的。”你需要對(duì)每個(gè)應(yīng)用程序和基礎(chǔ)設(shè)施進(jìn)行評(píng)估,而公司也需要考慮資本支出與運(yùn)營(yíng)支出之間的適宜性。你該如何證明這一點(diǎn):“在災(zāi)難恢復(fù)中,你所做的一切都是在不斷地復(fù)制,你可以通過(guò)DRaaS來(lái)這樣做,而不會(huì)導(dǎo)致所有沉重的基礎(chǔ)設(shè)施成本的貶值,也不需要增加任何投資。”
總的來(lái)說(shuō),Rasner對(duì)他的DRaaS體驗(yàn)非常滿意:“我們已經(jīng)對(duì)它進(jìn)行了測(cè)試,它堅(jiān)如磐石。盡管到達(dá)這里的過(guò)程有些痛苦,但我們的災(zāi)難恢復(fù)情況比過(guò)去好得多了。”