虛擬化徹底改變了我們?cè)跀?shù)據(jù)中心部署應(yīng)用的方式,并延伸到了災(zāi)難恢復(fù)。
以前,配置過(guò)程要花幾周甚至幾個(gè)月的時(shí)間,如今卻轉(zhuǎn)變?yōu)閹追昼妰?nèi)搞定的自動(dòng)化任務(wù)。虛擬化具備一些能提供敏捷性、靈活性和更好彈性的特點(diǎn),包括snapshots(快照)、vMotion和HA/FT(高可用性/容錯(cuò)性)。
與此同時(shí),災(zāi)難恢復(fù)也轉(zhuǎn)變了。在物理服務(wù)器環(huán)境下,意外中斷的恢復(fù)過(guò)程需要失效備援到主要環(huán)境或完全相同的硬件和操作系統(tǒng)的復(fù)制,以還原備份。
據(jù)稱(chēng),虛擬化能廢除上述恢復(fù)過(guò)程的很多步驟,使災(zāi)難恢復(fù)的部署變的更容易更簡(jiǎn)單。但是能簡(jiǎn)化到什么程度呢?
本文中,我們會(huì)調(diào)查災(zāi)難恢復(fù)計(jì)劃和配置過(guò)程的每一步,以及虛擬化可以幫助簡(jiǎn)化到什么程度?
物理 PK. 虛擬
服務(wù)器虛擬化是一個(gè)很棒的工具,能夠加強(qiáng)和簡(jiǎn)化應(yīng)用部署的工作量。硬件使用不足——典型是單一應(yīng)用對(duì)應(yīng)一個(gè)操作系統(tǒng)實(shí)例,把物理資產(chǎn)集中成更高效的封裝時(shí),虛擬化為服務(wù)器提供隔離性和管理效益。
虛擬服務(wù)器綜合了代表物理磁盤(pán)的虛擬磁盤(pán)文件,處理器、存儲(chǔ)器和其他附件的配置信息。這使得虛擬服務(wù)器——或者虛擬機(jī)器(VM)——非常輕便,也允許虛擬化提供一些能力,諸如高可用性(在出現(xiàn)硬件故障時(shí)將VM移到另一臺(tái)服務(wù)器上)和容錯(cuò)性(如果硬件出問(wèn)題,運(yùn)行能掌管服務(wù)的VM重映像),而無(wú)需大量附加硬件或者復(fù)雜的配置。
將VM看成一套文件的能力意味著備份和恢復(fù)也一樣簡(jiǎn)化了。運(yùn)行VM的硬件各種各樣(無(wú)限制),管理程序因此承擔(dān)了翻譯物理地址到虛擬設(shè)備上的任務(wù)。這表示VM和封裝在它內(nèi)部的工作量比以往更加輕便。
災(zāi)難恢復(fù)計(jì)劃和執(zhí)行
我們來(lái)看看典型災(zāi)難復(fù)原方案的關(guān)鍵元素,以及看清虛擬化技術(shù)可以在哪里幫上忙。
災(zāi)難恢復(fù)計(jì)劃的第一步,是查看商業(yè)需求,以及將應(yīng)用與服務(wù)水平目標(biāo)匹配。在災(zāi)難恢復(fù)領(lǐng)域,測(cè)量標(biāo)準(zhǔn)是復(fù)原時(shí)間目標(biāo)(RTO)和修復(fù)點(diǎn)目標(biāo)(RPO)。
RTO指定應(yīng)用在服務(wù)必須恢復(fù)前可以忍受的總故障時(shí)間。任務(wù)嚴(yán)苛的應(yīng)用有很低的,甚至為零的RTO(表示服務(wù)必須一直連續(xù))。
RPO描述了應(yīng)用可以忍受的數(shù)據(jù)損失總量。該指標(biāo)有可能為零(比如,沒(méi)有數(shù)據(jù)損失)或者以分鐘或小時(shí)來(lái)衡量。一些無(wú)核app(比如那些用來(lái)報(bào)告的)可能可以忍受的RPO為24小時(shí),尤其是數(shù)據(jù)可以從別的來(lái)源產(chǎn)生時(shí)。
此時(shí),與技術(shù)的選擇沒(méi)有關(guān)系。開(kāi)展商業(yè)影響/風(fēng)險(xiǎn)分析是基于人們對(duì)商業(yè)需求的評(píng)估。然而,隨著我們?cè)跒?zāi)難復(fù)原計(jì)劃過(guò)程中更進(jìn)一步,我們會(huì)發(fā)現(xiàn)技術(shù)選擇出現(xiàn)了。接下來(lái)的問(wèn)題,變成了虛擬化到底能在哪里幫助災(zāi)難復(fù)原。
災(zāi)難恢復(fù)風(fēng)險(xiǎn)評(píng)估下一步,災(zāi)難恢復(fù)計(jì)劃過(guò)程要獲取從影響分析中得到的服務(wù)要求,并且提出風(fēng)險(xiǎn)評(píng)估。
對(duì)于每個(gè)應(yīng)用或者系統(tǒng),我們可以將RTO/RPO要求對(duì)應(yīng)到可能的風(fēng)險(xiǎn),評(píng)估那些風(fēng)險(xiǎn)的可能性,并開(kāi)始為每項(xiàng)風(fēng)險(xiǎn)制定出減輕和修復(fù)策略。下面的表格展示了一些例子:
此時(shí)此刻,我們可以看到,要在物理和虛擬基礎(chǔ)設(shè)施中做出選擇。
第一個(gè)例子顯示,基于物理硬件的集群解決方案如何用來(lái)履行服務(wù)要求的。盡管不能接受數(shù)據(jù)損失,應(yīng)用可以忍受高達(dá)30分鐘的中斷。
可用以下兩種方式實(shí)現(xiàn)。一種是失效備援的鏡像物理設(shè)施,價(jià)格不菲。另一種是擁有高可用性的虛擬設(shè)施,比如VMware HA。該功能可使在備用硬件上的應(yīng)用自動(dòng)重啟,運(yùn)用共享存儲(chǔ)基礎(chǔ)框架以確保RPO為零。
第二個(gè)例子展示了一個(gè)企業(yè)的網(wǎng)站需要24*7小時(shí)不停機(jī)。這種情況下,應(yīng)用以靜態(tài)數(shù)據(jù)為基礎(chǔ),在一個(gè)或者更多的訪問(wèn)同一數(shù)據(jù)池的網(wǎng)絡(luò)服務(wù)器實(shí)例上實(shí)現(xiàn)。如果任一服務(wù)器停止,負(fù)載均衡軟件會(huì)重定向通信路線到一個(gè)新服務(wù)器上。
虛擬化通過(guò)單獨(dú)的VM提供網(wǎng)絡(luò)服務(wù)器實(shí)例,就可以應(yīng)用在上述場(chǎng)景中。如果一種硬件故障總是發(fā)生,新的網(wǎng)絡(luò)服務(wù)器就可以從模板中部署并加入到負(fù)載均衡列表中,而無(wú)需更多復(fù)雜的HA或者集群軟件。該方案在跨地域的場(chǎng)景中也可以實(shí)現(xiàn)。
第三個(gè)例子凸顯了傳統(tǒng)應(yīng)用如何被傳統(tǒng)的或者基于VM的備份所保護(hù)。相比使用物理基礎(chǔ)架構(gòu),虛擬方案提供更快的備份和還原能力。
建立災(zāi)難恢復(fù)方案現(xiàn)在,我們已經(jīng)識(shí)別了應(yīng)用和量化了相應(yīng)的風(fēng)險(xiǎn)。我們開(kāi)始完整制定出減輕和修復(fù)場(chǎng)景,作為應(yīng)用和基礎(chǔ)設(shè)施設(shè)計(jì)的一部分。與純粹的物理服務(wù)器運(yùn)行相比,虛擬化提供了一些獨(dú)特的性質(zhì),可以幫助達(dá)到業(yè)務(wù)連續(xù)性。包括:
基于模板化的應(yīng)用工作負(fù)荷,有能力在幾分鐘內(nèi)加速|(zhì)VM實(shí)例。
通過(guò)容錯(cuò)性和高可用性的應(yīng)用恢復(fù),可以消除對(duì)復(fù)雜修復(fù)措施的需要,包括在大城市。
VM失效備援的一體化和自動(dòng)化可適用于偏遠(yuǎn)地區(qū),使用工具有VMware’s Site Recovery Manager。
硬件抽象化允許VM在不同的硬件平臺(tái)上修復(fù)。與生產(chǎn)現(xiàn)場(chǎng)相比較,硬件平臺(tái)可能是高低不一的規(guī)格或者混合的。
VM/服務(wù)器備份基于來(lái)自下面存儲(chǔ)器的文件映象復(fù)制。
失效備援與應(yīng)用的集成,通過(guò)使用基于主機(jī)的工具,避免崩潰一致性副本和應(yīng)用恢復(fù)的更高可能性。
通過(guò)工具,比如vMotion,避免災(zāi)難。
所有這些特征允許應(yīng)用以比典型物理服務(wù)器更高效的方式在基礎(chǔ)設(shè)施上部署。
測(cè)試和驗(yàn)證設(shè)計(jì)之后,需要測(cè)試和驗(yàn)證災(zāi)難復(fù)原計(jì)劃。是否使用虛擬基礎(chǔ)架構(gòu),方案必須包括驗(yàn)證應(yīng)用有能力在災(zāi)難復(fù)原模式運(yùn)行,并且以每個(gè)系統(tǒng)服務(wù)水平目標(biāo)(RPO/RTO)的形式恢復(fù)正常運(yùn)行。
虛擬化不能避免測(cè)試(和確認(rèn)基礎(chǔ)設(shè)施每一部分配置正確),但它可以使測(cè)試過(guò)程實(shí)現(xiàn)起來(lái)更簡(jiǎn)單。比如,提出在災(zāi)難復(fù)原現(xiàn)場(chǎng)的VM,測(cè)試功能和數(shù)據(jù)完整性,而保持VM的隔離性,以避免與正運(yùn)轉(zhuǎn)的生產(chǎn)現(xiàn)場(chǎng)一起崩潰。無(wú)需影響災(zāi)難恢復(fù)過(guò)程就可實(shí)現(xiàn)。反之,對(duì)物理服務(wù)器的測(cè)試會(huì)讓生產(chǎn)服務(wù)處于危險(xiǎn)中,直到測(cè)試結(jié)束。
總結(jié)虛擬化以更高效和簡(jiǎn)單的方式,提供了大量執(zhí)行災(zāi)難復(fù)原的機(jī)會(huì)。然而,正如我們所看到的,基于商業(yè)需求,它不能代替深思熟慮、詳細(xì)說(shuō)明的綜合災(zāi)難復(fù)原方案。隨著技術(shù)持續(xù)進(jìn)化,災(zāi)難復(fù)原方案需要回顧和更新,以反映當(dāng)前的虛擬化能力,從而變成一份“活的”文檔,以確保不間斷的業(yè)務(wù)持續(xù)性。