雖然災(zāi)難事件的發(fā)生是無法完全杜絕的,但是由災(zāi)難事件所導(dǎo)致的業(yè)務(wù)中斷卻是可以避免的。通過使用正確的工具和采用合適的測試策略,多云中的主動-主動故障轉(zhuǎn)移可確保企業(yè)的一切業(yè)務(wù)正常運行。
對于某些企業(yè)(例如金融企業(yè))來說,每一次業(yè)務(wù)中斷事件所帶來的經(jīng)濟損失常常是以每小時百萬美元計算的,更不用說此類事件對客戶、公共關(guān)系以及企業(yè)形象所帶來的負面影響了。一個多云災(zāi)難恢復(fù)計劃可有助于降低此類可避免的損失。公共云供應(yīng)商們在多個不同區(qū)域部署了若干數(shù)據(jù)中心,因此,如果發(fā)生人為的或自然的災(zāi)害,另一家供應(yīng)商的云平臺是不太可能受到影響的。
即便是在云面世之前,企業(yè)用戶也可以通過在遠離主機站點意外地方設(shè)置備份站點的方法來實現(xiàn)這種災(zāi)難恢復(fù)(DR)。這種模式被稱為主動-主動故障轉(zhuǎn)移,該模式主要包括了兩個運行著完全相同平臺、應(yīng)用程序、存儲資源以及其他所需組件的副本的站點。
云技術(shù)讓這個主動-主動故障轉(zhuǎn)移模式的應(yīng)用成本變得更為低廉,這是因為采用云技術(shù)就無需用戶自行購買備份站點所需的軟硬件配置。但是,多云環(huán)境中主動-主動自動化故障轉(zhuǎn)移的設(shè)置是略有復(fù)雜的。
自動化故障轉(zhuǎn)移與擴展的挑戰(zhàn)
第一個挑戰(zhàn)就是創(chuàng)建平臺副本,或者在兩個或兩個以上公共基礎(chǔ)設(shè)施即服務(wù)(IaaS)云品牌的平臺上創(chuàng)建平臺副本。雖然亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)和Azure都提供了類似的平臺,例如Linux和Windows,但是它們可能并不會提供完全相同的配置。
通常來說,用戶必須依靠類似的平臺和配置來實現(xiàn)主動-主動故障轉(zhuǎn)移。即便兩個副本環(huán)境之間并不完全相同,那也是可以的,但是需要對故障轉(zhuǎn)移過程進行完整的測試。
第二個挑戰(zhàn)在于實現(xiàn)自動化故障轉(zhuǎn)移的云平臺與配置管理系統(tǒng)。這些工具被部署在兩個或兩個以上的IaaS云平臺上,并提供自動調(diào)節(jié)功能,以及實現(xiàn)從主要IaaS云到輔助備用IaaS云故障轉(zhuǎn)移的自動化。
在這里選擇正確的技術(shù)是最為至關(guān)重要的。目前還沒有哪一個單一工具能夠同時提供擴展與故障轉(zhuǎn)移功能、配置管理,以及應(yīng)用程序與數(shù)據(jù)的復(fù)制自動化。用戶可能需要予以權(quán)衡并使用多個工具。例如,包括CloudSigma在內(nèi)的云故障轉(zhuǎn)移工具,而一些數(shù)據(jù)復(fù)制工具則會被內(nèi)置到基于云的數(shù)據(jù)庫應(yīng)用程序中,例如Oracle。自動擴展功能通常是云平臺本身功能的一部分,例如AWS的Auto Scaling。但是,對于多云來說,用戶將需要投資搭建一個第三方云管理平臺,例如CA科技、思科或惠普企業(yè)等公司所提供的云管理平臺,以用于實現(xiàn)跨多個平臺環(huán)境的監(jiān)控與擴展。
用戶需要在組件級別進行測試,以確保應(yīng)用程序能夠在工作負載出現(xiàn)額外負載時實現(xiàn)自動擴展。用戶應(yīng)每個月定期使用預(yù)制腳本程序來測試其故障轉(zhuǎn)移策略,以模擬當(dāng)主平臺或備份平臺發(fā)生故障時故障轉(zhuǎn)移功能的實際運行情況。持續(xù)尋找各種方法來改進故障轉(zhuǎn)移程序,以及提升主要IaaS云和輔助IaaS云自動擴展的能力。了解是否有新的工具或流程可有助于降低延遲時間或恢復(fù)生產(chǎn)所需的時間。
支持多云中自動化故障轉(zhuǎn)移功能的新技術(shù)新技術(shù)的不斷涌現(xiàn)總是伴隨著新機遇的出現(xiàn)。這些新技術(shù)包括了無服務(wù)器和容器,這類新技術(shù)有可能幫助企業(yè)用戶在如今更多傳統(tǒng)技術(shù)的基礎(chǔ)上在多云上建立這些自動化功能。
無服務(wù)器計算消除了管理員對于公共IaaS資源所需數(shù)量與配置的擔(dān)憂,例如存儲與計算。雖然大多數(shù)公共云中都存在著無服務(wù)器系統(tǒng)(其中包括了AWS和Azure),但是這些系統(tǒng)之間的兼容性和可移植性仍然是一大挑戰(zhàn),這是因為不同供應(yīng)商使用了不同的編程語言和數(shù)據(jù)。
容器技術(shù)實現(xiàn)了更多的承諾。它們可實現(xiàn)跨多個主流公共云供應(yīng)商的可移植性,其中包括了AWS、Azure和谷歌。容器技術(shù)還提供了一些已經(jīng)通過容器編排和集群子系統(tǒng)(如Kubernetes)內(nèi)置實現(xiàn)自動故障轉(zhuǎn)移和擴展的功能。