改變了什么?備份與恢復(fù)
自從計(jì)算技術(shù)突飛猛進(jìn)以來,應(yīng)用程序和數(shù)據(jù)平臺發(fā)生了巨大的轉(zhuǎn)變。這其中有幾種因素:
•新的應(yīng)用。第三代應(yīng)用程序是地理分布式的,跨越多個(gè)系統(tǒng)進(jìn)行擴(kuò)展,始終處于開放狀態(tài),通常部署在云端模式中。
•現(xiàn)有的應(yīng)用程序正在轉(zhuǎn)向云端。他們沒有消失,但企業(yè)正在將部分或全部應(yīng)用移動到云端。他們還需要備份和恢復(fù)。
•恢復(fù)時(shí)間目標(biāo)(RTO)和恢復(fù)點(diǎn)目標(biāo)(RPO)窗口正在縮?。浩髽I(yè)希望“永遠(yuǎn)在線”,而不是每天都進(jìn)行夜間備份。
•規(guī)模較小的企業(yè)將全面采用公共云。中小型企業(yè)不希望因?yàn)镮T業(yè)務(wù)影響主要業(yè)務(wù)。他們一直在推動云應(yīng)用和平臺的快速發(fā)展。
•企業(yè)將構(gòu)建混合云。企業(yè)將通過內(nèi)部部署和公共云環(huán)境部署應(yīng)用程序和數(shù)據(jù)。而規(guī)模,合規(guī)性和其他因素,意味著他們需要在系統(tǒng)內(nèi)部保留一些系統(tǒng)。
•每個(gè)組織都會使用多個(gè)云。沒有人會愿意將他們的業(yè)務(wù)綁定在一個(gè)云端或一個(gè)提供商。即使現(xiàn)在,企業(yè)正在分散云計(jì)算和本地的工作負(fù)載。企業(yè)的開發(fā)和測試的業(yè)務(wù)可能只使用一個(gè)云端,而同一應(yīng)用程序可能部署在私有云或不同的公共云中。
云計(jì)算對備份,恢復(fù)和連續(xù)性的影響
云計(jì)算為組織提供了更多的靈活性,運(yùn)營節(jié)省和按需付費(fèi)模式。公共云提供商也可以構(gòu)建更具彈性的基礎(chǔ)架構(gòu)。亞馬遜公司確保EC2的99.95%的可用性和S3的99.99%的可用性; S3設(shè)計(jì)用于11個(gè)9的數(shù)據(jù)安全和可靠性,具有多個(gè)可用區(qū)域。因?yàn)樵朴?jì)算是如此可靠,并且成本低廉,它很快成為本地?cái)?shù)據(jù)的備份目標(biāo)。但是,當(dāng)企業(yè)在云端中運(yùn)行應(yīng)用程序時(shí),這不應(yīng)該讓企業(yè)相信備份和恢復(fù)是“內(nèi)置的”。亞馬遜公司甚至建議為所有AWS本機(jī)應(yīng)用程序和云數(shù)據(jù)庫提供備份服務(wù)。
雖然服務(wù)可用性和數(shù)據(jù)恢復(fù)能力解決了基礎(chǔ)架構(gòu)業(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù),但它不提供備份和恢復(fù)的時(shí)間點(diǎn)恢復(fù)或應(yīng)用程序級智能。與云計(jì)算平臺一樣,它們不會防止邏輯錯(cuò)誤。而研究顯示,10個(gè)錯(cuò)誤中有8個(gè)是邏輯錯(cuò)誤,數(shù)據(jù)損壞,用戶錯(cuò)誤。
現(xiàn)有備份產(chǎn)品和云計(jì)算
如上所述,傳統(tǒng)的備份和恢復(fù)產(chǎn)品不能滿足云應(yīng)用的需求,即使是移動到云端的現(xiàn)有應(yīng)用,而不僅僅是因?yàn)樗鼈兘⒃诓煌臅r(shí)代。此外,云計(jì)算和分布式架構(gòu)還面臨其他挑戰(zhàn):
•云計(jì)算打破了基于媒體服務(wù)器的傳統(tǒng)解決方案架構(gòu)。云計(jì)算的應(yīng)用程序和數(shù)據(jù)沒有駐留在特定的陣列或磁盤上,因此用戶無法輕松備份所看不到的內(nèi)容。備份也不能捕獲云中的配置數(shù)據(jù),例如AWS Cloud Formation模板。
•云計(jì)算不會以相同的語言溝通。傳統(tǒng)解決方案采用磁帶,磁盤或虛擬磁盤。在云中的備份和恢復(fù)意味著采用正確的集成協(xié)議,例如S3 API或谷歌云存儲。
•備份設(shè)備無法移動到云端。現(xiàn)有的備份設(shè)備(如EMC Data Domain或NetBackup)在內(nèi)部工作得非常好,無法被拾取并移動到云端。
•傳統(tǒng)備份代理不會擴(kuò)展。如果用戶可以獲得在云中運(yùn)行的備份代理,則可能會在數(shù)十個(gè)或可能數(shù)百個(gè)節(jié)點(diǎn)之間進(jìn)行擴(kuò)展。
•虛擬機(jī)不是正確的抽象層次: Datos IO CODR架構(gòu)的核心原則是可擴(kuò)展的以應(yīng)用為中心的數(shù)據(jù)管理和數(shù)據(jù)保護(hù)視圖,需將其與傳統(tǒng)方法區(qū)分開來。這就是為什么CODR架構(gòu)反思應(yīng)用數(shù)據(jù),并使用全局語義重復(fù)數(shù)據(jù)刪除來實(shí)現(xiàn)存儲效率的原因,而不是依靠將數(shù)據(jù)視為不透明對象(如VM或LUN)的傳統(tǒng)重復(fù)數(shù)據(jù)刪除技術(shù)。采用這種方法的好處是可以通過網(wǎng)絡(luò)鏈接覆蓋云層的精細(xì)粒度和高空間效率的數(shù)據(jù)保護(hù)。
•云計(jì)算網(wǎng)關(guān)或遷移服務(wù):僅限于單向。
數(shù)據(jù)保護(hù)必須重新發(fā)布
云應(yīng)用的備份和恢復(fù)問題很新穎,因?yàn)樵朴?jì)算備份和恢復(fù)架構(gòu)應(yīng)該具有三個(gè)關(guān)鍵因素:
•彈性計(jì)算。架構(gòu)應(yīng)該在彈性計(jì)算實(shí)例上有效地?cái)U(kuò)展。服務(wù)器或設(shè)備不應(yīng)有任何資本支出費(fèi)用。
•沒有媒介服務(wù)器。備份大型的橫向擴(kuò)展的數(shù)據(jù)庫需要直接的并行流架構(gòu),以便在數(shù)據(jù)庫和輔助存儲之間進(jìn)行數(shù)據(jù)移動。傳統(tǒng)的備份架構(gòu)依賴于迅速成為阻塞點(diǎn)的媒介服務(wù)器。直接并行流并允許數(shù)據(jù)以原生格式保持可用。
•語義重復(fù)數(shù)據(jù)刪除橫向擴(kuò)展應(yīng)用程序數(shù)據(jù)庫通常具有3倍的復(fù)制因子。如果用戶備份單個(gè)節(jié)點(diǎn)或甚至管理整個(gè)數(shù)據(jù)庫的快照,則三分之二的備份數(shù)據(jù)是多余的。隨著時(shí)間的推移,備份將不會在分布式架構(gòu)中運(yùn)行語義,其重復(fù)數(shù)據(jù)刪除效率達(dá)到75%至80%。