災難恢復(DR)站點是建設在企業(yè)總部之外的數(shù)據(jù)中心設施。它的目的是使企業(yè)系統(tǒng)在電力中斷、網(wǎng)絡攻擊、網(wǎng)絡故障、自然災害、意外停機、破壞或其他導致主要位置癱瘓的事件中保持運行。
根據(jù)災難恢復站點的類型以及它們使用的災難恢復服務,災難恢復站點設施可能會立即聯(lián)機運行,或者可能會有短時間或長時間的延遲。所選災難恢復站點的類型取決于企業(yè)的需求和財務資源。
災難恢復站點的重要性是什么?
災難恢復站點可確保企業(yè)的業(yè)務無論發(fā)生任何事故或災難都可以繼續(xù)運營。它們還可以用作從主站點復制數(shù)據(jù)的方法,以確保最小的數(shù)據(jù)丟失。災難恢復站點極大地降低了組織的風險,并消除了破壞性數(shù)據(jù)丟失事件或可能使組織業(yè)務癱瘓的停機時間的可能性。
對于任務關鍵型操作,恢復點目標(RPO)的時間通常不到15分鐘,恢復時間目標(RTO)不到一小時。換句話說,如果發(fā)生事故,災難恢復站點將在一小時內(nèi)運行,或者丟失少于15分鐘的數(shù)據(jù)。
在當前的災難場景中,網(wǎng)絡攻擊和勒索軟件已成為一種現(xiàn)實的新威脅,導致嚴重的中斷。因此,現(xiàn)代災難恢復站點必須滿足這種可能性,并確保生產(chǎn)和恢復從網(wǎng)絡訪問的角度進行邏輯分離,同時具有多個數(shù)據(jù)快照以實現(xiàn)網(wǎng)絡恢復。這也是確?;謴图夹g包括自動化和協(xié)調(diào)以提供最小的停機時間和恢復時間目標(RTO)的關鍵。
災難恢復站點使用遠程訪問安全網(wǎng)關作為主備份和災難恢復備份站點之間的橋梁。
災難恢復站點的類型
選擇何種類型的災難恢復站點歸結為所需的恢復點目標(RPO)和恢復時間目標(RTO),也就是說,可以接受多少停機時間和數(shù)據(jù)丟失。
熱站點
這是目標環(huán)境已經(jīng)啟動并運行的位置,可以通過故障轉(zhuǎn)移立即激活。還有高可用性體系結構選項,企業(yè)可以在群集或負載平衡設置中擁有多個節(jié)點。在這些情況下,單個節(jié)點的中斷不會影響可用性。實質(zhì)上,企業(yè)將激活生產(chǎn)環(huán)境的兩個或更多實例,因此會產(chǎn)生大量成本。然后,任何運營熱門網(wǎng)站的人都會將IT成本增加兩倍或更多倍。
冷站點
這是一個目標災難恢復環(huán)境,需要在啟動恢復過程后激活?;A設施存在但需要啟動并全面啟動。此環(huán)境有時可用于開發(fā)/測試,并可在需要時重新用于災難恢復。因此,冷站點的成本要低得多。
暖站點
暖站點處在熱站點和冷站點之間,是指企業(yè)可以在待機狀態(tài)下使用計算功能的站點,該計算功能可以輕松地連接到恢復的(或已經(jīng)復制的)數(shù)據(jù)。其成本介于冷熱站點之間。
此外,其他因素也可能發(fā)揮作用。例如數(shù)據(jù)保護策略的類型。也就是說,壓縮數(shù)據(jù)和需要補充的備份與復制數(shù)據(jù)中已有的數(shù)據(jù)相比,可以簡單地安裝到企業(yè)的計算機上。恢復自動化/編排軟件會影響恢復的速度和成本。
災難恢復成本
關鍵任務系統(tǒng)通常需要具有高可用性架構的熱站點,并且具有接近零的恢復點目標(RPO)/恢復時間目標(RTO)。但是,業(yè)務關鍵型系統(tǒng)越來越多地使用災難恢復即服務(DRaaS)的云計算恢復技術,這些技術通過不到15分鐘的恢復點目標(RPO)和不到1小時的恢復時間目標(RTO)復制數(shù)據(jù)和協(xié)調(diào)恢復。不太重要的系統(tǒng)可以依賴具有基于備份的保護的冷站點架構,通常提供大約24小時的恢復點目標(RPO)和幾天的恢復時間目標(RTO)。
StorageIO Group分析師Greg Schulz說,“成本和功能根據(jù)企業(yè)對恢復點目標(RPO)和恢復時間目標(RTO)的需求而有所不同。還要記住企業(yè)的應用程序和數(shù)據(jù)需要(并且可以承受)。不僅要考慮成本,還要考慮應用程序和數(shù)據(jù)可用、可訪問和可用的價值和業(yè)務效益。”
底線:恢復點目標(RPO)和恢復時間目標(RTO)越好,成本越高。在某些組織中,其優(yōu)先級用于降低成本。某些核心應用程序和功能被分配高恢復時間目標(RTO)/恢復點目標(RPO),而常規(guī)功能的恢復周期較慢。
位置的重要性
企業(yè)在地下室或附近建立災難恢復站點并不是一種好方法。發(fā)生主要位置災害事件也可能影響次要位置。因此,最佳做法是將備用設施建設在30英里以上的距離。而有些人認為30英里的距離太少。
“站點之間至少需要200英里的距離,最好是在單獨的電網(wǎng)上,并有單獨和冗余的電網(wǎng)接入。”Commvault公司首席戰(zhàn)略官Chris Vanwagoner說。
災難恢復站點的位置取決于以下因素:
•接入電網(wǎng)
•網(wǎng)絡連接
•洪泛區(qū)
•龍卷風
•其他惡劣天氣模式
例如,如果主站點可能遭受洪水或地震,那么災難恢復站點應該位于不會遭受這些災害的地方。同樣,災難恢復站點的電力應用來自不同的電網(wǎng),并位于另一個運營商的網(wǎng)絡上。否則,它將容易受到主站點造成停機的相同故障的影響。
災難恢復站點的大小應適當,以處理預期的工作負載。組織的主要IT系統(tǒng)旨在滿足日常業(yè)務活動的需求。如果災難恢復(DR)/業(yè)務連續(xù)性計劃(BC)計劃必須確保整個組織的全面運營能力,則需要正確確定災難恢復站點的規(guī)模和配置。然而,經(jīng)常會有財務方面的考慮。
許多災難恢復站點的大小都是為了最小化功能。它們只是為了維持關鍵系統(tǒng)的運行,但在試圖支持日常業(yè)務運營的壓力下會崩潰。
災難恢復站點所有權也會有所不同。有時,企業(yè)的災難恢復站點可能是自已構建的,有可能由另一家公司托管。還有一些共址部署的設施來處理多個組織的災難恢復需求。無論災難恢復站點以何種方式運行,其快速恢復、提供故障轉(zhuǎn)移的功能并使組織能夠恢復處理。
“擁有自己的設施與使用他人的共址部署、托管或云平臺相比,歸根結底是出于財務、安全和控制方面的考慮。”Schulz說。
內(nèi)部站點與外部站點
一些組織具有運營其自己的災難恢復站點的財務手段、人力資源和/或監(jiān)管要求。這些內(nèi)部站點的投資成本通常很昂貴,但在某些業(yè)務中,由于停機可能導致的潛在損失要大得多,因此其成本高昂是合理的。
例如,在某些金融機構中,停機一天的時間可能是熱站點的年度維護成本。還有一些行業(yè)是企業(yè)內(nèi)部管理的災難恢復站點,由合規(guī)性法規(guī)強制執(zhí)行。
不過,對于大多數(shù)組織來說,外部站點仍然是最佳選擇。將災難恢復功能轉(zhuǎn)移到數(shù)據(jù)中心服務的專業(yè)提供商、云計算提供商或托管提供商的成本通常要低得多。對于一些組織來說,內(nèi)部資源不足以運行內(nèi)部操作的站點。外部站點可以是全套服務或部分服務,也可以只是租用的場所,用于部署在發(fā)生災難時組織可以使用的設備。
云存儲越來越多地為災難恢復提供了一種可擴展且經(jīng)濟高效的方法。由于云平臺由許多地理位置分散的物理位置組成,因此有些人可以使用這些特性以降低成本,實現(xiàn)有效的災難恢復站點計劃。
但是,那些選擇這條路線的組織會被警告要密切關注應用程序的兼容性。“云平臺無法運行當今數(shù)據(jù)中心的所有內(nèi)容,如大型機和某些應用程序。”VanWagoner說。