如何應(yīng)對恢復(fù)故障過程中的問題

責(zé)任編輯:sjia

2012-07-21 09:17:02

摘自:TechTarget中國

許多災(zāi)難恢復(fù)(DR)規(guī)劃旨在當(dāng)災(zāi)難事故發(fā)生后,將關(guān)鍵的系統(tǒng)和數(shù)據(jù)恢復(fù)(或稱故障切換)到另一個站點,并在之后恢復(fù)(或稱故障恢復(fù))至原來系統(tǒng)的原始運營狀態(tài)。

許多災(zāi)難恢復(fù)(DR)規(guī)劃旨在當(dāng)災(zāi)難事故發(fā)生后,將關(guān)鍵的系統(tǒng)和數(shù)據(jù)恢復(fù)(或稱故障切換)到另一個站點,并在之后恢復(fù)(或稱故障恢復(fù))至原來系統(tǒng)的原始運營狀態(tài)。而當(dāng)系統(tǒng)恢復(fù)到其原始運營狀態(tài)時,企業(yè)就能夠恢復(fù)業(yè)務(wù)運作。

故障切換和故障恢復(fù)流程相當(dāng)之復(fù)雜,并且必需在事先仔細(xì)規(guī)劃并測試。當(dāng)切換到一個備用站點,相應(yīng)的技術(shù)應(yīng)當(dāng)能夠接管應(yīng)用,尤其是運營系統(tǒng)、網(wǎng)絡(luò)訪問以及帶寬、足夠的數(shù)據(jù)存儲、數(shù)據(jù)庫、文件和設(shè)備。不過,在切換回原系統(tǒng)之前必需解決一些額外的情況。本篇將分析在故障切換和恢復(fù)系統(tǒng)至主站點之前所要解決的各項問題。

如果企業(yè)規(guī)模較大,有諸多辦公室和完善的IT部門,那么在你故障切換和故障恢復(fù)時可能不會遇到太大的障礙。這是因為你在倉庫中應(yīng)當(dāng)會留有備份資源,比如服務(wù)器、桌面系統(tǒng)、筆記本電腦和其它設(shè)備,在恢復(fù)站點可以進(jìn)行快速地替換。不過如果你的企業(yè)規(guī)模較小并且沒有這種額外的資源,你的恢復(fù)選擇可能會比較局限。

對于中小型企業(yè)(SMB),有許多種災(zāi)難恢復(fù)可供選擇,不過必需在財務(wù)資源、員工、物理空間、已有系統(tǒng)和所需數(shù)據(jù)之間進(jìn)行平衡。

不過當(dāng)你準(zhǔn)備恢復(fù)(故障恢復(fù))至原系統(tǒng)時,事故發(fā)生后的環(huán)境可能和之前一樣,但也可能不一樣。在故障恢復(fù)時,你通常有兩種可能性:你之前的辦公環(huán)境(假如和事故前沒什么兩樣);抑或是一個不同的場所,部分或甚至全部失去了你原有的辦公空間。

在故障切換時,應(yīng)當(dāng)將以下問題作為整體解決的一部分加以考慮確認(rèn):

現(xiàn)有系統(tǒng)和相關(guān)軟件可以復(fù)制在備用站點中(物理設(shè)備和基于云的解決方案)。

所有的重要數(shù)據(jù)(例如日常工作文件)和信息(例如用戶記錄)可以復(fù)制在備用站點中,并且時間節(jié)點盡可能接近事故發(fā)生時。

特定的故障切換軟件(例如Double-Take)在兩個站點都可用來啟動故障切換作業(yè)。

有足夠的網(wǎng)絡(luò)帶寬(例如通過因特網(wǎng))傳輸數(shù)據(jù)至進(jìn)行故障切換的備用站點。

當(dāng)準(zhǔn)備恢復(fù)至原站點時,測試系統(tǒng)和基礎(chǔ)架構(gòu)來確保其工作正常;確保有足夠的存儲容量處理返回的系統(tǒng)和數(shù)據(jù);并且確保有足夠的網(wǎng)絡(luò)帶寬來用于故障恢復(fù)。
現(xiàn)在,如果你的原站點并不可用,你的災(zāi)難恢復(fù)規(guī)劃必須啟動如下步驟:

獲取新的硬件(例如服務(wù)器、存儲和路由器)和軟件(例如操作系統(tǒng)和應(yīng)用程序)來支持你實現(xiàn)和原環(huán)境類似的運作環(huán)境。

確保空間來放置新的IT設(shè)備。

獲取新的桌面系統(tǒng)和周邊設(shè)備。

安裝故障切換/故障恢復(fù)軟件,如果在你的恢復(fù)規(guī)劃中有這部分策略的話。

確保網(wǎng)絡(luò)帶寬足以支持故障恢復(fù)工作。

再次提醒下,如果你是中小型企業(yè),請考慮購買數(shù)TB的外部存儲來備份你的系統(tǒng)和數(shù)據(jù)。這些存儲設(shè)備可以在許多辦公供應(yīng)商那里購得。同時,部署“第二層備份”也是個不錯的作法,以防你的故障切換和故障恢復(fù)部署沒有如期工作。

好消息是市場上有大量用于中小型企業(yè)(以及大型企業(yè))的故障切換和故障恢復(fù)工具。無論部署何種策略,你需要牢記以下關(guān)鍵點:

確保災(zāi)難恢復(fù)規(guī)劃中的故障切換和故障恢復(fù)活動的正常運作。

和已確定的數(shù)據(jù)恢復(fù)供應(yīng)商協(xié)作安排應(yīng)急備份和恢復(fù)。

將災(zāi)難恢復(fù)規(guī)劃文檔化,其中清晰地概括故障切換到備用站點以及故障恢復(fù)回主站點或新站點的各項步驟(例如具體腳本)。

建立IT硬件和軟件的主和備用源。

每年測試故障切換和故障恢復(fù)流程和系統(tǒng),確保其工作正常。(最好每周末時進(jìn)行一次測試,不過桌面的演練同樣有效)

明確災(zāi)難事故中員工的角色和職責(zé)。

培訓(xùn)IT員工故障切換和故障恢復(fù)的流程內(nèi)容

總結(jié)

確保在進(jìn)行災(zāi)難恢復(fù)規(guī)劃時,你會考慮將IT運營故障切換至另一個備用站點,并且你如何恢復(fù)(故障恢復(fù))至原始站點或可能的新站點。很有可能你的故障恢復(fù)會比故障切換更為復(fù)雜,因此準(zhǔn)備好仔細(xì)檢驗所有的可用方式。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號