近來備份圈的問題之一是如果可以消除整個備份程序,那么多很多快照,重復(fù)數(shù)據(jù)刪除,壓縮和復(fù)制的功能的多數(shù)存儲系統(tǒng),他們是否也可以被消除呢?這個想法聽起來很好。讓主存儲自己掌控,這樣也可以消除數(shù)據(jù)中心中的一個麻煩進(jìn)程,但是這個策略也有一個漏洞。那就是主存儲可以完全完成我們所期待的備份任務(wù)嗎?
例如,備份系統(tǒng)的能力是當(dāng)一個系統(tǒng)發(fā)生故障或數(shù)據(jù)設(shè)置被破壞時,我們可以追溯到某個特定的時間點。這就意味著在某個時間我們能夠復(fù)制一套好的數(shù)傳串,通常我們是在晚上來做,并且在一個獨立的存儲設(shè)備上來存儲這些數(shù)據(jù),這些獨立的存儲設(shè)備通常容量比主存儲小,價格也比主存儲上更便宜。
在存儲冗余副本時,使用快照,重復(fù)數(shù)據(jù)刪除,壓縮和復(fù)制功能是一套更高效的方法。很多主存儲系統(tǒng)利用重復(fù)數(shù)據(jù)刪除來支持更多的快照或不限制數(shù)據(jù)副本。多數(shù)可以把數(shù)據(jù)復(fù)制到一個遠(yuǎn)程站點,因此可以避免在一個站點發(fā)生災(zāi)難后沒有先前數(shù)據(jù)的問題。有了這些功能部署,我們現(xiàn)在可以在災(zāi)難發(fā)生時,及時的在某個時間點恢復(fù),并且整個系統(tǒng)也可以被恢復(fù),但是即使這樣,還存在一些潛在的缺點。
使用主存儲存在的一個明顯的漏洞是在主要位置發(fā)生一個系統(tǒng)故障的風(fēng)險。這可能來自一個控制器錯誤或一個多驅(qū)動故障。如果主存儲系統(tǒng)發(fā)生故障時,而主存儲是備份副本的唯一來源,那么這時你需要從遠(yuǎn)程副本中恢復(fù)數(shù)據(jù)。此時,最主要的問題是時間。需要多長時間從廣域網(wǎng)上獲取數(shù)據(jù),并恢復(fù)本地系統(tǒng)的數(shù)據(jù)呢?和通過線上獲取所有的數(shù)據(jù)這種方法相比,把它傳送到災(zāi)難恢復(fù)單元更容易些。
另一個問題是所有冗余數(shù)據(jù)的參考方法。通過重復(fù)數(shù)據(jù)刪除,當(dāng)制作一個數(shù)據(jù)副本或做快照時,快照或重復(fù)數(shù)據(jù)刪除服務(wù)為冗余副本創(chuàng)建一個參考表格來標(biāo)記寫入要求,而不是實際的寫入。這個參考表格是一個數(shù)據(jù)庫。主要是為了應(yīng)對潛在的故障。你主存儲上的數(shù)據(jù)和所有副本的數(shù)據(jù)點都依賴這個表格來配置自身數(shù)據(jù)。如果表格被破壞了,那么你的在某個時間點的副本甚至你的主存儲數(shù)據(jù)都變得不可讀。
以上情況發(fā)生的幾率都很小,但這也就是我們做備份來防止數(shù)據(jù)丟失的原因。你可以在本地復(fù)制第二個模塊兒,在災(zāi)難恢復(fù)時復(fù)制第三次,這和備份基本上是一樣的事情。我們同樣也可以假設(shè)系統(tǒng)故障或破壞瞬時發(fā)生。
不管是重復(fù)數(shù)據(jù)刪除或快照都可能會產(chǎn)生錯誤,但這個錯誤不會即刻顯現(xiàn)。我們有可能在一個壞的表格中寫入了數(shù)據(jù),重復(fù)數(shù)據(jù)刪除也可能在積極的尋找錯誤,所有的程序都正確的進(jìn)行,直到一個月后,你可能才發(fā)現(xiàn)這個問題。你突然讀取一個文件時,這個文件可能丟失了,也可能被破壞了。多數(shù)重復(fù)數(shù)據(jù)刪除進(jìn)程可以自我檢查代碼,這樣有助于防止發(fā)生類似的事情。但是這種事情也是值得注意的。
多虧了主存儲上的快照,重復(fù)數(shù)據(jù)刪除和復(fù)制,甚至是二級恢復(fù)也可以很好的被接受。它基本上可以99.999%的保證你的關(guān)鍵信息迅速恢復(fù)。在一個獨立的平臺沒有存儲數(shù)據(jù)時,要特別注意它的風(fēng)險。