云存儲是一個非常有吸引力的將日常數(shù)據(jù)管理外包的服務(wù),但是,一旦數(shù)據(jù)丟失,所有的后果都將由擁有此數(shù)據(jù)的公司承擔(dān),而不是托管服務(wù)提供商。考慮到這一點,了解數(shù)據(jù)丟失的原因、云服務(wù)提供商承擔(dān)多少責(zé)任、安全利用云存儲的一些基本方法以及不管數(shù)據(jù)是存儲在本地還是云端的完整性監(jiān)測方法和標(biāo)準(zhǔn)就顯得非常重要。
完整性監(jiān)測在云存儲服務(wù)中是必不可少的,同樣,數(shù)據(jù)完整性也是所有數(shù)據(jù)中心最核心的任務(wù)。任何級別的存儲和任何類型的媒質(zhì)都有可能發(fā)生數(shù)據(jù)損壞。位衰減(存儲介質(zhì)上的數(shù)據(jù)減弱或丟失)、控制器故障、重復(fù)數(shù)據(jù)刪除元數(shù)據(jù)損壞、磁帶故障是導(dǎo)致不同類型媒質(zhì)數(shù)據(jù)損壞的主要因素。元數(shù)據(jù)損壞是上述故障導(dǎo)致的直接結(jié)果,比如位衰減,并且也極其容易受到除硬件錯誤率以外的軟件故障的影響。不幸的是,重復(fù)數(shù)據(jù)刪除的一個副作用是,損壞的文件、塊(block)或字節(jié)將影響到每一塊與之相關(guān)聯(lián)的元數(shù)據(jù)。事實上,存儲壞境內(nèi)的任何一個環(huán)節(jié)都有可能發(fā)生數(shù)據(jù)損壞。將數(shù)據(jù)遷移到不同的平臺過程中很容易就被損壞,即將數(shù)據(jù)遷移到云端。云存儲系統(tǒng)也是由硬件和軟件組成的數(shù)據(jù)中心,其也容易受到攻擊而導(dǎo)致數(shù)據(jù)損壞。比如最近廣為人知的亞馬遜云宕機事件。許多企業(yè)不僅受到長時間的宕機影響,實際上,他們0.07%的客戶數(shù)據(jù)已經(jīng)丟失。據(jù)報道,引發(fā)數(shù)據(jù)丟失的原因是“亞馬遜ESB卷……不一致的數(shù)據(jù)快照恢復(fù)。”這就意味著亞馬遜系統(tǒng)中的數(shù)據(jù)已經(jīng)損壞,因此,客戶數(shù)據(jù)已經(jīng)丟失。每當(dāng)數(shù)據(jù)丟失,尤其是重要數(shù)據(jù)丟失,人們傾向于相互指責(zé)以推脫責(zé)任。在IT行業(yè),這通常會導(dǎo)致工作人員被解雇、公司承受巨大經(jīng)濟損失,甚至最嚴重的情況是企業(yè)破產(chǎn)。因此,關(guān)鍵是要了解云服務(wù)提供商要承擔(dān)的法律責(zé)任,以及每個服務(wù)水平協(xié)議(SLA)已采取一切可能的措施以確保數(shù)據(jù)的安全,防止數(shù)據(jù)丟失。就很多法律文件來說,SLA大多偏向于提供商的利益,而不是客戶的利益。許多云服務(wù)提供商都提供了不同層次的數(shù)據(jù)保護,但是,所有的存儲供應(yīng)商都不對數(shù)據(jù)完整性承擔(dān)責(zé)任。
云SLA協(xié)議,包括云提供商的保護都明確表明,數(shù)據(jù)丟失或損壞是最常見的情況。比如亞馬遜的客戶web服務(wù)協(xié)議,其中規(guī)定,“我們……不提供任何形式的聲明或保證,所提供的服務(wù)或第三方內(nèi)容是不間斷的、無差錯的、無故障部件的,或任何內(nèi)容…將是安全的、不丟失的或無損壞的。”這個協(xié)議甚至據(jù)以建議客戶“頻繁歸檔”他們的數(shù)據(jù)。如前所述,數(shù)據(jù)的完整性管理,無論其是在數(shù)據(jù)中心、私有云、混合云或公共云,其責(zé)任總是要該數(shù)據(jù)的實際擁有公司來承擔(dān)。
一些共通的最佳方式將允許公司利用云的靈活性和易接近性的優(yōu)點,而又不會危及其數(shù)據(jù)安全。在數(shù)據(jù)保護的前提下分散風(fēng)險,將數(shù)據(jù)丟失的可能性降到最低。即使是在云端存儲數(shù)據(jù),保留一個主副本和現(xiàn)場數(shù)據(jù)的備份副本也是很有意義的,這樣的話,訪問數(shù)據(jù)就不會依賴于網(wǎng)絡(luò)性能或連通性。堅持這些基本的最佳做法,了解云服務(wù)提供商SLA的細節(jié),適當(dāng)構(gòu)建模塊以主動監(jiān)測數(shù)據(jù)的完整性,無論其是存儲在云端或是本地。
驗證一組數(shù)據(jù)的完整性的方法之一基于哈希值。哈希值是根據(jù)一個預(yù)定義的方式壓縮一組數(shù)據(jù)而得到的一個獨特的值。由于哈希值是從原始數(shù)據(jù)本身獲得的,如果兩個哈希值不完全相同,其就意味著這兩個副本至少有一個已被更改或損壞。
確保云提供商無論何時何地存儲副本,都能夠提供數(shù)據(jù)的哈希值核對,并與第二個數(shù)據(jù)副本的哈希值進行比較。人工進行這個級別的數(shù)據(jù)監(jiān)測將非常繁瑣。幸運的是還有其他的方法可用,包括標(biāo)題檢查。Spectra Logic公司和 其他動態(tài)歸檔聯(lián)盟(Active Archive Alliance)成員都提供自動監(jiān)測系統(tǒng)內(nèi)數(shù)據(jù)完整性工具。
雖然動態(tài)歸檔是監(jiān)測數(shù)據(jù)完整性的方法之一,但其仍需要目前廣泛采用的云標(biāo)準(zhǔn)協(xié)議支持其完整性監(jiān)測和互操作性。因為并不是所有的數(shù)據(jù)中心或云托管基礎(chǔ)設(shè)施都采用的同一標(biāo)準(zhǔn)的設(shè)備,不同存儲設(shè)備之間的互操作性至關(guān)重要。云存儲管理接口(CDMI)標(biāo)準(zhǔn)是全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會(SNIA)在2010年提出來的。兼容CDMI的系統(tǒng)可能查詢另一個兼容CDMI的系統(tǒng)的對象的哈希值,以此驗證兩個數(shù)據(jù)副本是否相同。通過監(jiān)測主數(shù)據(jù)副本和備份副本的完整性,企業(yè)可以確認存儲在云端的數(shù)據(jù)副本是否損壞??梢酝ㄟ^數(shù)據(jù)值來頻繁地監(jiān)測這些數(shù)據(jù)集。諸如CDMI之類的行業(yè)標(biāo)準(zhǔn),其不僅能確保異構(gòu)兼容系統(tǒng)之間的互操作性,并且還給數(shù)據(jù)完整性監(jiān)測提供了便利機制。
最近很難看到云行業(yè)在媒體上出現(xiàn),特別是Iron Mountain公司停止了他們最基本的云存儲服務(wù)和預(yù)先討論的亞馬遜宕機事件之后。但是,這篇文章的宗旨不在于討論云存儲平臺是否明智,而是在研究和實施云戰(zhàn)略時,應(yīng)考慮更多的因素,而不是僅簡單地考慮每GB的存儲成本。如果云存儲實施正確,將給所有的企業(yè)提供許多的利益。消除云劣勢需要智能數(shù)據(jù)管理戰(zhàn)略。不管在何處或怎樣存儲數(shù)據(jù),在需要時,其可訪問和可恢復(fù)絕對是至關(guān)重要的。這個承諾是所有數(shù)據(jù)完整性監(jiān)測和驗證的核心任務(wù)。