隨著全球數(shù)據(jù)總量的爆炸式增長,我們必須改變對相關(guān)信息的保護方式。
過去五年以來,應(yīng)用程序的規(guī)范已經(jīng)迎來徹底轉(zhuǎn)變。如今,我們需要在應(yīng)用當中實現(xiàn)更多敏捷性、可擴展性與可用性要求。在如今這個時代,應(yīng)用的主要趨勢開始轉(zhuǎn)向社交平臺、移動設(shè)備與軟件即服務(wù)(簡稱SaaS)。另外,其需要有能力從各種來源處獲取批量數(shù)據(jù),同時實時處理以提供背景信息或者業(yè)務(wù)洞穴能力,借此建立競爭優(yōu)勢。為了滿足這些新型需求,企業(yè)無法再單純依賴于傳統(tǒng)關(guān)系型數(shù)據(jù)庫。有鑒于此,一系列新型數(shù)據(jù)庫系統(tǒng)應(yīng)運而生,其本質(zhì)上具備分布式與橫向擴展特性,能夠被部署在商用硬件之上,同時提供可協(xié)調(diào)的統(tǒng)一性與性能調(diào)整機制。更重要的是,為了滿足敏捷性需求,云端數(shù)據(jù)庫即服務(wù)模式亦得到廣泛采用。
為了幫助大家理解這場分布式數(shù)據(jù)庫變革的規(guī)模之大,我們整理出了以下圖表,可以看到NoSQL類搜索數(shù)量正呈現(xiàn)出急劇上升之勢。
這意味著數(shù)據(jù)保護要求已經(jīng)徹底改變,且受到數(shù)據(jù)至上時代的大力推動(包括Web規(guī)模應(yīng)用以及分布式數(shù)據(jù)庫)。企業(yè)需要收集大量數(shù)據(jù)并從中獲取有價值信息,用以帶來更為可觀的商業(yè)價值以及更為迅捷的決策制定能力。大部分分布式與云數(shù)據(jù)庫已經(jīng)提供復(fù)制功能,用于滿足數(shù)據(jù)保護及可用性要求。然而,我們?nèi)匀恍枰鉀Q可擴展時間點備份與恢復(fù)這一重大難題。如果沒有時間點備份的支持,企業(yè)將時刻面臨著因人為錯誤、邏輯損壞或者其它運營故障造成的數(shù)據(jù)丟失風險。
傳統(tǒng)備份解決方案主要面向關(guān)系型數(shù)據(jù)庫設(shè)計,即面向共享式存儲并采用ACID事務(wù)模型。遺憾的是,這類設(shè)計無法滿足分布式場景下的時間點備份要求(包括本地存儲、最終一致性以及基礎(chǔ)設(shè)施的彈性特質(zhì))。
考慮到數(shù)據(jù)庫架構(gòu)已經(jīng)發(fā)生本質(zhì)性轉(zhuǎn)變,數(shù)據(jù)保護舉措亦需要進行重新定義與重新設(shè)計。以下為數(shù)據(jù)保護在大數(shù)據(jù)時代下面臨的新挑戰(zhàn):
·獲取最終一致性數(shù)據(jù)庫的一套持久性時間點備份副本,我們將其稱為當前全新分布式時代下數(shù)據(jù)保護的“版本控制”新規(guī)范:備份到快照到復(fù)制到復(fù)制數(shù)據(jù)管理再到版本控制。
·最大程度降低故障恢復(fù)時間(即低RTO)。
·隨應(yīng)用程序的實際需求進行規(guī)模擴展。
·允許輕松更新測試/開發(fā)環(huán)境以實現(xiàn)持續(xù)開發(fā)。
·在發(fā)生故障時提供運營彈性。
·提供立足于公有云或者內(nèi)部數(shù)據(jù)中心的部署靈活性。
大多數(shù)企業(yè)正在積極投資企業(yè)級時間點備份與恢復(fù)產(chǎn)品,從而確保自身能夠安心在分布式數(shù)據(jù)庫之上部署并擴展下一代應(yīng)用程序。在未來五年內(nèi),各企業(yè)將重新定義數(shù)據(jù)保護技術(shù),從而切實滿足下一代應(yīng)用的實際需要。