盡管硬件不斷更新?lián)Q代,但是軟件定義存儲的不斷創(chuàng)新使得數(shù)據(jù)以一種更可靠的方式進行訪問并使得其利用周期得以延長。
對數(shù)據(jù)進行長期存儲是需要承擔風險的。
對數(shù)據(jù)進行短期保護充滿了諸多風險,例如數(shù)據(jù)為錯誤、硬盤故障、網(wǎng)絡攻擊、人為失誤以及自然災害等等。然而對數(shù)據(jù)進行長期存儲除了要面對以上風險,還要考慮到其他問題,例如硬件架構、軟件平臺、應用以及數(shù)據(jù)格式的變化等等。
與此同時,對于數(shù)據(jù)可訪問性、協(xié)同性以及大數(shù)據(jù)分析與日俱增的需求也使得問題不僅僅停留在儲存時限層面,還要考慮到其可用性。目前,相當數(shù)量的創(chuàng)新理念及產(chǎn)品將會幫助我們解決數(shù)據(jù)長期存儲以及對其訪問的問題。
回首過去
對于數(shù)據(jù)長期儲存,大部分公司通常選擇以磁帶為載體。當然,這種方式在可靠性上自然無可厚非,而它的局限性也已經(jīng)被反復討論多次了。
最近的創(chuàng)新產(chǎn)品已經(jīng)解決了磁帶壽命的問題,這使得其可以更長久的對數(shù)據(jù)進行存儲,這里不得不提到LTO技術以及Barium Ferrite(BaFe)磁帶。生產(chǎn)商的測試表明BaFe磁帶可以持續(xù)使用30年而且并不會因為消磁使得其壽命打折。盡管壽命得以延長,磁帶還是會有使用周期的限制,比如誤操作或者惡劣的存儲環(huán)境等等。即使冗余備份以及讀校驗可以在某種程度上起到作用,但由此產(chǎn)生的開銷與其帶來的容量提升相比,并不那么盡如人意。
退一步說,對數(shù)據(jù)進行長期存儲僅僅是眾多問題中的一個。數(shù)據(jù)本身的可訪問性是對其進行存儲時必須考慮的因素。隨著帶庫技術的不斷革新,很多公司會保留那些老的磁帶,為的就是日后仍然可以對上面的數(shù)據(jù)進行訪問,這種現(xiàn)象并不罕見。此外,對那些有一定年頭兒的應用數(shù)據(jù)進行歸檔操作也十分普遍。這些做法都可以對數(shù)據(jù)進行長期保留。但如果要對這些數(shù)據(jù)進行快速訪問,類似磁帶這種老古董在有些時候并不會有很大幫助。
展望未來
軟件定義存儲或許可以提供另外一種選擇——至少可以作為參考。盡管軟件定義存儲種類繁多,但萬變不離其宗的是,不管底層硬件如何實現(xiàn),它都可以對硬件進行抽象并給用戶呈現(xiàn)一個統(tǒng)一的數(shù)據(jù)訪問接口。有些產(chǎn)品甚至可以在底層硬件升級換代之后繼續(xù)保留之前的接口狀態(tài),而且不需要任何數(shù)據(jù)遷移操作。當然并不是所有的軟件定義存儲產(chǎn)品都支持這種功能,所以在技術評定時,這將作為一項相當重要的考核標準。
例如,某個軟件定義存儲產(chǎn)品支持標準x86架構并可以將多代硬件進行整合,這在保證數(shù)據(jù)長期可用性方面帶來的意義很大。然而事事無絕對,畢竟有些x86架構的服務器可能已經(jīng)服役近40年了。當然,誰都不清楚x86架構能否再經(jīng)歷一個40年的周期,但它確確實實已經(jīng)成為業(yè)界的標準之一。
軟件定義存儲的獨到之處在于其架構靈活性。支持的硬件類型越多,產(chǎn)品對技術革新的適應能力就越強。繼續(xù)靈活性的話題,有些存儲架構不斷在硬件抽象層面做文章并將公有云存儲甚至帶庫存儲包羅進來。這里面的關鍵之處就在于,產(chǎn)品的高度靈活性在某種程度上就等同于其對技術革新的強大適應能力。
另外一個需要考慮的問題就是擴展性。一些文件級或者對象級存儲產(chǎn)品在容量上已經(jīng)支持到PB級別。在評價某個存儲系統(tǒng)能否適應未來十年的需求時,高擴展性是一項參考指標。此外,對空閑空間的數(shù)據(jù)重建以及自我修復等高端數(shù)據(jù)保護機制也要考慮在內。
軟件定義存儲架構并非千篇一律
盡管軟件定義存儲產(chǎn)品在數(shù)據(jù)長期歸檔方面做出了很大貢獻,但還有很多問題值得我們考慮。首先,我們要清楚軟件定義存儲產(chǎn)品的架構并非千篇一律。對于海量數(shù)據(jù)倉庫來說,可擴展文件系統(tǒng)或者對象存儲架構則需要進一步商榷?;趥鹘y(tǒng)文件系統(tǒng)或者塊級存儲架構的產(chǎn)品很有可能無法滿足預期的需求。在某些場合,甚至連可擴展文件系統(tǒng)都不行。由于文件系統(tǒng)本身架構的限制,甚至可擴展文件系統(tǒng),都會對PB級存儲的擴展帶來一定的制約。盡管如此,就算軟件定義存儲架構可以在未來實現(xiàn)對擴容的支持,在線存儲空間及其底層的硬件、電力、空調以及空間需求在很大程度上都將成為大部分公司的瓶頸。
很多軟件定義存儲產(chǎn)品,尤其是那些可擴展文件系統(tǒng)或者對象級存儲,都在趨向動態(tài)歸檔的發(fā)展,在這種情況下,數(shù)據(jù)就可以繼續(xù)保持在線狀態(tài)并可以被客戶實時訪問。然而,對于多數(shù)IT公司來說,這種實施并非易事。由于缺乏相關的工具以及數(shù)據(jù)分析,這些公司可能會選擇將更多的數(shù)據(jù)置于在線狀態(tài)?;蛘卟捎猛耆喾吹拇胧?mdash;—將所有數(shù)據(jù)都放在帶庫上,并期待這些數(shù)據(jù)很少被使用。
為了應付這種歸檔存儲的復雜性,一些產(chǎn)品開始轉向對虛擬層的研究,這一層級將處于動態(tài)歸檔對象存儲以及傳統(tǒng)帶庫之上。這樣做的結果就是某個單獨的存儲池可以同時跨越在線/離線數(shù)據(jù)載體。和傳統(tǒng)單獨專注于在線或者離線的歸檔產(chǎn)品來說,這部分產(chǎn)品的訂單相對更少。對于包括離線數(shù)據(jù)載體在內的硬件抽象化來說,也許會代表著未來幾年的潛在發(fā)展趨勢。
軟件定義存儲產(chǎn)品以及硬件抽象化的確可以提供長期的數(shù)據(jù)存儲以及訪問。盡管軟件定義存儲還沒有解決長期存儲性數(shù)據(jù)的可訪問性帶來的所有挑戰(zhàn),但它仍然作為一種解決方案或者工具,其靈活性可以幫助IT公司在未來技術革新道路上越走越好。