調(diào)研機(jī)構(gòu)Igneous公司近期發(fā)布的一份名為《2018年非結(jié)構(gòu)化數(shù)據(jù)管理狀況》的調(diào)查報(bào)告指出,大多數(shù)IT專業(yè)人員對(duì)滿足組織對(duì)非結(jié)構(gòu)化數(shù)據(jù)集的備份、恢復(fù)和保留的期望并不滿意,而組織對(duì)數(shù)據(jù)的重視也在增加。這份報(bào)告指出,唯一比“數(shù)據(jù)”更重要的資產(chǎn)是“客戶”。
該報(bào)告基于對(duì)管理大量文件數(shù)據(jù)的200位IT主管的調(diào)查,并展示了非結(jié)構(gòu)化數(shù)據(jù)關(guān)注點(diǎn)的變化視角,這些關(guān)注點(diǎn)反映了組織數(shù)據(jù)價(jià)值的增長(zhǎng)。盡管仍存在保護(hù)數(shù)據(jù)、滿足數(shù)據(jù)容量需求和保護(hù)數(shù)據(jù)安全的問(wèn)題,但與數(shù)據(jù)可訪問(wèn)性、數(shù)據(jù)治理和數(shù)據(jù)洞察力相比,這些問(wèn)題的重要性已經(jīng)降低?,F(xiàn)在,組織的首要任務(wù)包括發(fā)現(xiàn)和查找數(shù)據(jù)、滿足法規(guī)遵從性和理解數(shù)據(jù)相關(guān)性的能力。非結(jié)構(gòu)化數(shù)據(jù)保護(hù)需要在更大的非結(jié)構(gòu)化數(shù)據(jù)管理策略中無(wú)縫工作,但大多數(shù)組織都沒(méi)有工具來(lái)完成更具挑戰(zhàn)性的管理任務(wù)。
問(wèn)題在于,非結(jié)構(gòu)化數(shù)據(jù)保護(hù)通常與非結(jié)構(gòu)化數(shù)據(jù)管理分開(kāi)管理。傳統(tǒng)上,備份管理人員負(fù)責(zé)非結(jié)構(gòu)化數(shù)據(jù)的保護(hù),而存檔管理人員負(fù)責(zé)整體的非結(jié)構(gòu)化數(shù)據(jù)的管理。
將備份和存檔過(guò)程作為單獨(dú)的孤島運(yùn)行是有問(wèn)題的。它至少需要兩個(gè)進(jìn)程,每個(gè)進(jìn)程都必須與存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)的文件系統(tǒng)交互。這兩個(gè)進(jìn)程的分離意味著要執(zhí)行功能的兩組軟件,文件系統(tǒng)交互的次數(shù)是兩倍,最重要的是存儲(chǔ)量也增加了一倍。
備份挑戰(zhàn)
一個(gè)值得關(guān)注的問(wèn)題是,大多數(shù)組織使用其備份過(guò)程來(lái)滿足其組織的數(shù)據(jù)保留和數(shù)據(jù)遵從性需求的一部分(在許多情況下是全部)。數(shù)據(jù)恢復(fù)應(yīng)該是組織首先投資于備份系統(tǒng)的主要原因,通常發(fā)生在最新的備份中,并且從一周以上的備份中恢復(fù)的次數(shù)不到所有恢復(fù)工作的1%。盡管存在這些恢復(fù)模式,但大多數(shù)組織傾向于將備份數(shù)據(jù)保留數(shù)年甚至數(shù)十年的時(shí)間。其原因何在?以滿足數(shù)據(jù)保留和數(shù)據(jù)法規(guī)遵從性方面的要求。
存檔挑戰(zhàn)
與無(wú)限期保留數(shù)據(jù)的備份過(guò)程相比,僅保留幾個(gè)月甚至幾周的備份數(shù)據(jù)的備份過(guò)程將更好地滿足組織的備份需求。然后,組織可以通過(guò)將所有數(shù)據(jù)復(fù)制到存檔中來(lái)滿足保留要求。存檔文件提供了逐個(gè)文件的視圖,而不是“作業(yè)視圖”,從而使歸檔文件可以輕松滿足對(duì)特定文件或文件版本的請(qǐng)求。存檔過(guò)程的問(wèn)題是如何以可靠的方式將這些數(shù)據(jù)保存到存檔中。大多數(shù)存檔解決方案不像備份軟件那樣提供本機(jī)數(shù)據(jù)移動(dòng)功能。它們通常通過(guò)對(duì)文件系統(tǒng)進(jìn)行逐個(gè)文件的掃描來(lái)尋找要移至存檔的候選文件,這是一個(gè)非常耗時(shí)的過(guò)程。
通常,歸檔文件的存儲(chǔ)選項(xiàng)也很有限,只能歸檔到大型磁帶系統(tǒng)、NAS系統(tǒng)或?qū)ο蟠鎯?chǔ)中。許多組織出乎意料地缺乏對(duì)云存儲(chǔ)的支持。存檔存儲(chǔ)通常也獨(dú)立并且與備份存儲(chǔ)分開(kāi)。
將數(shù)據(jù)保護(hù)和數(shù)據(jù)歸檔發(fā)展為集成的非結(jié)構(gòu)化數(shù)據(jù)管理
組織需要尋找使他們能夠從保護(hù)數(shù)據(jù)發(fā)展為主動(dòng)管理數(shù)據(jù)的解決方案。此外,供應(yīng)商需要?jiǎng)?chuàng)建兩個(gè)流程,而不是創(chuàng)建用于數(shù)據(jù)保護(hù)的獨(dú)立解決方案。盡管數(shù)據(jù)保護(hù)是非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)的基本組件,但非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)不僅僅是備份和存檔。它還包括復(fù)制管理、數(shù)據(jù)復(fù)制、災(zāi)難恢復(fù)、數(shù)據(jù)集發(fā)現(xiàn)/分析、強(qiáng)大的搜索、數(shù)據(jù)隱私合規(guī)性,以及數(shù)據(jù)移動(dòng)/遷移工作流。此外,它還包含這樣的想法:如果這些流程相互集成,那么它們都將更加高效。
非結(jié)構(gòu)化數(shù)據(jù)管理的要求
第一個(gè)要求是與數(shù)據(jù)源的單步交互。即使組織僅執(zhí)行備份和存檔,這兩個(gè)過(guò)程也代表數(shù)據(jù)中心中每個(gè)存儲(chǔ)系統(tǒng)的兩次傳遞。沒(méi)有集成非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)而擴(kuò)展到其所有功能可能意味著要跨環(huán)境中的所有存儲(chǔ)系統(tǒng)進(jìn)行五到六次傳遞。這些孤島中的每一個(gè)還需要單獨(dú)的管理和配置。缺乏集成的非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)方法的原因是盡管有許多組織無(wú)法提供所有必需的功能,卻還是將備份作為單個(gè)非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)解決方案。
除了非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)的所有其他功能之外,第二個(gè)要求是一組強(qiáng)大的數(shù)據(jù)保護(hù)功能。如果要合并數(shù)據(jù)保護(hù)和管理,則非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)解決方案需要提供連續(xù)的數(shù)據(jù)備份。當(dāng)用戶或應(yīng)用程序向服務(wù)器添加數(shù)據(jù)或更改服務(wù)器上的文件時(shí),非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)解決方案必須非常快速地將它們復(fù)制到輔助存儲(chǔ)區(qū)域。這種快速的數(shù)據(jù)復(fù)制意味著該解決方案可以固有地抵御自然災(zāi)害、勒索軟件和其他網(wǎng)絡(luò)攻擊等風(fēng)險(xiǎn)。
非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)的第三個(gè)要求是智能。為什么?首先,智能數(shù)據(jù)管理對(duì)解決方案的備份組件的壓力較小。備份從本質(zhì)上成為數(shù)據(jù)傳輸?shù)囊环N手段,并且可以預(yù)測(cè)哪些數(shù)據(jù)需要保留的系統(tǒng)可以在數(shù)據(jù)進(jìn)入非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)系統(tǒng)后優(yōu)化其位置。這極大地簡(jiǎn)化了“備份”的工作。另一方面,智能非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)允許該解決方案提供有關(guān)其存儲(chǔ)數(shù)據(jù)的確切詳細(xì)信息。搜索應(yīng)該是通用的,并且可以在本地或云中的所有存儲(chǔ)層上運(yùn)行。非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)解決方案還應(yīng)提供對(duì)生產(chǎn)數(shù)據(jù)的洞察力,并建議從主存儲(chǔ)中移出那些數(shù)據(jù),從而降低主存儲(chǔ)成本。
輔助存儲(chǔ)層的管理是非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)的另一個(gè)關(guān)鍵方面。組織正在增加對(duì)二級(jí)存儲(chǔ)的投資,而現(xiàn)在有被二級(jí)存儲(chǔ)大量數(shù)據(jù)淹沒(méi)的危險(xiǎn)。它必須擴(kuò)展以適應(yīng)數(shù)據(jù)的爆炸性增長(zhǎng),其中大多數(shù)發(fā)生在第二層。隨著規(guī)模的擴(kuò)展,購(gòu)買、維護(hù)和升級(jí)二級(jí)存儲(chǔ)所需的成本和運(yùn)營(yíng)開(kāi)銷令人生畏。二級(jí)存儲(chǔ)的可擴(kuò)展性包括兩個(gè)組成部分:該軟件必須進(jìn)行擴(kuò)展以跟蹤其可能管理的數(shù)十億個(gè)文件的詳細(xì)信息,其容量必須進(jìn)行擴(kuò)展以物理形式存儲(chǔ)所有數(shù)據(jù)。為了解決這些問(wèn)題,非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)應(yīng)該為客戶提供“按服務(wù)”交付二級(jí)存儲(chǔ)的選項(xiàng),并與本地存儲(chǔ)和云存儲(chǔ)集成。
非結(jié)構(gòu)化數(shù)據(jù)管理的好處
過(guò)去,供應(yīng)商曾出售過(guò)帶有以下承諾的存檔文件:“它可以通過(guò)減少主存儲(chǔ)空間來(lái)收回成本。”僅當(dāng)IT部門對(duì)解決方案足夠信任以使其能夠從主存儲(chǔ)中轉(zhuǎn)移數(shù)據(jù)時(shí),存檔解決方案才能降低主存儲(chǔ)的成本。這些解決方案要求IT團(tuán)隊(duì)參與并立即開(kāi)始遷移數(shù)據(jù)。存檔供應(yīng)商在IT會(huì)將其50%或更多數(shù)據(jù)遷移到存檔的假設(shè)下建立其投資回報(bào)(ROI)模型。如今,IT很少進(jìn)行這些跳躍,最終放棄了大多數(shù)歸檔項(xiàng)目。
非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)是不同的。首先,它通過(guò)將非結(jié)構(gòu)化數(shù)據(jù)備份與其他數(shù)據(jù)管理功能集成在一起,解決了IT團(tuán)隊(duì)面臨的直接問(wèn)題,就是如何在連續(xù)一致的基礎(chǔ)上充分保護(hù)非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)。連續(xù)備份功能使IT人員滿意,他們知道可以從幾乎所有類型的災(zāi)難(包括勒索軟件)中恢復(fù)。
其次,集成備份的概念為下一步從主存儲(chǔ)歸檔舊數(shù)據(jù)提供了極大的信心。例如,集成意味著組織可以制定一條策略,規(guī)定“只有在90天內(nèi)未訪問(wèn)文件并且已通過(guò)備份過(guò)程充分保護(hù)文件的情況下,才從生產(chǎn)中刪除文件”。而且,由于非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)解決方案已經(jīng)在數(shù)據(jù)保護(hù)方面付出了代價(jià),因此立即達(dá)到50%遷移標(biāo)記的壓力較小。IT部門可以將精力投入檔案庫(kù)中,以建立對(duì)該解決方案的信心。
但是,即使在存檔之前,非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)解決方案也可以提供跨層搜索和文件洞察,因此組織可以在不考慮其存儲(chǔ)位置的情況下找到數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)使組織不僅可以降低成本,還可以滿足合規(guī)性法規(guī),包括GDPR法規(guī)和其他數(shù)據(jù)隱私法規(guī),例如加利福尼亞州實(shí)施的《消費(fèi)者隱私法》。
簡(jiǎn)而言之,非結(jié)構(gòu)化數(shù)據(jù)管理(UDM)解決了當(dāng)前IT面臨的一個(gè)大問(wèn)題:非結(jié)構(gòu)化數(shù)據(jù)保護(hù)。它還為組織滿足法規(guī)和合規(guī)性問(wèn)題提供了平臺(tái),并降低了總體存儲(chǔ)成本。