企業(yè)網(wǎng)D1Net 10月29日(北京),重復(fù)數(shù)據(jù)刪除是一種數(shù)據(jù)縮減技術(shù),旨在減少存儲(chǔ)系統(tǒng)中的存儲(chǔ)容量;它在大數(shù)據(jù)時(shí)代興起,現(xiàn)已成為對(duì)抗數(shù)據(jù)急劇增長(zhǎng)的有效武器,并獲得大多數(shù)企業(yè)的認(rèn)可。那么,企業(yè)采用重復(fù)數(shù)據(jù)刪除技術(shù)有哪些注意事項(xiàng)呢?
重復(fù)數(shù)據(jù)刪除技術(shù)是否適用于您的企業(yè)?
并不是所有的企業(yè)都適宜采用此項(xiàng)技術(shù),數(shù)據(jù)量大、且冗余大的企業(yè)才適合使用重復(fù)數(shù)據(jù)刪除技術(shù)。通常情況下,當(dāng)企業(yè)的數(shù)據(jù)量越大,備份數(shù)據(jù)中所包含的冗余部分也就越多。雖然說(shuō)增量的數(shù)據(jù)備份策略只是備份哪些有變化的文件,可以在一定程度上提高備份的效率、縮小磁盤空間。但是這個(gè)贈(zèng)量備份策略通常也會(huì)包含比較多的冗余的數(shù)據(jù)塊。為此對(duì)節(jié)省磁盤空間的效果并不是很理想。
此時(shí)企業(yè)可以嘗試使用重復(fù)數(shù)據(jù)刪除技術(shù)來(lái)消除冗余的數(shù)據(jù)塊。通常情況下重復(fù)數(shù)據(jù)刪除技術(shù)的核心優(yōu)勢(shì)就是保存唯一一份備份數(shù)據(jù)的數(shù)據(jù)段。簡(jiǎn)單的說(shuō),當(dāng)數(shù)據(jù)寫入到備份設(shè)備時(shí),數(shù)據(jù)會(huì)被分割成可變長(zhǎng)度的數(shù)據(jù)段。重復(fù)數(shù)據(jù)刪除解決方案會(huì)實(shí)時(shí)的將該數(shù)據(jù)段與已經(jīng)存儲(chǔ)的各個(gè)數(shù)據(jù)段進(jìn)行對(duì)比。如此的話,就可以保證每個(gè)唯一的數(shù)據(jù)段在存儲(chǔ)設(shè)備上只保留一份。
為此如果企業(yè)想大幅度的降低其存儲(chǔ)容量,并且企業(yè)的數(shù)據(jù)存在比較大的冗余,此時(shí)就可以使用重復(fù)數(shù)據(jù)刪出技術(shù)來(lái)解決存儲(chǔ)容量過(guò)大的問(wèn)題。
重復(fù)數(shù)據(jù)刪除對(duì)企業(yè)現(xiàn)有備份環(huán)境是否造成影響?影響有多大?
企業(yè)用戶備份做兩次全備份時(shí)間間隔一般不長(zhǎng),通常只有不超過(guò)5%的數(shù)據(jù)是不同的,剩余大部分?jǐn)?shù)據(jù)都是相同的,因此,重復(fù)數(shù)據(jù)刪除絕對(duì)可以給企業(yè)備份系統(tǒng)帶來(lái)很大的好處。從而衍生出這樣一個(gè)問(wèn)題:重復(fù)數(shù)據(jù)刪除是否會(huì)對(duì)企業(yè)現(xiàn)有備份環(huán)境造成影響?可能會(huì)造成什么樣的影響?這種影響有多大?
舉個(gè)例子,如果你的備份環(huán)境已經(jīng)有比較長(zhǎng)的時(shí)間了,各項(xiàng)備份機(jī)制都趨于完善,這個(gè)時(shí)候你應(yīng)該考慮加入重復(fù)數(shù)據(jù)刪除解決方案。那么你要選擇什么樣的重復(fù)數(shù)據(jù)刪除產(chǎn)品呢?是選擇在線處理方式的重復(fù)數(shù)據(jù)刪除產(chǎn)品,還是選擇后處理方式的重復(fù)數(shù)據(jù)刪除產(chǎn)品呢?這里需要告誡你的是:方式可能并不適合你當(dāng)前的備份環(huán)境。因?yàn)榉绞娇赡芙o你的備份環(huán)境帶來(lái)很大的改變,不僅可能你的備份軟件需要升級(jí)、備份設(shè)備需要更換,還可能出現(xiàn)備份機(jī)制、備份習(xí)慣的通通改變。更有可能出現(xiàn),改變現(xiàn)有備份環(huán)境會(huì)使備份處理的速度變的很慢,甚至引發(fā)無(wú)法預(yù)計(jì)且不可恢復(fù)的數(shù)據(jù)丟失。所以如果用戶不仔細(xì)考慮重復(fù)數(shù)據(jù)刪除產(chǎn)品對(duì)現(xiàn)有備份環(huán)境的影響,則很可能將已有的備份環(huán)境做出巨大改變,而這種巨大的改變也犯了IT建設(shè)之大忌。
注意某些類型的數(shù)據(jù)不適合刪除
業(yè)內(nèi)專家指出,對(duì)某些特定文件類型和應(yīng)用程序數(shù)據(jù)做重復(fù)數(shù)據(jù)刪除不是很有效;像Lotus Notes這種特定的應(yīng)用程序,不能產(chǎn)生高數(shù)據(jù)重刪比率。結(jié)構(gòu)化的數(shù)據(jù)庫(kù)也產(chǎn)生較低的數(shù)據(jù)重刪比率。某些特定富媒體文件類型可以產(chǎn)生相同大小或者比之前大的重復(fù)數(shù)據(jù)刪除輸出。除此以外,任何有高可變率的情況都可能導(dǎo)致數(shù)據(jù)重刪的比率很低。