以下是IT專業(yè)人員應(yīng)該了解的對(duì)象存儲(chǔ)和數(shù)據(jù)塊存儲(chǔ),以及它們?nèi)绾芜m應(yīng)當(dāng)今的數(shù)據(jù)存儲(chǔ)環(huán)境的內(nèi)容。
什么是對(duì)象存儲(chǔ)?
“對(duì)象存儲(chǔ)”或“基于對(duì)象的存儲(chǔ)”一詞是由它的名稱派生出來的,因?yàn)樗鼘?shù)據(jù)和元數(shù)據(jù)封裝到對(duì)象中。元數(shù)據(jù)本質(zhì)上是描述其他數(shù)據(jù)的數(shù)據(jù),或者在基于對(duì)象的存儲(chǔ)的情況下,是關(guān)于通常存儲(chǔ)在對(duì)象內(nèi)的文件的信息。
對(duì)象存儲(chǔ)在平面結(jié)構(gòu)或地址空間中。每個(gè)對(duì)象都分配一個(gè)對(duì)象ID或唯一標(biāo)識(shí)符,使它們可以從單個(gè)存儲(chǔ)庫(kù)或存儲(chǔ)池中檢索。企業(yè)非常重視這種方法,因?yàn)樗峁┝烁蟮撵`活性,可以將數(shù)據(jù)放置在基于數(shù)據(jù)塊和文件的存儲(chǔ)解決方案之外。
亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)公司和其他提供商的云計(jì)算對(duì)象存儲(chǔ)產(chǎn)品的普及促進(jìn)了近年來對(duì)象存儲(chǔ)的發(fā)展。
什么是塊存儲(chǔ)?
塊存儲(chǔ)與存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)是同義詞,并且支持網(wǎng)絡(luò)附加存儲(chǔ)(NAS)系統(tǒng)中使用的文件存儲(chǔ)技術(shù)無法實(shí)現(xiàn)的存儲(chǔ)服務(wù)。塊存儲(chǔ)涉及將數(shù)據(jù)保存在塊或原始存儲(chǔ)卷中。
這些存儲(chǔ)塊中的每一個(gè)可以作為一個(gè)單獨(dú)的硬盤驅(qū)動(dòng)器出現(xiàn)在外部服務(wù)器操作系統(tǒng)上。操作系統(tǒng)依次使用光纖通道(FC)、以太網(wǎng)上的光纖通道(FCOE)或ISCSI協(xié)議來訪問這些塊。
塊存儲(chǔ)和SAN因此在企業(yè)IT環(huán)境中很普及的原因是由于其靈活性和性能特征。塊存儲(chǔ)支持各種需要低延遲、基于網(wǎng)絡(luò)的存儲(chǔ)操作的工作負(fù)載,其中包括業(yè)務(wù)關(guān)鍵型應(yīng)用程序、虛擬機(jī)、RAID實(shí)施和數(shù)據(jù)庫(kù)。
雖然不應(yīng)該將其與文件存儲(chǔ)系統(tǒng)混淆,這種類型使組織能夠通過網(wǎng)絡(luò)使用NAS-a文件系統(tǒng)為員工提供共享文件服務(wù),可以將其分層存儲(chǔ)在塊存儲(chǔ)上,因?yàn)閴K存儲(chǔ)顯示為原始存儲(chǔ)到服務(wù)器操作系統(tǒng)。
在云平臺(tái)中,塊存儲(chǔ)可從AWS Elastic Block Store或AWS EBS等服務(wù)獲得,該服務(wù)提供可擴(kuò)展塊存儲(chǔ),供Elastic Compute Cloud(EC2)實(shí)例使用。
對(duì)象存儲(chǔ)和塊存儲(chǔ)用例
以下是在數(shù)據(jù)中心中使用對(duì)象存儲(chǔ)和塊存儲(chǔ)的方式:
(1)對(duì)象存儲(chǔ)用例
•云存儲(chǔ)
•非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)(文檔、圖像、視頻等)
•大數(shù)據(jù)存儲(chǔ)
•備份和恢復(fù)
•檔案存儲(chǔ)
•大數(shù)據(jù)分析
(2)塊存儲(chǔ)用例
•數(shù)據(jù)庫(kù)
•業(yè)務(wù)應(yīng)用程序
•虛擬機(jī)
•RAID
•從網(wǎng)絡(luò)存儲(chǔ)啟動(dòng)
塊存儲(chǔ)和對(duì)象存儲(chǔ)的區(qū)別
對(duì)象存儲(chǔ)和塊存儲(chǔ)最大的區(qū)別之一是它們?nèi)绾翁幚碓獢?shù)據(jù)。
如前所述,對(duì)象存儲(chǔ)包括數(shù)據(jù)和元數(shù)據(jù)??梢宰远x該元數(shù)據(jù)以包含支持搜索或高級(jí)存儲(chǔ)管理和分析等功能的其他幾個(gè)屬性。事實(shí)上,對(duì)象存儲(chǔ)可以具有非常豐富的元數(shù)據(jù)。
這也是企業(yè)日益轉(zhuǎn)向基于對(duì)象的存儲(chǔ)解決方案的另一個(gè)原因。組織可以將自己的自定義信息添加到對(duì)象存儲(chǔ)元數(shù)據(jù)中,從而為基礎(chǔ)數(shù)據(jù)提供更多業(yè)務(wù)場(chǎng)景和相關(guān)性。
這與文件存儲(chǔ)形成對(duì)比,例如,文件存儲(chǔ)通常包含有關(guān)文件基本屬性的元數(shù)據(jù),如文件名、文件類型和創(chuàng)建日期。對(duì)象的元數(shù)據(jù)可以描述他們綁定的應(yīng)用程序以及許多其他特征。
與塊存儲(chǔ)相比,基于對(duì)象的存儲(chǔ)實(shí)際上在元數(shù)據(jù)中移動(dòng)。
在塊存儲(chǔ)中,服務(wù)器操作系統(tǒng)使用其唯一地址直接訪問完成讀取和寫入操作所需的數(shù)據(jù)塊。正在使用的操作系統(tǒng)或應(yīng)用程序負(fù)責(zé)跟蹤和管理沒有本地元數(shù)據(jù)的這些數(shù)據(jù)塊。
塊存儲(chǔ)使用光纖通道、FCoE或iSCSI協(xié)議訪問各個(gè)數(shù)據(jù)塊。對(duì)象數(shù)據(jù)通常使用由熟悉的超文本傳輸??協(xié)議(HTTP)請(qǐng)求組成的開發(fā)人員友好的API進(jìn)行訪問。
對(duì)象存儲(chǔ)解決的問題
對(duì)象存儲(chǔ)的固有數(shù)據(jù)保護(hù)功能是其另一個(gè)吸引力。在通常情況下,使用對(duì)象副本和刪除編碼來確保數(shù)據(jù)在磁盤節(jié)點(diǎn)故障時(shí)仍可訪問,從而不需要RAID。
簡(jiǎn)單地說,擦除編碼涉及將對(duì)象分割成塊,用額外的冗余數(shù)據(jù)對(duì)它們進(jìn)行編碼,并將這些片段分布在幾個(gè)磁盤或節(jié)點(diǎn)上。如果災(zāi)難襲擊了包含這些碎片的系統(tǒng)或磁盤,其剩余的數(shù)據(jù)碎片可以包含足夠的信息來重新組裝對(duì)象。
塊存儲(chǔ)解決的問題
企業(yè)需要為其應(yīng)用程序提供可靠,低延遲的存儲(chǔ)?
塊存儲(chǔ)是運(yùn)行關(guān)鍵業(yè)務(wù)應(yīng)用程序,需要可預(yù)測(cè)性能的數(shù)據(jù)庫(kù)和工作負(fù)載的企業(yè)的首選解決方案。特別是如果交易系統(tǒng)一直在等待數(shù)據(jù)或無法及時(shí)更新數(shù)據(jù),它們的運(yùn)行并不會(huì)很好。
塊存儲(chǔ)也因其可靠和高效的數(shù)據(jù)傳輸而受到重視。存儲(chǔ)管理人員通常很重視將塊存儲(chǔ)卷設(shè)置為外部服務(wù)器的獨(dú)立磁盤的能力,并且他們可以相對(duì)容易地管理訪問權(quán)限和控制權(quán)限。
對(duì)象存儲(chǔ)和塊存儲(chǔ)的權(quán)衡
與大多數(shù)技術(shù)一樣,對(duì)象存儲(chǔ)和塊存儲(chǔ)都有其優(yōu)點(diǎn)和缺點(diǎn)。
在比較塊存儲(chǔ)和對(duì)象存儲(chǔ)時(shí),對(duì)象存儲(chǔ)后者通常成本較低,因?yàn)樗梢栽谏唐酚布线\(yùn)行。盡管存在軟件定義的存儲(chǔ)解決方案(SDS),可以在現(xiàn)成的硬件上啟用SAN和NAS功能,但專用SAN存儲(chǔ)陣列形式的塊存儲(chǔ)通常更昂貴。
在性能方面,SAN勝出。
更改對(duì)象庫(kù)中的數(shù)據(jù)需要傳輸整個(gè)對(duì)象的新版本,而存儲(chǔ)在SAN中的數(shù)據(jù)可以在文件內(nèi)的數(shù)據(jù)塊級(jí)別進(jìn)行更改。需要隨機(jī)訪問可能存儲(chǔ)在對(duì)象內(nèi)的數(shù)據(jù)的應(yīng)用程序(例如數(shù)據(jù)庫(kù)和事務(wù)系統(tǒng))通常不適用于對(duì)象存儲(chǔ)。
對(duì)象存儲(chǔ)還必須與封裝了元數(shù)據(jù)的頭文件進(jìn)行抗衡。相對(duì)于塊存儲(chǔ),還增加了開銷,也降低了性能。讀取延遲也是一個(gè)問題。
還有數(shù)據(jù)一致性模型的問題??紤]到SAN的架構(gòu)和性能特征,存儲(chǔ)在此環(huán)境中的數(shù)據(jù)副本可以被認(rèn)為是非常一致的,這意味著最新版本的數(shù)據(jù)在修改后立即可用。對(duì)象存儲(chǔ)通常被認(rèn)為是最終一致的,這意味著存在最新版本的數(shù)據(jù)不一定是最新版本的風(fēng)險(xiǎn)。這是由于擦除編碼和復(fù)制,以及數(shù)據(jù)在分布式對(duì)象存儲(chǔ)環(huán)境中傳播和傳播的時(shí)間。
對(duì)象存儲(chǔ)和塊存儲(chǔ)工作負(fù)載
如上所述,對(duì)象存儲(chǔ)在需要處理大量非常規(guī)更新的非結(jié)構(gòu)化數(shù)據(jù)的環(huán)境中發(fā)揮作用。這可以包括文檔、照片和視頻。
富含元數(shù)據(jù)的對(duì)象存儲(chǔ)使大規(guī)模分析成為企業(yè)的有吸引力的命題。對(duì)象存儲(chǔ)也使得提供和管理跨越地理位置的存儲(chǔ)變得相對(duì)經(jīng)濟(jì)。
同時(shí),塊存儲(chǔ)的屬性使其成為高性能業(yè)務(wù)應(yīng)用程序、事務(wù)數(shù)據(jù)庫(kù)和虛擬機(jī)的理想選擇,這些應(yīng)用程序需要低延遲、細(xì)粒度的數(shù)據(jù)訪問和一致的性能。
盡管有著根本性的不同,但現(xiàn)在企業(yè)正在采用這兩種技術(shù)來滿足他們的存儲(chǔ)需求。日益普遍的是,SAN中使用的塊存儲(chǔ)系統(tǒng)滿足關(guān)鍵業(yè)務(wù)應(yīng)用程序的即時(shí)數(shù)據(jù)需求,而非結(jié)構(gòu)化數(shù)據(jù)、媒體文件、日志和其他內(nèi)容集中到內(nèi)部部署或云端對(duì)象存儲(chǔ)解決方案中,并為企業(yè)提供兩全其美的解決方案。