谷歌公司重新思考開發(fā)數(shù)據(jù)中心存儲技術(shù)

責(zé)任編輯:editor004

作者:Harris編譯

2016-05-10 10:40:10

摘自:機房360

摘要:根據(jù)相關(guān)機構(gòu)的預(yù)測,數(shù)據(jù)中心的存儲容量市場增長沒有放緩的跡象。為什么我們談?wù)摿诉@么多都是圍繞機械磁盤,而不是固態(tài)硬盤,而固態(tài)硬盤的讀取速度更快,而其成本已經(jīng)開始下降。

根據(jù)相關(guān)機構(gòu)的預(yù)測,數(shù)據(jù)中心的存儲容量市場增長沒有放緩的跡象。思科公司預(yù)計,到2019年,使用個人云存儲服務(wù)的全球互聯(lián)網(wǎng)用戶(20億)將從2014年的42%增長到2019年的55%,每個用戶每月消費的云存儲流量將從2014年的992兆字節(jié)增長到2019年的1.6GB字節(jié)。思科公司稱之為“萬物聯(lián)網(wǎng)”的物聯(lián)網(wǎng)數(shù)據(jù)將會從2014年的134.5ZB字節(jié)增長到2019年的507.5ZB字節(jié)。

不用說,這是一個龐大的數(shù)據(jù)量,需要大量的存儲空間,而谷歌公司需要采用各種方法對此進行根本性轉(zhuǎn)變,該公司的工程師提議要重新思考數(shù)據(jù)中心存儲系統(tǒng)的設(shè)計。

云計算需要不同的磁盤

在2016年文件和存儲技術(shù)國際會議(FAST2016年)上,谷歌公司基礎(chǔ)設(shè)施副總裁埃里克·布魯爾表示,該公司希望與產(chǎn)業(yè)界和學(xué)術(shù)界合作開發(fā)支持云數(shù)據(jù)中心的適合云存儲服務(wù)的磁盤。他認為,云計算的存儲方式興起,意味著大多數(shù)機械硬盤將成為主要部署在數(shù)據(jù)中心大容量存儲服務(wù)的一部分。這樣的服務(wù)已經(jīng)成為磁盤增長最快的市場,并將在不久的將來占據(jù)大部分市場。

他以谷歌子公司YouTube作為一個例子,最近來自DisksforDataCenters的一篇論文指出,全球用戶每分鐘向YouTube網(wǎng)站上傳的視頻超過400小時,而在每天中,其1小時的視頻需要添加1PB字節(jié)的數(shù)據(jù)中心存儲容量。

面對一個如此依賴于這一基本技術(shù)的行業(yè),這是一個艱難的現(xiàn)實。目前這一代的磁盤,通常被稱為“近線企業(yè)”的磁盤,并沒有為這個新的使用案例進行優(yōu)化,它們被設(shè)計成滿足傳統(tǒng)服務(wù)器的需求。谷歌公司認為,這需要技術(shù)人員花費時間來開發(fā)一種新的專門針對大型數(shù)據(jù)中心和云服務(wù)設(shè)計的磁盤。

谷歌公司并不是唯一一個尋找新的存儲問題答案的廠商。面對存儲容量的需求不斷增長的問題,來自微軟和華盛頓大學(xué)的研究人員最近發(fā)表了一篇論文,該論文主張進一步探索利用DNA片段對數(shù)據(jù)進行編碼和存儲,并對迄今為止已經(jīng)探索的這種編碼系統(tǒng)提出了重大改進建議。

讓我們退后一步,從谷歌公司的角度看存儲。首先,該公司說你應(yīng)該停止尋找單個磁盤(甚至是數(shù)組)作為獨立的技術(shù)。相反,是時候把重點放在“收集”上。

谷歌公司提出的三種存儲的關(guān)鍵變化:

(1)在“集合視圖”中,其中重點收集了大量的磁盤的性能匯總

(2)將重點放在使用存儲的現(xiàn)場服務(wù)的潛伏尾期

(3)從存儲別人的數(shù)據(jù)中了解變化的安全需求

收集視圖

收集視圖意味著更高級別的維護,包括背景檢查,總結(jié),檢測潛在的錯誤,數(shù)據(jù)再平衡,更均衡地使用磁盤(包括新的磁盤),以及數(shù)據(jù)復(fù)制和重建?,F(xiàn)代磁盤的這些變化發(fā)生在內(nèi)部,這是部分冗余,而通過自身的單個磁盤不能滿足要求。同時,磁盤包含了低層次細節(jié),這通常有利于新的API,使磁盤和更高級別的系統(tǒng)之間有更好的廣泛合作。

集合視圖的第三個方面是,谷歌公司優(yōu)化IOPS和容量的整體平衡,利用隨時間變化的驅(qū)動器的一個精心挑選的組合。谷歌公司選擇新的磁盤,以便增加邊際IOPS和容量,使谷歌公司更接近他們的總體目標(biāo)。工作量的變化,如更好地利用固態(tài)硬盤或RAM,并轉(zhuǎn)移總體目標(biāo)。

為什么不是固態(tài)硬盤?

但是,為什么我們談?wù)摿诉@么多都是圍繞機械磁盤,而不是固態(tài)硬盤,而固態(tài)硬盤的讀取速度更快,而其成本已經(jīng)開始下降。

可以說,固態(tài)硬盤提供更好的IOPS,并很有可能是未來的存儲技術(shù)。但谷歌公司表示,每GB的成本仍然太高。更重要的是,在機械磁盤和固態(tài)硬盤之間的每美元容量的增長速度都比較接近(使用數(shù)據(jù)中心的固態(tài)硬盤,其程序擦除周期至少具有足夠數(shù)量),所以其成本不會在未來十年發(fā)生太大的變化。谷歌公司確實大量使用固態(tài)硬盤,但它們主要用于高性能工作負載和緩存方面,這有助于磁盤存儲需求轉(zhuǎn)移到固態(tài)硬盤。

重新設(shè)計的磁盤

如今,這樣的事情變得更加有趣。谷歌基公司本上是呼吁業(yè)界來全面建立一個新的磁盤設(shè)計標(biāo)準(zhǔn)。

谷歌公司指出,目前的3.5英寸硬盤幾何形狀和大小繼承PC軟盤的設(shè)計。另一種形式的因素應(yīng)該會產(chǎn)生一個更好的總擁有成本。改變外形是一個長期的過程,需要一個廣泛的討論,但谷歌公司認為它應(yīng)該考慮。雖然該公司可以規(guī)范其自身的形式(高容量),其潛在的問題超出了谷歌的設(shè)計與業(yè)界一起開發(fā)新的解決方案可以更好地服務(wù)于大家,尤其是實現(xiàn)一個標(biāo)準(zhǔn)。這就是一個關(guān)鍵點:標(biāo)準(zhǔn)化。

有一系列可能的二次優(yōu)化,其中一些可能是重要的。這些包括系統(tǒng)級熱優(yōu)化,系統(tǒng)水平振動優(yōu)化、自動化和機器人處理優(yōu)化,系統(tǒng)級氦備份優(yōu)化和系統(tǒng)水平權(quán)重優(yōu)化。

“傳統(tǒng)”的數(shù)據(jù)中心存儲的未來是什么?

是的,基于云的存儲繼續(xù)以驚人的速度增長。是的,我們看到更多的采用新的端點技術(shù),物聯(lián)網(wǎng)和虛擬化。所有這些都圍繞創(chuàng)建存儲和數(shù)據(jù)優(yōu)化的更多需求。

但是在你心慌,并開始尋找未來的存儲方案之前,你必須了解有谷歌公司所提議的有多大承諾。谷歌公司的建議將重新定義現(xiàn)代標(biāo)準(zhǔn)化的磁盤架構(gòu),而這種架構(gòu)已經(jīng)存在了相當(dāng)長的一段時間。

1956年,IBM公司推出了第一款硬盤驅(qū)動器RAMAC305系統(tǒng),其存儲容量為5MB,每兆數(shù)據(jù)價格為1萬美元。該系統(tǒng)的體積有兩個冰箱大小,采用50個24寸磁盤。1980年,希捷公司發(fā)布了第一個5.25英寸硬盤。然后在1983年,Rodime公司發(fā)布了世界上第一個3.5英寸硬盤;R0352硬盤包括兩個盤片,其存儲容量為10MB。

在他們的文件中,谷歌公司討論了物理變化,如更高密度的驅(qū)動器和磁盤組,以及一系列的固件的變化。他們討論公司的目標(biāo),包括更高的容量和更多的I/O每秒的操作,除了一個更好的總擁有成本。但即使是谷歌公司這樣的規(guī)模,以及不確定的市場需求,那這種想法如何可行?

我們談?wù)摰氖敲總€業(yè)務(wù)和數(shù)據(jù)中心創(chuàng)建一個新的存儲標(biāo)準(zhǔn),以及充分利用基于磁盤環(huán)境的生態(tài)系統(tǒng)。谷歌認為這將是數(shù)據(jù)中心的存儲磁盤的新時代。

技術(shù)發(fā)展似乎是一個巨大的上升電梯。隨著時間的推移,存儲技術(shù)不斷進步。也許是時候開發(fā)能夠滿足云計算生態(tài)系統(tǒng)需求的存儲環(huán)境了。無論哪種方式,這是不容易的任務(wù),需要整個行業(yè)的支持,使其成為現(xiàn)實。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號