在數(shù)據(jù)中心設(shè)計(jì)層面,一個(gè)重要的趨勢(shì)是提高功率密度。鑒于數(shù)據(jù)中心的空間限制,其需要更高效的運(yùn)作,以應(yīng)對(duì)電力需求和成本的上升,很明顯,將每臺(tái)機(jī)架投入更多的資源是一個(gè)非常實(shí)用的解決方案。但是,這一方案除了擁有其固有的好處之外,提高功率密度也為一些數(shù)據(jù)中心運(yùn)營(yíng)商帶來了一些必須解決的問題和挑戰(zhàn)。
功率密度的趨勢(shì)
低功率密度往往等同于效率低下。如此寶貴的空間資源僅僅由如此少的IT設(shè)備資源所消耗,同時(shí)其還需要消耗更多的設(shè)備維護(hù)成本。位于圣克拉拉的高密度托管提供商Colovore公司的CFO兼聯(lián)合創(chuàng)始人本·庫(kù)格林指出:“當(dāng)前,典型數(shù)據(jù)中心的客戶部署的機(jī)架都是大約每臺(tái)機(jī)架8–12千瓦的系列,雖然某些數(shù)據(jù)中心的密度要求更高,但接近20+千瓦的現(xiàn)象在大多數(shù)進(jìn)行大數(shù)據(jù)分析處理的密集型應(yīng)用程序來說仍然是罕見的。但與此同時(shí),美國(guó)仍然有某些沿海地區(qū)的典型的數(shù)據(jù)中心的機(jī)架為4–5千瓦(而這還是10年前修訂的標(biāo)準(zhǔn))。”
在托管空間,只支持低功率密度的造價(jià)是非常昂貴的,因?yàn)槿庥脵C(jī)架空間可能由于缺乏足夠的電源而無法使用。盡管機(jī)架上裝備了大量的設(shè)備,但托管空間的基礎(chǔ)設(shè)施配套能力不匹配。“客戶可以在他們現(xiàn)有的服務(wù)器基礎(chǔ)設(shè)施上輕松地完成每臺(tái)機(jī)架8-10千瓦的部署,但因?yàn)榇蠖鄶?shù)數(shù)據(jù)中心設(shè)計(jì)建成的是僅支持4-5千瓦的,這樣他們就必須跨機(jī)架實(shí)施半機(jī)架裝備運(yùn)行,否則就不能很好的實(shí)施冷卻。但客戶已經(jīng)為全機(jī)架買單了,盡管其實(shí)只是用了半機(jī)架的負(fù)載資源。這無疑是一種浪費(fèi)。”
對(duì)于功率密度最為明顯的約束之一便是配電基礎(chǔ)設(shè)施,公用電力公司提供的電源和數(shù)據(jù)中心的備用設(shè)施的水平都會(huì)影響到功率密度。對(duì)于公用電力公司所提供的每瓦的電力,數(shù)據(jù)中心必須有足夠的UPS和柴油發(fā)電機(jī),以便在停電的情況下繼續(xù)保持其運(yùn)營(yíng)能力。當(dāng)然,布線、配電單元(PDU)等提供電源給專用機(jī)架。庫(kù)格林指出,“大多數(shù)的數(shù)據(jù)中心并沒有太多的電力以供給給其設(shè)施,所以他們希望能夠從公共電力公司獲得更多的電力資源,并在數(shù)據(jù)中心的核心基礎(chǔ)設(shè)施(電氣和機(jī)械基礎(chǔ)設(shè)施、發(fā)電機(jī),配電設(shè)備等)上面花了很多錢。因此,對(duì)數(shù)據(jù)中心而言,獲得更多的電力和成本問題是兩個(gè)重要的變量。”
但也許數(shù)據(jù)中心面臨的更為迫切的需要是冷卻:設(shè)備每消耗一瓦的電力,就會(huì)產(chǎn)生一瓦的余熱,必須除去,以保持?jǐn)?shù)據(jù)中心所需的操作溫度。這也是數(shù)據(jù)中心最初不打算將設(shè)備安置為更高密度所希望規(guī)避的最大的挑戰(zhàn)。“當(dāng)你數(shù)據(jù)中心機(jī)架層面的密度增加,服務(wù)器必然會(huì)生成更多的熱量,因此更多的冷卻也是必需的。”庫(kù)格林說。“冷卻基礎(chǔ)設(shè)施是非常昂貴的,但最大的挑戰(zhàn)可能來自于試圖改造舊的數(shù)據(jù)中心。大多數(shù)這些舊的數(shù)據(jù)中心建設(shè)初期屋頂設(shè)得都很低,在許多情況下,實(shí)在沒有簡(jiǎn)單的方法來提高密度。除了拆毀之外幾乎沒有什么方法,但這對(duì)于數(shù)據(jù)中心而言是非常難的,特別是當(dāng)其還托管著某些客戶的時(shí)候。”
不幸的是,對(duì)于傳統(tǒng)的數(shù)據(jù)中心企業(yè)而言,將其數(shù)據(jù)中心改造成具備更高密度的數(shù)據(jù)中心意味著除了等待半導(dǎo)體摩爾定律帶來的改進(jìn)之外,其數(shù)據(jù)中心的設(shè)施沒有多大實(shí)際潛力能夠繼續(xù)擴(kuò)大計(jì)算能力了。但是,這種方法需要購(gòu)買新的IT設(shè)備,更好的工藝技術(shù),以及摩爾定律的不斷進(jìn)步,才能實(shí)現(xiàn)更高的效率,而這可能需要十年左右的時(shí)間。庫(kù)格林指出,在這種情況下,“主機(jī)托管提供商只能簡(jiǎn)單地使用‘分散負(fù)載’,或迫使客戶來跨半機(jī)架來使用他們的基礎(chǔ)設(shè)施。但是,這顯然是不可持續(xù)的,他們最終將隨著客戶服務(wù)器的刷新,耗盡他們的空間、電力、冷卻資源。”
整合基礎(chǔ)設(shè)施驅(qū)動(dòng)更大的功率密度
向更高的密度的推進(jìn)可以歸納為長(zhǎng)期的基礎(chǔ)設(shè)施整合:基本上,將更多計(jì)算機(jī)資源打包到更小體積,可以通過數(shù)據(jù)中心現(xiàn)有的趨勢(shì)來實(shí)現(xiàn),如采用虛擬化技術(shù)、刀片服務(wù)器和微服務(wù)器。整合基礎(chǔ)設(shè)施“對(duì)于數(shù)據(jù)中心的運(yùn)營(yíng)效率有著非常積極的作用。”庫(kù)格林說,“因?yàn)镮T部署的物理尺寸較小,IT經(jīng)理管理的權(quán)限更有限,而當(dāng)服務(wù)器的數(shù)量減少了30-50%時(shí),帶給總功率的節(jié)約才會(huì)更有意義。”
這種方法旨在通過提升機(jī)架層面的電力,降低數(shù)據(jù)中心的總功率(其具有雙重的好處,因?yàn)槠渫瑫r(shí)也降低了冷卻要求)。“其實(shí),每一臺(tái)服務(wù)器的電力需求大大增加,但總體而言,總功率是可以下降的,因?yàn)樗枰姆?wù)器數(shù)量更少了。這便是高密度數(shù)據(jù)中心為何變得如此重要的原因了,他們是讓一切基礎(chǔ)設(shè)施得以整合的關(guān)鍵。今天的服務(wù)器可以輕松地實(shí)現(xiàn)每臺(tái)機(jī)架單元達(dá)到500瓦到1千瓦!”
高密度帶來的散熱問題
當(dāng)然,通過高密度可以帶來更高的效率,每臺(tái)機(jī)架均安置了盡可能多的設(shè)備,從而幫助數(shù)據(jù)中心實(shí)現(xiàn)盡可能的節(jié)省成本、占地空間和解決管理難題。但好東西都是需要權(quán)衡的:在這種情況下,會(huì)造成冷卻問題。低密度部署通常是采用空氣冷卻,并且,在大部分地區(qū),都是采用免費(fèi)的室外空氣冷卻的方法。但隨著數(shù)據(jù)中心功率密度的上升,空氣冷卻變得令人望而卻步,而且會(huì)變得造價(jià)昂貴。
較之均勻分布的直接冷卻源,產(chǎn)熱的解決方案更類似于提供點(diǎn)源:產(chǎn)熱的究竟是由于機(jī)架、服務(wù)器、甚至處理器的級(jí)別。“服務(wù)器芯片級(jí)的處理能力似乎在持續(xù)增加,但在某些時(shí)候,他們將需要內(nèi)部冷卻,立即在服務(wù)器附近實(shí)施冷卻,以防止產(chǎn)生的熱量增加太多。”因此僅僅對(duì)一個(gè)點(diǎn)采用空氣冷卻可能仍然不夠,需要采用水資源(或其它液體)提供更大的冷卻能力,但是,這需要犧牲掉一部分的基礎(chǔ)設(shè)施交付能力,提升執(zhí)行上也存在一定的困難,如實(shí)現(xiàn)冷卻水與設(shè)備電子元件的嚴(yán)格隔離。
部署一個(gè)基于水的冷卻方案可能會(huì)導(dǎo)致某些問題,特別是對(duì)于老舊的數(shù)據(jù)中心而言尤其如此,必須改造現(xiàn)有的基礎(chǔ)設(shè)施。但對(duì)于那些能夠支持不斷增長(zhǎng)的功率密度的新設(shè)施而言,水冷卻的方案能夠?qū)⒗鋮s能力輸送到任何需要的地方,而不是僅僅試圖讓整個(gè)房間保持足夠低的溫度,以確保服務(wù)器空間整體運(yùn)行溫度。諸如熱通道/冷通道的方案可以讓冷卻空氣有一些回旋的余地,但這種方案也有其局限性。最后,隨著數(shù)據(jù)中心高密度要求的不斷提升,浸泡技術(shù)可能會(huì)成為必要的技術(shù)?,F(xiàn)在已經(jīng)有一些公司在提供這方面的產(chǎn)品,包括不導(dǎo)電的流體,以及將冷卻液體輸入服務(wù)器機(jī)箱。
高密度的回報(bào)
對(duì)于客戶,無論他們是托管服務(wù)的客戶,或者就是數(shù)據(jù)中心運(yùn)營(yíng)商,高密度在在總擁有成本(TCO)方面能夠?yàn)樗麄兲峁┲匾邑S厚的利潤(rùn)回報(bào)。庫(kù)格林說,“當(dāng)一家公司可以整合其IT基礎(chǔ)設(shè)施到虛擬化的刀片服務(wù)器,其可以立馬節(jié)省20%至30%以上的經(jīng)營(yíng)成本,以及每臺(tái)機(jī)架4-5千瓦的遺留部署。這在很大程度上是由于節(jié)省了每月機(jī)柜需要容納服務(wù)器所消耗的電力費(fèi)用,以及降低了交叉連接和頂級(jí)機(jī)架交換機(jī)的成本。”對(duì)于托管服務(wù)客戶和數(shù)據(jù)中心運(yùn)營(yíng)商,這意味著進(jìn)一步擴(kuò)大了現(xiàn)有機(jī)架的可用空間,賣弄去了構(gòu)建新的數(shù)據(jù)中心的麻煩和費(fèi)用,其收益絕不僅僅是直接的成本節(jié)約。
對(duì)于那些想要繼續(xù)保持其舊有的數(shù)據(jù)中心建筑或走托管路線的企業(yè)而言,隨著能源價(jià)格上漲和IT服務(wù)需求的增長(zhǎng),他們需要提高效率和節(jié)省地面和機(jī)架空間。因此,數(shù)據(jù)中心實(shí)施高密度功率是一大趨勢(shì),但同時(shí)也是一項(xiàng)挑戰(zhàn):將更多的容量打包到機(jī)架需要建設(shè)相關(guān)的配電設(shè)備,備份基礎(chǔ)設(shè)施、冷卻能力也需要提供相關(guān)的部署支持,以保持管理操作溫度。雖然冷卻液的方法目前可能還不是一個(gè)較為普遍的趨勢(shì),但隨著空氣冷卻方法在高密度環(huán)境開始逐漸變得不太實(shí)用和實(shí)惠,其會(huì)變得更加普遍。然而,無論從空氣冷卻過度到液體冷卻方法需要多久的時(shí)間,數(shù)據(jù)中心功率密度無疑將繼續(xù)攀升,因?yàn)槠髽I(yè)都在試圖最大限度地利用自己的資源。