在數(shù)據(jù)中心設計層面,一個重要的趨勢是提高功率密度。鑒于數(shù)據(jù)中心的空間限制,其需要更高效的運作,以應對電力需求和成本的上升,很明顯,將每臺機架投入更多的資源是一個非常實用的解決方案。但是,這一方案除了擁有其固有的好處之外,提高功率密度也為一些數(shù)據(jù)中心運營商帶來了一些必須解決的問題和挑戰(zhàn)。
功率密度的趨勢
低功率密度往往等同于效率低下。如此寶貴的空間資源僅僅由如此少的IT設備資源所消耗,同時其還需要消耗更多的設備維護成本。位于圣克拉拉的高密度托管提供商Colovore公司的CFO兼聯(lián)合創(chuàng)始人本·庫格林指出:“當前,典型數(shù)據(jù)中心的客戶部署的機架都是大約每臺機架8–12千瓦的系列,雖然某些數(shù)據(jù)中心的密度要求更高,但接近20+千瓦的現(xiàn)象在大多數(shù)進行大數(shù)據(jù)分析處理的密集型應用程序來說仍然是罕見的。但與此同時,美國仍然有某些沿海地區(qū)的典型的數(shù)據(jù)中心的機架為4–5千瓦(而這還是10年前修訂的標準)。”
在托管空間,只支持低功率密度的造價是非常昂貴的,因為全租用機架空間可能由于缺乏足夠的電源而無法使用。盡管機架上裝備了大量的設備,但托管空間的基礎(chǔ)設施配套能力不匹配。“客戶可以在他們現(xiàn)有的服務器基礎(chǔ)設施上輕松地完成每臺機架8-10千瓦的部署,但因為大多數(shù)數(shù)據(jù)中心設計建成的是僅支持4-5千瓦的,這樣他們就必須跨機架實施半機架裝備運行,否則就不能很好的實施冷卻。但客戶已經(jīng)為全機架買單了,盡管其實只是用了半機架的負載資源。這無疑是一種浪費。”
對于功率密度最為明顯的約束之一便是配電基礎(chǔ)設施,公用電力公司提供的電源和數(shù)據(jù)中心的備用設施的水平都會影響到功率密度。對于公用電力公司所提供的每瓦的電力,數(shù)據(jù)中心必須有足夠的UPS和柴油發(fā)電機,以便在停電的情況下繼續(xù)保持其運營能力。當然,布線、配電單元(PDU)等提供電源給專用機架。庫格林指出,“大多數(shù)的數(shù)據(jù)中心并沒有太多的電力以供給給其設施,所以他們希望能夠從公共電力公司獲得更多的電力資源,并在數(shù)據(jù)中心的核心基礎(chǔ)設施(電氣和機械基礎(chǔ)設施、發(fā)電機,配電設備等)上面花了很多錢。因此,對數(shù)據(jù)中心而言,獲得更多的電力和成本問題是兩個重要的變量。”
但也許數(shù)據(jù)中心面臨的更為迫切的需要是冷卻:設備每消耗一瓦的電力,就會產(chǎn)生一瓦的余熱,必須除去,以保持數(shù)據(jù)中心所需的操作溫度。這也是數(shù)據(jù)中心最初不打算將設備安置為更高密度所希望規(guī)避的最大的挑戰(zhàn)。“當你數(shù)據(jù)中心機架層面的密度增加,服務器必然會生成更多的熱量,因此更多的冷卻也是必需的。”庫格林說。“冷卻基礎(chǔ)設施是非常昂貴的,但最大的挑戰(zhàn)可能來自于試圖改造舊的數(shù)據(jù)中心。大多數(shù)這些舊的數(shù)據(jù)中心建設初期屋頂設得都很低,在許多情況下,實在沒有簡單的方法來提高密度。除了拆毀之外幾乎沒有什么方法,但這對于數(shù)據(jù)中心而言是非常難的,特別是當其還托管著某些客戶的時候。”
不幸的是,對于傳統(tǒng)的數(shù)據(jù)中心企業(yè)而言,將其數(shù)據(jù)中心改造成具備更高密度的數(shù)據(jù)中心意味著除了等待半導體摩爾定律帶來的改進之外,其數(shù)據(jù)中心的設施沒有多大實際潛力能夠繼續(xù)擴大計算能力了。但是,這種方法需要購買新的IT設備,更好的工藝技術(shù),以及摩爾定律的不斷進步,才能實現(xiàn)更高的效率,而這可能需要十年左右的時間。庫格林指出,在這種情況下,“主機托管提供商只能簡單地使用‘分散負載’,或迫使客戶來跨半機架來使用他們的基礎(chǔ)設施。但是,這顯然是不可持續(xù)的,他們最終將隨著客戶服務器的刷新,耗盡他們的空間、電力、冷卻資源。”
整合基礎(chǔ)設施驅(qū)動更大的功率密度
向更高的密度的推進可以歸納為長期的基礎(chǔ)設施整合:基本上,將更多計算機資源打包到更小體積,可以通過數(shù)據(jù)中心現(xiàn)有的趨勢來實現(xiàn),如采用虛擬化技術(shù)、刀片服務器和微服務器。整合基礎(chǔ)設施“對于數(shù)據(jù)中心的運營效率有著非常積極的作用。”庫格林說,“因為IT部署的物理尺寸較小,IT經(jīng)理管理的權(quán)限更有限,而當服務器的數(shù)量減少了30-50%時,帶給總功率的節(jié)約才會更有意義。”
這種方法旨在通過提升機架層面的電力,降低數(shù)據(jù)中心的總功率(其具有雙重的好處,因為其同時也降低了冷卻要求)。“其實,每一臺服務器的電力需求大大增加,但總體而言,總功率是可以下降的,因為所需要的服務器數(shù)量更少了。這便是高密度數(shù)據(jù)中心為何變得如此重要的原因了,他們是讓一切基礎(chǔ)設施得以整合的關(guān)鍵。今天的服務器可以輕松地實現(xiàn)每臺機架單元達到500瓦到1千瓦!”
高密度帶來的散熱問題
當然,通過高密度可以帶來更高的效率,每臺機架均安置了盡可能多的設備,從而幫助數(shù)據(jù)中心實現(xiàn)盡可能的節(jié)省成本、占地空間和解決管理難題。但好東西都是需要權(quán)衡的:在這種情況下,會造成冷卻問題。低密度部署通常是采用空氣冷卻,并且,在大部分地區(qū),都是采用免費的室外空氣冷卻的方法。但隨著數(shù)據(jù)中心功率密度的上升,空氣冷卻變得令人望而卻步,而且會變得造價昂貴。
較之均勻分布的直接冷卻源,產(chǎn)熱的解決方案更類似于提供點源:產(chǎn)熱的究竟是由于機架、服務器、甚至處理器的級別。“服務器芯片級的處理能力似乎在持續(xù)增加,但在某些時候,他們將需要內(nèi)部冷卻,立即在服務器附近實施冷卻,以防止產(chǎn)生的熱量增加太多。”因此僅僅對一個點采用空氣冷卻可能仍然不夠,需要采用水資源(或其它液體)提供更大的冷卻能力,但是,這需要犧牲掉一部分的基礎(chǔ)設施交付能力,提升執(zhí)行上也存在一定的困難,如實現(xiàn)冷卻水與設備電子元件的嚴格隔離。
部署一個基于水的冷卻方案可能會導致某些問題,特別是對于老舊的數(shù)據(jù)中心而言尤其如此,必須改造現(xiàn)有的基礎(chǔ)設施。但對于那些能夠支持不斷增長的功率密度的新設施而言,水冷卻的方案能夠?qū)⒗鋮s能力輸送到任何需要的地方,而不是僅僅試圖讓整個房間保持足夠低的溫度,以確保服務器空間整體運行溫度。諸如熱通道/冷通道的方案可以讓冷卻空氣有一些回旋的余地,但這種方案也有其局限性。最后,隨著數(shù)據(jù)中心高密度要求的不斷提升,浸泡技術(shù)可能會成為必要的技術(shù)?,F(xiàn)在已經(jīng)有一些公司在提供這方面的產(chǎn)品,包括不導電的流體,以及將冷卻液體輸入服務器機箱。
高密度的回報
對于客戶,無論他們是托管服務的客戶,或者就是數(shù)據(jù)中心運營商,高密度在在總擁有成本(TCO)方面能夠為他們提供重要且豐厚的利潤回報。庫格林說,“當一家公司可以整合其IT基礎(chǔ)設施到虛擬化的刀片服務器,其可以立馬節(jié)省20%至30%以上的經(jīng)營成本,以及每臺機架4-5千瓦的遺留部署。這在很大程度上是由于節(jié)省了每月機柜需要容納服務器所消耗的電力費用,以及降低了交叉連接和頂級機架交換機的成本。”對于托管服務客戶和數(shù)據(jù)中心運營商,這意味著進一步擴大了現(xiàn)有機架的可用空間,賣弄去了構(gòu)建新的數(shù)據(jù)中心的麻煩和費用,其收益絕不僅僅是直接的成本節(jié)約。
對于那些想要繼續(xù)保持其舊有的數(shù)據(jù)中心建筑或走托管路線的企業(yè)而言,隨著能源價格上漲和IT服務需求的增長,他們需要提高效率和節(jié)省地面和機架空間。因此,數(shù)據(jù)中心實施高密度功率是一大趨勢,但同時也是一項挑戰(zhàn):將更多的容量打包到機架需要建設相關(guān)的配電設備,備份基礎(chǔ)設施、冷卻能力也需要提供相關(guān)的部署支持,以保持管理操作溫度。雖然冷卻液的方法目前可能還不是一個較為普遍的趨勢,但隨著空氣冷卻方法在高密度環(huán)境開始逐漸變得不太實用和實惠,其會變得更加普遍。然而,無論從空氣冷卻過度到液體冷卻方法需要多久的時間,數(shù)據(jù)中心功率密度無疑將繼續(xù)攀升,因為企業(yè)都在試圖最大限度地利用自己的資源。