在可預(yù)見的將來,由于許多企業(yè)決定放棄擁有自己的數(shù)據(jù)中心,并將應(yīng)用程序遷移到云平臺,這些少數(shù)公司將會占據(jù)云計算市場的大部分增長。圖1顯示了2020年的超大規(guī)模數(shù)據(jù)中心的預(yù)計增長,以及預(yù)期在這些數(shù)據(jù)中心駐留的服務(wù)器的百分比。到2020年,預(yù)計大規(guī)??蛻魧捎盟惺鄢龅姆?wù)器的47%。對于諸如惠普和戴爾這樣的傳統(tǒng)硬件提供商來說,這種情況預(yù)示著更窄的客戶群,同時將擁有更高的技術(shù)敏銳度和更密切的關(guān)注底線。HPE和戴爾將看到他們?yōu)槌笠?guī)模客戶提供的服務(wù)器超過了“無名”白盒供應(yīng)商,并可以更好地提供客戶需要的產(chǎn)品。標準的服務(wù)器配置并不再適合所有客戶。越來越多的人將開放式計算作為一種降低成本和提高效率的途徑。
新的網(wǎng)絡(luò)拓撲將為超大規(guī)模數(shù)據(jù)中心的南北向流量和東西向流量帶來更高的帶寬。 Facebook公司已經(jīng)公開了基于商品交換機設(shè)計的規(guī)范,并向全世界展示了軟件定義網(wǎng)絡(luò)(SDN)和網(wǎng)絡(luò)功能虛擬化(NFV)的諸多優(yōu)勢。
對于超大規(guī)模數(shù)據(jù)中心運營商來說,電力輸送和冷卻新方法的創(chuàng)新使其設(shè)施中的機架功率密度得以提高,同時提高整體基礎(chǔ)設(shè)施的效率,從而產(chǎn)生極低的PUE。以下討論了電力基礎(chǔ)設(shè)施在使超大規(guī)模數(shù)據(jù)中心盡可能可靠和高效運行方面發(fā)揮的作用。
誰是超大規(guī)模廠商?
當今網(wǎng)絡(luò)上最強大的廠商名字是互聯(lián)網(wǎng)熱潮期間在20世紀80年代和90年代開始發(fā)展的超大規(guī)模廠商。微軟公司成功打造成了當今超過900億美元的龐然大物,其產(chǎn)品從全球數(shù)據(jù)中心足跡推動的操作系統(tǒng)和辦公軟件包轉(zhuǎn)向SaaS(Office 365)和PaaS(Azure)。亞馬遜公司于1994年開始從一家在線書商成為了一個價值1700億美元的電子商務(wù)巨頭,并且還成為全球規(guī)模最大的云計算服務(wù)提供商。
Facebook公司是全球最大的社交媒體企業(yè),在全球各地擁有眾多大型數(shù)據(jù)中心。阿里巴巴是中國規(guī)模最大的電子商務(wù)商,并且正在將其數(shù)據(jù)中心覆蓋范圍擴展到國外。谷歌在20世紀90年代開始時是從一個研究項目發(fā)展起來,并迅速成長為互聯(lián)網(wǎng)上最大的搜索提供商。該公司也依賴多個地區(qū)的海量數(shù)據(jù)中心來提供用戶在搜索網(wǎng)絡(luò)時所期望的快速性能。其他大型且快速增長的超大規(guī)模數(shù)據(jù)中心運營商還包括蘋果、騰訊、百度、eBay等。
大多數(shù)超大規(guī)模數(shù)據(jù)中心的建設(shè)者都擁有自己的基礎(chǔ)設(shè)施。超大規(guī)模數(shù)據(jù)中心運營商原本采用HPE、Dell EMC、思科等公司制造的硬件,如今轉(zhuǎn)向采用臺灣和中國ODM廠商(如廣達、英業(yè)達、富士康、超微、浪潮等)提供的低成本、專用定制和“開放式”計算和網(wǎng)絡(luò)解決方案。
功率密度和冷卻對超大規(guī)模設(shè)計的影響
在過去的幾十年中,數(shù)據(jù)中心行業(yè)的機架功率密度與計算和存儲密度相應(yīng)地增長。如今在單一機架中的服務(wù)器和硬盤比以往任何時候都要多。而一個典型的IT機架的軸功率為1-3千瓦,如今20到40千瓦的負載在單個機柜中也是常見的。美國國家可再生能源實驗室報告表明,每機架30千瓦的部署普遍存在。
谷歌公司的全球基礎(chǔ)設(shè)施負責人Joe Kava表示,該公司在2015年使用了5.7兆瓦的能源。其中數(shù)據(jù)中心的能耗占了絕大多數(shù),這也是谷歌公司為其云計算園區(qū)采購可再生能源獲得領(lǐng)先地位的原因。
基于英特爾、AMD、NVIDIA和ARM的最新芯片技術(shù)提供的新服務(wù)器每秒可提供更高的運算速度和每瓦操作性能。與此同時,數(shù)據(jù)中心房地產(chǎn)的成本在大多數(shù)市場上漲,導(dǎo)致運營商尋求更高的IT機柜來更有效地利用空間。有的運營商甚至采用一個裝滿IT設(shè)備的高大圓柱,但密集的部署將會產(chǎn)生大量散熱問題,數(shù)據(jù)中心架構(gòu)師必須采用空氣或水作為冷卻介質(zhì)。有一些數(shù)據(jù)中心設(shè)施同時部署這兩種冷卻方式。
高效的空氣冷卻措施需要遵守各種設(shè)計原則:
•更改設(shè)備的部署方向,以創(chuàng)建自然的熱通道和冷通道。
•在空置的機架空間使用盲板以確保冷空氣不會泄漏到熱通道中。
•實行熱通道或冷通道遏制。
•自然對流可以通過精心設(shè)計的設(shè)施流動空氣,冷空氣下沉到地板上,熱空氣上升到天花板。因此,對冷通道采用高架冷空氣設(shè)計,并在機架背面提升天花板或煙囪,以驅(qū)動空氣通過IT系統(tǒng)。
絕熱冷卻依賴于通過體積膨脹引起的氣壓變化來減少熱量的過程。在數(shù)據(jù)中心中使用絕熱過程以促進有效利用水和電的“自然冷卻”方法。
液體冷卻非常適合機柜功率和熱密度超過以合理速度流動的空氣的冷卻能力(高達幾百CFM)的應(yīng)用。液體冷卻有多種形式:冷卻門、冷凍擱板、直接噴霧冷卻到芯片上等等。 “在高性能計算領(lǐng)域,其制冷方案都將轉(zhuǎn)向液體冷卻。”Eurotech公司技術(shù)總監(jiān)Paul Arts說,“在我們的設(shè)想中,擴張是唯一的途徑。我們認為這是新一代高性能計算的開始,擁有巨大的力量。我們正處于革命的開始階段。”
最終,冷卻決策將取決于數(shù)據(jù)中心將運行的參數(shù):維護/維修的頻率、可用技術(shù)人員的數(shù)量、維修的允許時間、期望的功率效率水平等等。
推動超大規(guī)模數(shù)據(jù)中心的未來需求
許多論文記錄了數(shù)據(jù)中心行業(yè)在21世紀初日益增長的電力需求。如果摩爾定律和服務(wù)器虛擬化對行業(yè)沒有幫助,電力需求的增長可能會超過美國總發(fā)電量的10%。相反,IT行業(yè)在監(jiān)管自身方面發(fā)揮了領(lǐng)導(dǎo)作用,使IT系統(tǒng)更加節(jié)能。英特爾公司和AMD公司致力于減少服務(wù)器芯片(CPU)的功耗,并且隨著每代CPU的產(chǎn)生,他們改進了每個周期的指令,并減少了每條指令的功率,同時保持在給定的功率范圍內(nèi)。
展望未來,許多超大規(guī)模數(shù)據(jù)中心運營商正致力于為其數(shù)據(jù)中心設(shè)施提供可再生能源。首先通過購買可再生能源證書和電力抵消(從當?shù)毓檬聵I(yè)購買水力發(fā)電等綠色能源的電能),現(xiàn)在許多超大規(guī)模數(shù)據(jù)中心都使用燃料電池或太陽能陣列的電能。蘋果公司和Facebook公司已經(jīng)有多個數(shù)據(jù)中心采用太陽能的電力。微軟公司在懷俄明州夏延擁有沼氣發(fā)電廠,并從Pilot Hill Wind購買風力發(fā)電,并在全球各地建設(shè)大量太陽能發(fā)電設(shè)施。亞馬遜公司在德克薩斯州建立了一個253兆瓦的風力發(fā)電場,而谷歌公司所有的數(shù)據(jù)中心在2017年全部采可再生能源。
“我們是全球最大的可再生能源企業(yè)購買者。”谷歌公司技術(shù)基礎(chǔ)設(shè)施高級副總裁Joe Kava說。
IT行業(yè)也有許多關(guān)于最適合超大規(guī)模數(shù)據(jù)中心的電力基礎(chǔ)設(shè)施的建議。在早期,F(xiàn)acebook公司的機架設(shè)備采用了480V/277V交流電源,而機架上IT負載采用12V 直流電源。谷歌公司提出了采用48V直流電為服務(wù)器供電,直接轉(zhuǎn)換負載點電源以48V運行到主板運行CPU、內(nèi)存等所需的工作電壓和電流。在谷歌公司實施的項目中,從電源到機架的電力為480/277的交流電(或400V/230V交流電),通過三相整流器將交流電轉(zhuǎn)換為直流電為機架設(shè)備供電。微軟公司最近的開放計算項目采用了480/277V 交流電源為機架設(shè)備供電,而服務(wù)器采用277V電源,服務(wù)器機箱中帶有兩個三相電源,并支持與機架服務(wù)器配套的基本(非智能)PDU。
對于那些尋求采用發(fā)電設(shè)備運行數(shù)據(jù)中心的公司來說,在現(xiàn)場生產(chǎn)直流電源并將其輸送到機架上是很有意義的。在這種情況下,將380V直流電源引入機架,并通過DC-DC轉(zhuǎn)換器轉(zhuǎn)換到48V是一種選擇?;蛘呱踔量梢詫?8V直流電源輸入到機架上,這取決于與電源的距離。
每個數(shù)據(jù)中心都是為了實現(xiàn)功能、等待時間、正常運行時間、成本和價值目標而構(gòu)建的。電力傳輸基礎(chǔ)設(shè)施的選擇與這些目標密切相關(guān),并由數(shù)據(jù)中心運行的軟件棧的穩(wěn)健性和靈活性所緩解。未來的超大規(guī)模數(shù)據(jù)中心可能會從虛擬機遷移到容器,并提供“無服務(wù)器”計算模式。而人們有關(guān)數(shù)據(jù)中心采用交流電源和直流電源的爭論將會持續(xù)下去,而部署機架上的燃料電池等新技術(shù)也將越來越受歡迎,為數(shù)據(jù)中心業(yè)主和運營商提供可再生能源以支持超大規(guī)模數(shù)據(jù)中心將成為一種強制性要求。人們需要了解有關(guān)超大規(guī)模計算的更多信息。