科技創(chuàng)新助力打造新一代綠色數(shù)據(jù)中心

責任編輯:editor005

作者:龍旭東

2014-12-31 23:05:30

摘自:比特網(wǎng)

綠色節(jié)能對于數(shù)據(jù)中心而言已經(jīng)不是一個錦上添花的議題,而是一個必須做好的課題,因為能源成本的占比正在不斷攀升。IT策略對能耗的影響是一個很大的話題,這里我們重點關注IT治理模式、應用部署、數(shù)據(jù)中心整合和應用軟件的優(yōu)化:

綠色節(jié)能對于數(shù)據(jù)中心而言已經(jīng)不是一個錦上添花的議題,而是一個必須做好的課題,因為能源成本的占比正在不斷攀升。根據(jù)美國環(huán)境保護署EPA的報告,在數(shù)據(jù)中心的運維成本之中,場地基礎設施的運維成本于2004年開始超越服務器的購買和運維成本,能源成本則于2008年開始超越服務器的購買和運維成本。對于企業(yè)自用的數(shù)據(jù)中心而言,綠色節(jié)能意味著大量成本的節(jié)省(視規(guī)模的不同,大型數(shù)據(jù)中心的整體PUE值每下降0.1意味著每年電費可以降低數(shù)十萬元到上千萬元人民幣);而對向外出租運營的數(shù)據(jù)中心而言,綠色節(jié)能則直接關系到自己的市場競爭力和盈利水平。

數(shù)據(jù)中心的綠色節(jié)能從何入手呢?答案是越早越節(jié)能!越早期做出的策略性規(guī)劃越能夠更大幅度地節(jié)能。下面我們就來重點討論前三個階段——IT策略(ITStrategy)、數(shù)據(jù)中心策略(Data CenterStrategy)、數(shù)據(jù)中心設備和系統(tǒng)設計(IT Equipment, Power,Cooling)——中的各種策略規(guī)劃和節(jié)能技術在綠色數(shù)據(jù)中心上的應用。

IT策略(ITStrategy)

IT策略對能耗的影響是一個很大的話題,這里我們重點關注IT治理模式、應用部署、數(shù)據(jù)中心整合和應用軟件的優(yōu)化:

IT治理模式

統(tǒng)一的IT治理模式更加節(jié)能。一個企業(yè)總有其從小到大的發(fā)展歷程,在規(guī)模較小的時候,分散的IT治理模式是最天然的選擇,也最能夠快速有效地響應業(yè)務的需求。等到企業(yè)發(fā)展到一定的規(guī)模之后就會發(fā)現(xiàn)其諸多弊端,其中與能耗相關的是數(shù)量眾多、運維水平低下的小型數(shù)據(jù)中心,這些數(shù)據(jù)中心因為規(guī)模小,適用的設計技術受到限制(如采用高能耗的風冷而不是更節(jié)能的水冷、處于辦公環(huán)境只能與辦公大樓共用空調系統(tǒng)等),管理水平也難以有效提升,導致數(shù)據(jù)中心整體能耗高居不下。另外,分散的IT治理模式還會導致IT部署和采購模式的不一致,體現(xiàn)在數(shù)據(jù)中心里規(guī)格型號多樣的IT設備,這些設備有著不同的功率密度,會導致這些設備在數(shù)據(jù)中心中的部署密度偏低,其總體擁有成本(TCO)會高于高密度的部署。目前中國互聯(lián)網(wǎng)行業(yè)的幾大巨頭都采用統(tǒng)一的IT設備采購模式,IT設備標準化工作做得很好,因而他們的數(shù)據(jù)中心能夠采用更高的部署密度(一般在7KW/機柜或更高),節(jié)能效果也走在了其他行業(yè)之前。

應用部署

整合應用,并采用虛擬化和云計算的方式進行部署更加節(jié)能。業(yè)界研究表明,在業(yè)務處理量一定的前提下,采用少量的高性能設備(高負載)進行業(yè)務處理,會比采用數(shù)量眾多的低性能設備(低負載)大幅度節(jié)能。目前業(yè)界已經(jīng)有諸多實踐的虛擬化和云計算的部署方式就能夠享受到節(jié)能的好處,節(jié)能的幅度因場景而不同,常見的節(jié)能幅度一般會超過20%。并非所有的應用都能夠有效地運行在一臺物理機器上,對某些應用需要事先進行改造才能夠做應用整合。

數(shù)據(jù)中心整合

整合的數(shù)據(jù)中心部署更加節(jié)能。前面提到,分散的IT治理模式會導致數(shù)量眾多的高能耗小型數(shù)據(jù)中心,在進行有效地IT架構變革之后,業(yè)界的實踐一般采用數(shù)據(jù)中心整合的方式,將多個小數(shù)據(jù)中心集中起來,常見的數(shù)據(jù)中心整體部署模式有兩地三中心、兩地兩中心等。集中后的數(shù)據(jù)中心有規(guī)模效應,能夠采用更節(jié)能的技術進行設計,能夠組建成規(guī)模的、更專業(yè)的運維團隊,進而大幅度降低數(shù)據(jù)中心整體能耗,更能降低IT的總體擁有成本(TCO)。

應用軟件的優(yōu)化

劣質應用軟件對能源的消耗異常驚人。中國惠普公司在成立后的近30年中,經(jīng)歷過諸多行業(yè)的大集中項目及其配套的應用升級、改造、優(yōu)化工作,在最顯著的一個案例之中,優(yōu)化前后應用軟件的性能竟然相差百倍,大家可以想象優(yōu)化前后系統(tǒng)能耗上的差異。

優(yōu)化應用軟件性能是建設數(shù)據(jù)中心綠色的源頭,它能帶來的好處包括更小規(guī)模的硬件數(shù)量和更短的系統(tǒng)峰值時間,進而帶來更低的能耗。

HP公司自己的IT變革案例很好地體現(xiàn)了上述關注點,HP將遍布全球的85個數(shù)據(jù)中心整合為6個全球性數(shù)據(jù)中心,大幅度降低了IT的總體擁有成本,HP全球數(shù)據(jù)中心整合后獲得的收益數(shù)據(jù)如下。

數(shù)據(jù)中心策略(Data Center Strategy)

在數(shù)據(jù)中心策略層面,下列因素與數(shù)據(jù)中心能耗密切相關:

首先,選址。只要有可能,盡量將數(shù)據(jù)中心選擇在低溫干燥的地理區(qū)域,這樣會讓數(shù)據(jù)中心的設計人員有更大的節(jié)能設計余地。

其次,數(shù)據(jù)中心等級建設。HP數(shù)據(jù)中心服務部做過評估,對于一個IT運維能力和場地設施運維能力都很強的成熟客戶,在特定應用場景下,建設兩個Tier2等級的數(shù)據(jù)中心比建設一個Tier4的數(shù)據(jù)中有著更高的綜合可靠性和相似甚至略低的建設成本。隨著更多軟件冗余技術(如云計算、虛擬化)的成熟和應用,人們開始重新評估場地設施的級別,低級別的數(shù)據(jù)中心因系統(tǒng)冗余少,有著更高的系統(tǒng)利用率,也意味著更低的能耗。實際的案例包括,原來主流數(shù)據(jù)中心采用T3/T4級別的eBay和Yahoo,已經(jīng)把大部分應用部署在Tier1甚至更低等級的數(shù)據(jù)中心,只有核心數(shù)據(jù)庫和核心網(wǎng)絡繼續(xù)留在高級別數(shù)據(jù)中心里。

第三,分期規(guī)劃。數(shù)據(jù)中心的建筑屬于不動產之列,一旦建成難于擴展,因此現(xiàn)代的數(shù)據(jù)中心需要做好規(guī)模規(guī)劃,一般企業(yè)數(shù)據(jù)中心會預留10年以上的發(fā)展規(guī)模。這意味著機電系統(tǒng)需要進行分期建設,找到一個合適的容量進行機電設備的實施,使得IT設備在合理的時間內達到較高的負載進而提升機電系統(tǒng)的利用率,達到節(jié)能的目的。需要注意的是,數(shù)據(jù)中心機電系統(tǒng)的實施也屬于“動土”范疇,分期建設的規(guī)劃還是需要考慮適當?shù)姆€(wěn)定運行期,不要“不間斷地動土”,需要為分期規(guī)模找到平衡點。

第四,機柜部署密度。前面提到,在業(yè)務處理能力一定的情況下,高密度機柜部署會更節(jié)能,TCO也更低。高密度部署的前提是IT設備標準化。

在數(shù)據(jù)中心設備和系統(tǒng)設計層面,下列因素與數(shù)據(jù)中心能耗密切相關。一個是氣流組織。氣流組織的好壞會大幅度影響能耗,應當進行機柜的冷熱通道隔離,必要時作封閉處理。優(yōu)良的氣流組織設計目前已經(jīng)落實到大部分新建的數(shù)據(jù)中心,但一些老舊機房這方面的問題依然嚴重。另外一個是,高壓直流。相比于交流系統(tǒng),高壓直流系統(tǒng)具有能源效率高、能耗低、系統(tǒng)簡單、穩(wěn)定可靠等特點。目前在數(shù)據(jù)中心行業(yè)的實踐當中,高壓直流的應用主要在于電氣系統(tǒng)的末端(接入服務器一端)。高壓直流系統(tǒng)目前處于大規(guī)模應用的前期階段,其設備對比直流系統(tǒng)也暫時不具備成本優(yōu)勢?;蛟S高壓直流系統(tǒng)最大的好處在于系統(tǒng)的簡單和穩(wěn)定,以往交流數(shù)據(jù)中心的設備故障之中UPS和電池的故障高居榜首,直流系統(tǒng)則可以讓你大幅度減少這些煩惱。至于高壓直流的具體節(jié)能數(shù)據(jù),不同的廠商尚有分歧。下圖是HP公司內部的一個工作小組聯(lián)合業(yè)界部分電氣系統(tǒng)廠商做的一次評測結果,其數(shù)據(jù)不一定具有普遍適用性,僅供參考。注意其中僅在末端系統(tǒng)(Rack-level)采用高壓直流和整個場地全部電氣系統(tǒng)(Facility-level)都采用高壓直流的大幅能耗差異。

值得一提的是,HP公司已經(jīng)于2014年正式推出直流服務器,到2014年底,直流IT設備將覆蓋主要高低端的服務器、存儲和網(wǎng)絡設備。主流IT設備廠商也有類似的直流產品計劃。

還有空調系統(tǒng)技術,采用先進的空調系統(tǒng)技術進行數(shù)據(jù)中心的設計是數(shù)據(jù)中心場地基礎設施節(jié)能的核心。在較高的服務器進風溫度前提下(在ASHRAE建議的服務器進風溫度上限27℃,現(xiàn)代服務器都能夠保持良好的運行狀態(tài)),對于新建的大中型數(shù)據(jù)中心,我們推薦前端采用高溫冷凍水系統(tǒng),使得冷凍水送回水溫度得以較傳統(tǒng)設計大幅度提高,達到17到23℃,這樣使得可使用自然冷卻的時間大為延長,也使得這一方案能夠適用于我國絕大多數(shù)地理區(qū)域。

對于末端系統(tǒng)而言,如下圖所示,越接近熱源的末端空調方式是越節(jié)能的方式。我們推薦末端系統(tǒng)采用接近機柜的水冷技術(審慎的行業(yè)和單位慎用),目前可落地的方案包括水冷背板方案(RDHX)和頂置式對流制冷方案(OCC),由于OCC方案具有更少的物理接頭(意味著更高的可靠性)、更低的造價、更好的冗余部署方式(N+1,2N等),我們認為OCC是更好的方案。

控制系統(tǒng)也很重要。數(shù)據(jù)中心的控制系統(tǒng)(Building ManagementSystem,BMS,也稱為“樓控系統(tǒng)”),是數(shù)據(jù)中心利用自然冷卻節(jié)能的重要部分,BMS是空調系統(tǒng)進行自動加機減機、平穩(wěn)地在各種空調運行模式間切換、實現(xiàn)故障組件的替代的重要系統(tǒng)。BMS系統(tǒng)缺失或手動的BMS系統(tǒng)會導致作為過渡季節(jié)的春秋季,空調系統(tǒng)進行部分自然冷卻期間,無法有效地加機減機、調整運行工況達到節(jié)能目的,其原因是運維人員手工操作太繁瑣,干脆讓空調系統(tǒng)全負荷運行(對運維人員而言這樣也更“安全”),這意味著成百上千小時的部分自然冷卻時間被浪費。

就新建數(shù)據(jù)中心而言,這可能目前國內數(shù)據(jù)中心與國外相比差距最大的地方。目前國內新建數(shù)據(jù)中心在控制系統(tǒng)上還是走傳統(tǒng)路線,采用樓控廠商的商用或辦公樓宇設計方案,存在不少單點故障,控制系統(tǒng)的可用性級別低于數(shù)據(jù)中心級別,其實這樣的數(shù)據(jù)中心無法獲得高級別等級認證。更要命的是,樓控廠商不了解數(shù)據(jù)中心的工作需求(業(yè)主方也不了解),系統(tǒng)都號稱可編程,但是因為沒有人說得清楚編程需求,于是“可編程”變成了“沒編程”,業(yè)主最終花了自動系統(tǒng)的錢,得到的是一個手動系統(tǒng),這樣的現(xiàn)象可以說遍地都是。HP公司在數(shù)據(jù)中心控制系統(tǒng)上有著超強的技術實力和超過30年的經(jīng)驗(來自美國EYP),愿為解決國內數(shù)據(jù)中心市場上最后的一塊大的技術堡壘做出應有的貢獻。

綜上所述,綜合采用了高壓直流系統(tǒng)、冷/熱通道封閉、高溫冷凍水前端、OCC末端、優(yōu)秀的控制系統(tǒng)之后,HP公司在炎熱的印度的一個實際數(shù)據(jù)中心案例中,全數(shù)據(jù)中心的綜合PUE達到了1.4以下。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號