摘要:插座交換開關(guān)和插座級(jí)的功率測量對(duì)于現(xiàn)代數(shù)據(jù)中心的設(shè)備、增長和效率的完整管理目標(biāo)是至關(guān)重要的。
插座交換開關(guān)和插座級(jí)的功率測量對(duì)于現(xiàn)代數(shù)據(jù)中心的設(shè)備、增長和效率的完整管理目標(biāo)是至關(guān)重要的。多年來,在數(shù)據(jù)中心業(yè)界一直流傳著這樣一條準(zhǔn)則:您數(shù)據(jù)中心無法對(duì)不能測量的設(shè)施實(shí)施任何改善。盡管數(shù)據(jù)中心的操作運(yùn)營人員們能夠基于他們過去的經(jīng)驗(yàn)總結(jié),而進(jìn)行一些標(biāo)準(zhǔn)化的設(shè)備升級(jí);或可能實(shí)施偶然性的改進(jìn),但如若沒有對(duì)IT設(shè)備的詳細(xì)測量,以及對(duì)于分配系統(tǒng)的每個(gè)級(jí)別的功率控制,則不可能實(shí)施持續(xù)性的改進(jìn)。管理對(duì)數(shù)據(jù)中心設(shè)備的部署和使用,并隨著時(shí)間的推移,在設(shè)備達(dá)到其使用壽命期間時(shí)進(jìn)行報(bào)廢處置屬于數(shù)據(jù)中心的日常運(yùn)營活動(dòng)。而通過機(jī)架密度意識(shí)、容量規(guī)劃和正常運(yùn)營維護(hù)來了解數(shù)據(jù)中心業(yè)務(wù)的增長,將繼續(xù)成為數(shù)據(jù)中心管理人員們所面臨的主要挑戰(zhàn)。而隨著經(jīng)濟(jì)大環(huán)境的緊縮、市場競爭在未來十年還將進(jìn)一步加劇,故而效率分析只會(huì)變得更加關(guān)鍵。在本文中,我們將特別向廣大讀者諸君提出:具備插座交換開關(guān)和插座級(jí)功率測量功能的機(jī)架PDU是現(xiàn)代數(shù)據(jù)中心所必備的。
管理IT設(shè)備
業(yè)務(wù)所依賴的、托管在數(shù)據(jù)中心中的IT設(shè)備是安裝在機(jī)柜或機(jī)架中的網(wǎng)絡(luò)、計(jì)算和存儲(chǔ)設(shè)備。這些設(shè)備具有由它們各自的使用目的而分別定義的有限的使用壽命周期,并且必須被妥善管理。不僅僅是在其操作運(yùn)營期間注重對(duì)它們的管理,而是要從其部署到最終報(bào)廢的整個(gè)使用壽命期間對(duì)于它們的所有使用壽命周期進(jìn)行跟蹤。此外,管理一款設(shè)備包括隨著時(shí)間的推移對(duì)于相關(guān)設(shè)備的功耗成本會(huì)超過其所給企業(yè)業(yè)務(wù)帶來的功能價(jià)值的理解。換句話說,數(shù)據(jù)中心管理人員們重要的是應(yīng)該基于設(shè)備所消費(fèi)的每瓦特的能耗所帶來的性能,而準(zhǔn)確的知道什么時(shí)候應(yīng)該更新到更高效的設(shè)備,來替換舊的設(shè)備。由于能夠從相關(guān)財(cái)務(wù)負(fù)責(zé)部門看到數(shù)據(jù)中心的電力成本費(fèi)用,因此,及時(shí)報(bào)廢淘汰這些舊的設(shè)備也有助于數(shù)據(jù)中心提高效率。
鎖定和部署
關(guān)于在中型和大型數(shù)據(jù)中心環(huán)境中部署新的IT設(shè)備的一個(gè)難題是回答三個(gè)關(guān)于“在何處?”的問題。這三個(gè)“在何處?”的大問題與支持這些新設(shè)備所需的功率、空間和冷卻有關(guān)。相當(dāng)一部分的設(shè)備將被簡單地安裝在其所適合的位置,然后記錄下來以便進(jìn)行追蹤。當(dāng)設(shè)備的正常運(yùn)行和效率被認(rèn)為是非常重要的時(shí)候,這是一種有風(fēng)險(xiǎn)的部署方法。事實(shí)上,數(shù)據(jù)中心管理人員不僅需要識(shí)別新的IT設(shè)備適合安置在何處,而且還應(yīng)當(dāng)確定哪臺(tái)機(jī)架能夠在正常運(yùn)營和效率方面以正確的相位為之提供恰當(dāng)?shù)目捎霉β剩@是至關(guān)重要的。能夠顯示機(jī)柜電源使用情況和溫度的趨勢工具(例如,去年的趨勢情況)可以幫助數(shù)據(jù)中心管理人員們確定基于最壞的情況條件在機(jī)柜內(nèi)安裝更多的設(shè)備是否安全。管理這方面的方法之一是“鎖定”未使用的插座。換句話說,在沒有安裝設(shè)備時(shí),請(qǐng)關(guān)閉交換機(jī)架PDU的插座。然后在所安裝的新設(shè)備進(jìn)行生產(chǎn)作業(yè)單時(shí),按照計(jì)劃將電力供應(yīng)給適當(dāng)?shù)牟遄?。下圖1顯示了插座控制操作的一般通用GUI界面。許多PDU還具有用于執(zhí)行相同操作的命令行界面和SNMP訪問。諸如Server Technology公司所提供的Sentry電源管理器(SPM)等電源管理軟件可以調(diào)度插座控制的任務(wù)以便提供與票證部署(ticketed deployment)一致的手段。
圖1:通過Server Technology公司所提供的PRO2機(jī)架PDU,從一個(gè)網(wǎng)絡(luò)訪問進(jìn)行插座控制
跟蹤
不管簡單與否,識(shí)別所安裝的設(shè)備的任務(wù)通常歸結(jié)為在資產(chǎn)管理系統(tǒng)中對(duì)每款設(shè)備進(jìn)行命名,并提供關(guān)于機(jī)架名稱、機(jī)架中的RU插槽和用于電源的機(jī)架PDU插座等相關(guān)信息。所以,以這種方式識(shí)別設(shè)備并提供“鎖定”交換開關(guān)控制的一款軟件包應(yīng)該是一款數(shù)據(jù)中心管理器的打包。下圖2顯示了Server Technology公司的SPM中的機(jī)柜設(shè)備頁面。通過配置每款部署設(shè)備的基本特性,如名稱、RU位置、規(guī)模大小和使用的插座,數(shù)據(jù)中心管理人員可以輕松管理部署。
Bill-back
對(duì)于企業(yè)組織中的各個(gè)部門而言,特定IT設(shè)備的電力使用情況的“bill-back” ,或至少“show-back”一直是一種緩慢增長的趨勢(許多人會(huì)認(rèn)為“太慢了”)。但這不僅帶來了更好的預(yù)算分配,而且還通過強(qiáng)制業(yè)務(wù)部門考慮每臺(tái)設(shè)備的價(jià)值,而不是通過囤積服務(wù)器或存儲(chǔ),來提高效率。國際正常運(yùn)行時(shí)間協(xié)會(huì)(Uptime Institute)一直是積極推廣“bill-back”模式的領(lǐng)導(dǎo)者,并在其《IT Chargeback推動(dòng)效率提升》一文中提供了一個(gè)很好的證據(jù)。為了在實(shí)踐中執(zhí)行“bill-back”或“show-back”,一家數(shù)據(jù)中心必須首先具有從能量消耗設(shè)備收集數(shù)據(jù)的能量管理系統(tǒng)。下圖3顯示了Server Technology公司的SPM通過位置所提取的標(biāo)準(zhǔn)能源成本報(bào)告。類似的報(bào)告還允許業(yè)務(wù)部門監(jiān)控一組散布在世界各地的多個(gè)位置的機(jī)柜。如有必要,同樣的軟件還可以監(jiān)測每款設(shè)備的插座級(jí)別能量消耗情況。
圖2:Server Technology公司的SPM中的機(jī)柜設(shè)備選項(xiàng)卡
圖3:Server Technology公司的SPM中的能源成本報(bào)告
管理增長
如果只需考慮數(shù)據(jù)中心的總體規(guī)?;驍?shù)據(jù)中心的能耗總數(shù),就很容易考慮到增長。這并不是說,對(duì)于某家特定數(shù)據(jù)中心的總能耗為1.5兆瓦的理解是沒有意義的。事實(shí)上,在其能源利用率方面了解數(shù)據(jù)中心是至關(guān)重要的。關(guān)鍵在于,當(dāng)談到數(shù)據(jù)中心的增長時(shí),人們不能放棄對(duì)于在IT設(shè)備級(jí)別所發(fā)生的任務(wù)的理解。考慮數(shù)據(jù)中心的所有增長因素,包括密度、容量、以及正常運(yùn)行時(shí)間,對(duì)于數(shù)據(jù)中心的管理而言是至關(guān)重要的。而這一切都要從機(jī)架中的設(shè)備和其電源使用情況開始。隨著時(shí)間的推移,充分了解機(jī)架內(nèi)的電源使用情況,將有助于發(fā)現(xiàn)滯留容量能力,以便在已有資源內(nèi)優(yōu)化增長。
密度
在Server Technology公司所推出的《管理不同數(shù)據(jù)中心機(jī)架密度(Managing Variable Data Center Rack Densities)》一文中,這種情況是為了在數(shù)據(jù)中心的整個(gè)生命周期內(nèi)規(guī)劃機(jī)架內(nèi)IT設(shè)備的密度。我們可以通過每臺(tái)機(jī)架中的特定設(shè)備在數(shù)據(jù)中心中的功率使用的總體密度中所占據(jù)主導(dǎo)地位的程度來進(jìn)一步加深這一認(rèn)識(shí)。數(shù)據(jù)中心的增長不一定需要部署新的設(shè)備。下圖4提供了在既定的特定電源電路下,關(guān)于服務(wù)器利用率計(jì)劃如何影響可以部署到特定機(jī)架中的服務(wù)器的數(shù)量的示例。在這種情況下,可以部署28臺(tái)利用率為30%的服務(wù)器,或者部署19臺(tái)可以達(dá)到80%的利用率的服務(wù)器。在該示例中,數(shù)據(jù)中心的增長涉及將應(yīng)用程序添加到現(xiàn)有設(shè)備,以便增加利用率。即使部署的服務(wù)器數(shù)量下降了約30%,每瓦能耗的性能也增加了80%。
圖4:每臺(tái)服務(wù)器的能耗和每臺(tái)機(jī)架的vs.CPU使用情況 - 30A 三相208V電路,來源:Server Technology公司《管理不同數(shù)據(jù)中心機(jī)架密度》
通過在機(jī)架PDU處測量的每個(gè)插座的功率,可以看出該效果的細(xì)節(jié)。我們可以說,這種機(jī)架具有更高的功率密度,但卻是較低的物理設(shè)備密度。另一方面,新設(shè)備部署所增加的物理密度,可能會(huì)也可能不會(huì)增加機(jī)架中的總功率。這些設(shè)備趨勢導(dǎo)致了具備更多插座的更高功率的機(jī)架PDU被安裝到更高的機(jī)架。
容量規(guī)劃
與為數(shù)據(jù)中心電力使用的增長進(jìn)行規(guī)劃相比,容量規(guī)劃在電力供應(yīng)鏈的各個(gè)層面都至關(guān)重要;然而,如果數(shù)據(jù)中心的設(shè)計(jì)充分實(shí)現(xiàn)了,則可以基于每個(gè)IT設(shè)備的測量來預(yù)測機(jī)架級(jí)的容量。下圖5顯示了對(duì)于機(jī)柜總功率的預(yù)測趨勢。在這種情況下,簡單地增加安裝設(shè)備的利用率會(huì)導(dǎo)致功率使用增加的趨勢。在包括安裝附加設(shè)備的增長趨勢中可以看到更明顯的階梯式變化。無論采用哪種方式,都可以設(shè)置容量的限制閾值,以允許基于未來可能的條件發(fā)出警報(bào)。這會(huì)帶來關(guān)于機(jī)柜何時(shí)將耗盡功率或超過溫度閾值的實(shí)際預(yù)測。
為了基于機(jī)柜內(nèi)的實(shí)際利用情況來補(bǔ)充這種預(yù)測趨勢,數(shù)據(jù)中心管理人員們可以使用現(xiàn)有機(jī)柜設(shè)備的插座功率測量來幫助涉及補(bǔ)充類似設(shè)備的“假設(shè)”情況。Server Technology公司的POPS PDU便是能夠提供這種有價(jià)值的信息的一種方式。
圖5:Server Technology公司的SPM預(yù)測功率趨勢
正常運(yùn)行
無論企業(yè)數(shù)據(jù)中心正常運(yùn)行的標(biāo)準(zhǔn)到底如何,很少有企業(yè)會(huì)僅僅只是因?yàn)樵鲩L太過突然就允許簡單的降低正常運(yùn)行水平的。網(wǎng)絡(luò)可訪問的插座控制減少了重新啟動(dòng)鎖定設(shè)備的響應(yīng)時(shí)間,特別是對(duì)于遠(yuǎn)程站點(diǎn)而言。在恢復(fù)了失去的功率之后,插座功率的分段排序?qū)⒂兄诜乐估擞恳痤~外的停機(jī)中斷。當(dāng)然,了解單個(gè)配電設(shè)備隨著時(shí)間的推移的功耗情況有助于衡量冗余,以保持較高的正常運(yùn)行水平。下圖6顯示了SPM的機(jī)柜內(nèi)的功率使用的細(xì)節(jié)。在這種情況下,功率使用連續(xù)地在機(jī)架PDU電路的安全等級(jí)閾值的上下反彈。沒有斷路器會(huì)損害一個(gè)電源,但安全合規(guī)性可能會(huì)受到損害。如圖6的左下角的條形圖所示:雖然“A”(最左邊的黃色條)和“B”(中間黃色條)電源上的單個(gè)PDU符合均安全規(guī)范,但是在一個(gè)電源損失的“假設(shè)”情況下(最右邊的黃色條)表明其必須在電力允許范圍內(nèi)恢復(fù)正常功能。
圖6:執(zhí)行冗余檢查的機(jī)柜頁面
管理效率
數(shù)據(jù)中心的效率是關(guān)乎到“綠色環(huán)保”,并甚至關(guān)乎到您的錢包的事項(xiàng)。提高效率的最重要的出發(fā)點(diǎn)是為了省錢。IT設(shè)備電力供應(yīng)級(jí)別降低有助于數(shù)據(jù)中心從整體上降低功率和冷卻要求。這不僅是從基本的kW-h成本的角度,而且還包括設(shè)備部署時(shí)的資本支出和持續(xù)增長的角度。眾多介紹了管理數(shù)據(jù)中心效率的重要性的文章之一是:DatacenterDynamics網(wǎng)站所發(fā)表了《現(xiàn)實(shí):數(shù)據(jù)中心電源使用已然失控(The truth is: data center power is out of control )》。在該文章中,作者指出,效率的提高將增加需求,使總體消費(fèi)實(shí)際上增加。在數(shù)據(jù)中心,這意味著無論效率如何提高,功率使用都將增加。有人可能認(rèn)為這是無視效率提升倡議的論據(jù),但事實(shí)上這將是一個(gè)嚴(yán)重的錯(cuò)誤。隨著時(shí)間的推移,數(shù)據(jù)中心的效率將變得越來越重要,因?yàn)槠渌偁幮缘钠髽I(yè)組織將變得更有效率??紤]到這一點(diǎn),根據(jù)數(shù)據(jù)中心中的特殊重點(diǎn),管理效率將采取幾種形式。在機(jī)架式IT設(shè)備領(lǐng)域,包括選擇電力供應(yīng)和正確利用IT資源。同時(shí),一些簡單易行的措施包括在下班時(shí)間或設(shè)備不被使用時(shí)將其斷電關(guān)閉。
電源供應(yīng)
在IT設(shè)備電源供應(yīng)水平上管理效率有兩種形式。首先,用電源輸出除以電源輸入,這是效率的技術(shù)定義。但由于電源效率接近95%,這可以說是一個(gè)微不足道的討論。第二個(gè)方面是我們可以稱之為有效性。這與設(shè)備所消耗的功率比上執(zhí)行實(shí)際的工作任務(wù)所消耗的功率有關(guān)。綠色網(wǎng)格組織的DCeP(數(shù)據(jù)中心能源生產(chǎn)率)對(duì)于了解數(shù)據(jù)中心內(nèi)的有效性非常有用。在2014年3月13日關(guān)于協(xié)調(diào)數(shù)據(jù)中心能源效率全球衡量標(biāo)準(zhǔn)的備忘錄中,他們重申了他們的建議,即在IT負(fù)載中直接使用IT能源消耗來計(jì)算PUE。雖然許多服務(wù)器都有其收集電源性能數(shù)據(jù)的手段,但大多數(shù)其他類型的設(shè)備并沒有。這使得數(shù)據(jù)中心的管理人員們只有一個(gè)選擇——使用從機(jī)架PDU的插座級(jí)的監(jiān)控來獲取電力消耗和能耗情況。下圖7顯示了采用Server Technology公司的POPS PDU的插座能耗指標(biāo)情況。
圖7:Server Technology公司的SPM的能耗報(bào)告
減載/調(diào)度
在許多企業(yè)組織機(jī)構(gòu)中,完全供電的數(shù)據(jù)中心機(jī)架式IT設(shè)備并不需要24/7全天候的供電。在無人值守時(shí)間內(nèi)關(guān)閉部分或全部的設(shè)備容量能力是降低功耗和成本的最重要的方式。下圖8展示出了一個(gè)政府機(jī)構(gòu)參照此方法的結(jié)果,其將設(shè)備在不需要運(yùn)行的非工作時(shí)間關(guān)閉。結(jié)果顯示在任何一周內(nèi),其POC數(shù)據(jù)中心的電力使用量平均下降超過50%。
插座級(jí)的控制允許通過自動(dòng)化實(shí)現(xiàn)這樣的中斷過程的調(diào)度。很多機(jī)架PDU允許通過腳本或SNMP命令自動(dòng)訪問控制插座狀態(tài)。諸如SPM這樣的軟件包可以提供簡單的工具組以通過一個(gè)單一的調(diào)度任務(wù)實(shí)現(xiàn)一組插座控制命令,可以基于需求時(shí)間需要進(jìn)行復(fù)制。
圖8:插座控制調(diào)度所帶來的實(shí)際節(jié)省
僵尸服務(wù)器
盡管長期以來業(yè)界一直有關(guān)于“僵尸”服務(wù)器所造成浪費(fèi)的討論——“僵尸”服務(wù)器是那些仍然在使用但又尚未被充分使用的設(shè)備——但是它們對(duì)數(shù)據(jù)中心效率的影響幾乎沒有任何減少。自然資源保護(hù)委員會(huì)(NRDC)在其2014年8月發(fā)布的《數(shù)據(jù)中心效率評(píng)估(Data Center Efficiency Assessment )》中對(duì)“僵尸”或“昏迷”服務(wù)器提供了令人信服的評(píng)估。該報(bào)告指出了一個(gè)簡單的問題: “據(jù)我們所知,目前沒有IT經(jīng)理因?yàn)闆]有處置其數(shù)據(jù)中心的僵尸服務(wù)器兒被企業(yè)開除炒掉,”作者還指出,”刪除僵尸設(shè)備被證明是一個(gè)更具管理性的挑戰(zhàn),而不僅僅是一個(gè)純技術(shù)的問題。”我們同意:隨著時(shí)間的推移,對(duì)插座級(jí)別的測量可以讓數(shù)據(jù)中心管理人員分析這些設(shè)備是否是僅保持在空閑狀態(tài),并且決定其是否可以被關(guān)閉或重新啟動(dòng)。下圖9顯示了基于SPM的機(jī)柜設(shè)備的簡單趨勢。連續(xù)的低功耗使用顯然告訴了我們這款設(shè)備是一款“僵尸”的跡象。
圖9:SPM的機(jī)柜設(shè)備趨勢
總結(jié)
一款具備插座交換開關(guān)和插座級(jí)功率測量功能的智能機(jī)架PDU與功率和能耗管理軟件耦合的系統(tǒng)在現(xiàn)代數(shù)據(jù)中心中是必不可少的。而諸如Server Technology公司的SPM交換POPS PRO2系列PDU就滿足了這一需求。這些功能能夠幫助數(shù)據(jù)中心人員管理三個(gè)關(guān)鍵方面:在其整個(gè)生命周期的IT設(shè)備、數(shù)據(jù)中心機(jī)架內(nèi)的增長以及通過成本節(jié)約實(shí)現(xiàn)企業(yè)效率要求的競爭優(yōu)勢。