DCIM部署的挑戰(zhàn)

責任編輯:editor005

2015-07-08 13:35:34

摘自:機房360

本系列文章的前三部分盡管對DCIM供應(yīng)商的承諾、企業(yè)的相關(guān)采購指南和企業(yè)用戶部署DCIM所能帶來的潛在利益進行了分析。至于要增加IT機架級能量 功率計量和環(huán)境監(jiān)測的能力,其提供了更靈活的選擇,其中一些如上所述具有潛在較小的破壞性。

本系列文章的前三部分盡管對DCIM供應(yīng)商的承諾、企業(yè)的相關(guān)采購指南和企業(yè)用戶部署DCIM所能帶來的潛在利益進行了分析。然而,雖然這一切可能在紙面上看上去很好,但在實際操作實施的過程中可能并如供應(yīng)商的銷售團隊所描述的那樣簡單。在現(xiàn)實情況下,企業(yè)用戶現(xiàn)有的設(shè)施,特別是那些較舊的設(shè)施的能源效率往往較低,也遠遠低于能源監(jiān)測水平。在這一部分文章中,我們將為大家介紹一些數(shù)據(jù)中心在改裝操作層面或?qū)⒚媾R的一些挑戰(zhàn),以及將DCIM系統(tǒng)合并到一個新的數(shù)據(jù)中心設(shè)計時的相關(guān)的注意事項。

  設(shè)施系統(tǒng)儀器儀表

幾乎所有的數(shù)據(jù)中心都有建筑樓宇管理系統(tǒng)(BMS)來監(jiān)控主要設(shè)備組件的操作運行狀況。這些監(jiān)控一般包括電力供應(yīng)鏈及其子系統(tǒng)的公共電力供應(yīng)情況、配電盤、自動轉(zhuǎn)換開關(guān)、發(fā)電機、UPS和下游的配電板。其也會被連接到冷卻系統(tǒng)組件。然而,在許多情況下,BMS系統(tǒng)所收集的大量數(shù)據(jù)類型并不是細粒度的。在某些情況下,這些信息往往被局限在非?;镜脑O(shè)備狀態(tài)信息(開關(guān))和報警條件。

因此,這些站點往往成為部署DCIM的潛在好處的首要候選。為了讓DCIM系統(tǒng)能夠收集和分析能源使用信息,他們需要遠程讀取能源電表。不幸的是,某些數(shù)據(jù)中心甚至可能沒有任何實時能量消耗計量儀表,只能根據(jù)每月所消耗的總能量的使用情況來分析。雖然這已經(jīng)是一些數(shù)據(jù)中心站點在過去的事實上的做法,但這其實并沒有提供足夠的關(guān)于能源被使用到何處或其設(shè)施效率方面的任何離散數(shù)據(jù)。最近,DCIM(以及一些BMS)系統(tǒng)已被設(shè)計用于從所有這些系統(tǒng)測量和跟蹤所有更精細的信息。然而,典型的瓶頸問題是在這些老舊的設(shè)施中缺乏能夠顯示能源消耗情況的電源控制面板或在老舊的冷卻設(shè)備(如CRAC /CRAH或冷水機組)中缺乏內(nèi)部溫度或其他傳感器(可遠程查詢)。

加裝電能消耗計量設(shè)備和環(huán)境傳感器是采用DCIM的主要障礙之一。特別是在電源和散熱系統(tǒng)的冗余水平較低的數(shù)據(jù)中心站點尤其如此。這需要安裝電流變壓器(CT)和電位變壓器(PT)來測量電壓。雖然有“卡入式”類型的CT不需要斷開導體以安裝,但近來的OSHA已經(jīng)限制了所謂的“熱工作”帶電面板,因此可能需要關(guān)閉某些系統(tǒng)以便滿足電力工作的安全需要。而在關(guān)鍵任務(wù)數(shù)據(jù)中心 涉及到“停機”的話顯然是相當嚴重的。所以,部署DCIM項目除了要獲得相關(guān)資金和資源的內(nèi)部支持,這類具有潛在破壞性的DCIM部署工作還需要獲得來自企業(yè)高層管理部門的批準,及與企業(yè)基礎(chǔ)設(shè)施和IT部門的合作,而這在許多企業(yè)中都是一個固有的瓶頸。

基礎(chǔ)設(shè)施的監(jiān)測:從PUE開始

在其最基本的層面,一款DCIM系統(tǒng)應(yīng)顯示實時數(shù)據(jù)、歷史趨勢,并提供年度電力使用效率(PUE)報告。這包括在相關(guān)設(shè)備上安裝電能消耗計量硬件,并至少還收集IT能量使用情況(通常是UPS輸出)。然而,部署DCIM系統(tǒng)最大的益處是其它相關(guān)設(shè)施設(shè)備(冷凍機組、CRAH / CRACs,水泵,冷卻塔等)應(yīng)安裝電能計量、環(huán)境監(jiān)測傳感器。這使得DCIM提供了一個深入分析,并允許優(yōu)化冷卻基礎(chǔ)設(shè)施的性能,以及提供早期故障檢測的警告和預測性維護功能。

空白空間:IT機架級的電源功率監(jiān)測

盡管在UPS的輸出計量IT總的能耗是最簡單和最常見的獲得PUE讀數(shù)的方法,但該方法并不能提供關(guān)于數(shù)據(jù)中心具體如何使用能源情況的任何見解。而這恰恰是對整個數(shù)據(jù)中心的能耗狀況有一套全面的看法,而不僅僅只是任何單個設(shè)備所需的一大關(guān)鍵功能。然而,較之設(shè)備數(shù)量、機架(和IT設(shè)備)的數(shù)量,對于傳感器的數(shù)目需求遠遠更大。而對于機架級的功率/能量計量情況來說,關(guān)注度最高的兩大領(lǐng)域要么是地板的PDU(分支電路監(jiān)測),要么是在機架內(nèi)監(jiān)測PDU(智能功率條,其中一些甚至能夠跟蹤監(jiān)測每臺IT設(shè)備的能源使用情況)。

從改造的角度,如果地板級PDU并不是已經(jīng)裝備分支電路電流監(jiān)控,添加CT到每條電纜以供給機架與任何其他的電氣工作是相同的,其也是阻礙DCIM實施的另一個障礙。然而,已被使用多年的另一種測量機架級IT設(shè)備電源使用情況的方法是安裝機架配電單元(機架電源板)。這通??梢员苊馊魏螣岵僮鳎捎跈C架PDU插入現(xiàn)有的插座。而安裝機架PDU確實需要斷開IT設(shè)備,以取代非電力消耗計量,其潛在破壞性可以遠遠小于地板級PDU關(guān)閉,因為其可以針對每臺機架執(zhí)行一次(如果IT硬件配備雙電源,可能不需要關(guān)閉IT設(shè)備)。而A-B冗余層PDU也是如此,有些人可能會猶豫不敢這樣做,擔心某些服務(wù)器可能沒有雙配電A-B電源線,以正確插入匹配的A-B PDU。

機架級PDU通常也使用TCP / IP(SNMP),所以其可以通過現(xiàn)有的布線和網(wǎng)絡(luò)連接。然而,雖然這避免了需要安裝專門的布線到每一個機架,但也不是沒有成本的。網(wǎng)絡(luò)布線的位置是一種IT資源,是一個昂貴的生產(chǎn)交換機的網(wǎng)絡(luò)端口。最具成本效益的選擇方案可能是為每一行增加一個低成本的48端口交換機,以創(chuàng)建一個專用的網(wǎng)絡(luò),其也可以被隔離以增加額外的安全性。

安全

在今天的環(huán)境中,安全問題顯然是在幾乎所有企業(yè)最被關(guān)注的一個問題。數(shù)據(jù)中心的設(shè)施,特別是其IT負載,很明顯代表高價值目標。因此,其每一個方面都需要關(guān)注是否存在潛在威脅。新建數(shù)據(jù)中心或改造數(shù)據(jù)中心的一大挑戰(zhàn)是以前無法預料的,即要確保DCIM對于設(shè)備和IT系統(tǒng)順利訪問的同時,防范潛在的安全漏洞。這并不是說,DCIM軟件本質(zhì)上是不安全的。然而,由于其本身的性質(zhì),具有像章魚一樣多管齊下的觸角,能夠訪問各種關(guān)鍵系統(tǒng),這增加了潛在的安全威脅的切入點的數(shù)目,以及目標被探測到的可能性,一旦弱點被發(fā)現(xiàn)就會被利用的。這種類型的潛在威脅最近被證明是目標的突破口,其中不乏IT系統(tǒng)被滲透事件(如數(shù)以百萬計的信用卡信息被盜取),通過使用HVAC系統(tǒng),供應(yīng)商能夠登錄了解誰進行了遠程網(wǎng)絡(luò)訪問,以監(jiān)控HVAC設(shè)備。雖然DCIM可能沒有直接參與到這種情況下,但它只會加劇人們對于安全問題的關(guān)切,而這無疑進一步阻礙了其部署實現(xiàn)。

例如,BACnet協(xié)議最初是為了在基礎(chǔ)設(shè)施內(nèi)用于專用線路的“升級”,使其能夠被遠程通過標準TCP / IP網(wǎng)絡(luò)(BACnet / IP)進行訪問。其使用UDP / IP協(xié)議,其通常出于安全原因阻止大多數(shù)企業(yè)防火墻。雖然在過去有時候,一些防火墻管理員可以被說服允許一些有限的UDP連接,最近的大規(guī)模安全漏洞會進一步阻礙BACnet / IP作為首選協(xié)議。

此外,DCIM的特征之一是集中管理大型多點的環(huán)境,這也增加了兩個潛在的威脅點和損壞的范圍。最起碼,過濾器、防火墻和路由器的訪問列表將需要檢查和修改,允許DCIM能夠跨內(nèi)部和外部邊界和域與設(shè)備進行通信。甚至簡單網(wǎng)絡(luò)管理協(xié)議(SNMP),通常被IT設(shè)備和大多數(shù)機架式PDU使用的協(xié)議(其已經(jīng)被不斷修正,以提高安全性),仍然是不被認為是非常安全的,并因此被視為另一個潛在威脅。所以,除了所有其他方面和實施成本,在考慮部署內(nèi)部和外部防火墻和入侵檢測系統(tǒng)時,務(wù)必格外謹慎小心。

新建數(shù)據(jù)中心所需考慮的問題

從設(shè)施的角度來看,在新建數(shù)據(jù)中心被設(shè)計建立前,將能夠提供方便DCIM計量冷卻系統(tǒng)電力消耗和傳感器的最好和最容易的機會。當為DCIM項目編制預算時,務(wù)必記住設(shè)施方面的系統(tǒng)具有相比IT設(shè)備較長的生命周期(10-15年甚至更多)。所以,當面對最初的預算限制需要做出任何可能的妥協(xié)時,務(wù)必考慮到DCIM軟件可以在購買了相關(guān)建筑設(shè)備,升級或更換之后再購買,而不會影響數(shù)據(jù)中心的運營。相反,安裝能源計量設(shè)備通常需要電氣面板斷電,是具有破壞性的,最好是在前期一次性做好,而不是在之后增加更多的能源計量或其他儀器(如冷卻水流量監(jiān)測設(shè)備),其可能需要設(shè)備停機以便隨后實施安裝。

至于要增加IT機架級能量/功率計量和環(huán)境監(jiān)測的能力,其提供了更靈活的選擇,其中一些如上所述具有潛在較小的破壞性。盡管如此,任何新件數(shù)據(jù)中心的每個地板級PDU應(yīng)該有分支電路監(jiān)控。

總結(jié)

上面的例子只代表在一個DCIM項目實施部署過程中或?qū)⒂龅降奶魬?zhàn)的一個橫截面。雖然對于電氣工作的潛在破壞性是抑制實施和改造DCIM項目的一個顯著的因素,但這并不是不可克服的??紤]到DCIM項目的分階段實施的方法,特別是對改造方案而言。如果在協(xié)調(diào)階段完成(假設(shè)有一些冗余系統(tǒng)),其仍然強烈建議附加能耗計量設(shè)備的安裝,以便能夠從DCIM部署中實現(xiàn)最多的功能。

IT監(jiān)控可以減少安全威脅侵擾,但除了要考慮一般性的一個重要因素,還需要兼顧環(huán)境因素,IT系統(tǒng)正在從許多途徑不斷探討未知的弱點,而這些威脅每天都需要處理,并減輕無形的安全風險。

這些問題將需要相對于數(shù)據(jù)中心設(shè)備的大小,也許需要進行一些綜合的權(quán)衡和折衷。這會顯著影響到部署DCIM的相對價值或潛在的好處,以及對整體成本的評估??紤]做一個試點項目,首先要積累經(jīng)驗,然后再將其作為一個基礎(chǔ)來記錄問題,并更準確地預測需要克服執(zhí)行方面可能遇到的挑戰(zhàn),進行全面的資源部署。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號