隨著互聯網信息技術與智能化迅速發(fā)展,數據在呈指數級增長,這些信息和數據的處理、存儲、管理和使用離不開安全穩(wěn)定的數據中心。公眾可能感受不到數據中心的存在,但在社會的各個層面,人們須臾離不開數據中心提供的各種服務,離開數據中心的社會生活已不可想象。然而供電作為數據中心運行最基礎的條件則成為重中之重。大型數據中心的冗余供電系統(tǒng),是否萬無一失呢?本文通過負載測試對數據中心供電安全的影響和應用,在不同階段和場合如何更好地維護發(fā)電機組健康、平穩(wěn)運轉做了相應的闡述,并給出了部分解決方案。
1 數據中心供電安全的重要性
數據中心作為國民經濟發(fā)展的關鍵節(jié)點,在供電安全設計上一直遵循最高標準,通常采用兩路市電+2組后備發(fā)電機組+2組蓄電池組的多重供電組合。理論上可以提供極為安全的供電環(huán)境,但是在實際運行中,數據中心供電系統(tǒng)依然存在安全隱患,而隱患往往又是出現在檢測維護流程上,出現在對設備細節(jié)的重視程度上。
近年來,因為維護不當導致數據中心停電的事故并非個例:
2012年7月,美國Hosting.com停電故障造成1100家客戶網站停機長達5h。而停電原因是工程師在例行維護時,對斷路器錯誤操作所致。
2012年10月,凡客誠品五周年紀念日之際,卻因機房停電導致網站無法訪問,致使當日的促銷活動無法進行,造成的經濟損失據稱達千萬元。
2016年1月,美國威瑞森電信的數據中心由于維護問題引發(fā)停電,導致捷藍航空所有數據服務中斷,致使旅客滯留機場約7h。
就在近日,擁有信息黃埔之稱的北京郵電大學校園核心機房著火受損,造成北京高校校園網紛紛崩潰,這其中不僅包含了北郵自身,還有中石油,中政法,清華,北師。這一把火,可以說是燒掉了半個北京的校園網。
根據艾默生網絡能源和波耐蒙研究所的調研,數據中心發(fā)生意外停電故障后,每分鐘平均產生的經濟損失約5000美元。
從細節(jié)入手,對檢測維護工作高度重視,做好平時對數據中心供電系統(tǒng)的維護,才能最大限度的保障數據中心不出現停電事故,減少不必要的經濟損失。
2 如何預防供電問題出現
①把好驗收關。對供電系統(tǒng)以及線路,尤其是作為最后一道防線的后備發(fā)電機組進行按照行業(yè)標準做進廠驗收,保證機組在各種環(huán)境下均可正常啟動,確保電源質量合格,不把問題放進來;
②制定嚴格的電源定期維護保養(yǎng)流程,遵守流程對電源、尤其是對長期不使用的后備發(fā)電機組進行帶載測試;
③做好每次維護測試的數據記錄和管理,建立電源健康檔案,保證質量和問題的可追溯性。企業(yè)應建立上級維護管理,每次測試后留存數據參數記錄,調出檔案后查詢每次數值記錄就可以了解設備是否按照規(guī)程制作,機組是否存在異常,及時發(fā)現問題及時處理。
作為供電系統(tǒng)的最后一道防線,后備發(fā)電機組的定期維護卻時常被人忽視,尤其是缺少對后備機組帶載測試重要性的認識。
在空載狀態(tài)下的常規(guī)檢測,無法及時發(fā)現機組的潛在隱患,只有進行定期的帶載測試,才能比照機組的質量標準,驗證其性能是否健康。
此外,機組長期不使用,或者低功率欠載運行,很快會造成積碳,嚴重時會發(fā)生機組爆燃事故,嚴重影響機組壽命。為預防欠載,也需要定期讓機組處于高負荷狀態(tài),保持健康。
比如我國為非洲某國建設的援外數據中心項目,由于白天使用狀態(tài)為滿載狀態(tài),但夜晚便降低到30%的欠載狀態(tài),長期運行會導致積碳,發(fā)生事故。我公司實地考察后,根據實際情況進行了配載,杜絕了機組積碳可能性,保證設備的使用壽命。因維護不當導致的發(fā)電機組內部積碳實例如圖1所示。
對后備發(fā)電機組進行測試,通常需要幾個功能單元組合來實現:
①為了使機組處于高負荷狀態(tài),需要有模擬負載單元來吸收機組輸出的電能,并將電能安全消耗掉;
②后備機組多是10.5kV高壓機組,控制單元負責對模擬負載單元的帶載功率進行調節(jié),使其按照維護規(guī)程要求的時間、功率帶載;
③測量單元負責采集和分析機組輸出的電能參數;
④數據記錄單元可以比對機組電參數,得出其是否合格的結論,并將其存檔。
通過上述單元組合實現負載測試,最終可以得出結論,告訴我們機組的帶載能力是否正常,能否在需要的時候正常啟動并輸出足夠的功率。
以往有些企業(yè)沒有使用模擬負載,在維護時直接讓機組帶真負載。真負載與模擬負載相比,功率難以精確控制,操作繁瑣,不能保證帶載的安全性,不是專業(yè)的測試手段。尤其是數據中心行業(yè),機房設備十分昂貴,若貿然使用真設備極其容易造成設備損壞報廢,造成極大經濟損失。
3 發(fā)電機組檢測解決方案
假負載在發(fā)電機組生命周期不同階段發(fā)揮的作用如圖2所示。
(1)負載測試貫穿發(fā)電機組的整個生命周期第一階段:新機組裝,工程驗收。檢測功率是否符合標準;
第二階段:消聲降噪處理后,需要檢測輸出功率是否受到影響,核對容量試驗;
第三階段:安裝一年以上或維修后,需實際帶載能力測試;
第四階段:定期帶載維護。長期正常使用后,當柴油發(fā)電機負載在30%以下,燃氣機在25%以下就要做相應配載消除積碳現象,此時負載已由檢測設備轉化為生產設備,將負載設定發(fā)電機組處于欠載狀態(tài)值內時自動啟動,杜絕發(fā)電機組欠載;另外定期的檢測有助于用戶及時發(fā)現老化期間、排除故障和隱患,保證發(fā)電機組的健康運轉。
(2)發(fā)電機組測試假負載(簡稱假負載)主要功能
①階段加載:按維護規(guī)程的時間和功率,設置多個加載階段,自動連續(xù)的使機組帶載,如0→25%→50%→75%→100%連續(xù)加載;
②穩(wěn)態(tài)測試:在穩(wěn)定帶載狀態(tài)下,檢測機組功率、電壓、電流、頻率等參數;
③瞬態(tài)測試:在機組突加突卸狀態(tài)下,檢測機組電參數的波動情況;
④計算機軟件控制:可以在遠程計算機上直接操作測試;
⑤數據管理:可以顯示并記錄各項測試數據,存檔備查。
(3)企業(yè)應充分根據后備發(fā)電機組的實際情況,以及使用環(huán)境等因素,定制假負載,使負載測試過程最優(yōu)化。
在定制過程中,需要企業(yè)提供機組與環(huán)境的各項數據:
①電壓:常見的負載輸入電壓包括400V、10.5kV、20kV等,根據被測發(fā)電機組的電壓而定。10.5kV負載的應用最廣泛,近幾年也有越來越多的企業(yè)選擇20kV負載;
②負載性質:假負載包含阻性負載R、感性負載L、容性負載C,可以只有單一性質的負載,也可以由兩種或三種性質的負載組合。
目前,數據中心應用較多的是純阻性負載。由于數據中心存在大量容性用電設備,為了使測試結果更加趨近于真實工況,能通過測試結果全面驗證機組性能,越來越多的企業(yè)選擇RC阻容式負載;
③功率:負載功率通常是單臺發(fā)電機組額定有功功率的110%,比如1600kW機組適合配備1760kW的負載,1800kW機組可以配備2000kW負載。目前2000kW負載的應用最為廣泛;
④控制方式選擇:假負載日常不會在本地進行操作,而是在百米之外遠程控制。可以選擇控制柜、外控箱、筆記本電腦(含軟件)等多種形式操作模擬負載;
⑤產品封裝與通風:負載通常采用集裝箱封裝,常見的有6m標準箱或9m標準箱。負載采取熱能耗原理,將電能轉化為熱能消耗掉,因此需要風冷散熱,常見的進出風方式為兩側進風、頂部出風。負載周圍3m不能有障礙物,以免影響通風。
企業(yè)可根據自身環(huán)境,選擇固定式或移動式負載,選擇固定在建筑物樓頂、底部等合適場所。比如哈爾濱某軍工企業(yè),在最初設計時沒有充分了解負載設備的具體指標,將負載擬安裝在廠房內。后工作人員在實地勘查時發(fā)現若按原設計方案運行負載一小時后環(huán)境溫度可高達80℃以上,后經及時修改設計方案,節(jié)省了企業(yè)大量財力與時間,設備也得以正常使用。
上面提到數據中心應用較多的是純阻性負載。由于數據中心存在大量容性用電設備,為了使測試結果更加趨近于真實工況,在情況允許的情況下提前設計或通過測試驗證機組性能都可以達到目的。
4 數據中心機房線路和冷卻系統(tǒng)提供驗收解決方案
機架式負載模擬機房服務器,專門為數據中心而設計,具有安全,可靠,體積小完全模擬現場服務器負載的特點。是數據中心負載的理想選擇,在機房驗收時發(fā)揮以下作用:
①在機房接入服務器之前代替服務器作為末端負載,能夠更好的模擬服務器的性能,幫助判斷電源設備的可靠性;
②測試輸電線路的安全性及電池等儲電設施的可用性,同時協助進行配合各種電源的切換。即檢測電路在連接過程中有沒有出現因電路虛接導致電路出現熱點、損害電路安全現象;
③作為和機架式服務器相似的熱源,能夠模擬服務器的電力使用、散熱及其他方面的氣流變化。通過集成測試,確保供配電系統(tǒng)、空調新風系統(tǒng)、防雷接地系統(tǒng)、監(jiān)控系統(tǒng)、機房綜合環(huán)境、機柜IT微環(huán)境、機房裝修工程等各系統(tǒng)之間有效運行,并驗證達到設計及運營要求的程度。
在機架式負載功率選擇上可以根據機房服務器功率大小決定,常用的機架式負載功率為3、4、5、6、8kW不等,通常一次性會使用數百臺一起測試。通常為交流220V±10%/50Hz、直流240至270V,可以根據需求選擇純交流或純直流機架式負載、選擇交直流通用型負載。
機架式負載常見兩種電阻形式:合金電阻式與PTC電阻式。
合金電阻式的優(yōu)缺點:受溫度影響小,功率穩(wěn)定,但電壓變化時不能保持恒流恒功率,然而在交流220V或直流240V電壓下可基本保持恒功率。具體數據標準還有待勘定。
PTC電阻式的優(yōu)缺點:受電壓影響小,可以恒流恒功率運行,但溫度變化時功率波動明顯,沖擊較大,而且會產生大量諧波。
5 負載測試中的技術難點
(1)絕緣安全:測試高壓發(fā)電機組對模擬負載絕緣強度要求高越來越多的企業(yè)需要對20kV機組進行測試,這時對負載的絕緣強度要求極高,尤其負載長期工作在室外,容易因為下雨等原因導致絕緣下降,發(fā)生危險。
早期低壓負載內的電阻部件多數直接安置在不銹鋼隔板上,但是在高壓負載設備的設計中卻行不通,絕緣強度、電容等因素導致不銹鋼與機箱存在電容,尤其是在潮濕的環(huán)境下長時間運行后極易結水導電,釀成事故。經過研發(fā),可采用獨特的高絕緣強度復合架構,使設備具有防潮、防雨、防腐蝕、耐高溫的特點,即使長期工作在非常潮濕的條件下,也能保持良好的絕緣性和可靠性。由此凱翔負載成為國內最早可直接安全檢測20kV以上高壓發(fā)電機組的設備。此技術現已獲得發(fā)明專利,直接檢測20kV高壓機組,就可以無需變壓器中轉,為企業(yè)節(jié)省變壓器的投入成本。
(2)容性負載:模擬容性負載時容易導致沖擊和泄放使用容性模擬負載對發(fā)電機組進行測試時,由于容性負載的特性,極易在啟停時造成對機組的沖擊和泄放,對機組造成傷害。
凱翔科技通過創(chuàng)新的電路和保護設計,使容性負載不會對機組造成影響,可以安全完成測試,從而使高壓阻容一體式負載成為可能,更加全面的驗證機組性能。
(3)過熱保護:模擬負載采用熱能耗原理,容易高溫過熱
凱翔科技自主研發(fā)的負載專用集成化保護模塊,同時具有過熱、過電壓、過電流、風量過低、風機熱過載、風機相序等多重保護功能,并能向控制系統(tǒng)準確、及時的反饋異常原因,是負載行業(yè)非常全面的保護系統(tǒng)。
北京某數據中心項目,原設計要求在負載設備周圍3m內保持通風,因企業(yè)疏忽,在負載設備旁搭建一面空心墻。后期在測試時因遠程系統(tǒng)及時發(fā)出警報,從而避免了事故的發(fā)生。
(4)移動便利:數據中心園區(qū)機組未必集中,需要移動測試
凱翔高壓負載采用標準集裝箱封裝,頂部有吊裝環(huán),可以很方便的吊裝到需要的位置。同時還提供移動車載式負載,移動更加便利。
相比傳統(tǒng)測試用的水負載,固定后也可以再次移動,施工成本極低,使用范圍靈活。
(5)智能管理:測試結果要能直觀反映問題,儲存后便于查找;
凱翔科技可根據業(yè)主測試規(guī)程的個性化要求,對軟件數據分析與管理部分進行個性化設計,在軟件界面、功能、參照標準等方面量體裁衣,滿足企業(yè)需要。軟件可對測試數據進行顯示和記錄,設定編號管理和查詢,生成各種曲線、圖表、測試報告。
供電系統(tǒng)作為數據中心基礎設施主要組成部分,在數據中心行業(yè)發(fā)展中地位越來越顯著,對數據中心供電安全技術的研究越來越受到行業(yè)內人士的關注,假負載技術在供電安全領域的技術及應用也日臻標準化、全面化、系統(tǒng)化。選擇高效、經濟、可用性高的負載設備維護數據中心的供電安全,已逐漸成為行業(yè)內的共識。
作者簡介
陳國民,河北凱翔電氣科技股份有限公司技術總監(jiān),從事電源檢測自動化和智能化領域的研究應用已有二十余年。在數據中心、電信機房應急以及后備電源測試和維護方面具有豐富經驗和創(chuàng)見。