突然斷電會使數(shù)據(jù)中心的運營陷入癱瘓。電力中斷對IT系統(tǒng)有害,因為會導致數(shù)據(jù)丟失、文件損壞和設(shè)備損壞。內(nèi)部部署數(shù)據(jù)中心需要直接集成到電力基礎(chǔ)設(shè)施中的一個備份電源系統(tǒng),以確保關(guān)鍵系統(tǒng)保持在線運營。
數(shù)據(jù)中心電源基礎(chǔ)設(shè)施應該支持兩種運行模式:常規(guī)運行和緊急運行。在常規(guī)運行模式下,數(shù)據(jù)中心接入一家或多家公用事業(yè)公司的電力線路,而一些企業(yè)可能使用柴油發(fā)電機來滿足其電力需求。
但是,柴油發(fā)電機通常在電力基礎(chǔ)設(shè)施中具有另一個重要作用:在緊急情況下提供備用電源。在緊急情況下,企業(yè)采用一臺或多臺柴油發(fā)電機為數(shù)據(jù)中心供電,并以交流電(AC)的形式提供能量。
UPS電源的重要性
數(shù)據(jù)中心通常會部署一個或多個自動轉(zhuǎn)換開關(guān),以便在市電和備用電源之間進行切換。如果市電中斷或發(fā)生故障,轉(zhuǎn)換開關(guān)向連接的備用柴油發(fā)電機發(fā)送啟動命令,然后開始發(fā)電時提供電力。一旦市電恢復,轉(zhuǎn)換開關(guān)切換到市電供電,并向柴油發(fā)電機發(fā)送停機命令。
數(shù)據(jù)中心的電源基礎(chǔ)設(shè)施包括一個或多個UPS電源。UPS電源具有兩個關(guān)鍵用途:保護IT設(shè)備免受尖峰電壓的影響,并在斷電時提供短期電力。
另一個常見的電源基礎(chǔ)設(shè)施組件是配電單元(PDU),它是一種高級電源插座,可從UPS電源獲得電力,然后將其分配給IT系統(tǒng)。配電單元(PDU)不會產(chǎn)生電源尖峰,這就是為什么配電單元(PDU)通常與UPS電源一起使用的原因。
其功率調(diào)節(jié)和路由通過開關(guān)柜或主要配電板以及變壓器完成。這樣可以確保電源電壓和電流正常輸出。其設(shè)備配置取決于數(shù)據(jù)中心的規(guī)模、IT系統(tǒng)的數(shù)量和類型。
確保連續(xù)運行
數(shù)據(jù)中心電力基礎(chǔ)設(shè)施必須為數(shù)據(jù)中心設(shè)施其他設(shè)備提供電力,如照明、警報、傳感器、火災監(jiān)測器、冷卻裝置和除濕器。其電力基礎(chǔ)設(shè)施還必須為IT系統(tǒng)(如服務器、存儲設(shè)備和網(wǎng)絡(luò)組件)提供電力,這樣即使斷電,它們也可以不間斷地運行。
在正常運行期間,以IT系統(tǒng)為目標的電源將連續(xù)不斷地通過UPS電源運行。UPS電源確保連接的電池充滿電,并隨時準備支持緊急操作。電池可提供足夠的電力,以使IT系統(tǒng)在短時間內(nèi)運行,其具體取決于電池的數(shù)量和類型。
有些UPS電源采用飛輪或超級電容器而不是電池。飛輪采用加速轉(zhuǎn)子來存儲可轉(zhuǎn)化為電力的動能。超級電容器根據(jù)需要利用靜電荷存儲電能。
UPS電源分為離線式、在線互動式、在線式三種。如果市電中斷,UPS電源將切換為供電狀態(tài),將其轉(zhuǎn)換為交流電并將其發(fā)送到PDU。在線互動式UPS的工作原理大致相同,只不過它在市電為設(shè)備供電時對其進行調(diào)節(jié),以防止電壓尖峰。
在線UPS將交流電轉(zhuǎn)換為直流電并為電池充電。剩余的電能都會被調(diào)節(jié)并轉(zhuǎn)換回交流電以供PDU輸出。運行關(guān)鍵工作負載的大型數(shù)據(jù)中心通常會部署在線UPS電源,因為它們可以提供最高級別的保護,盡管會增加運營成本。
無論使用哪種UPS,或者組織如何配置備用電源,其目標都是相同的:提供足夠的時間關(guān)閉IT系統(tǒng)或讓備用發(fā)電機啟動發(fā)電。在理想情況下,在檢測到故障不到一分鐘之后,備用柴油發(fā)電機將會啟動,從而使UPS電源恢復正常運行。
大多數(shù)數(shù)據(jù)中心的備用發(fā)電機都有足夠的燃料,可以運行24至48小時。備用發(fā)電機的數(shù)量和所需的總電壓取決于數(shù)據(jù)中心的特定功率要求。
組織必須確保其發(fā)電機安全運行,符合適用的環(huán)境法規(guī),并讓管理員監(jiān)測一氧化碳或一氧化氮等廢氣。
主動計劃停電
每個數(shù)據(jù)中心都應該制定一個災難恢復計劃,該計劃概述了在停電時應采取的步驟以及每個設(shè)備應扮演的角色;在停機期間遵循這個計劃至關(guān)重要。
這意味著要按規(guī)定的順序關(guān)閉IT系統(tǒng),確保備用發(fā)電機運轉(zhuǎn)并適當通風,監(jiān)測溫度以防止過熱,并驗證應急系統(tǒng)(例如抽水設(shè)備)是否正常運行。
一旦恢復供電,也必須有恢復計劃。IT系統(tǒng)應按照規(guī)定的順序重新校準,并進行測試,確認一切按預期運行。應該關(guān)閉應急設(shè)備,為下次危機做好準備。最重要的是,參與者應在停電期間和之后保持適當?shù)耐ㄐ牛瑥亩故茈娫粗袛嘤绊懙墓ぷ魅藛T都能獲得基礎(chǔ)設(shè)施狀態(tài)的最新信息。
數(shù)據(jù)中心電源基礎(chǔ)設(shè)施也需要定期的設(shè)備維護和測試。如果電力中斷,維護不當?shù)腢PS電源或柴油發(fā)電機可能影響數(shù)據(jù)中心的運營,這可能會影響其故障排除時間。