本周,某云存儲公司的部分客戶反應(yīng)存儲的圖片無法正常顯示或者打開。經(jīng)與故障IDC服務(wù)商核實(shí),該故障是由于該云服務(wù)商下的IDC基礎(chǔ)設(shè)施合作單位的部分機(jī)柜掉電導(dǎo)致。同時,掉電還影響到一臺城域網(wǎng)核心交換機(jī),間接影響到另外一個用戶的業(yè)務(wù)運(yùn)行。這一事故引發(fā)了行業(yè)熱議和思考——為什么部分機(jī)柜會掉電?如何避免此類事故再次發(fā)生?
造成部分機(jī)柜掉電的原因可能有:
機(jī)柜可靠性等級低,并沒有實(shí)現(xiàn)真正的獨(dú)立雙路供電,只有一路PDU或者兩路PDU來自同一個開關(guān)供電;
機(jī)房安全性等級低,沒有機(jī)柜電流監(jiān)測和報警,部分機(jī)柜電力負(fù)荷率偏高,但未提前發(fā)覺;
PDU缺少分插口分?jǐn)喙收系哪芰?,單臺服務(wù)器故障短路導(dǎo)致PDU上端總開關(guān)越級跳閘,其下PDU多條同時失電;
天氣炎熱,多臺機(jī)柜為同一類系統(tǒng)正好負(fù)荷率同時升高導(dǎo)致同時超載跳閘掉電;
天氣炎熱,機(jī)房散熱能力下降,配電系統(tǒng)容量下降,跳閘;
違規(guī)使用PDU插座,比如插上測試插頭或者個人手機(jī)充電或者臨時改造或者施工等,同時又正好碰見短路故障;
因此,可靠、高效、完備的電源管理解決方案是保障數(shù)據(jù)中心生產(chǎn)力及業(yè)務(wù)連續(xù)性的根基,而PDU在其中擔(dān)當(dāng)了重要的角色。
如今,無論是外部大環(huán)境的大數(shù)據(jù)、IT消費(fèi)者化、虛擬化以及云計算的發(fā)展趨勢,還是內(nèi)部關(guān)于傳遞完全可信、安全和靈活性服務(wù)的需求,都對數(shù)據(jù)中心的運(yùn)營方式提出了更高的期待與要求。數(shù)據(jù)中心的電源供給與分配不能再僅僅是一個被動的過程。技術(shù)、設(shè)備、運(yùn)營方針等方面日新月異的應(yīng)用,都導(dǎo)致在機(jī)柜級別的電能和環(huán)境管理需求急劇增加。人們已不再滿足于PDU的原本角色和作用,而對之提出了新的期待:更智能,具備監(jiān)測、分析和實(shí)時響應(yīng)威脅和機(jī)會的功能。
例如,領(lǐng)先的智能電源管理解決方案供應(yīng)商力登(Raritan)旗下智能PDU產(chǎn)品,就能通過機(jī)柜級和設(shè)備端的用電監(jiān)控管理,除了能夠追蹤電流、電壓、電功率、功率因素以及能源的使用率(提供1%級別的計費(fèi)級測量精度), 其遠(yuǎn)程切換功能讓運(yùn)維人員無需親臨現(xiàn)場,就能通過力登智能PDU對設(shè)備進(jìn)行電源開、關(guān)、重啟等操作,及時修復(fù)故障,保障系統(tǒng)持續(xù)運(yùn)行,還能將PDU空閑插座設(shè)為無電狀態(tài),消除因人為失誤或設(shè)備同時加電等引起的斷電跳閘。
此外,力登的智能PDU最大的特點(diǎn)在于,運(yùn)維人員能夠通過Power IQ電能管理軟件對設(shè)備所處微環(huán)境的溫度、濕度、氣壓等狀況進(jìn)行監(jiān)控,更重要的是這些計量后的數(shù)據(jù)會被收集整理,從而為管理者提供決策參考。如果設(shè)備用電出現(xiàn)異?;蛘咴O(shè)備微環(huán)境出現(xiàn)變化都會及時報警通知運(yùn)維人員,從而最大程度地保證設(shè)備始終處于健康狀況,避免計劃外宕機(jī)。
由此可見,智能化的電源管理解決方案不僅能夠保障數(shù)據(jù)中心用電安全、避免掉電,還能幫助數(shù)據(jù)中心運(yùn)維人員提高管理效率、簡化管理流程、提升數(shù)據(jù)中心資源利用率以及業(yè)務(wù)綜合管理。