在多數(shù)情況下,觸發(fā)數(shù)據(jù)中心停機(jī)的特定事件是不可預(yù)知的。企業(yè)花費(fèi)數(shù)千萬美元設(shè)計建設(shè)數(shù)據(jù)中心的冗余基礎(chǔ)設(shè)施和自動故障轉(zhuǎn)移系統(tǒng),以彌補(bǔ)不可預(yù)測的問題。但是根據(jù)定義,這個目標(biāo)是無法達(dá)到的。
英國數(shù)據(jù)中心運(yùn)營商UKFast公司日前宣布,一家承包商在12月12日上午意外地在英格蘭曼徹斯特市的一個電力中心觸發(fā)了一起事故,切斷了UKFast公司運(yùn)營的數(shù)據(jù)中心園區(qū)中三個數(shù)據(jù)中心的其中兩個設(shè)施的電力供應(yīng)。而這兩個數(shù)據(jù)中心的備用電源系統(tǒng)沒有按照設(shè)計要求建設(shè),因此導(dǎo)致數(shù)據(jù)中心斷電停機(jī)。
UKFast公司的曼徹斯特數(shù)據(jù)中心園區(qū)
雖然花費(fèi)了大約一個小時的時間就將其發(fā)電機(jī)的備用電源提供給數(shù)據(jù)中心,但直到次日上午,UKFast公司的工程師們才恢復(fù)其所有的客戶服務(wù)。一些物理設(shè)備由于停電而損壞,不得不被替換,并且使得基礎(chǔ)設(shè)施系統(tǒng)正常運(yùn)行也存在一些軟件的問題。
UKFast公司提供了在曼徹斯特數(shù)據(jù)中心園區(qū)托管的各種數(shù)據(jù)中心服務(wù),其中包括主機(jī)、云計算、專用服務(wù)器,以及托管服務(wù)。園區(qū)內(nèi)共有三座兩層樓的數(shù)據(jù)中心建筑:MaNOC 4,MaNOC 5和MaNOC 6和7(建有兩個數(shù)據(jù)中心的單一建筑)。每棟建筑都有兩層的數(shù)據(jù)大廳。MaNOC 5和MaNOC 6和7這兩個建筑都遭遇電力中斷。
而這兩個數(shù)據(jù)中心的UPS供電系統(tǒng)在失去市電時正常工作,而備用電源柴油發(fā)電機(jī)雖然啟動但未能實現(xiàn)相位同步,UKFast公司表示這種情況歸因于電力電纜的損壞:UPS供電系統(tǒng)為其工作負(fù)載提供了電力,并啟動了柴油發(fā)電機(jī),然而,由于電力電纜的物理損壞,對現(xiàn)場提供的電力不穩(wěn)定并且是間歇性的。結(jié)果,柴油發(fā)電機(jī)組無法實現(xiàn)同步并提供備用電源。數(shù)據(jù)中心工程師只好對柴油發(fā)電機(jī)實施了手動同步工作。
由于電網(wǎng)通常并不可靠,因此許多數(shù)據(jù)中心運(yùn)營商會在其數(shù)據(jù)中心上建立冗余的電力供應(yīng),這些供應(yīng)通常連接到多個電網(wǎng)。但是這種冗余基礎(chǔ)設(shè)施的投資成本高昂,一些數(shù)據(jù)中心運(yùn)營商(特別是小型運(yùn)營商)有時會省卻這些開支,把他們的設(shè)備的正常運(yùn)行時間寄希望于他們備用電源系統(tǒng)的穩(wěn)健性上。
法國云計算服務(wù)提供商OVH公司在斯特拉斯堡的三個數(shù)據(jù)中心在11月電力中斷后停機(jī)。該公司表示,其停電的主要原因之一是數(shù)據(jù)中心缺乏雙電源回路。 OVH公司表示,雖然使用電源雙饋電架構(gòu)是企業(yè)的標(biāo)準(zhǔn),但是這個數(shù)據(jù)中心實施的是一個較舊的標(biāo)準(zhǔn),沒有提供雙路電源。