防止數(shù)據(jù)中心停機(jī)需要采取什么措施

責(zé)任編輯:editor005

作者:蘇楠

2017-11-06 14:25:36

摘自:中國(guó)IDC圈編譯

日前,據(jù)調(diào)研機(jī)構(gòu)對(duì)于數(shù)據(jù)中心的運(yùn)營(yíng)調(diào)查報(bào)告中表示,某些數(shù)據(jù)中心宕機(jī)事件本不應(yīng)該發(fā)生。工作人員的失誤,備用發(fā)電機(jī)沒(méi)有啟動(dòng),驚慌失措的決定等這些錯(cuò)誤都可以通過(guò)正確的流程和完善的電力系統(tǒng)設(shè)計(jì)來(lái)防止。

日前,據(jù)調(diào)研機(jī)構(gòu)對(duì)于數(shù)據(jù)中心的運(yùn)營(yíng)調(diào)查報(bào)告中表示,某些數(shù)據(jù)中心宕機(jī)事件本不應(yīng)該發(fā)生。而其宕機(jī)的主要原因并不是由于惡劣天氣、計(jì)劃外維護(hù)、甚至電網(wǎng)故障等因素導(dǎo)致,相反,這是一些組織糟糕的計(jì)劃和維護(hù)不當(dāng)造成的。從航空公司到互聯(lián)網(wǎng)巨頭,這些主要的用戶和企業(yè)都已經(jīng)成為了停機(jī)中斷事件的受害者,并且也深刻感受到這些可以預(yù)防的數(shù)據(jù)中心中斷事件的影響。然而不幸的是,這種情況并不少見(jiàn)。

數(shù)據(jù)中心行業(yè)廠商通過(guò)對(duì)歐洲各國(guó)IT和數(shù)據(jù)中心管理人員的調(diào)查表明:27%的受訪者表示在過(guò)去的三個(gè)月遭遇過(guò)長(zhǎng)時(shí)間的中斷,對(duì)組織業(yè)務(wù)產(chǎn)生了不利的影響。絕大多數(shù)受訪者(82%)認(rèn)為大多數(shù)關(guān)鍵業(yè)務(wù)流程依賴于IT服務(wù),74%的受訪者表示數(shù)據(jù)中心的健康狀況直接影響到IT服務(wù)的質(zhì)量。組織業(yè)務(wù)主要取決于IT服務(wù)和IT設(shè)備依賴于數(shù)據(jù)中心的功能。事實(shí)上,四分之一以上的數(shù)據(jù)中心遭受長(zhǎng)時(shí)間的中斷事件表明在行業(yè)層面上有些方法措施是錯(cuò)誤的。

(1)事先規(guī)劃防止電力供應(yīng)中斷

正如關(guān)鍵業(yè)務(wù)流程依賴IT服務(wù)一樣,數(shù)據(jù)中心本身也必須提供彈性以保持業(yè)務(wù)運(yùn)行。它是任何企業(yè)風(fēng)險(xiǎn)管理戰(zhàn)略中的核心資產(chǎn)。

工作人員的失誤,備用發(fā)電機(jī)沒(méi)有啟動(dòng),驚慌失措的決定等這些錯(cuò)誤都可以通過(guò)正確的流程和完善的電力系統(tǒng)設(shè)計(jì)來(lái)防止。然而,組織往往并沒(méi)有遵循數(shù)據(jù)中心電力管理的黃金法則:行動(dòng)獲得結(jié)果和產(chǎn)生后果需要采取行動(dòng)。

組織需要災(zāi)難恢復(fù)流程,并明確規(guī)定在重新啟動(dòng)數(shù)據(jù)中心時(shí)應(yīng)采取哪些步驟。在數(shù)據(jù)中心停機(jī)中斷的情況下,工作人員可能處于忙碌緊張狀態(tài),并面臨恢復(fù)正常服務(wù)的壓力。畢竟,工作人員的主要目標(biāo)是盡可能快地恢復(fù)正常運(yùn)營(yíng)。因此,災(zāi)難恢復(fù)流程有助于避免延長(zhǎng)停電時(shí)間。

(2)提高工作人員的技能

實(shí)際上,數(shù)據(jù)中心缺乏電源管理意識(shí)和理解是一個(gè)常見(jiàn)的問(wèn)題。參與調(diào)查的數(shù)據(jù)中心專業(yè)人員中有三分之二的人表明對(duì)電力保障沒(méi)有充分的信心。而在組織在能夠掌握電源管理(從UPS維護(hù)到電池檢查)之前,可能會(huì)有更多的與電源相關(guān)的停電事件發(fā)生。

但是,工作人員的技能對(duì)于提高電源可用性有著至關(guān)重要的作用。許多組織發(fā)現(xiàn),無(wú)論是在能源效率設(shè)計(jì)、持續(xù)管理消費(fèi),或快速有效地處理與電力有關(guān)的故障,以避免和減輕停電方面,都很難招募和保留相關(guān)的專業(yè)人員或人才。

(3)更新升級(jí)基礎(chǔ)設(shè)施

除了提高技能和保障電力之外,數(shù)據(jù)中心基礎(chǔ)設(shè)施本身經(jīng)常需要更新升級(jí),以滿足企業(yè)對(duì)其效率,可靠性和靈活性的期望。在這個(gè)調(diào)查中,大約一半受訪者表示,他們的核心IT基礎(chǔ)架構(gòu)需要加強(qiáng),而近三分之二的受訪者表示需要加強(qiáng)電力和冷卻等方面的設(shè)施。

電源管理越來(lái)越成為一種軟件定義的活動(dòng)。鑒于工作人員的技能方面的差距,軟件可以通過(guò)IT人員熟悉的儀表板來(lái)提供電源管理選項(xiàng),以彌合IT部門(mén)和電源之間的鴻溝,從而更輕松地進(jìn)行管理,并實(shí)現(xiàn)電力基礎(chǔ)設(shè)施管理的自動(dòng)化。采用這種技術(shù)可以減少或消除數(shù)據(jù)中心的停機(jī)時(shí)間。

行業(yè)廠商已經(jīng)向數(shù)據(jù)中心的虛擬化環(huán)境方向發(fā)展。IT和數(shù)據(jù)中心的專業(yè)人員如今已經(jīng)非常熟悉使用虛擬化技術(shù)來(lái)維護(hù)硬件。那么為什么不使用同樣的原則呢?所有的配電設(shè)計(jì)和相關(guān)的彈性軟件工具必須與主要虛擬化供應(yīng)商的產(chǎn)品相兼容,促進(jìn)基礎(chǔ)設(shè)施的未來(lái)發(fā)展。這種方法將使數(shù)據(jù)中心專業(yè)人員可以持續(xù)地維護(hù)系統(tǒng),從而減少基礎(chǔ)設(shè)施陳舊過(guò)時(shí)的風(fēng)險(xiǎn)。

更好的準(zhǔn)備和災(zāi)難恢復(fù)過(guò)程可能會(huì)阻止許多中斷事件的發(fā)生。數(shù)據(jù)中心行業(yè)用戶必須從這些事件中吸取教訓(xùn),并采取必要的措施。因此,為了減少數(shù)據(jù)中心的中斷事件,有效實(shí)施電源管理是一個(gè)必備措施。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)