在日前的《行業(yè)之聲》中,F(xiàn)ORTRUST公司首席運(yùn)營(yíng)官羅伯特o麥克拉里討論了數(shù)據(jù)中心維護(hù)和工作方式戰(zhàn)略,以及包括哪些內(nèi)容。FORTRUST公司首席運(yùn)營(yíng)官羅伯特o麥克拉里主要負(fù)責(zé)FORTRUST公司的業(yè)務(wù)運(yùn)營(yíng),高層建設(shè)和戰(zhàn)略技術(shù)指導(dǎo)的整體監(jiān)督。他開(kāi)發(fā)并實(shí)施了過(guò)程控制,有效地支持了自2001年以來(lái)丹佛公司提供的持續(xù)正常運(yùn)行時(shí)間和可靠性。他是數(shù)據(jù)中心行業(yè)管理和運(yùn)營(yíng)的領(lǐng)先專家之一,并被AFCOM選為入圍年度數(shù)據(jù)中心經(jīng)理。
擁有維護(hù)和生命周期策略的熟練運(yùn)營(yíng)團(tuán)隊(duì)是數(shù)據(jù)中心關(guān)鍵系統(tǒng)基礎(chǔ)設(shè)施在長(zhǎng)時(shí)間能持續(xù)提供高可用性服務(wù)交付和正常運(yùn)行能力的核心。
根據(jù)最近的市場(chǎng)研究,企業(yè)在繼續(xù)利用托管服務(wù),并將其作為企業(yè)基礎(chǔ)設(shè)施的關(guān)鍵部分。桑德勒研究公司預(yù)測(cè),到2020年,全球托管市場(chǎng)的復(fù)合年增長(zhǎng)率將超過(guò)12%,這是由于企業(yè)IT預(yù)算減少,以及關(guān)鍵應(yīng)用支持和可訪問(wèn)性需求的上升。
隨著企業(yè)越來(lái)越依賴托管服務(wù)提供商,對(duì)這些數(shù)據(jù)中心進(jìn)行適當(dāng)維護(hù)變得更加重要。即使是一分鐘的宕機(jī)時(shí)間,也可能使企業(yè)付出數(shù)千美元的代價(jià),并損害其在行業(yè)中的聲譽(yù),因此需要服務(wù)提供商竭盡全力確保24小時(shí)的正常運(yùn)行時(shí)間是絕對(duì)必要的。
這就是強(qiáng)大的數(shù)據(jù)中心維護(hù)和生命周期策略在發(fā)揮作用,并成為數(shù)據(jù)中心設(shè)施流程的關(guān)鍵部分。但是,確切地說(shuō),客戶應(yīng)該問(wèn)托管供應(yīng)商這些維護(hù)策略會(huì)帶來(lái)什么樣的好處?
是什么使維護(hù)和生命周期策略如此重要?
在當(dāng)前的IT環(huán)境中,停機(jī)時(shí)間不僅在成本方面代價(jià)高昂,而且還會(huì)對(duì)企業(yè)品牌的聲譽(yù)造成無(wú)法估量的損害。尤其是那些支持客戶服務(wù)所必需面向客戶資源的托管數(shù)據(jù)中心設(shè)施更是如此。
FORTRUST公司首席運(yùn)營(yíng)官羅伯特o麥克拉里指出,數(shù)據(jù)中心糟糕的維護(hù)和生命周期策略是計(jì)劃外停機(jī)的第二個(gè)主要原因,人為錯(cuò)誤和容量管理不善是數(shù)據(jù)中心停機(jī)的最主要的原因。即使是最佳優(yōu)化設(shè)計(jì)的數(shù)據(jù)中心,如果缺乏適當(dāng)?shù)南到y(tǒng)維護(hù)和保養(yǎng)的話,也無(wú)法阻止這種情況發(fā)生。
麥克拉里在FORTRUST公司發(fā)布的高可靠性數(shù)據(jù)中心操作指南中寫(xiě)道:"數(shù)據(jù)中心的設(shè)計(jì)可靠性并不能彌補(bǔ)較差的維護(hù)和生命周期策略所帶來(lái)的損失。而維護(hù)和生命周期戰(zhàn)略是數(shù)據(jù)中心持續(xù)長(zhǎng)期提供高可用性服務(wù)交付和正常運(yùn)行時(shí)間的核心。"
不同類型的維護(hù)
當(dāng)涉及到維護(hù)策略時(shí),有一些不同的類型,托管客戶應(yīng)該獲取有關(guān)這些過(guò)程的細(xì)節(jié),這是至關(guān)重要的,因?yàn)樗鼘@示托管服務(wù)提供商對(duì)數(shù)據(jù)中心設(shè)施內(nèi)正常運(yùn)行時(shí)間的奉獻(xiàn)。
麥克拉里指出,這里的全面戰(zhàn)略應(yīng)包括:
定期和徹底的檢查:數(shù)據(jù)中心工作人員應(yīng)該不斷檢查數(shù)據(jù)中心的各種系統(tǒng)和設(shè)備,以確保它們處于正常工作狀態(tài)。這包括對(duì)發(fā)電機(jī),水溫,燃料液位,氣室壓力,電氣和機(jī)械分配系統(tǒng)操作參數(shù),以及其他系統(tǒng)參數(shù)和配置的日常檢查等。
連續(xù)測(cè)試:數(shù)據(jù)中心設(shè)施的員工還應(yīng)測(cè)試特定系統(tǒng),以確保其在正確的參數(shù)范圍內(nèi)運(yùn)行。這里的過(guò)程可以包括紅外線,負(fù)載測(cè)試和故障切換測(cè)試。
預(yù)測(cè)性維護(hù):這是數(shù)據(jù)中心戰(zhàn)略的關(guān)鍵部分。預(yù)測(cè)性維護(hù)利用測(cè)量和其他數(shù)據(jù)分析來(lái)識(shí)別可能指示潛在故障的任何變化,趨勢(shì)或者違規(guī)行為。這樣,工作人員可以在導(dǎo)致中斷之前解決這些問(wèn)題。
預(yù)防性維護(hù):麥克拉里解釋說(shuō),預(yù)防性維護(hù)的目的是"保持一件設(shè)備或部件運(yùn)行在最佳水平或延長(zhǎng)其生命周期的行動(dòng)".這種類型的維護(hù)可包括過(guò)濾器或換油,以及清潔熱交換器和電氣系統(tǒng)。
糾正性維護(hù):最后,當(dāng)系統(tǒng)或組件需要維修或更換時(shí),工作人員應(yīng)充分利用糾正性維護(hù)流程。在正確的維護(hù)下,阻止泄漏或更換軸承或閥門(mén)。
通過(guò)包括預(yù)測(cè)性和預(yù)防性維護(hù)的策略,系統(tǒng)故障的可能性大大降低。這些過(guò)程使數(shù)據(jù)中心設(shè)施的工作人員能夠在導(dǎo)致計(jì)劃外或甚至計(jì)劃中斷之前查明和解決問(wèn)題。
"不要成為一個(gè)只會(huì)等待失敗的組織。" 麥克拉里建議說(shuō),"我相信,在故障前預(yù)測(cè)到設(shè)備中的問(wèn)題是簡(jiǎn)單的。事實(shí)上,我相信,如果你有一個(gè)強(qiáng)大的維護(hù)和生命周期戰(zhàn)略,不可預(yù)測(cè)的失敗將會(huì)成為一個(gè)隨機(jī)事件。"因此,定期維護(hù)對(duì)于確保關(guān)鍵系統(tǒng)正常運(yùn)行時(shí)間至關(guān)重要。
生命周期策略的部分
確保設(shè)施管理人員有一個(gè)生命周期策略也是至關(guān)重要的。麥克拉里解釋說(shuō),這包括預(yù)防性和預(yù)測(cè)性維護(hù)計(jì)劃以及其他最佳實(shí)踐,以提高設(shè)備的生命周期。在這里尋找的活動(dòng)包括:
故障前更換:許多系統(tǒng)和組件在其使用期到期之后,將在一定的間隔時(shí)間之后進(jìn)行更換。而沒(méi)有更換這些設(shè)備會(huì)增加故障和意外停機(jī)的幾率。
切換:類似地,某些組件需要根據(jù)特定的時(shí)間表進(jìn)行切換,以確保性能和平衡。
更換:最后,客戶應(yīng)確保設(shè)數(shù)據(jù)心設(shè)施工作人員有一個(gè)規(guī)定正確時(shí)間更換設(shè)備的策略。
此過(guò)程可以確保關(guān)鍵系統(tǒng)在過(guò)程中不中斷。
其他最佳實(shí)踐
托管客戶還應(yīng)確保其服務(wù)提供商遵循其他維護(hù)和生命周期最佳實(shí)踐。麥克拉里表示,"供應(yīng)商應(yīng)優(yōu)先考慮預(yù)防性和預(yù)測(cè)性維護(hù)。這包括了解并將設(shè)備制造商的建議納入其整個(gè)流程。在許多情況下,設(shè)施工作人員不應(yīng)只是遵循這些建議,而是在這些建議之外,需要確保設(shè)備在最佳水平運(yùn)行,并且可以延長(zhǎng)其生命周期??蛻暨€應(yīng)該確保他們的提供商優(yōu)先進(jìn)行預(yù)防性和預(yù)測(cè)性維護(hù)措施,而不是糾正性維護(hù)措施。
"從長(zhǎng)遠(yuǎn)來(lái)看,校正維護(hù)的成本要大得多," 麥克拉里寫(xiě)道。 "而定期的預(yù)防性維護(hù)將為企業(yè)節(jié)省更多的成本。"
此外,最好確保包括數(shù)據(jù)中心維護(hù)和生命周期過(guò)程的關(guān)鍵流程在內(nèi)部處理,并且這些活動(dòng)不會(huì)外包給第三方。數(shù)據(jù)中心設(shè)施管理者應(yīng)該為外部供應(yīng)商執(zhí)行哪些流程提供極大的選擇性。根據(jù)經(jīng)驗(yàn),這些整體程序中不到20%應(yīng)該是外包的。
麥克拉里說(shuō):"擁有維護(hù)和生命周期策略的技術(shù)運(yùn)營(yíng)團(tuán)隊(duì)是數(shù)據(jù)中心關(guān)鍵系統(tǒng)基礎(chǔ)設(shè)施在長(zhǎng)時(shí)間內(nèi)持續(xù)提供高可用性服務(wù)交付和正常運(yùn)行時(shí)間的能力的核心。維護(hù)和生命周期戰(zhàn)略必須是一個(gè)例行程序。這些細(xì)節(jié)和所有權(quán)都是可以復(fù)制的,而整個(gè)組織的每一級(jí)都可以確定和強(qiáng)調(diào)。
麥克拉里表示,F(xiàn)ORTRUST公司已經(jīng)連續(xù)提供了100%關(guān)鍵系統(tǒng)正常運(yùn)行時(shí)間超過(guò)15年。