數(shù)據(jù)中心的資本項(xiàng)目往往會(huì)發(fā)生變數(shù),而相關(guān)的管理執(zhí)行人員又減少了唯一可以阻止這些變數(shù)的進(jìn)程。
對(duì)于正在進(jìn)行數(shù)據(jù)中心資本投資項(xiàng)目的IT企業(yè)組織而言,不可否認(rèn),其風(fēng)險(xiǎn)是很高的。構(gòu)建新的數(shù)據(jù)中心無疑是一項(xiàng)巨大的投資,但其也可以實(shí)現(xiàn)或阻礙企業(yè)組織的IT戰(zhàn)略和能力,從而影響企業(yè)組織為未來多年的整體業(yè)務(wù)績(jī)效。
隨著越來越多的企業(yè)組織依賴于主機(jī)托管數(shù)據(jù)中心供應(yīng)商,因而確保這些項(xiàng)目的設(shè)計(jì)和建設(shè)能夠滿足您企業(yè)的業(yè)務(wù)需求無疑也是至關(guān)重要的。
對(duì)于任何數(shù)據(jù)中心工程項(xiàng)目而言,通常都會(huì)牽扯到多家供應(yīng)商、分包商,并會(huì)涉及到超過50多個(gè)不同的學(xué)科領(lǐng)域,包括諸如數(shù)據(jù)中心的架構(gòu)、電氣設(shè)備、HVAC、管道給排水、燃料泵、網(wǎng)絡(luò)布線等等——故而在建造過程中,如果沒有發(fā)生任何誤差或在施工過程中不存在任何偷工減料,無疑將是相當(dāng)棒的。
而在施工監(jiān)督、規(guī)劃和預(yù)算方面的失效則意味著昂貴的新數(shù)據(jù)中心設(shè)施將無法滿足業(yè)主的要求,最終結(jié)果或?qū)?dǎo)致新建成的數(shù)據(jù)中心設(shè)施性能不佳或靈活性有限。
而對(duì)于這些問題的解決可能會(huì)延遲數(shù)據(jù)中心建設(shè)項(xiàng)目的工期,而且通常需要花費(fèi)大量的額外支出。在某些情況下,某些問題仍然將在數(shù)據(jù)中心的使用壽命范圍內(nèi)長(zhǎng)期妨礙其正常的健康運(yùn)轉(zhuǎn),并可能最終需要提前更換設(shè)備。
即使該設(shè)施在其預(yù)期壽命內(nèi)仍然可以繼續(xù)運(yùn)行,但其運(yùn)行成本則可能會(huì)超出預(yù)期,使得數(shù)據(jù)中心蒙受更多的停機(jī)中斷事故,并且使得數(shù)據(jù)中心業(yè)主不得不引入新的產(chǎn)品和服務(wù)。
鑒于企業(yè)組織在IT基礎(chǔ)設(shè)施項(xiàng)目上投入了大量資金,并且考慮到現(xiàn)如今的整個(gè)數(shù)據(jù)中心行業(yè)的成熟度,您可能會(huì)認(rèn)為:出現(xiàn)資本項(xiàng)目錯(cuò)誤的狀況是極為罕見的。
但事實(shí)上:您錯(cuò)了!
數(shù)據(jù)中心項(xiàng)目不斷失敗
諸如Uptime Institute等等這樣的權(quán)威機(jī)構(gòu)往往會(huì)對(duì)數(shù)據(jù)中心資本項(xiàng)目進(jìn)行評(píng)估,以確保在整個(gè)數(shù)據(jù)中心的設(shè)計(jì)、建造和運(yùn)營(yíng)過程中,數(shù)據(jù)中心的業(yè)務(wù)需求和目標(biāo)能夠真正得以實(shí)現(xiàn)。
通常,技術(shù)人員在所謂的調(diào)試階段(大多數(shù)IT資本項(xiàng)目出現(xiàn)失敗的核心)之后,會(huì)立即進(jìn)入新的數(shù)據(jù)中心站點(diǎn)。
非技術(shù)項(xiàng)目業(yè)主可能會(huì)認(rèn)為調(diào)試是一個(gè)神秘的,過于工程設(shè)計(jì)化的過程,他們可以減少或縮短這一過程,以滿足其他業(yè)務(wù)壓力。但他們這樣做其實(shí)是有危險(xiǎn)的,因?yàn)檎{(diào)試是決定一個(gè)項(xiàng)目成功的最重要的階段。
調(diào)試:
·驗(yàn)證設(shè)備和系統(tǒng)是否是按照工程師的設(shè)計(jì)進(jìn)行操作運(yùn)營(yíng)的
·為設(shè)施在其整個(gè)生命周期內(nèi)應(yīng)如何運(yùn)行提供了一個(gè)基準(zhǔn)
·為操作運(yùn)營(yíng)人員熟悉系統(tǒng)的操作、測(cè)試和驗(yàn)證操作程序,而不會(huì)危及關(guān)鍵IT負(fù)載提供最好的機(jī)會(huì)。
在調(diào)試完成后,該數(shù)據(jù)中心站點(diǎn)應(yīng)該為上線做好準(zhǔn)備了。
然而,在最新推出的約200份層級(jí)認(rèn)證中,幾乎每份報(bào)告都在不同程度上揭示了在層級(jí)認(rèn)證過程中所發(fā)現(xiàn)的數(shù)據(jù)中心基礎(chǔ)設(shè)施的一些設(shè)計(jì)缺陷,設(shè)備故障或意外問題。事實(shí)上,超過70%的數(shù)據(jù)中心建造項(xiàng)目在第一輪示范期間未通過層級(jí)認(rèn)證評(píng)估,需要數(shù)據(jù)中心業(yè)主投入更多時(shí)間和資源來解決這些問題。
2016年,在美洲的一個(gè)數(shù)據(jù)中心資本項(xiàng)目的層級(jí)認(rèn)證期間,其備用電力系統(tǒng)在模擬公用電力公司供電中斷期間出現(xiàn)故障失敗。這是一個(gè)預(yù)期的設(shè)計(jì)條件——可以說是一處新建數(shù)據(jù)中心最基本的功能。故障發(fā)生的根本原因是緣于針對(duì)設(shè)計(jì)到備用電力系統(tǒng)中的某個(gè)“功能特征”,數(shù)據(jù)中心的所有者并沒有針對(duì)該“功能特征”接受培訓(xùn),不具備適當(dāng)?shù)闹R(shí),并且沒有被通知該“功能特征”的存在,從而破壞了數(shù)據(jù)中心的設(shè)計(jì)初衷目的。
而在2016年的歐洲的一個(gè)層級(jí)認(rèn)證項(xiàng)目期間,Uptime Institute發(fā)現(xiàn),數(shù)據(jù)中心對(duì)生命安全構(gòu)成了威脅。對(duì)電力系統(tǒng)的服務(wù)工作需要在400伏連接放置一個(gè)螺絲刀。其他被發(fā)現(xiàn)的故障,歸因于糟糕的保險(xiǎn)絲額定值和樓宇監(jiān)控和自動(dòng)化系統(tǒng)的錯(cuò)誤。這三個(gè)問題中的任何一個(gè)都會(huì)導(dǎo)致新數(shù)據(jù)中心的服務(wù)中斷。
Uptime Institute的層級(jí)標(biāo)準(zhǔn)高級(jí)副總裁克里斯·布朗解釋道:“許多數(shù)據(jù)中心業(yè)主依靠層級(jí)認(rèn)證作為調(diào)試活動(dòng)。在我們進(jìn)行認(rèn)證之前,數(shù)據(jù)中心業(yè)主僅僅只進(jìn)行最小的測(cè)試,并指望我們能夠?yàn)樗麄冋{(diào)試該數(shù)據(jù)中心站點(diǎn),而這一工作并不是層級(jí)認(rèn)證所打算做的。”
重點(diǎn)需要注意的是,Uptime Institute的評(píng)估是數(shù)據(jù)中心資本項(xiàng)目的最后一步,緊接著的便是新數(shù)據(jù)中心的投入運(yùn)營(yíng)使用了。所有的數(shù)據(jù)中心資本項(xiàng)目的利益相關(guān)者在評(píng)估開始之前就已經(jīng)簽署數(shù)據(jù)中心了。
那么,為什么在調(diào)試階段沒有發(fā)現(xiàn)這些問題呢?
調(diào)試狀態(tài)的問題
調(diào)試活動(dòng)代表了驗(yàn)證數(shù)據(jù)中心業(yè)主是否具備嚴(yán)格測(cè)試數(shù)據(jù)中心的關(guān)鍵基礎(chǔ)設(shè)施的能力的一個(gè)獨(dú)特的機(jī)會(huì)。但是,這個(gè)過程常常被縮短。
Uptime Institute的顧問將負(fù)責(zé)為數(shù)據(jù)中心業(yè)主和項(xiàng)目管理團(tuán)隊(duì)調(diào)試故障,但不是調(diào)試代理。
Uptime Institute的高級(jí)顧問Ryan Orr表示說:“數(shù)據(jù)中心的業(yè)主對(duì)他們的調(diào)試代理所提出的保持低成本和維護(hù)計(jì)劃的要求,成為了調(diào)試代理們的一大束縛。”
延遲新建數(shù)據(jù)中心的投產(chǎn)運(yùn)營(yíng),不管其業(yè)主是企業(yè)、托管服務(wù)商還是大規(guī)模躉售商,都不是大多數(shù)企業(yè)組織的選擇。因此,如果在數(shù)據(jù)中心交接日期之前沒有完成調(diào)試,IT就開始正式的遷入的話,那么當(dāng)IT開始遷入時(shí),在許多情況下,可能會(huì)使調(diào)試活動(dòng)難以正常完成。
“調(diào)試工作應(yīng)該始終總是最后的一項(xiàng)工作。”Orr說。 “所以,如果有項(xiàng)目延遲的可能,其實(shí)任何一個(gè)項(xiàng)目都會(huì)有這種可能性,那么調(diào)試過程總是是被擠壓犧牲掉了?;蛘呷绻?xiàng)目超過了預(yù)算,調(diào)試過程也會(huì)被擠壓犧牲掉。一般會(huì)將大約需要兩個(gè)星期的調(diào)試時(shí)間安排被擠壓到僅僅只有三四天,而調(diào)試代理人必須盡其所能地做到最好。”
Orr指出了當(dāng)前調(diào)試狀態(tài)所存在的其他幾個(gè)問題:
· 太多的企業(yè)組織對(duì)假設(shè)和代表性的測(cè)試很滿意。例如,一家數(shù)據(jù)中心業(yè)主可以執(zhí)行調(diào)試項(xiàng)目的第一階段,但是由于系統(tǒng)的共享,并且數(shù)據(jù)中心業(yè)主不想將實(shí)時(shí)的IT負(fù)載置于共享基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)測(cè)試中,因此在后續(xù)階段縮短了調(diào)試時(shí)間。
· 承包商和調(diào)試代理之間的不當(dāng)關(guān)系。數(shù)據(jù)中心業(yè)主應(yīng)直接聘請(qǐng)調(diào)試代理。然而,這種情況發(fā)生得似乎越來越少,并引發(fā)了對(duì)利益沖突的嚴(yán)重關(guān)切。
· 許多數(shù)據(jù)中心業(yè)主認(rèn)為他們并不需要嚴(yán)格的調(diào)試,因?yàn)樗麄兛梢砸蕾嚮A(chǔ)設(shè)施的冗余。然而有時(shí)候,有冗余固然是一回事,但數(shù)據(jù)中心業(yè)主對(duì)于其冗余的具體狀況并未有清晰的了解,除非其經(jīng)過了恰當(dāng)?shù)臏y(cè)試。
如何恰當(dāng)?shù)倪M(jìn)行調(diào)試
一套精心策劃和執(zhí)行的調(diào)試程序?qū)⒂兄谠谛陆〝?shù)據(jù)中心建成交付之前很好的驗(yàn)證該數(shù)據(jù)中心資本投資項(xiàng)目。其也將使得數(shù)據(jù)中心的運(yùn)營(yíng)團(tuán)隊(duì)能夠處于一個(gè)更好的位置在該數(shù)據(jù)中心剩下的使用壽命范圍期限內(nèi)來負(fù)責(zé)管理和運(yùn)營(yíng)數(shù)據(jù)中心的關(guān)鍵基礎(chǔ)設(shè)施,并最終確保該數(shù)據(jù)中心設(shè)施實(shí)現(xiàn)其全部潛力。在數(shù)據(jù)中心調(diào)試的嚴(yán)格性方面經(jīng)驗(yàn)不足的建筑施工團(tuán)隊(duì)經(jīng)常會(huì)低估了調(diào)試所需的時(shí)間或?qū)⒄{(diào)試期視為數(shù)據(jù)中心建成完工交付訪問工作延遲的一種緩沖。由于上述兩個(gè)原因,數(shù)據(jù)中心業(yè)主或業(yè)主代表應(yīng)注意安排好足夠的時(shí)間進(jìn)行調(diào)試,并確保承包商在施工期限范圍內(nèi)的建成交付。建議在制定數(shù)據(jù)中心項(xiàng)目進(jìn)度時(shí),就聘請(qǐng)調(diào)試代理和總承包商,并將他們作為合作伙伴。
此外,數(shù)據(jù)中心資本項(xiàng)目包括對(duì)在關(guān)鍵任務(wù)環(huán)境中缺乏經(jīng)驗(yàn)的團(tuán)隊(duì)可能不熟悉的要求;這些要求往往對(duì)預(yù)算有影響。
例如,數(shù)據(jù)中心業(yè)主和業(yè)主代表必須仔細(xì)檢查施工投標(biāo),以確保其資金和時(shí)間的充足:
·關(guān)鍵設(shè)備的現(xiàn)場(chǎng)測(cè)試
·借助供應(yīng)商的支持?jǐn)U展4級(jí)和5級(jí)調(diào)試
·負(fù)載管理團(tuán)隊(duì)在臨界環(huán)境中模擬全部IT負(fù)載
·用于測(cè)試和驗(yàn)證發(fā)動(dòng)機(jī)發(fā)電機(jī)系統(tǒng)的柴油燃料
由于經(jīng)驗(yàn)豐富的團(tuán)隊(duì)了解數(shù)據(jù)中心特定調(diào)試的重要性,調(diào)試代理將能夠在調(diào)試過程的早期更有效地工作,進(jìn)而更好的過渡到操作設(shè)置階段。
此外,從項(xiàng)目施工開始到調(diào)試再到建成交付,運(yùn)營(yíng)應(yīng)該是數(shù)據(jù)中心項(xiàng)目設(shè)計(jì)和施工團(tuán)隊(duì)的一部分。包括將操作運(yùn)營(yíng)納入到變更管理的范圍讓數(shù)據(jù)中心業(yè)主有機(jī)會(huì)在整個(gè)企業(yè)范圍內(nèi)共享和學(xué)習(xí)關(guān)于數(shù)據(jù)中心將如何運(yùn)行的關(guān)鍵信息,包括設(shè)定點(diǎn),設(shè)備輪換,變更管理,培訓(xùn)和備用庫(kù)存。
數(shù)據(jù)中心的資本項(xiàng)目面臨著復(fù)雜的挑戰(zhàn),涉及到多個(gè)利益相關(guān)方和承包商,以及需要將跨多個(gè)學(xué)科領(lǐng)域的知識(shí)匯聚整合在一起。為了確保數(shù)據(jù)中心基礎(chǔ)設(shè)施的投資滿足企業(yè)組織的業(yè)務(wù)需求,項(xiàng)目負(fù)責(zé)人需要選擇合適的合作伙伴,授權(quán)合格的所有者代表,并留出足夠的時(shí)間進(jìn)行嚴(yán)格的調(diào)試和第三方認(rèn)證。
關(guān)于作者
本文作者M(jìn)att Stansberry自2011年起就負(fù)責(zé)擔(dān)任Uptime Institute的內(nèi)容和出版總監(jiān)。他之前的職位是TechTarget公司的數(shù)據(jù)中心和虛擬化團(tuán)隊(duì)的編輯總監(jiān)。自2003以來,他就開始就企業(yè)IT和企業(yè)可持續(xù)發(fā)展領(lǐng)域進(jìn)行長(zhǎng)期性的研究和報(bào)告。