數(shù)據(jù)中心驗證過程到底有多重要

責任編輯:editor03

2014-06-12 17:14:01

摘自:賽迪網(wǎng)

ASHRAE 美國采暖、制冷與空調(diào)工程師學會認為,數(shù)據(jù)中心驗證是一個系統(tǒng)性的質(zhì)量驗證過程。此過程驗證并記錄該數(shù)據(jù)中心設施作為一個整體及其所有的設備。

ASHRAE 美國采暖、制冷與空調(diào)工程師學會認為,數(shù)據(jù)中心驗證是一個系統(tǒng)性的質(zhì)量驗證過程。此過程驗證并記錄該數(shù)據(jù)中心設施作為一個整體及其所有的設備、子系統(tǒng)滿足用戶的設計目標和運行要求。

作為全球最有影響力的行業(yè)組織,ASHRAE更看重數(shù)據(jù)中心驗證過程的重要性。數(shù)據(jù)中心驗證是業(yè)主對于數(shù)據(jù)中心建造質(zhì)量進行確認的一個過程。在歐美的建筑行業(yè),驗證作為工程質(zhì)量管理的規(guī)定步驟已經(jīng)存在了30多年。近10年來,歐美的數(shù)據(jù)中心客戶也已經(jīng)把驗證作為數(shù)據(jù)中心工程質(zhì)量管理的規(guī)定動作了。

國內(nèi)近幾年建設的大型數(shù)據(jù)中心也都開始把驗證作為必須的要求。但相對起國外,行業(yè)人士預計還有80%的國內(nèi)數(shù)據(jù)中心沒有聘用專業(yè)的第三方機構(gòu)進行數(shù)據(jù)中心的驗證。這為數(shù)據(jù)中心穩(wěn)健運行埋下了隱患。

而從數(shù)據(jù)中心項目實際進展的角度,規(guī)劃、設計、建設階段投資大,周期長,驗證是確保投資達到預期目標的最重要的手段,也可以看作數(shù)據(jù)中心建設的終點。與此同時,驗證是數(shù)據(jù)中心運行的起點。一個專業(yè)和完善的測試驗證可以極大降低數(shù)據(jù)中心在其運行早期的故障率,并為其全生命周期的穩(wěn)健運行奠定基礎。也就是說,數(shù)據(jù)中心驗證過程發(fā)生在工程竣工和投產(chǎn)之間的關鍵節(jié)點,這個節(jié)點也直接決定了數(shù)據(jù)中心前期投資和后期運行能否按照規(guī)劃順利實現(xiàn)。

基于大數(shù)據(jù)[注]導致業(yè)務量激增和數(shù)據(jù)中心能力不斷增強的雙重需求,無論是以金融業(yè)為代表的注重自身業(yè)務持續(xù)性的行業(yè)用戶,以互聯(lián)網(wǎng)、運營商為代表的希望通過數(shù)據(jù)中心擴展業(yè)務收入的行業(yè)用戶,以地方政府為代表的以產(chǎn)業(yè)園模式介入數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展的新興用戶,還是以提供數(shù)據(jù)中心服務為己任的老牌IDC 提供商們,都需要全程參與數(shù)據(jù)中心的從無到有。而用戶自身參與的過程也為數(shù)據(jù)中心項目帶來諸多潛在風險,最值得引起重視的風險包括前期數(shù)目巨大已經(jīng)投入的投資風險和后期業(yè)務對數(shù)據(jù)中心潛在的嚴重依賴風險。

數(shù)據(jù)中心驗證的價值——為什么要做?

以汽車為例子,在生產(chǎn)線上有嚴格的質(zhì)量管理,出廠前也有廠驗。所有汽車在從組裝線下線之后、交付用戶之前,需要經(jīng)歷整車綜合測試、道路測試。同時,對于每個車型要做碰撞實驗,以模擬最壞情況下汽車整車的應對能力。只有那些通過了所有上路實際測試的車輛,才能讓我們放心駕駛。

數(shù)據(jù)中心建設和汽車有很多相似之處。安全(可靠性和可用性)也是頭等大事。未經(jīng)測試直接投入運行的數(shù)據(jù)中心,未必立刻出現(xiàn)故障,但存在用戶自己也無法掌握的隱患和風險。經(jīng)過對行業(yè)案例的分析比對,專家認為,忽視數(shù)據(jù)中心驗證過程會增加風險變成事故的幾率。舉例來說,北京某知名數(shù)據(jù)中心,投產(chǎn)前因工期緊張等原因未進行測試驗證。在運行一段時間后,用戶希望對A路UPS 進行保養(yǎng),在操作斷開A 路斷路器的時候,不幸的是,B路UPS 卻被切斷,導致系統(tǒng)中斷,也因此付出了數(shù)額不菲的經(jīng)濟代價。

由此可見,只有在投產(chǎn)前進行全面的測試驗證才能發(fā)現(xiàn)全部問題,排除定時炸彈。數(shù)據(jù)中心驗證作為項目必須經(jīng)歷的重要過程,應該引起國內(nèi)用戶們的足夠重視。

通常情況下,客戶會要求具備相關能力和資質(zhì)的第三方公司針對包括供配電、安防、空調(diào)、監(jiān)控、環(huán)境、布線、線纜、防雷接地等子系統(tǒng)進行設備測試、系統(tǒng)內(nèi)測試、系統(tǒng)聯(lián)調(diào)、和基于故障模擬的集成測試。

高端客戶更看重基于故障模擬的集成測試,模擬極端情況,測試系統(tǒng)實際抗故障能力:模擬發(fā)電機故障以測試容量及冗余能力,模擬市電故障測試轉(zhuǎn)換開關和發(fā)電機性能,模擬UPS 故障測試UPS 冗余能力,等等。

可以說,數(shù)據(jù)中心驗證作為檢測必備環(huán)節(jié),正在成為每一個數(shù)據(jù)中心建設工程的標準流程。

驗證能夠有效幫助后期正常運行,對項目實際運行、后期運維和可能的事故預案都有著非常重要的作用。

測試驗證過程通過多層級測試、模擬多種情景來幫助發(fā)現(xiàn)系統(tǒng)可能存在的問題,并且針對薄弱環(huán)節(jié)進行整改,減少實際運行的故障隱患,提高系統(tǒng)可靠性,保證項目前期投資;

另外,驗證過程所實施的大量測試工作,為運維團隊提供了提前參與項目管理的機會,使得運維團隊對系統(tǒng)更加熟悉,并且掌握了一定的解決問題能力,便于后期對數(shù)據(jù)中心的全面管理;

更為重要的是,針對關鍵設備、系統(tǒng)內(nèi)、系統(tǒng)間及基于故障模擬的集成測試的驗證過程,為業(yè)主提供了大量真實有效的測試數(shù)據(jù),為將來數(shù)據(jù)中心的各項操作提供了全面的數(shù)據(jù)支持,也為業(yè)主完成標準化管理流程和運維預案提供了價值素材。

數(shù)據(jù)中心驗證的實施——誰來做?

數(shù)據(jù)中心驗證最重要的目標就是通過對所有故障可能性的設想和模擬,來找到數(shù)據(jù)中心在設計和建設過程中留下的問題,幫助用戶規(guī)避更多風險,降低數(shù)據(jù)中心故障率。好的驗證服務就是為業(yè)主發(fā)現(xiàn)當前的問題,并且提醒業(yè)主所有的單點故障點,為潛在的問題敲警鐘。所謂當前的問題,就是通過測試中發(fā)現(xiàn)的問題,比如斷路器的線可能接反;又比如線路標識的缺乏;或者是電路接點沒有擰緊。所謂單點故障(Single Point Of Failure) 就是列出所有供配電及制冷系統(tǒng)上可能引起系統(tǒng)中斷的點。

實踐中,有些數(shù)據(jù)中心管理者業(yè)存在這樣的誤區(qū):我是否還需要驗證?我已經(jīng)有監(jiān)理公司負責工程了?設備廠家也會來調(diào)試設備的啊?

機房工程中,業(yè)主會因為工程復雜程度以及施工多頭介入而頭痛不已,聘請工程監(jiān)理介入施工過程是國內(nèi)常用的做法,工程監(jiān)理主要關注于工程的安全、進度、預算、材料質(zhì)量的把控。但卻不能對整體工程結(jié)果性能負責。究其原因,工程監(jiān)理駐場的團隊一般僅有1-2名,無法三頭六臂看顧偌大工程,沒有相應的儀器和測試經(jīng)驗,也無法精通從供配電到制冷到弱電等全部專業(yè)的技術,無論從團隊能力還是團隊力量可能都沒法勝任專業(yè)的驗證過程。

還有部分業(yè)主把測試驗收分別交付給設備廠商或是工程承包商,他們或只著眼于自身所提供設備的質(zhì)量驗收,無法提供系統(tǒng)聯(lián)調(diào)的專業(yè)服務,更無故障模擬測試能力;或者無法提供用戶角度的第三方的測試驗收和整改意見。顯而易見,監(jiān)理、施工公司和廠商代表都無法幫助業(yè)主完成真正意義上的驗證過程,而測試驗證真正需要的是專業(yè)技術團隊的實施,從而保證最終的整體工程結(jié)果的性能符合設計要求和運行要求

數(shù)據(jù)中心驗證的內(nèi)容——做什么?

以國內(nèi)數(shù)據(jù)中心技術咨詢服務公司——中科仙絡咨詢服務公司為例,專注于數(shù)據(jù)中心技術服務領域,擁有10年歷史,及為上百家IDC和金融客戶提供數(shù)據(jù)中心全生命周期咨詢服務的經(jīng)驗,是美國Uptime研究所認可的戰(zhàn)略聯(lián)盟伙伴,擁有Uptime認證之ATD及ATS 技術人員。

擁有專業(yè)理論、豐富項目經(jīng)驗和權威的技術團隊等優(yōu)質(zhì)資源,中科仙絡認為,通過對關鍵設備測試、系統(tǒng)內(nèi)測試、系統(tǒng)間測試以及基于故障模擬的集成測試這四個不同層級的專業(yè)測試,以及通過圖紙審核、現(xiàn)場測試、專家評審、整改總結(jié)等步驟來完成測試驗證過程。測試驗證的目標就是挑出數(shù)據(jù)中心所有的問題和潛在的弱點,通過測試及驗證,最大化降低系統(tǒng)性風險,提高數(shù)據(jù)中心的可靠性、可用性程度;確認機房竣工前關鍵節(jié)點的施工質(zhì)量、安裝工藝、系統(tǒng)可用性;減少及規(guī)避機房建設階段的問題及隱患,降低帶病工作的可能性;獲得設備、設施第一手真實的相關數(shù)據(jù),評估及優(yōu)化設備、設施的配置以達到節(jié)能的目標,讓業(yè)主對項目驗收和未來的投產(chǎn)更有信心。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號