新時代的數(shù)據(jù)中心
數(shù)據(jù)中心在國內(nèi)興起只有10多年的時間,但明顯經(jīng)歷了幾個階段:第一階段(-2005)是普通機房階段,有UPS供電,有空調(diào)制冷,放上IT設(shè)備就算一個數(shù)據(jù)中心了;第二階段(2005-10),隨單機柜IT設(shè)備功率增加,強調(diào)了氣流組織、地板下送風(fēng),雙路UPS供電;第三階段(2010-15),進一步優(yōu)化氣流組織,冷/熱通道封閉、模塊化機房、Tier 3/4等級安全性;第四階段(2015-),互聯(lián)網(wǎng)應(yīng)用劇增、大數(shù)據(jù)、AI、云服務(wù),導(dǎo)致數(shù)據(jù)中心規(guī)模迅速擴大和集中,數(shù)萬機柜的超大型數(shù)據(jù)中心成為主流,能效的追求和創(chuàng)新應(yīng)用發(fā)展到極致,自然冷、風(fēng)墻、水下數(shù)據(jù)中心、液冷服務(wù)器等新技術(shù)不斷被創(chuàng)造和應(yīng)用。
當前數(shù)據(jù)中心呈現(xiàn)如下特征:
1、 規(guī)模超大,5000機柜以上,有的規(guī)劃已經(jīng)超過10萬機柜;以前的萬平米數(shù)據(jù)中心都不好意思再說自己是大數(shù)據(jù)中心了。
2、 用電量超大,單個110/220KV變電站已經(jīng)不能滿足供電容量,需從多個變電站供電。并且供電電壓提升,10KV供電直接到機樓。一個數(shù)據(jù)中心園區(qū)有多個變電站。
3、 用水量大,冷水機組的應(yīng)用,導(dǎo)致冷卻水蒸發(fā)量大,有的每月耗水量超過30萬噸。建筑物內(nèi)外管網(wǎng)密布。
4、 設(shè)施層面的新技術(shù)應(yīng)用多,自然冷、風(fēng)墻、液冷、山洞、水下、集裝箱…
運維新挑戰(zhàn)
針對上述新時代數(shù)據(jù)中心的特征,設(shè)施運維管理面臨的挑戰(zhàn)有:
1、 規(guī)模超大帶來的人員、組織和效率的變化。以前萬平米以內(nèi)的數(shù)據(jù)中心,人工巡檢一次2-4小時,現(xiàn)在數(shù)十萬平米,人工巡檢一次一整天都不夠,勢必需要劃分更小的責(zé)任區(qū)域。需要更多的運維人員,組織的龐大增加了管理的難度,效率的下降。由于運維人員分布在不同的區(qū)域,互相交流減少、易閉塞,情緒變壞。
2、 電壓等級提高,安全風(fēng)險增加。以往運維人員接觸的是低壓(低于1000V),現(xiàn)在供電設(shè)備、發(fā)電機、冷機都是高壓供電,維護安全要求提升,但人員的安全意識、工作習(xí)慣、個人保護、安全教育未必全跟上。
3、 新應(yīng)用多,技術(shù)能力不足。各種層出不窮的新技術(shù)和新應(yīng)用,對運維人員的培訓(xùn)相對較少,實際操作和維護實踐不足,技術(shù)積累不夠,都會影響發(fā)生問題時的處置效果。
4、 運維人才供應(yīng)不足,面對迅速膨脹的超大數(shù)據(jù)中心,動輒數(shù)百人的運維人員需求,市場根本無法提供和滿足。但基于上述的原因,運維人才的培訓(xùn)和成長周期比較長,以致大家互相挖角,爭搶有限的優(yōu)秀運維人才,導(dǎo)致運維成本增加。
5、 規(guī)模的集中,導(dǎo)致風(fēng)險集中,事故影響增加。前些天亞馬遜的數(shù)據(jù)中心事故,導(dǎo)致了全球大面積的服務(wù)和應(yīng)用中斷,損失慘重。因此運維管理的壓力超前。
當然,挑戰(zhàn)遠不止這些,我們運維人該如何應(yīng)對?數(shù)據(jù)中心設(shè)施論壇(3.28 北京)將邀請業(yè)界專家、行業(yè)大咖、知名廠商共同探討和交流分享。歡迎您的加入!