對于企業(yè)用戶來說,近些年隨著數(shù)據(jù)量呈指數(shù)倍的爆發(fā)式增長態(tài)勢,以及云計算平臺的飛速發(fā)展,使得用戶對于數(shù)據(jù)中心的需求度開始不斷攀升。我們也不難發(fā)現(xiàn),已經(jīng)有越來越多的企業(yè)開始建造自己的數(shù)據(jù)中心,或者有些中小型企業(yè)用戶也開始選擇把自己的數(shù)據(jù)放在數(shù)據(jù)中心當中進行存儲和管理。
然而對于數(shù)據(jù)中心的基礎設施建設以及一些日常運維管理等多方面的問題,或許不同的用戶有著不同的需求,有些企業(yè)用戶可能只是需要大容量的存儲空間,對于數(shù)據(jù)的提取可能并不頻繁,也就是我們平時所說的冷數(shù)據(jù)占據(jù)了大多數(shù)業(yè)務模塊,也許有些用戶對于在數(shù)據(jù)中心存儲數(shù)據(jù)的計算能力和運行方式要求的更加敏捷更加靈活,這可能對于數(shù)據(jù)中心管理者們來說又是另外的一套方案了。
綜上所述,當今的企業(yè)用戶對于數(shù)據(jù)中心的設計、建造、管理等很多環(huán)節(jié)仍然還存在把握不準的地方,尤其是在數(shù)據(jù)中心的設計和建造過程當中,有一些現(xiàn)實存在的困難和問題需要去克服和解決,這些事實存在的問題究竟有哪些?本期筆者就和大家來聊聊。
大功率,散熱就成了問題
我們都知道,在整個數(shù)據(jù)中心運行過程當中,基礎當中的基礎就是電力運行了,然而只要有電力系統(tǒng)的運行和工作就必然會產(chǎn)生一些熱量,對于這些電能的應用現(xiàn)在只有很少一部分得到了充分的應用,除非企業(yè)的數(shù)據(jù)中心采用超導體供電,否則你將永遠為這些散失到空間里的熱量付費。
數(shù)據(jù)故障不可避免
宕機是每個數(shù)據(jù)中心管理員們最不希望看到的事情,但是在實際運行當中,數(shù)據(jù)中心當中的眾多硬件設備不太可能保證永遠不出故障,這也就意味著用戶永遠也無法將事故發(fā)生概率降低至零。需要注意UPS到負載之間的路徑以及制冷系統(tǒng)的冗余容錯功能。
電負載的密度會繼續(xù)增加
若干年前,一個服務器機架只裝不到十臺服務器,而現(xiàn)在可容納幾十臺刀片服務器;若干年前,每個機架的平均功率是1~2kW左右,現(xiàn)在是3kW甚至更高,高密度機架甚至從3~5kW增長至20~25kW。因此,電費將是影響數(shù)據(jù)中心發(fā)展的重要因素之一。
數(shù)據(jù)中心可用性提升
我們前文說到了數(shù)據(jù)中心當中設備的宕機現(xiàn)象,如果一個現(xiàn)實的網(wǎng)站遭遇宕機,那么有可能導致一個潛在用戶在幾秒鐘的時間內(nèi)流失掉,轉(zhuǎn)而去訪問另外一家網(wǎng)站,如果一臺路由器設備宕機,那么很有可能導致在這個局域網(wǎng)內(nèi)的幾百個用戶無法正常連接網(wǎng)絡,若一個光纖室宕機,就可能有幾千個用戶斷開網(wǎng)絡連接,損失不可估量。
管理人員的高素質(zhì)培訓
對于數(shù)據(jù)中心來說,擁有一支高素質(zhì)高技能的管理人員團隊同樣也是非常重要的,由于人才緊缺、人力成本高昂以及培訓機構缺位等諸多原因,如今的數(shù)據(jù)中心操作人員,大部分都很少甚至沒有培訓。這樣一來,數(shù)據(jù)中心操作人員不得不通過手動操作和不正規(guī)的培訓獲得知識,通過犯錯誤、甚至造成代價高昂的宕機獲得知識,這是極為得不償失的。
系統(tǒng)升級當中的問題
我們都知道,任何一款硬件設備都會牽扯到其中應用的升級和維護,那么在整個升級過程當中就有可能產(chǎn)生故障的可能,比如像UPS中的IGBT器件,也會在開機時因熱沖擊顯示類似的故障模式。同樣道理,冗余和備份系統(tǒng)可能會在切換時出現(xiàn)故障。由于人為因素,系統(tǒng)在狀態(tài)變更之后更容易出現(xiàn)故障,可能是因為系統(tǒng)沒有正確地返回運行狀態(tài)所導致。
編輯的話
數(shù)據(jù)中心作為當今這個大數(shù)據(jù)和云計算時代數(shù)據(jù)量的重要載體,在實際運行和管理過程當中確實會面臨很多的問題,對于數(shù)據(jù)中心服務提供商來說,保障用戶數(shù)據(jù)的安全、快速、穩(wěn)定的運行是需要考慮到的首要問題,對于用戶而言,選擇將自己的數(shù)據(jù)托管到哪個平臺上,也是需要深思熟慮的。