影響數(shù)據(jù)中心高可用性設計的六個因素

責任編輯:editor005

2015-10-19 14:25:34

摘自:機房360

隨著數(shù)據(jù)中心日益成為企業(yè)的業(yè)務核心,人們對數(shù)據(jù)中心可靠性的要求也越來越來高。(3)2(N+1)冗余配置UPS系統(tǒng)并不比2N冗余UPS系統(tǒng)更加可靠  更多的冗余并不意味著更高的可靠性

隨著數(shù)據(jù)中心日益成為企業(yè)的業(yè)務核心,人們對數(shù)據(jù)中心可靠性的要求也越來越來高。但是數(shù)據(jù)中心的設計并不是簡單地進行基礎設施冗余。數(shù)據(jù)中心的高層管理人員更加關注數(shù)據(jù)中心的可靠性和安全性,因此數(shù)據(jù)中心的設計比以往任何時候都更為重要,特別是滿足特定的公司需求的時候。

在實際工作中,提高可靠性并不需要更多的冗余配置,也沒有超出預算的必要。莫里森·赫什菲爾德工程公司關鍵業(yè)務總監(jiān)史蒂芬·夏皮羅,曾經(jīng)參與很多的數(shù)據(jù)中心項目建設,他表示企業(yè)數(shù)據(jù)中心的性能要達到預期,還要在冗余設計時進行調整。

最近在美國馬里蘭州國家港口召開的數(shù)據(jù)中心世界會議上,夏皮羅做了如何從可用性角度看待數(shù)據(jù)中心設計決策的演講報告。以下是他演講報告中一些亮點:

(1)更多的冗余并不意味著更高的可靠性

夏皮羅表示,重要的不僅僅是數(shù)據(jù)中心設計,盡可能多滿足IT設備應用程序的實際需求也很重要,更多的基礎設施冗余并不會自動使系統(tǒng)更加可靠。事實上,在冗余組件增加一個點都會降低可靠性,因為這使系統(tǒng)變得更加復雜,更加難以管理。

(2)TierIV數(shù)據(jù)中心的成本是TierII數(shù)據(jù)中心的兩倍

數(shù)據(jù)中心基礎設施的可靠性水平必須匹配數(shù)據(jù)中心支持的應用程序需求。人們都希望設計和建設最可靠的數(shù)據(jù)中心,雖然客戶為此可以負擔高昂費用,但這種做法并不明智,特別是考慮到冗余的成本。

夏皮羅表示,引用數(shù)據(jù)中心設施咨詢機構UptimeInstitute的調查,TierI級數(shù)據(jù)中心和TierII級數(shù)據(jù)中心的成本與TierIII和TierIV級數(shù)據(jù)中心的成本相比,之間差異很小。而數(shù)據(jù)中心的設計從TierII級到TierIII級,其費用增幅巨大:幾乎是100%。以同樣擁有15000平方英尺空間的數(shù)據(jù)中心為例,TierI級數(shù)據(jù)中心的UPS電源每千瓦成本為10000美元,TierII數(shù)據(jù)中心的UPS電源每千瓦的成本為11000美元。TierIII數(shù)據(jù)中心的UPS電源成本為20000美元,TierIV級的UPS電源成本為22000美元??梢钥吹?,TierIII數(shù)據(jù)中心電源成本是TierI級數(shù)據(jù)中心的一倍。

(3)2(N+1)冗余配置UPS系統(tǒng)并不比2N冗余UPS系統(tǒng)更加可靠

更多的冗余并不意味著更高的可靠性,夏皮羅說,2(N+1)UPS冗余配置的設計并不比2NUPS冗余配置更加可靠。夏皮羅表示,對于一個系統(tǒng)來說,2N冗余UPS系統(tǒng)故障的概率與2(N+1)冗余UPS系統(tǒng)故障概率基本相同。

(4)2n冗余發(fā)電機配置比n+1冗余發(fā)電機配置更加可靠

夏皮羅表示,2(N+1)發(fā)電機冗余系統(tǒng)的配置與N+1發(fā)電機冗余系統(tǒng)配置的差異很小。而2(N+1)冗余的UPS系統(tǒng)中,具備雙路供電配置,一個備用電源轉換開關,以及雙路IT設備。N+1的UPS冗余系統(tǒng)的失效概率2.94%,2NUPS冗余系統(tǒng)的失效概率約為1.5%,二者的失效概率相差4.41%。

即使在UptimeInstitute的評級系統(tǒng)中的最高級別TierIV數(shù)據(jù)中心,同樣也不需要多余的發(fā)電機。TierIV數(shù)據(jù)中心只是要求必須有一臺發(fā)電機連續(xù)運行,即使在維修過程中。夏皮羅說,所有主要的發(fā)電機制造商都很容易滿足這個需求,

TierIII和TierIV級數(shù)據(jù)中心也要求這么做,但是,發(fā)電站冗余電源和燃料供應基礎設施需要同時維護和容錯。

(5)8小時運行發(fā)電機故障率為15%

發(fā)電機冗余很重要,因為發(fā)電機并不可靠。即使一臺發(fā)電機啟動成功,其IT設備可以采用這臺發(fā)電機的電力,但很難確保不發(fā)生意外,因為當數(shù)據(jù)中心斷電事故發(fā)生時,發(fā)電機必須運行較長時間。

紐約遭遇了颶風桑迪襲擊,這對于長時間運行的發(fā)電機的可靠性進行了一次罕見的測試,很多發(fā)電機在這個測試中失敗。莫里森·赫什菲爾德工程公司的許多客戶數(shù)據(jù)中心設施在電力中斷之后轉換到發(fā)電機供電。夏皮羅說。數(shù)據(jù)中心電力的故障發(fā)生的原因不盡相同,甚至出現(xiàn)了由于發(fā)電機組燃料箱底部積累的雜質并沒有過濾掉,導致發(fā)電機最終失效的情況。

他援引愛達荷國家工程實驗室的一項研究發(fā)現(xiàn),15%的的柴油發(fā)電機在連續(xù)運行8小時后失效;1%的發(fā)電機24小時后失效;5%的柴油發(fā)電機半小時后失效;2%的柴油發(fā)沒有啟動。

(6)數(shù)據(jù)中心Tier的級別不會決定可靠性

雖然UptimeInstitute定義了數(shù)據(jù)中心基礎設施設計可靠性的級別,但影響數(shù)據(jù)中心設計可靠性的因素很多。其中包括數(shù)據(jù)中心的選址,施工建設的質量,設備的質量,設備的調試過程,數(shù)據(jù)中心的運行年限、數(shù)據(jù)中心維護與管理、人員培訓、維修方法,以及人員技術水平等。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號