數(shù)據(jù)中心設計者無法自行評定Uptime、TIA、LEED或其他認證級別是有原因的。
Uptime Institute級別目的是為了描述設施已經實現(xiàn)和沒有實現(xiàn),可能對數(shù)據(jù)中心冗余與故障停機時間造成的影響。Uptime等級是評估數(shù)據(jù)中心設計建造的可靠性與可用性級別的切實方法。
然而,Uptime級別因不同數(shù)據(jù)中心設計者而有不同的解釋。因此,自稱的類似設計認證,實際缺乏可靠支持。合法的數(shù)據(jù)中心認證需要經過Uptime Institute的嚴格審查才能獲得。
其他數(shù)據(jù)中心設計認證也按照相同方式運作,如LEED(Leadership in Energy and Environmental Design)的金、銀和白金級設施認證。設計師可以根據(jù)項目情況評估自己的LEED得點,但驗證與真正的LEED認證只有U.S. Green Building Council能夠頒發(fā)。
為什么說的和實際不一樣?
Uptime Institute數(shù)據(jù)中心等級基于設施中最薄弱的一個環(huán)節(jié)。因此,即使是該設施擁有四級能源能源與冷卻組件冗余——雙不間斷電源、水冷機組、配電設備、機房空氣處理器以及四級雙主動配電路徑,如果只有單一管道路徑,也只能獲得Uptime二級認證。
許多數(shù)據(jù)中心設計師對這種僵化和專有的做法感到不滿。設計師可能會認為單管在關鍵任務負載數(shù)據(jù)中心已經足夠強大;第二條管并不是必須達到的可靠性目標。因此,對設計師來說,數(shù)據(jù)中心應該能夠獲得Uptime四級認證。
數(shù)據(jù)中心設計者往往因為自己在預算、空間限制以及之前的失敗經驗而妥協(xié)。例如,某個具備高度能源冗余的數(shù)據(jù)中心發(fā)生了冷卻故障,因為數(shù)據(jù)中心經營者對冷卻冗余預算非??量?,卻對電力系統(tǒng)不惜成本。這樣宣稱的Tier III Plus或Near Tier IV數(shù)據(jù)中心設計級別是Uptime Institute明確否定的。設施好壞只取決于其最薄弱的環(huán)節(jié)。Uptime只會將如何真正地達到可用性目標作為認證標準,并確保任何修改都是在標準級別內。
TIA vs. Uptime Institute
不同數(shù)據(jù)中心設計認證的出現(xiàn),試圖取代Uptime認證等級,但并沒有真正的流行起來。
電信工業(yè)協(xié)會(TIA)942-A標準發(fā)布了級別附加內容,但實際用途是評估數(shù)據(jù)中心布線。附加標準F中闡述了Uptime Institute的基本定義。為了清楚地說明數(shù)據(jù)中心設計認證級別,Uptime采用羅馬數(shù)字(級別I、II、III和IV),而TIA使用阿拉伯數(shù)字(級別1、2、3和4)。
這種方法更容易讓設計人員根據(jù)不同標準來評估與分類數(shù)據(jù)中心基礎設施各部分的耐用性。然而,TIA級別并不將數(shù)據(jù)中心作為一個整體來評估可靠性和可用性。Uptime Institute認為TIA-942-A部分分類不合法,而且對確保長期可靠性與停機時間沒有任何價值。
設計認證要求的內容
獲得等級認證只需要冗余組件——額外的能源供應、空調和水泵,對嗎?事實并非如此。如果沒有安置在適當?shù)奈恢?,沒有注意它們如何連接、安裝和標記,冗余組件不會增加任何可靠性。
不同級別的設計核心區(qū)別在于可同時維護的能力:數(shù)據(jù)中心在不影響計算機系統(tǒng)情況下維護所有系統(tǒng)組件的能力。
冗余組件經常會被以某種容易讓設施出現(xiàn)故障的方式安裝。安裝選項同樣還可能限制設施能力或在維護時對數(shù)據(jù)中心關鍵計算負載造成影響。其他常犯的錯誤包括定位控制和閥門在緊急時刻非常難訪問,或者組件標簽設置不合理與規(guī)劃失誤。未經確認的設計決定可能會把運營推入失敗的陷阱,而這些問題是可以避免發(fā)生的。
TIA 942-A標準警告:“了解哪些可能影響數(shù)據(jù)中心運營風險的行為十分重要,不論它們是故意或偶然時間,還是自然行為。數(shù)據(jù)中心設計者、管理員和經理需要在兩個方面進行重點評估,一方面盡可能減少危害設施的情況發(fā)生,一方面要做好應急預案。”
打造具有認證等級的數(shù)據(jù)中心
無論數(shù)據(jù)中心設計是否通過Uptime或TIA級別認證,真正關鍵的建筑設計任務,需知識淵博的團隊協(xié)作,以免重蹈覆轍。
如果系統(tǒng)為滿足認證等級而犧牲有效性或有用性,認證體系就被錯誤使用了。如果宣傳已經達到三級或四級容錯的數(shù)據(jù)中心出現(xiàn)故障,尤其是承載大規(guī)模云服務的設施,那么會有很多的用戶受影響,數(shù)據(jù)中心運營商通過的認證將變得毫無意義并可能失去企業(yè)用戶。
構建滿足指定性能需求,而不考慮通過Uptime、TIA、LEED的US.Green Building Council或其他組織認證的數(shù)據(jù)中心設計其實是可行的。然而,專業(yè)的設計團隊、更詳細的設計文檔和雇傭工程監(jiān)理,都會花掉跳過認證后所節(jié)省的時間與成本。同行評估可以被作為認證評估過程的替代方案,找出潛在停機風險,用更現(xiàn)實靈活的方式處理,而不是按照認證的死板要求實現(xiàn)。
Uptime Institute要求所有目標在開始之前,必須根據(jù)實際預算進行設置,停機時間因為預算削減所產生的影響,是可以理解并在預期范圍內。這就是為何沒有通過嚴格認證就宣稱自己通過設計等級不合法的原因。無論你是否通過認證,等級排名會被同行作為一種通信方式加以利用。