為了幫助行業(yè)從像最近的英國航空公司發(fā)生的IT事故這樣的事件中學(xué)習(xí),此次中斷事件在5月底的那個周末取消了數(shù)千架次的航班。目前一個即將成立的行業(yè)組織將致力于分享有關(guān)數(shù)據(jù)中心故障的數(shù)據(jù)。
如果航空公司的一架飛機(jī)發(fā)生空難,那么就會立即進(jìn)行中立調(diào)查,以查明出現(xiàn)的問題。數(shù)據(jù)中心也可以提供這樣的關(guān)鍵服務(wù),但其故障或潛在的災(zāi)難通常被隱瞞,或受到涉及公司的內(nèi)部查詢,最終被不對外披露協(xié)議所掩蓋,其結(jié)果是相同的故障將一再反復(fù)發(fā)生。
數(shù)據(jù)中心事件報告網(wǎng)絡(luò)旨在通過建立一個中立和匿名的論壇來共享關(guān)于導(dǎo)致嚴(yán)重的IT故障或近乎失敗原因的數(shù)據(jù)來改變這一點。它將于今年8月3日在英國數(shù)據(jù)中心利益集團(tuán)倫敦會議上發(fā)布。
從失敗中學(xué)習(xí)
i3 Solutions公司創(chuàng)始人Ed Ansett表示,“人們需要了解的重要事情是許多故障是經(jīng)常性故障。“我前段時間得出的結(jié)論是人們沒有從經(jīng)驗中學(xué)習(xí)。”
Ansett對許多重復(fù)發(fā)生的IT故障進(jìn)行了編目,他表示,“很多數(shù)據(jù)中心的中斷,人們曾多次遭遇,就像兩年前的新加坡證券交易所的中斷事件,但人們需要找出其根本原因,以及如何避免這種情況。”
Ansett表示,之所以有了分享這些事件發(fā)生原因的想法首先出現(xiàn)在2015年DCD新加坡活動的演講中。他說:“分享的目的不是為了獲得利益,而是一種數(shù)據(jù)中心的民間學(xué)習(xí)行為。”
盡管人們通常不愿分享自己的數(shù)據(jù)中心失敗的細(xì)節(jié),但Ansett相信有些企業(yè)會愿意分享“數(shù)據(jù)中心的崩潰的原因和宕機(jī)的細(xì)節(jié)”,并以此教育人們。Ansett說,“我的感覺是有很多人都想進(jìn)行分享,特別是幾年前的事情。”
該小組將開始從小做起,但在某些時候,它將需要資助一個審查提交信息的秘書處。Ansett說,任何資金都必須是中性的,而不是來自單一的設(shè)備供應(yīng)商。數(shù)據(jù)中心行業(yè)沒有相當(dāng)于民航局可以進(jìn)行碰撞調(diào)查的機(jī)構(gòu)。
目前i3 Solutions公司設(shè)有一個咨詢委員會,主要致力調(diào)查電力和冷卻領(lǐng)域,但其未來的計劃將達(dá)到到更高的層次,其中包括網(wǎng)絡(luò),服務(wù)器和存儲和應(yīng)用。
在數(shù)據(jù)中心故障之前,這只是一個時間問。英國DCIG公司的Simon Allen說。“我們現(xiàn)在需要采取行動,沒有理由這個古老的秘密應(yīng)該占上風(fēng)。”
他指出航空業(yè)界分享事故信息的記錄,他說:“在數(shù)據(jù)中心行業(yè),普遍的做法就是在誤導(dǎo)保護(hù)企業(yè)聲譽的過程中,掩蓋其失敗或潛在的災(zāi)難,情況并非如此。其根本原因調(diào)查結(jié)果通常是秘密的,受到NDA的約束,導(dǎo)致數(shù)據(jù)中心行業(yè)在從失敗中學(xué)習(xí)中處于不利地位。”
i3 Solutions公司的第三方受托人是關(guān)鍵任務(wù)設(shè)施專家Peter Gross。