自然災(zāi)害是數(shù)據(jù)中心最常見(jiàn)的敵人。颶風(fēng)桑迪(Hurricane Sandy)最近考驗(yàn)了美國(guó)東海岸的云提供商的極限,在“超級(jí)風(fēng)暴”破壞了新澤西、紐約、弗吉尼亞等地之后,托管和托管設(shè)備遭遇了斷電、洪水和基礎(chǔ)設(shè)施破壞。
不管地理位置如何,對(duì)于云計(jì)算和托管提供商而言,關(guān)鍵在于適當(dāng)?shù)臄?shù)據(jù)中心災(zāi)難恢復(fù)(DR)和業(yè)務(wù)持續(xù)性規(guī)劃,從而確??蛻?hù)的正常運(yùn)行時(shí)間,尤其是當(dāng)災(zāi)難發(fā)生的時(shí)候(災(zāi)害襲來(lái):GIS技術(shù)防止云中斷事件)。
盡管很多地區(qū)再到風(fēng)暴的持續(xù)破壞,導(dǎo)致電力中斷和能源緊缺,一些云提供商和服務(wù)提供商仍舊設(shè)法避免在颶風(fēng)后的服務(wù)終端。其中有三家就是Telx Group、Integrity Virtual IT和CentriLogic,他們分享了其數(shù)據(jù)中心DR以及業(yè)務(wù)持續(xù)性規(guī)劃是怎么做的,從而保持其服務(wù)在線(xiàn)并讓客戶(hù)滿(mǎn)意。
Telx渡過(guò)難關(guān) 感謝數(shù)據(jù)中心DR預(yù)備
Telx是一家位于紐約的數(shù)據(jù)中心運(yùn)營(yíng)商和托管提供商,在紐約市區(qū)有兩大設(shè)備區(qū)以及新澤西兩處設(shè)備中心,;另外還有一個(gè)新澤西數(shù)據(jù)中心在建。這四個(gè)數(shù)據(jù)中心收到了電力中斷的損失,被迫在颶風(fēng)期間發(fā)電。
預(yù)期到會(huì)斷電,Telx過(guò)渡了期NJR2設(shè)備到發(fā)電機(jī)上,這是位于新澤西的一個(gè)更大的數(shù)據(jù)中心,發(fā)電機(jī)在風(fēng)暴之前就運(yùn)作,保持了八小時(shí)之久,Ron Sterbenz表示,他是Telx的市場(chǎng)副總裁。在NJR2使用的兩個(gè)變電站恢復(fù)在線(xiàn)后,公共電源基本穩(wěn)定,Telx的小一點(diǎn)的數(shù)據(jù)中心NJR1仍舊整天靠發(fā)電機(jī)維持。
該公司在曼哈頓的設(shè)備(NYC1)都依靠發(fā)電機(jī)運(yùn)作,直到公共電力恢復(fù)一直都在發(fā)電機(jī)上運(yùn)作,Sterbenz表示。NYC2在大廈管理團(tuán)隊(duì)減少整個(gè)大廈的空調(diào)時(shí)遭遇了輕微的冷卻問(wèn)題。Telx已經(jīng)對(duì)于風(fēng)暴做出了準(zhǔn)備,通過(guò)引入風(fēng)扇進(jìn)行現(xiàn)場(chǎng)冷卻,員工也能夠在雨后打開(kāi)窗戶(hù)。
Telx在風(fēng)暴前也完成了每一個(gè)數(shù)據(jù)中心的能源供給,增加了額外的員工在風(fēng)暴期間工作,并存儲(chǔ)了不易腐壞的食物為長(zhǎng)時(shí)間工作的員工供給,Sterbenz說(shuō)道。
盡管在每一個(gè)風(fēng)暴點(diǎn)中每一個(gè)數(shù)據(jù)中心單獨(dú)運(yùn)行在一個(gè)發(fā)電機(jī)上,盡管NYC2的設(shè)備遭遇過(guò)熱的問(wèn)題,Telx沒(méi)有宕機(jī)。“我們準(zhǔn)備充分,讓我們客戶(hù)在颶風(fēng)期間運(yùn)轉(zhuǎn)自如,”Sterbenz介紹。
Integrity Virtual IT積極應(yīng)戰(zhàn) CentriLogic聚焦人文
同時(shí)風(fēng)暴區(qū)域的一些傳統(tǒng)IT服務(wù)提供商依賴(lài)云提供商保持正常工作。Integrity Virtual IT是一家IT外包公司,為例馬里蘭州銀泉,使用基于hypervisor的數(shù)據(jù)復(fù)制產(chǎn)品,該產(chǎn)品來(lái)自以色列的DR即服務(wù)提供商Zerto,通過(guò)Integrity弗吉尼亞和芝加哥的數(shù)據(jù)中心復(fù)制數(shù)據(jù)。
同時(shí)弗吉尼亞的數(shù)據(jù)中心沒(méi)有斷電,默認(rèn)其發(fā)電機(jī)在風(fēng)暴期間運(yùn)作。Integrity在兩個(gè)網(wǎng)站之間提供給客戶(hù)已經(jīng)復(fù)制的數(shù)據(jù),這些數(shù)據(jù)在風(fēng)暴之前就已經(jīng)轉(zhuǎn)移,Integrity CEO Ron Offer如是說(shuō)道。
Affigent是位于弗吉尼亞的一家技術(shù)咨詢(xún)公司,其客戶(hù)主要是政府,同時(shí)它也是Integrity的客戶(hù),預(yù)測(cè)到風(fēng)暴會(huì)持續(xù),選擇提前轉(zhuǎn)換到芝加哥數(shù)據(jù)中心。“當(dāng)我們意識(shí)到我們會(huì)成為風(fēng)暴中心,我們決定將主網(wǎng)站替換到芝加哥,”Matthew Friedman表示,他是Affigent的業(yè)務(wù)運(yùn)行總管。兩個(gè)網(wǎng)站之間的數(shù)據(jù)復(fù)制過(guò)程用了不到一小時(shí),而且對(duì)于Affigent的政府呵護(hù)是透明的。“我們沒(méi)有經(jīng)歷斷電或者破壞的復(fù)制流程。”
CentriLogic是一家云、托管和管理服務(wù)提供商,其數(shù)據(jù)中心位于紐約羅切斯特,也沒(méi)有因?yàn)轱Z風(fēng)經(jīng)歷斷電,但是卻演示了如何通過(guò)颶風(fēng)的考驗(yàn),一個(gè)提供商DR計(jì)劃如何很好的持續(xù)支持不僅僅是基礎(chǔ)架構(gòu)和故障轉(zhuǎn)移功能,還支持人和溝通,Robert Offley表示,他是該公司的CEO兼總裁,“你可以讓你的計(jì)算機(jī)保持運(yùn)作,但是提供商需要確保他們的客戶(hù)能夠遠(yuǎn)程訪(fǎng)問(wèn)這個(gè)系統(tǒng),且其員工可以提供支持的支持,”他指出。
數(shù)據(jù)中心災(zāi)難恢復(fù)(DR)經(jīng)驗(yàn)總結(jié):明智的設(shè)計(jì)設(shè)備
盡管在自然災(zāi)害發(fā)生或者風(fēng)暴臨近時(shí),對(duì)于數(shù)據(jù)中心基礎(chǔ)架構(gòu)而言,切實(shí)可行的措施不多,但是云提供商和數(shù)據(jù)中心運(yùn)營(yíng)商應(yīng)該存儲(chǔ)足夠的能源,包括針對(duì)發(fā)電機(jī)的能源和應(yīng)急人員的食物,F(xiàn)orrester Research基礎(chǔ)架構(gòu)和運(yùn)營(yíng)高級(jí)分析師Rachel Dines表示。
食物和燃料是表象,而不是病灶。很多數(shù)據(jù)中心運(yùn)營(yíng)商將其發(fā)電機(jī)存在大廈的地下室,這部分是最容易受到颶風(fēng)中洪水襲擊的。要讓關(guān)鍵性的基礎(chǔ)設(shè)施組件離開(kāi)地下室和第一層,這些洪水容易襲擊的地方,這也是供應(yīng)商保護(hù)客戶(hù)不宕機(jī)的第一步,Dines說(shuō)道。
對(duì)于管理服務(wù)或者托管提供商來(lái)說(shuō),故障恢復(fù)是讓客戶(hù)在線(xiàn)最核心的地方。“對(duì)于一些位于紐約數(shù)據(jù)中心的客戶(hù)而言,最顯著的遭受了宕機(jī)影響,像Datagram的客戶(hù),很多至少能夠故障恢復(fù)到另外的地理位置上。”
盡管故障恢復(fù)得當(dāng),在颶風(fēng)桑迪期間一些客戶(hù)還是遭遇了主網(wǎng)站和二級(jí)網(wǎng)站的宕機(jī)。因此,云提供商在選擇數(shù)據(jù)中心地址的時(shí)候應(yīng)該考慮地理差異化,Dines表示。“提供商需要考慮他們構(gòu)建數(shù)據(jù)中心的地區(qū)的風(fēng)險(xiǎn)預(yù)測(cè),讓其二級(jí)網(wǎng)站能夠在不同的地區(qū)運(yùn)轉(zhuǎn)。”