如何幸免云計算服務(wù)中斷事故發(fā)生

責任編輯:vicky

2011-07-22 09:07:49

摘自:比特網(wǎng)

云計算服務(wù)提供商宕機是你無法預(yù)防的,但是一些措施可以保護你。

今年四月,亞馬遜臭名昭著的云計算中心宕機,導(dǎo)致包括foursquare, Reddit在內(nèi)的多家知名網(wǎng)站受到影響,與此形成對比的是,多家亞馬遜云計算服務(wù)的企業(yè)級用戶由于成功預(yù)測這次“雷雨”天氣而從中幸免。

他們采用如下方法構(gòu)建彈性系統(tǒng):1. 使用多個空用性區(qū)域;2. 在傳統(tǒng)數(shù)據(jù)中心上有熱點備份;3. 或是有備用云服務(wù)提供商以應(yīng)對緊急情況。

硅谷的在線照片共享存儲公司SmugMug受亞馬遜云存儲服務(wù)宕機事件的影響不大,不像同類依賴于亞馬遜云存儲服務(wù)的公司深受其害。其中部分原因在于SmugMug公司沒有使用亞馬遜遭遇宕機的彈性塊存儲服務(wù)。而是將其應(yīng)用交叉部署在亞馬遜的多個數(shù)據(jù)中心上,所謂的“可用區(qū)”。

SmugMug公司CEO Chris MacAskill指出,如果其他公司也將自己的應(yīng)用分散部署開,那么就不會太受亞馬遜服務(wù)宕機的影響。他還建議公司要使用多個彼此分離的亞馬遜“可用區(qū)”。當然,使用多個”可用區(qū)“是要額外收費的。

SmugMug的用戶照片和視頻存儲嚴重依賴于亞馬遜S3云存儲服務(wù)。同時,SmugMug也使用多個EC2云存儲實例,不過,SmugMug仍然使用傳統(tǒng)數(shù)據(jù)中心來存儲,而不使用依附于每個獨立EC2實例的彈性塊存儲EBS(通常用來存儲操作性數(shù)據(jù))。

亞馬遜目前正出現(xiàn)服務(wù)下降的情況--宕機事件那一周,一個核心路由器及其備份出現(xiàn)問題,一個核心的數(shù)據(jù)庫服務(wù)出現(xiàn)問題。MacAskill說,“我不希望再去處理路由器或者數(shù)據(jù)庫硬件這類問題,所以我們依然要涉足云計算領(lǐng)域。”

MacAskill補充道,盡管出現(xiàn)了宕機問題, 亞馬遜的云計算服務(wù)性能依然好于SmugMug公司自己的服務(wù),也好與其他的云服務(wù)提供商,這點我們非常確信。

以色列新創(chuàng)的Kitely有限公司只使用了一塊亞馬遜可用區(qū),但是,幸運的是,他們使用的那塊存儲區(qū)沒有遭受宕機影響。即便如此,該公司還是希望能從中吸取教訓(xùn),Kitely公司CTO Oren Hurvitz 表示,“我們打算將我們的服務(wù)分散存儲到多個可用區(qū)。”

Kitely公司主要業(yè)務(wù)是基于云計算的虛擬會議和基于OpenSim平臺的協(xié)同虛擬環(huán)境,以及提供確保其虛擬服務(wù)正常運行的相關(guān)檢測服務(wù)。

“我們的系統(tǒng)能夠處理任何時間,任何服務(wù)可能出現(xiàn)的中斷,如果哪個服務(wù)失去響應(yīng),我們的系統(tǒng)會結(jié)束該服務(wù),并重啟一項新的服務(wù)。”

傳統(tǒng)備份

另一個未受宕機事件影響的公司是Mashery,該公司向BestBuy, Hoovers還有紐約時報等100多家公司提供應(yīng)用程序接口(API),同樣是因為該公司使用多個可用區(qū)才避免遭受宕機影響。即便如此,Mashery仍另有備份計劃—傳統(tǒng)數(shù)據(jù)中心。

Mashery CEO Oren Michels表示,“我們很早就意識到,如果亞馬遜服務(wù)完全中斷,問題會非常嚴重,所以我們需要容錯設(shè)施,我們已經(jīng)同Internap公司在硬件方面展開合作。”

亞特蘭大市的Internap網(wǎng)絡(luò)服務(wù)公司,不僅為Mashery提供熱點備份,還為那些亞馬遜服務(wù)的地理范圍外的,并且對云存儲或服務(wù)有更低延時要求的用戶提供產(chǎn)品環(huán)境。

Oren Michels說,“我們在兩邊都部署了充足的基礎(chǔ)設(shè)施以應(yīng)對高負載。”

兩年前,Mashery公司在起初部署云基礎(chǔ)設(shè)施的時候,亞馬遜是那里唯一一家提供云存儲服務(wù)的公司。那時,尋找另一個云做備份是不可能的,不過現(xiàn)在完全可能。

Oren Michels說,“我們一直關(guān)注著這個問題,但是如果湊活著用的話,亞馬遜的服務(wù)已經(jīng)出奇的好了。同樣,Internap也是我們的一個重要合作伙伴,Internap一直在向我們提供相應(yīng)的服務(wù)。”

Oren Michels補充道,“雖然價格不是用戶選擇云存儲服務(wù)商的決定因素,但是Internap還是想通過低價保持其競爭力。”

“我們擁有上百家大品牌廠商客戶,一旦存儲發(fā)生什么故障,損失用戶帶來的損失更大。解決用戶的API問題,其中就包括在宕機情況下保證服務(wù)正常運行。”

那些正在向云存儲過渡的公司,在最開始的階段通常選擇傳統(tǒng)數(shù)據(jù)中心做備份。研發(fā)公司Enderle Group的分析師Rob Enderle說。

“你可以部署一套次要資源—通常,用那些舊設(shè)備就可以了—作為實現(xiàn)故障切換的備用設(shè)備,讓他們處于待機狀態(tài),雖然可能提供的服務(wù)稍差,但仍能滿足用戶的需求。”

“有些公司的部分應(yīng)用使用傳統(tǒng)數(shù)據(jù)中心,而部分使用云計算存儲,或許所有應(yīng)用都部署雙份,并且使用同樣的災(zāi)難恢復(fù)站點,因為亞馬遜的云服務(wù)和傳統(tǒng)數(shù)據(jù)中心同時故障的可能性很小。”

但是,他同時警告,讓一套云服務(wù)作為同一個云里的另一套云服務(wù)的備份是不太可靠的。

“冗余服務(wù)可能會使用主服務(wù)中相同的資源,要對冗余服務(wù)提高警惕,務(wù)必確定冗余是真正的冗余,而不只是簡單的硬件和軟件的交疊。”

次要云服務(wù)提供商

使用另一個云服務(wù)提供商的傳統(tǒng)數(shù)據(jù)中心作為備份比其他方法都劃算的多。

這是因為你按計算周期付費給云服務(wù)提供商,不使用的情況下,只需極低的計算能力確??焖俎D(zhuǎn)換,確??梢园葱鑴討B(tài)添加服務(wù)。

傳統(tǒng)數(shù)據(jù)中心,必須有足夠的服務(wù)確保峰值負載調(diào)度問題,即使很少出現(xiàn)峰值負載,由于對相應(yīng)計算能力的這種要求,硬件投入增大,因此,一般情況下,采用傳統(tǒng)數(shù)據(jù)中心做備份成本翻倍,而采用云備份成本只增加一小部分。

例如,總部位于拉斯維加斯的基于Web的硬盤加密公司AlertBoot,過去,廣電費每個月就要花費5萬美元,該公司的CEO Tim Maliyil稱。

“我們同時擁有兩個物理數(shù)據(jù)中心,你很難想象關(guān)閉他們對我們來說有多高興。如今,我們使用的兩個云服務(wù),帶寬和主機租賃費用為每個月1.6萬美元。曾經(jīng)是多么的費電,而云計算的的確確降低了我們的成本。”

從傳統(tǒng)數(shù)據(jù)中心過渡到云計算并不難,AlertBoot已經(jīng)在傳統(tǒng)數(shù)據(jù)中心上使用VMware的虛擬化軟件。該公司選擇的兩個云提供商SunGard和OpSource也都使用VMware軟件。

從一個云提供商轉(zhuǎn)移到另一個云提供商只需要一兩分鐘。備份云能夠迅速啟動以處理增加的工作量。一家來自英國的服務(wù)廠商Zeus Technology提供轉(zhuǎn)換技術(shù)支持,這家公司幫助企業(yè)把應(yīng)用程序從一個云遷移到另一個云。

Maliyil說,他們公司之所以選擇這幾家公司,是因為他們提供企業(yè)級的可靠性。在我們這行,用戶不允許服務(wù)中斷,我們已經(jīng)將服務(wù)從亞馬遜的基礎(chǔ)設(shè)施上轉(zhuǎn)移出來。

另一家公司rPath,也為用戶提供跨多個云的服務(wù)管理技術(shù)支持,rPath有90家企業(yè)用戶,很多大企業(yè)和Internet服務(wù)提供商,像 ADM, Fujitsu,Qualcomm和EMC公司。

目前該公司采用16種鏡像格式來實現(xiàn)運行于云環(huán)境中應(yīng)用程序的快照。RPath首席營銷經(jīng)理Jake Sorofman稱,只需不到一周的時間,就可以將另一個云計算服務(wù)加入到列表里,對我們來說這很容易。

目前該公司支持亞馬遜EC2, Vmware, Citrix Zen, Microsoft HyperV, Rackspace還有其他幾種格式。只要是rPath系統(tǒng)里的應(yīng)用,產(chǎn)生新鏡像并將其部署到新的云上只需要15分鐘。

然而,首次將應(yīng)用加入到rPath系統(tǒng)可能要花較長時間,視復(fù)雜程度,封裝一個適合我們的平臺的應(yīng)用程序可能需要幾個小時甚至幾天的時間。不過,我們的專業(yè)服務(wù)團隊可以為用戶提供技術(shù)支持。

許多應(yīng)用程序已經(jīng)封裝好了,包括從Windows到Linux的全部應(yīng)用程序,包括WebLogic, WebSphere, SAP, EMC和RSA的全部產(chǎn)品。

我們有一個已經(jīng)模塊化的完整應(yīng)用程序??蓴U展列表,并且還有很大提高空間。

由于可以在云服務(wù)商間轉(zhuǎn)移應(yīng)用,所以企業(yè)客戶不僅得到了備份,也可以選擇最適合他們的云服務(wù)提供商。

“多選擇導(dǎo)致了套利的可能性,綜合考慮性能,政策和價格因素選擇云服務(wù)商,實現(xiàn)工作負載的優(yōu)化部署。而且,從這個層面上講,你可以輕松地在亞馬遜, Rackspace以及其他一些環(huán)境間轉(zhuǎn)移工作負載,由于消除了對服務(wù)商的鎖定,反過來也促進了服務(wù)提供商提高服務(wù)質(zhì)量。”

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號