2012年云數(shù)據(jù)中心宕機(jī)事件總結(jié)

責(zé)任編輯:vivian

2012-11-13 09:47:13

摘自:機(jī)房360

中斷影響了彈性魔豆服務(wù),其后是彈性魔豆服務(wù)的控制臺(tái),關(guān)系數(shù)據(jù)庫(kù)服務(wù),彈性緩存,彈性計(jì)算云EC2,以及云搜索。

盡管投入各種高新復(fù)雜技術(shù),盡管投入海量巨資,云計(jì)算還是顯得有些脆弱,在過(guò)去的幾年里不乏動(dòng)輒就宕機(jī)數(shù)小時(shí)的事件,甚至有的長(zhǎng)達(dá)一天或數(shù)天,并導(dǎo)致數(shù)據(jù)丟失。

微軟Azure

2012年,云服務(wù)的中斷屢屢讓提供商們尷尬不已,Thinkstrategies創(chuàng)始人Jeff Kaplan給了一些關(guān)于云計(jì)算的永不過(guò)時(shí)的簡(jiǎn)單建議。

以下是本年度云服務(wù)宕機(jī)事件一覽:

2月28日,由于“閏年bug”導(dǎo)致微軟Azure在全球范圍內(nèi)大面積服務(wù)中斷,中斷時(shí)間超過(guò)24小時(shí)。

微軟表示該軟件BUG是由于閏年時(shí)間計(jì)算不正確導(dǎo)致。

微軟Azure

2012年,云服務(wù)的中斷屢屢讓提供商們尷尬不已,Thinkstrategies創(chuàng)始人Jeff Kaplan給了一些關(guān)于云計(jì)算的永不過(guò)時(shí)的簡(jiǎn)單建議。

以下是本年度云服務(wù)宕機(jī)事件一覽:

2月28日,由于“閏年bug”導(dǎo)致微軟Azure在全球范圍內(nèi)大面積服務(wù)中斷,中斷時(shí)間超過(guò)24小時(shí)。

微軟表示該軟件BUG是由于閏年時(shí)間計(jì)算不正確導(dǎo)致。

這一事件激起了許多用戶的強(qiáng)烈反應(yīng),許多人要求微軟為此做出更合理詳細(xì)的解釋。

亞馬遜AWS

6月15日,亞馬遜北維吉尼亞的數(shù)據(jù)中心遭遇停電,由此導(dǎo)致亞馬遜網(wǎng)絡(luò)服務(wù)AWS中斷約6個(gè)小時(shí),影響波及亞馬遜彈性計(jì)算EC2、亞馬遜關(guān)系數(shù)據(jù)庫(kù)服務(wù)以及亞馬遜彈性魔豆AWS Elastic Beanstalk。

北維吉尼亞數(shù)據(jù)中心是亞馬遜使用最久的數(shù)據(jù)中心,在2011年以及今年10月都曾發(fā)生過(guò)宕機(jī)事故,導(dǎo)致用戶信心流失不少。

對(duì)于亞馬遜的有些合作伙伴來(lái)說(shuō),這種狀況往往會(huì)拖后腿。

“我很喜歡亞馬遜,但是宕機(jī)的時(shí)候也真是無(wú)能為力,盡管我也知道傳統(tǒng)IT數(shù)據(jù)中心也會(huì)遇到這種情況”,Stratalux公司CEO Jeremy說(shuō)。中斷事故導(dǎo)致了他的一位客戶服務(wù)中斷了1個(gè)小時(shí)。

微軟Windows Azure再次宕機(jī)

7月26日,Azure故障,導(dǎo)致西歐用戶受影響。微軟對(duì)故障的解釋是“由于錯(cuò)誤配置了網(wǎng)絡(luò)設(shè)備導(dǎo)致了西歐區(qū)域的服務(wù)網(wǎng)絡(luò)中斷”。

此次中斷持續(xù)2.5小時(shí)。微軟表示此次事故中并無(wú)用戶數(shù)據(jù)丟失。

Google Talk

在微軟Azure宕機(jī)的同一天,Google Gmail用戶使用的Gtalk中斷了近5小時(shí)。

Gtalk服務(wù)的控制面板頁(yè)為用戶提供了因服務(wù)中斷所導(dǎo)致的升級(jí)。Google對(duì)此也做出了道歉“請(qǐng)相信google是極度重視系統(tǒng)可靠性的,我們會(huì)更加注意提升我們系統(tǒng)的性能”。

GoDaddy

9月11日,網(wǎng)絡(luò)托管和電子郵件服務(wù)提供商GoDaddy遭遇6小時(shí)服務(wù)中斷,原因是網(wǎng)絡(luò)故障,起先懷疑是著名黑客組織Anonymous所為,但該組織予以了否認(rèn)。

該公司稱中斷的原因是由于內(nèi)部網(wǎng)絡(luò)故障導(dǎo)致路由表錯(cuò)誤。

在10月上旬,GoDaddy宣布他們計(jì)劃關(guān)閉其云服務(wù)業(yè)務(wù),其SMB將會(huì)整合到其他服務(wù)里。

又是亞馬遜AWS

10月22日,位于北維吉尼亞的亞馬遜網(wǎng)絡(luò)服務(wù)AWS又掛了,影響了包括Reddit、Pinterest等知名大網(wǎng)站。

中斷影響了彈性魔豆服務(wù),其后是彈性魔豆服務(wù)的控制臺(tái),關(guān)系數(shù)據(jù)庫(kù)服務(wù),彈性緩存,彈性計(jì)算云EC2,以及云搜索。

這次事故讓很多人認(rèn)為,亞馬遜是應(yīng)該升級(jí)其北維尼吉亞數(shù)據(jù)中心的基礎(chǔ)設(shè)施了。

Google App Engine

GAE是用于開發(fā)和托管WEB應(yīng)用程序的平臺(tái),數(shù)據(jù)中心由google管理,中斷時(shí)間是10月26日,持續(xù)4小時(shí),因?yàn)橥蝗蛔兊梅磻?yīng)緩慢,而且出錯(cuò)。受此影響,50%的GAE請(qǐng)求均失敗。

google表示沒有數(shù)據(jù)丟失,應(yīng)用程序行為也有備份可以還原。為表歉意,google宣布11月份用戶可以

google表示他們正在加強(qiáng)其網(wǎng)絡(luò)服務(wù)以應(yīng)對(duì)網(wǎng)絡(luò)延遲問(wèn)題,“我們已經(jīng)增強(qiáng)了流量路由能力,并調(diào)整了配置,這些將會(huì)有效防止此類問(wèn)題再次發(fā)生”。

在google服務(wù)故障的當(dāng)天,Dropbox和Tumblr也發(fā)生了服務(wù)中斷。不過(guò)并未找到三者之間存在的關(guān)系。

Tumblr

GAE中斷的當(dāng)天,著名微博客平臺(tái)和社交網(wǎng)站Tumblr也發(fā)生故障。幾小時(shí)后修復(fù),該公司也稱將會(huì)發(fā)布詳細(xì)的事故報(bào)告。

但此后他們尚未做出進(jìn)一步的解釋。

Dropbox

10月26日,在線存儲(chǔ)公司Dropbox也發(fā)生服務(wù)中斷。

當(dāng)時(shí)網(wǎng)站顯示錯(cuò)誤信息“抱歉,網(wǎng)站出問(wèn)題了,不過(guò)請(qǐng)勿擔(dān)心,數(shù)據(jù)都很安全,我們也在盡快修復(fù)。”

此后他們也并未做出進(jìn)一步的解釋。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)