根據(jù)Azure狀態(tài)網(wǎng)站更新的消息,一些客戶(hù)無(wú)法利用微軟在日本東部地區(qū)的存儲(chǔ)基礎(chǔ)設(shè)施的資源。網(wǎng)站聲稱(chēng),“工程師已經(jīng)確定了造成冷卻故障的根本原因,為了避免IT設(shè)備過(guò)熱并確保數(shù)據(jù)的完整性和彈性,一些資源自動(dòng)關(guān)閉。”
盡管今年2月的亞馬遜網(wǎng)絡(luò)服務(wù)存儲(chǔ)服務(wù)崩潰造成了2017年最大的云服務(wù)中斷事故,但那是由于錯(cuò)誤的命令造成的。而近日在日本發(fā)生的中斷事件提醒了云計(jì)算設(shè)施具有極端的物理性質(zhì)。
與冷卻設(shè)備故障相關(guān)的數(shù)據(jù)中心中斷是比較常見(jiàn)的,但并不像電氣基礎(chǔ)設(shè)施故障導(dǎo)致問(wèn)題那么常見(jiàn)。在波特蒙研究所定期調(diào)查的報(bào)告中,UPS故障是導(dǎo)致數(shù)據(jù)中心中斷的最常見(jiàn)的原因,這個(gè)調(diào)查是艾默生網(wǎng)絡(luò)能源(現(xiàn)稱(chēng)為Vertiv)公司委托波特蒙研究所進(jìn)行的。
此次中斷始于太平洋時(shí)間3月31日上午7點(diǎn)左右,并延續(xù)至當(dāng)天下午,在此期間,微軟Azure工程師一直在努力恢復(fù)系統(tǒng)。
此次故障,導(dǎo)致存儲(chǔ)設(shè)備和虛擬機(jī),以及更多的云服務(wù)(如Web Apps,Backup,HDInsight,Key Vault和Site Recovery)都受到了影響。
微軟Azure于2014年在日本西部地區(qū)的大阪和日本東部地區(qū)的埼玉縣分別開(kāi)通運(yùn)營(yíng)了一個(gè)數(shù)據(jù)中心。