經(jīng)過一番搜索,原來都是亦莊眾多數(shù)據(jù)中心被限電“搗的鬼”,事件詳情是這樣的:因亦莊電力公司對(duì)泰和變電站、博興變電站和科創(chuàng)街變電站進(jìn)行改造,其中泰和變電站、博興變電站改造期間為6月1日至15日,科創(chuàng)街變電站為6月15日至6月30日,共計(jì)30天時(shí)間。
值得注意的是,在進(jìn)行改造期間,用電單位務(wù)必將平日用電負(fù)荷減少、限制25%。于是,部分?jǐn)?shù)據(jù)中心開始使用柴油發(fā)電機(jī)進(jìn)行帶載,以保障數(shù)據(jù)中心的正常運(yùn)行。
人云亦“云”的時(shí)代,數(shù)據(jù)中心作為重要基礎(chǔ)設(shè)施發(fā)揮著必不可缺的重要作用,而隨著數(shù)據(jù)中心建設(shè)規(guī)模的不斷擴(kuò)大,新技術(shù)的層出不窮,數(shù)據(jù)中心的運(yùn)維難度也“更上一層樓”。尤其是當(dāng)面臨“突發(fā)事故”,更是考驗(yàn)一個(gè)數(shù)據(jù)中心運(yùn)維團(tuán)隊(duì)的應(yīng)急能力。雖然說數(shù)據(jù)中心運(yùn)維已是老生常談的話題,但實(shí)際上,在數(shù)據(jù)中心的整個(gè)生命周期里,運(yùn)維占據(jù)了非常高的比例,且運(yùn)維的質(zhì)量和效率對(duì)數(shù)據(jù)中心的發(fā)展起著決定性作用。
據(jù)筆者了解,數(shù)據(jù)中心的日常業(yè)務(wù)運(yùn)維主要包括:
1. 日常檢查,即主要對(duì)數(shù)據(jù)中心的所有運(yùn)行設(shè)備進(jìn)行例行檢查,包括服務(wù)器、業(yè)務(wù)運(yùn)行、機(jī)房環(huán)境(溫度、適度以及灰塵等)、空調(diào)和供電系統(tǒng)的運(yùn)轉(zhuǎn)情況、設(shè)備運(yùn)行是否過熱、地板、天窗、消防、監(jiān)控等內(nèi)容;
2. 應(yīng)用變更。隨著數(shù)據(jù)中心承載業(yè)務(wù)的不斷發(fā)展,管理人員應(yīng)根據(jù)應(yīng)用的需要及時(shí)作出變更,進(jìn)行調(diào)整;
3. 軟硬件升級(jí)。進(jìn)行軟硬件升級(jí)時(shí),需做好回退機(jī)制,以防升級(jí)出現(xiàn)問題時(shí)無法回退,業(yè)務(wù)長(zhǎng)時(shí)間無法恢復(fù);
4. 突發(fā)故障。對(duì)數(shù)據(jù)中心來說,要做到完全避免事故發(fā)生是0概率事件,而當(dāng)遇上突發(fā)故障,運(yùn)維人員需及時(shí)對(duì)故障原因作出準(zhǔn)確判斷并迅速找出解決方法。若短時(shí)間內(nèi)找不到解決方法,應(yīng)通過切換到備用設(shè)備上先恢復(fù)業(yè)務(wù),再進(jìn)行分析。
降低運(yùn)行維護(hù)風(fēng)險(xiǎn),專業(yè)技能之外還要有風(fēng)控策略
運(yùn)維工作對(duì)數(shù)據(jù)中心來說至關(guān)重要,關(guān)乎整個(gè)數(shù)據(jù)中心業(yè)務(wù)的正常運(yùn)行。運(yùn)維團(tuán)隊(duì)在具備一定的專業(yè)技能和應(yīng)急能力的基礎(chǔ)上,還需制定出相應(yīng)的運(yùn)行維護(hù)風(fēng)險(xiǎn)控制策略“以備不時(shí)之需”。
運(yùn)行維護(hù)風(fēng)險(xiǎn)是指信息系統(tǒng)在運(yùn)行與維護(hù)過程中操作管理、變更管理、機(jī)房管理和事件管理等環(huán)節(jié)產(chǎn)生的風(fēng)險(xiǎn)。運(yùn)行人員應(yīng)按操作規(guī)程巡檢和操作,維護(hù)人員應(yīng)按授權(quán)和維護(hù)規(guī)程要求對(duì)生產(chǎn)狀態(tài)的軟硬件、數(shù)據(jù)進(jìn)行維護(hù),除應(yīng)急外,其他維護(hù)應(yīng)在非工作時(shí)間進(jìn)行。以下是對(duì)運(yùn)行人員提出的幾條建議:
(一)制定詳細(xì)的運(yùn)行值班操作表,包括規(guī)定巡檢時(shí)間,操作范圍、內(nèi)容、辦法、命令以及負(fù)責(zé)人員等信息;
(二)提供常見和簡(jiǎn)便的操作菜單或命令,如信息系統(tǒng)的啟動(dòng)或停止、運(yùn)行日志的查詢等;
(三)提供機(jī)房環(huán)境、設(shè)備使用、網(wǎng)絡(luò)運(yùn)行、系統(tǒng)運(yùn)行等監(jiān)控信息;
(四)記錄運(yùn)行值班過程中所有現(xiàn)象、操作過程等信息。
優(yōu)質(zhì)的數(shù)據(jù)中心運(yùn)維管理系統(tǒng)能夠協(xié)助企業(yè)整合優(yōu)化企業(yè)信息資源和服務(wù)、提高生產(chǎn)率和競(jìng)爭(zhēng)力,能為企業(yè)提供更有力的保障支持??傊痪湓挘龊眠\(yùn)維很重要!
選址,一道關(guān)乎數(shù)據(jù)中心成敗的選擇題
數(shù)據(jù)中心是互聯(lián)網(wǎng)及其他信息業(yè)務(wù)的重要載體,其建設(shè)選址不僅要保證建筑物的質(zhì)量,還要保證配套設(shè)施的完備性和長(zhǎng)期運(yùn)轉(zhuǎn)的高可靠性。在充分考慮整體風(fēng)險(xiǎn)規(guī)避的前提下,數(shù)據(jù)中心建設(shè)選址的評(píng)估因素一般包括自然環(huán)境因素、周邊環(huán)境因素、政策環(huán)境因素、城市配套因素等。
相比較自然因素,政策性因素的不確定性可能對(duì)數(shù)據(jù)中心生命周期內(nèi)的有序經(jīng)營(yíng)帶來更大的潛在風(fēng)險(xiǎn)。
例如,即便在數(shù)據(jù)中心已經(jīng)運(yùn)營(yíng)多年的情況下,電力供應(yīng)問題仍如服務(wù)商的在喉之鯁。在用電高峰季節(jié),臨時(shí)性限電政策將對(duì)數(shù)據(jù)中心的正常運(yùn)行造成突發(fā)影響,所導(dǎo)致服務(wù)中斷將給客戶造成嚴(yán)重?fù)p失。因此,在選址階段應(yīng)對(duì)備選區(qū)域內(nèi)的產(chǎn)業(yè)結(jié)構(gòu)、能耗供需、發(fā)展政策等進(jìn)行多維度分析,對(duì)長(zhǎng)期運(yùn)營(yíng)的非自然環(huán)境風(fēng)險(xiǎn)進(jìn)行全面評(píng)估。