隨著新技術(shù)新業(yè)務(wù)的不斷發(fā)展,現(xiàn)代數(shù)據(jù)中心發(fā)生了很多變化:資源規(guī)模及維護壓力快速增長,客戶需求越來越多種多樣,數(shù)據(jù)中心迅速走向集中化、規(guī)?;?,大型數(shù)據(jù)中心成為主流,越來越多的云業(yè)務(wù)代替?zhèn)鹘y(tǒng)租賃托管業(yè)務(wù)……這些變化都要求數(shù)據(jù)中心踏上整合、云化之路,同時也給安全管控、資源管理、配套供給、綠色節(jié)能等方面提出新的挑戰(zhàn)。因此,構(gòu)造安全可控的云數(shù)據(jù)中心運維體系,成為運維工作的重中之重,而數(shù)據(jù)中心的安全防護、運維管理和客戶服務(wù)則是三個重要抓手。
打造三位一體的安全防護鎧甲
2012年6月29日,強雷暴天氣下發(fā)電機失靈,導(dǎo)致亞馬遜停運;2014年4月21日,三星數(shù)據(jù)中心火災(zāi)引發(fā)服務(wù)器大規(guī)模宕機;2015年2月11日國內(nèi)十大酒店數(shù)據(jù)因安全漏洞而泄露大量用戶隱私……這些頻頻發(fā)生的數(shù)據(jù)中心安全事件,一直在提醒我們:安全是IDC運維的第一要務(wù)。因此,需要在物理安全、系統(tǒng)安全及數(shù)據(jù)安全三個層面加強防護,構(gòu)造三位一體的堅固鎧甲。
物理安全,重點在于出入安全和操作安全,需要在門禁安檢、多點監(jiān)控、區(qū)域管理、安全記錄、授權(quán)管理、進出管理等方面梳理并完善物理安全管理制度及措施。同時可以運用先進的安防手段,比如在安檢系統(tǒng)上配置X光機和閘機,在門禁系統(tǒng)上配置防尾隨系統(tǒng)等安保系統(tǒng),這些都是保障物理安全的“利器”。
系統(tǒng)安全,主要是通過實現(xiàn)供電零終端、制冷不間斷、網(wǎng)絡(luò)高可靠等措施來保障系統(tǒng)安全穩(wěn)定地運行。在系統(tǒng)安全領(lǐng)域,越來越多的新興技術(shù)手段正得到運用,例如利用高壓發(fā)電機組自動并機發(fā)電,保證不間斷供電,當市電發(fā)生斷路,切換柜自動切換至油機發(fā)電;又比如模組機房采用封閉冷通道,規(guī)避局部熱點,使用列間空調(diào),實現(xiàn)精確送風,從而提高制冷效率。
數(shù)據(jù)安全,除了傳統(tǒng)意義上的防火墻部署、入侵檢測IDS、網(wǎng)站防護、網(wǎng)頁防篡改等,云數(shù)據(jù)的安全防護,成為云數(shù)據(jù)中心在安全領(lǐng)域面臨的一個重要挑戰(zhàn)。在云時代,由于數(shù)據(jù)被打散,資源池內(nèi)不同虛擬機間的數(shù)據(jù)入侵、數(shù)據(jù)泄露等問題引起了人們越來越多的關(guān)注,也相應(yīng)出現(xiàn)了很多防護措施,比如在IDC云平臺上部署虛擬化安全軟件,在宿主機內(nèi)部署三層虛擬網(wǎng)元(入侵檢測、防火墻、漏洞掃描等),通過其控制虛擬機間的訪問,能夠初步實現(xiàn)虛擬機間的安全防護。
構(gòu)建“4+1”集中運維管理流程
伴隨著數(shù)據(jù)中心規(guī)模越來越大,業(yè)務(wù)需求也越來越多樣化,維護壓力同步增長,所以集中化成為必然。所謂集中化的運維管理,就是通過完善IDC業(yè)務(wù)質(zhì)量監(jiān)控指標,同時建立IDC業(yè)務(wù)質(zhì)量管理流程,在機房管理、動環(huán)管理、網(wǎng)絡(luò)管理、云管理、業(yè)務(wù)管理等方面實現(xiàn)集中監(jiān)控、集中維護、集中性能、集中資源以及綠色節(jié)能管理等功能,即實現(xiàn)具有“四個集中”和“一個綠色”的“4+1”集中運維管理。
集中資源的重要性不言而喻。伴隨著互聯(lián)網(wǎng)業(yè)務(wù)的蓬勃發(fā)展,IDC業(yè)務(wù)發(fā)展越來越好,需要管理的資源就越來越多,如何有效管理眾多資源成為IDC運營的關(guān)鍵。在資源集中管控中可以通過三個最重要的技術(shù)手段,即全生命周期資源管理、跨數(shù)據(jù)中心資源共享以及精細化管理云資源平臺來實現(xiàn)IDC資源的集中化運維。
為了實現(xiàn)集中監(jiān)控與集中維護,可以通過建立IDC集中監(jiān)控平臺,將機房、動力、消防、資源、系統(tǒng)、業(yè)務(wù)、應(yīng)用數(shù)據(jù)等信息納入集中監(jiān)控之中,將告警輸出至集中故障平臺來進行統(tǒng)一派單;監(jiān)控人員對IDC設(shè)備實行724小時運維管理,同時建立跨專業(yè)的現(xiàn)場運維團隊,實施IDC問題三級響應(yīng)機制,探索智能維護之路。
對性能的集中監(jiān)控,就是借助云計算技術(shù),從網(wǎng)絡(luò)、服務(wù)器層面,來實時定位交互過慢、網(wǎng)絡(luò)質(zhì)量劣化等多維度復(fù)雜的性能問題。比如,當數(shù)據(jù)庫、媒體業(yè)務(wù)應(yīng)用虛擬機同受一臺主機控制時,當數(shù)據(jù)庫用戶反饋查詢速度慢時,就可以通過KQI/KPI關(guān)聯(lián)分析,定位原因為媒體業(yè)務(wù)IOPS高,造成數(shù)據(jù)庫應(yīng)用響應(yīng)時間長,并通過遷移數(shù)據(jù)庫應(yīng)用或限制媒體業(yè)務(wù)IO次數(shù)等措施解決問題。未來的云數(shù)據(jù)中心還將以云性能為重點,面向APP、云資源池等層面,開展性能管理研究。
綠色節(jié)能管理,就是從供電、制冷、云計算、IT設(shè)備等多個維度,應(yīng)用多種資源自動化調(diào)度策略,根據(jù)云平臺負荷動態(tài)調(diào)整供電、制冷量,確保設(shè)備可靠運行,獲得最優(yōu)PUE(數(shù)據(jù)中心總設(shè)備能耗)。在業(yè)務(wù)主機方面,通過積極應(yīng)用云計算和綠色IT設(shè)備,實現(xiàn)主機維度節(jié)能管理;在機房層面,通過熱仿真、模擬和勘測打造綠色機房,從而建設(shè)綠色數(shù)據(jù)中心,實現(xiàn)節(jié)能減排。
IDC的集中化運維管理,最終想要達到的目標是建立IDC運營管理支撐平臺,對IDC各項資源進行集中監(jiān)控、集中維護、集中性能,實行集中化管理運營,將告警、資源等指標與客戶進行關(guān)聯(lián),實時向客戶推送告警,開展IDC主動服務(wù)。
提供差異化全生命周期客戶服務(wù)
IDC服務(wù)也需要不斷地探索和提升,提供差異化全生命周期客戶服務(wù)。
提升IDC服務(wù),可以按照服務(wù)預(yù)防、服務(wù)響應(yīng)、服務(wù)交付、服務(wù)管理四
個維度,構(gòu)建IDC標準服務(wù)流程。可以采用的服務(wù)響應(yīng)渠道包括電話、E-MAIL、門戶網(wǎng)站、微信公眾號等。在服務(wù)交付上,可按照客戶等級和對IDC業(yè)務(wù)保障的重視程度,將IDC業(yè)務(wù)服務(wù)級別進行劃分,從售前、售中、售后三個階段,為客戶提供差異化的、具有等級的服務(wù),從而實現(xiàn)IDC增值服務(wù)能力和運營能力的提升。例如互聯(lián)網(wǎng)公司可以將設(shè)備通過物流寄送到數(shù)據(jù)中心,由數(shù)據(jù)中心代為上架、布放線纜,在網(wǎng)絡(luò)調(diào)通后再由互聯(lián)網(wǎng)公司遠程調(diào)測,這樣對于客戶而言無疑是更方便的解決方案,自然會贏得互聯(lián)網(wǎng)公司的青睞。 伴隨著新技術(shù)的不斷發(fā)展,特別是大數(shù)據(jù)云計算時代的到來,IDC面臨的傳統(tǒng)和新興的疊加挑戰(zhàn)會越來越多,運維技術(shù)的發(fā)展和能力的提升也是必然的發(fā)展趨勢。中能測(北京)科技發(fā)展有限公司以安全、質(zhì)量、服務(wù)為核心,夯實IDC安全管理,提升IDC業(yè)務(wù)質(zhì)量,為客戶提供標準化的全生命周期服務(wù),探索構(gòu)建IDC運維管理體系,同時給與機房每年的評定檢測,為我們的機房增加雙重的保險。