隨著應(yīng)用與技術(shù)的發(fā)展,數(shù)據(jù)中心的建設(shè)規(guī)模出現(xiàn)兩極分化的特征:一方面,業(yè)務(wù)集中與資源共享等趨勢推動數(shù)據(jù)中心向規(guī)?;较虬l(fā)展,另一方面,小型數(shù)據(jù)中心在解決資源瓶頸的問題以及提供差異化服務(wù)方面的作用日趨明顯。
IT系統(tǒng)的集中規(guī)?;ㄔO(shè)與垂直化分布特征,對基礎(chǔ)設(shè)施的管理提出了全新的要求,這些要求集中體現(xiàn)在融合統(tǒng)一、持續(xù)高可用、經(jīng)濟性運營、可服務(wù)等方面,并已成為數(shù)據(jù)中心可持續(xù)發(fā)展的關(guān)鍵KPI,而以此為基礎(chǔ)的數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)成為了精細化運營建設(shè)的關(guān)鍵內(nèi)容。
一、為何需要建設(shè)精細化運營
早期的數(shù)據(jù)中心管理側(cè)重“監(jiān)測”,管理對象單一,網(wǎng)絡(luò)簡單,煙囪化管理特征明顯,無法支撐業(yè)務(wù)的可持續(xù)發(fā)展。物聯(lián)網(wǎng)、M2M、云技術(shù)的發(fā)展,使得大量設(shè)備連接成為可能,基礎(chǔ)設(shè)施日趨整合,數(shù)據(jù)規(guī)模、復(fù)雜性增加,呈現(xiàn)出如下特征:
1、領(lǐng)域產(chǎn)業(yè)鏈聚合,海量硬件與軟件連接,資源的統(tǒng)一管理是基本訴求;
2、保障連續(xù)供電、連續(xù)供冷,構(gòu)建內(nèi)耗最小、功效最大的資源服務(wù)中心以應(yīng)對資源集中、成本控制帶來的挑戰(zhàn),成為IDC建設(shè)、過程運營需要面對的共同課題;
3、供電、冷卻能力、機柜空間等資源的最大化利用,成為降低TCO、延長數(shù)據(jù)中心建設(shè)周期的有效方法;
4、同時,DCIM管理與工具快速的滲透到數(shù)據(jù)中心基礎(chǔ)設(shè)施管理的E2E流程中,為自動化、智能化的高效運維與精細化管理提供了基本的技術(shù)條件;
建設(shè)完整的數(shù)據(jù)中心涉及基礎(chǔ)設(shè)施,技術(shù)與系統(tǒng)架構(gòu),應(yīng)用與數(shù)據(jù),業(yè)務(wù)與流程,組織與運營等全方位內(nèi)容。藉由基礎(chǔ)設(shè)施的運營管理,減少數(shù)據(jù)中心運營和管理成本,提高數(shù)據(jù)中心的易用性、持續(xù)可用性和靈活擴展性,保護投資、提升回報率,幫助用戶實現(xiàn)IT創(chuàng)新甚至業(yè)務(wù)創(chuàng)新,是IDC精細化運營的基本訴求。
二、滿足要求的精細化運營框架
數(shù)據(jù)中心建設(shè)是不同領(lǐng)域產(chǎn)業(yè)鏈的整合,基礎(chǔ)設(shè)施呈現(xiàn)出異構(gòu)、領(lǐng)域差異化特征,需構(gòu)建一個普適的管理模式,實現(xiàn)統(tǒng)一、融合的管理,以確保業(yè)務(wù)發(fā)生變化時,對系統(tǒng)進行自動調(diào)優(yōu),實現(xiàn)高效、準(zhǔn)確的管理。
2.1 統(tǒng)一、融合的管理
技術(shù)、業(yè)務(wù)、流程的發(fā)展和演進,推動數(shù)據(jù)中心管理目標(biāo)和功能不斷發(fā)展。
數(shù)據(jù)中心的基礎(chǔ)設(shè)施管理已經(jīng)從基本的動環(huán)管理演進為DCIM,且范圍逐漸延伸到BMS、IT資源領(lǐng)域。
管理體系已經(jīng)由孤立的資源監(jiān)控、系統(tǒng)及網(wǎng)絡(luò),向著統(tǒng)一、融合,面向服務(wù)、流程自動化方向發(fā)展。
管理功能從數(shù)據(jù)收集、發(fā)現(xiàn)、實時監(jiān)控,向歷史數(shù)據(jù)分析、決策分析、自動響應(yīng)方向發(fā)展。采集實際的數(shù)據(jù)以及對數(shù)據(jù)的分析、統(tǒng)計、報告,給出執(zhí)行策略是差異化競爭力的關(guān)鍵。
統(tǒng)一、融合的管理,要求有統(tǒng)一的數(shù)據(jù)模型,實現(xiàn)多源數(shù)據(jù)相同框架的管理;要求基于開放的平臺與體系架構(gòu),為系統(tǒng)管理工具選型提供更高的靈活性。
2.2 實現(xiàn)與業(yè)務(wù)關(guān)聯(lián)的架構(gòu)
IDC機房管理系統(tǒng)的目標(biāo)是保障基礎(chǔ)設(shè)施的持續(xù)高可用性,為業(yè)務(wù)系統(tǒng)安全、可靠地運行提供保障。
調(diào)查發(fā)現(xiàn),在眾多的機房中,盡管已經(jīng)部署了一定的監(jiān)控工具,但是這些監(jiān)控工具都是針對某一個系統(tǒng)或資源設(shè)計的,系統(tǒng)相互獨立,無法很好的集成(如制冷系統(tǒng)、供配電系統(tǒng)、服務(wù)器網(wǎng)絡(luò)設(shè)備之間的管理往往由不同的廠家提供,相互獨立)。
由于缺乏集成的管道和框架,其監(jiān)控的管理信息不能共享,導(dǎo)致誤報警和報警重復(fù)等現(xiàn)象。同時,由于這些工具都只是面向基礎(chǔ)設(shè)施的監(jiān)控,即使發(fā)現(xiàn)問題,也不能將問題與真正的業(yè)務(wù)聯(lián)系起來,也就不能判斷此問題對業(yè)務(wù)的影響,同時無法判斷解決問題時的優(yōu)先級順序,使影響關(guān)鍵業(yè)務(wù)的問題被延遲,甚或被忽略,從而無法達成SLA的關(guān)鍵訴求。
因此,一套能實時監(jiān)控系統(tǒng)、部件運行狀態(tài),準(zhǔn)確地判斷對業(yè)務(wù)影響的系統(tǒng)是實現(xiàn)數(shù)據(jù)中心智能化管理的基礎(chǔ)。要實現(xiàn)基礎(chǔ)設(shè)施的關(guān)聯(lián)管理,提升運營服務(wù)水平,要求:
1、系統(tǒng)能夠?qū)⒒A(chǔ)設(shè)施的管理與業(yè)務(wù)流程連接;
2、系統(tǒng)能夠?qū)⑺胁煌墓芾砉ぞ哌M行統(tǒng)一和集成,實現(xiàn)信息共享;
3、系統(tǒng)能夠根據(jù)共享的信息,建立起業(yè)務(wù)的關(guān)聯(lián)視圖。
精細化的運營要求管理工具可將自動化和智能化融入到業(yè)務(wù)流程中,實現(xiàn)主動式監(jiān)測和管理,專注于滿足業(yè)務(wù)增長提出的可用性、容量規(guī)劃和資源利用效率需求。
2.3 基于ITIL的最佳實踐
基礎(chǔ)設(shè)施管理解決方案不僅關(guān)注基礎(chǔ)設(shè)施本身,而且還包括組織內(nèi)部的組織流程、指令規(guī)范、 業(yè)務(wù)。 如何將組織流程、規(guī)范及業(yè)務(wù)融合到管理系統(tǒng)中,實現(xiàn)數(shù)據(jù)整合,提升運營服務(wù)品質(zhì)是ITIL的基本理念,是數(shù)據(jù)中心對外提供服務(wù)的基礎(chǔ)。
ITIL提供了一個業(yè)務(wù)與技術(shù)相結(jié)合的框架,是IT服務(wù)管理的成功實踐總結(jié)、指導(dǎo),已經(jīng)成為事實上的行業(yè)標(biāo)準(zhǔn),借鑒ITIL,運營可以以一種受控、有序的方式向最終用戶提供服務(wù)。
ITSM是建立在ITIL基礎(chǔ)上的數(shù)據(jù)中心管理與運營服務(wù)系統(tǒng),包括如下幾個階段:基礎(chǔ)監(jiān)控、融合集成、主動預(yù)防、自動優(yōu)化等,是一個漸進過程,處于不斷的優(yōu)化系統(tǒng)與技術(shù)的動態(tài)演進中。
基礎(chǔ)監(jiān)控,是IDC管理的起點,通常以數(shù)據(jù)采集、故障監(jiān)控和修復(fù)重大故障所需時間作為評估標(biāo)準(zhǔn),往往是事件觸發(fā)式的、被動式的。
在融合集成階段,對基礎(chǔ)設(shè)施管理評估標(biāo)準(zhǔn)為:所管理資源的可用性、在故障管理系統(tǒng)中關(guān)閉故障所需時間。要改善這些評估指標(biāo),離不開對業(yè)務(wù)流程化、最佳實踐方案的反饋與循環(huán)改進。
在主動預(yù)測階段,保障業(yè)務(wù)系統(tǒng)的可用性和SLA,是支撐主動、高效管理的動因。對資源的性能進行評估、分析,并利用相關(guān)領(lǐng)域的技能與知識,對系統(tǒng)資源性能、問題、容量做主動式管理,對資源的優(yōu)化配置提出建議,是該階段實踐的主要內(nèi)容。
自動優(yōu)化階段,系統(tǒng)會自動調(diào)整資源配置,以優(yōu)化性能。業(yè)務(wù)策略、業(yè)務(wù)優(yōu)先級及SLA會支配基礎(chǔ)構(gòu)架優(yōu)化的行為,如基于業(yè)務(wù)均衡的IT資源(VM)與基礎(chǔ)設(shè)施層的高效節(jié)能聯(lián)動、基于容量管理的負載均衡與資源優(yōu)化配置等。
自主階段,使用先進的成本與收益模型、性能與業(yè)務(wù)響應(yīng)及時性等來實現(xiàn)業(yè)務(wù)自動化保障、業(yè)務(wù)快速部署、資源的最大化利用,實現(xiàn)IDC建設(shè)的彈性擴展。
三、持續(xù)構(gòu)建精細化運營系統(tǒng)
數(shù)據(jù)中心基礎(chǔ)設(shè)施精細化運營的真正潛力在數(shù)據(jù),數(shù)據(jù)中有效信息分布在不同的解決方案與DCIM工具中,信息的整合貫穿運營的每個環(huán)節(jié),是實現(xiàn)精細化運營、構(gòu)建競爭力、改變市場格局的有效手段。實現(xiàn)數(shù)據(jù)中心的精細化運營,可遵從ITIL的服務(wù)理念,圍繞數(shù)據(jù)中心持續(xù)高可用、資源最大化利用以及服務(wù)運營持續(xù)構(gòu)建。
3.1 高效,持續(xù)高可用
通過系統(tǒng)的監(jiān)控和管理,確保基礎(chǔ)設(shè)施的持續(xù)高可用性;通過數(shù)據(jù)的采集與分析,提升資源的利用率;通過自動化的運維模型,提升管理效率,降低成本,實現(xiàn)業(yè)務(wù)服務(wù)的敏捷化。
精細、廣泛的管理
基礎(chǔ)設(shè)施的精細化、廣泛的管理,建立在統(tǒng)一、完備的管理模型基礎(chǔ)之上,DMTF發(fā)布的通用信息模型CIM框架提供了操作系統(tǒng)、應(yīng)用程序、網(wǎng)絡(luò)和設(shè)備管理的基本模型,但要實現(xiàn)基于業(yè)務(wù)、應(yīng)用的管理,則需要對模型做合適的擴展,以滿足運營的基本要求。
在構(gòu)建高效、持續(xù)高可用的運營系統(tǒng)的過程中,滿足ITSM管理要求統(tǒng)一的數(shù)據(jù)模型的基本要求包括:
1、自動的數(shù)據(jù)采集,設(shè)備管理、傳感網(wǎng)絡(luò)可持續(xù)采集和集中處理數(shù)據(jù)。
2、具有虛擬現(xiàn)實的建模能力,包括IT與基礎(chǔ)設(shè)備在內(nèi)的資源,可準(zhǔn)確的反應(yīng)現(xiàn)場的配置。
3、所見即所得,可視化的變更、配置,深入到CRAC、行、機架等級,實時可見的能力,可避免主觀臆斷的移動、添加、以及改變數(shù)據(jù)中心的配置。
4、可持續(xù)跟蹤IT資產(chǎn)的財務(wù)數(shù)據(jù)(購買日期、成本)以及物理數(shù)據(jù)(機架中的位置)的變化,實現(xiàn)生命周期內(nèi)的資產(chǎn)管理。
5、數(shù)據(jù)中心的能力規(guī)劃與預(yù)測,集中式的電源、散熱、空間、網(wǎng)絡(luò)占用計算可預(yù)知機架能力變化,提高資產(chǎn)利用率。
借助統(tǒng)一的數(shù)據(jù)模型、組件化及網(wǎng)絡(luò)構(gòu)建能力,DCIM能夠管理分散的、不斷增加的成組應(yīng)用,支持、收集開局、擴容、遷移、退網(wǎng)等場景下的配置、變更信息,并進行相關(guān)處理,提供相關(guān)信息,支持決策。用戶可在一個集中可視化視圖中,以一種更直觀、有效的方式來反映當(dāng)前部件狀態(tài)并執(zhí)行控制任務(wù)。
前瞻性的問題管理
IDC管理系統(tǒng)通過對基礎(chǔ)設(shè)備、連續(xù)供電系統(tǒng)、連續(xù)供冷系統(tǒng)的監(jiān)視、預(yù)測,管理粒度細化到設(shè)備的運行指標(biāo)級,深入洞察,實現(xiàn)問題的前瞻性管理。
實現(xiàn)對管理信息的簡潔化訪問,降低響應(yīng)的時間,減少非計劃的停機;消除故障,在問題沒有發(fā)生之前預(yù)知;與ITSM的集成,事件管理、問題管理流程化,自動化,是前瞻性管理的必要手段:
1、通過對連續(xù)供電、連續(xù)供冷系統(tǒng)的監(jiān)控,感知系統(tǒng)、設(shè)備的輸出能力以及性能下降,并對可能的業(yè)務(wù)影響進行分析,給出預(yù)警。
2、利用容量管理,實現(xiàn)機柜級的供電、制冷、空調(diào)、網(wǎng)絡(luò)的分析,規(guī)避資源沖突,在確保資源最大化利用的基礎(chǔ)上,提供連續(xù)的服務(wù)。
3、提供連續(xù)、實時的監(jiān)控工具,通過信息的簡潔化、快速訪問,降低系統(tǒng)或者網(wǎng)絡(luò)的停機時間,縮短MTTR。
4、結(jié)合事件、問題管理流程,規(guī)避流程外的疏忽和遺漏,保障服務(wù)的持續(xù)可用性與SLA。
智慧數(shù)據(jù)中心針對設(shè)備故障、運行性能的下降,提供容量、事件、問題管理等功能,可以預(yù)定義門限和條件,接收并處理告警、事件信息。
針對問題管理,管理系統(tǒng)利用知識庫、實踐經(jīng)驗庫,配置相應(yīng)的功能集,當(dāng)業(yè)務(wù)系統(tǒng)、應(yīng)用子系統(tǒng)或部件的可用性降低或者故障時,可自動感知、并實現(xiàn)主動的管理,進行自診斷、自恢復(fù)操作。使得IT人員可聚焦主要的職責(zé),開展主要的業(yè)務(wù)。
關(guān)聯(lián)管理提升運營服務(wù)水平
智慧管理通過配置服務(wù)策略,對資源進行監(jiān)視,發(fā)現(xiàn)影響可用性和預(yù)設(shè)服務(wù)水平的事件、狀態(tài)變化和性能降低。
當(dāng)被監(jiān)視的系統(tǒng)、設(shè)備中發(fā)生事件時,該事件被記錄并關(guān)聯(lián)到相應(yīng)的業(yè)務(wù)資源。在業(yè)務(wù)系統(tǒng)影響視圖中,資源自身及依賴該資源的業(yè)務(wù)系統(tǒng)同時在界面呈現(xiàn),幫助用戶快速確定出該資源的問題是否影響到關(guān)鍵業(yè)務(wù)系統(tǒng)。
同時,管理系統(tǒng)將事件與關(guān)聯(lián)資源的可用性和響應(yīng)時間指標(biāo)結(jié)合,并可將用戶或用戶組感興趣的資源組織在一起,形成業(yè)務(wù)系統(tǒng)視圖,實現(xiàn)關(guān)聯(lián)管理。
實現(xiàn)數(shù)據(jù)中心系統(tǒng)、服務(wù)間的關(guān)聯(lián)管理,需要建設(shè)以下幾個方面的關(guān)鍵能力:
1、構(gòu)建配置、變更管理能力,實現(xiàn)資源的自動發(fā)現(xiàn)、自動感知變更、數(shù)據(jù)同步,使用如設(shè)備面板、功耗分布圖、溫度云圖、監(jiān)視Dashboard等工具,全面掌控環(huán)境變化。
2、建立連續(xù)供電、連續(xù)供冷、管理網(wǎng)絡(luò)等系統(tǒng)的拓撲關(guān)系圖,提供完整的部件間的上下聯(lián)關(guān)系樹,并在資源能力下降時,進行關(guān)聯(lián)影響的分析。
3、共享的信息架構(gòu),通過業(yè)務(wù)關(guān)聯(lián)視圖,實現(xiàn)聯(lián)動控制、集群調(diào)控、資源遷移、擴容等操作,保障服務(wù)的連續(xù)性。
4、上述管理工具與服務(wù)流程(工單)結(jié)合,實現(xiàn)發(fā)現(xiàn)、測量、分析、調(diào)優(yōu)的閉環(huán)管理。
3.2 資源利用最大化
隨著數(shù)據(jù)中心的平均功率密度的持續(xù)增長,機位、供電能力、制冷能力的最大化利用,成為降低運營成本的關(guān)鍵。而基于供電、制冷、機位、端口的容量規(guī)劃和管理,是支持數(shù)據(jù)中心可持續(xù)發(fā)展,實現(xiàn)資源利用最大化的關(guān)鍵技術(shù)。
負載均衡、能效最大化
跟蹤數(shù)據(jù)中心全局(整個數(shù)據(jù)中心)或者局部(一個機架)的電源消耗模式,并通過PUE與能耗分布識別改進策略,持續(xù)優(yōu)化電源使用效率,是數(shù)據(jù)中心能效最大化運營的基本手段。通常包括如下幾個方面:
1) 完備的數(shù)據(jù)中心能效測量、分析、優(yōu)化模型;
2) 基于成功實踐的負載管理服務(wù),如應(yīng)用與負載均布;
3) 能效優(yōu)化服務(wù)能力,如多機柜管理、聯(lián)動,模擬配置和部署能力。
能耗測量是數(shù)據(jù)中心能耗管理的基礎(chǔ),包括測量點的選擇、測量參數(shù)等。能耗的管理策略決定了測量的模型,提供靈活的可定制的測量模型,可為不同場景下的數(shù)據(jù)中心能效優(yōu)化提供理論支持。
在具體的實踐中,一般采用PUE、pPUE(局部PUE)、DCiE、能耗分布等模型來評估能效,但要準(zhǔn)確的測量,需要系統(tǒng)能準(zhǔn)確的描述數(shù)據(jù)中心的供電、供冷網(wǎng)絡(luò)模型。
供電網(wǎng)絡(luò)的能耗測量借助智能電量儀、智能配電設(shè)備(如rPDU)、UPS等來實現(xiàn)。對于pPUE來說,還需要綜合考慮負載分布情況,實現(xiàn)一個電源系統(tǒng)分供多個負載的精確計算。
供冷網(wǎng)絡(luò)的測量主要是借助冷量儀實現(xiàn),對于一拖多的供冷網(wǎng)絡(luò),需要將支路冷量數(shù)據(jù)信息通過加權(quán)的方式將能耗分解到指定的區(qū)域負載。
因此,供電、供冷網(wǎng)絡(luò)模型的準(zhǔn)確性,所具有的測量條件,以及所采用的測量技術(shù)是能效準(zhǔn)確評估的前提條件。
負載管理服務(wù)包括規(guī)劃、監(jiān)視、配置部署幾個部分,并輔助以機位、制冷等因素,形成以供電、制冷、機位為基礎(chǔ)的容量管理,可為機架乃至數(shù)據(jù)中心的業(yè)務(wù)的持續(xù)增長提供有效的支持。
負載規(guī)劃需要考慮整個數(shù)據(jù)中心(最小單位為一個機房)的負載部署,在保證業(yè)務(wù)連續(xù)可用性基礎(chǔ)上,通過單機柜、機柜間的負載平衡配置,實現(xiàn)如變壓器、UPS輸出的三相平衡等特性,改善整個機房的供電環(huán)境,提升供電品質(zhì)。同時,負載的均衡分布,可促成冷量的均衡分布,規(guī)避冷、熱孤島現(xiàn)象,改善機房的散熱環(huán)境,最終顯著的提升PUE。
通過規(guī)劃設(shè)計能夠在數(shù)據(jù)中心建設(shè)初期確保設(shè)計的目標(biāo),但在實際的運營過程中,這些配置也不是靜態(tài)的,會隨著業(yè)務(wù)的伸縮不斷的動態(tài)變化,如物理設(shè)備的移動、變更、擴容服務(wù),以及虛擬機的遷移等。一個具有跟隨配置變更的能效調(diào)控工具是實現(xiàn)能效優(yōu)化運營的基本需求,應(yīng)該具有多機柜關(guān)聯(lián)管理、聯(lián)動、模擬配置和部署能力。實施可參考:
1) 實時監(jiān)視功耗,了解服務(wù)器/機架的平均和峰值功率。利用能耗管理工具,通過減少空閑容量的配置,提升電力資源的利用率;
2) 實時測量IT服務(wù)器的負載,并按照空調(diào)最佳COP調(diào)節(jié)制冷輸出,通過實時的負載溫度監(jiān)測和制冷容量的自適應(yīng)控制,實現(xiàn)按需供冷;
3) 根據(jù)功耗分布,給出負載規(guī)劃、配置優(yōu)化建議,實現(xiàn)負載再平衡。
容量管理,資源最大化利用
容量管理,是解決不斷變化的業(yè)務(wù)需求,確保在適當(dāng)?shù)臅r間,以適當(dāng)?shù)臄?shù)量、適當(dāng)?shù)膬r格提供基礎(chǔ)設(shè)施服務(wù)的能力,關(guān)鍵驅(qū)動力來源于:
1) 超高密度設(shè)備導(dǎo)致的基礎(chǔ)設(shè)施能力的可獲得性;
2) 總擁有成本(TCO)控制;
3) 業(yè)務(wù)的快速伸縮導(dǎo)致的IT設(shè)備的快速變更。
在數(shù)據(jù)中心基礎(chǔ)設(shè)施的容量分析中,主要借助供電、制冷、空間、端口、承重等數(shù)據(jù),根據(jù)規(guī)劃與設(shè)計的約束條件,計算制冷、供電的匹配能力、空間和網(wǎng)絡(luò)端口可獲得性、地板和機架承重限制,在IT需求與物理基礎(chǔ)設(shè)施供應(yīng)之間取得平衡。而最為關(guān)鍵的是機架級的供電與制冷的供給及需求的準(zhǔn)確分析與評估,需要從如下幾個方面進行量化:
1) 潛在需求:業(yè)務(wù)配置對供電、制冷的最大潛在需求,一般指考慮系統(tǒng)的峰值功率后的總需求;
2) 實際需求:當(dāng)前配置的實際需求,指系統(tǒng)實際運行過程中的供電與制冷需求;
3) 設(shè)計供給:設(shè)計階段給定的機架供電、制冷潛在供給能力,指在設(shè)計階段,基礎(chǔ)設(shè)施所能供給機柜的能力。
在實際環(huán)境中,實際需求小于潛在需求,而設(shè)計的供給能力往往大于機柜所配置業(yè)務(wù)的最大潛在需求,因此通過容量的規(guī)劃與精細化測量、評估、匹配,可有效的提高供電與制冷資源的利用率。
通過歷史運行數(shù)據(jù)分析,對實際需求進行準(zhǔn)確估測,以減少實際需求與潛在需求間的余量,實現(xiàn)電源、制冷與負載間的匹配;同時,減少潛在需求與設(shè)計供給間的裕量,從已裝機的供電、制冷系統(tǒng)中獲得最佳的機柜供給,最大化的使用裝機容量。在此過程中,可以采用的方法包括:
1) 最佳機位匹配算法,全面考慮供電、散熱、U空間、端口的匹配能力;
2) what if的模擬測試方法,分析和測試如果發(fā)生變更則可能對能力配置規(guī)劃產(chǎn)生的影響;
3) 機柜功率封頂技術(shù),減少對設(shè)計需求的裕量。
在基于ITIL的實踐中,容量管理往往與配置變更、問題事件、可用性管理等結(jié)合。容量管理以實際的配置以及配置的變更為基礎(chǔ),通過測量、分析與評估,給出問題改進建議以及可用性分析報告,來促進配置的調(diào)優(yōu)。
準(zhǔn)確的配置模型是進行容量管理的基礎(chǔ),智能管理系統(tǒng)一般使用基于行業(yè)標(biāo)準(zhǔn)(如CIM模型)的預(yù)定義對象模型,構(gòu)建CI屬性和關(guān)系,并且模型具有層次結(jié)構(gòu)和繼承關(guān)系,便于后續(xù)的維護管理,設(shè)備信息錄入以及設(shè)備間關(guān)聯(lián)關(guān)系的構(gòu)建能力是基本要求。
變更控制是動態(tài)容量管理的保障,為保障容量分析的及時、準(zhǔn)確,需要對配置的變更進行同步,保障現(xiàn)場配置與管理系統(tǒng)配置數(shù)據(jù)庫信息一致。借助移動APP,例行對配置信息進行巡檢、核查,是保障信息一致性的有效手段。
問題、事件管理為容量分析給出的優(yōu)化建議、預(yù)警提供支持,保障容量優(yōu)化規(guī)范、有序、可控。
此外,可視化能力使得從事容量管理的實踐駕輕就熟,管理系統(tǒng)提供可視化的建模能力,以視圖為基礎(chǔ),跟蹤資產(chǎn)的基本信息、物理數(shù)據(jù)(機架中的位置)、占位、工作狀態(tài)等,全面的掌控資源、容量狀態(tài)。借助可視化容量預(yù)警、報告,可避免主觀臆斷的移動、添加、以及改變配置,使得基礎(chǔ)設(shè)施的可持續(xù)性受益,確保生命周期內(nèi)設(shè)備、資源的最大化利用。
3.3 服務(wù)的部署、運營與持續(xù)構(gòu)建
數(shù)據(jù)中心基礎(chǔ)設(shè)備的精細化運營的最終目的在于,通過構(gòu)建不同運營模式的成本模型,提供不同等級的SLA保障服務(wù),以資源綁定用戶,實現(xiàn)不同運營模式的匹配(租賃、托管) 。
靈活部署,柔性擴展
傳統(tǒng)數(shù)據(jù)中心,通常采用項目單一部署的模式,IT設(shè)備與制冷、供電等相關(guān)基礎(chǔ)設(shè)施靜態(tài)綁定,此類強耦合架構(gòu),一旦實施,很難根據(jù)實際需求作出適應(yīng)性改變,無法滿足快速響應(yīng)用戶的要求。為適應(yīng)用戶需求的快速變化,模塊化數(shù)據(jù)中心、業(yè)務(wù)的分期部署與開通成為數(shù)據(jù)中心運營的首選模式。
匹配該建設(shè)模式的運營系統(tǒng),需要滿足:服務(wù)組件化、可靈活部署、可并行維護等訴求。
管理容量的可伸縮,系統(tǒng)支持分布式架構(gòu)、提供模塊化部署能力,通過靈活組態(tài)模式實現(xiàn)模塊構(gòu)建,適應(yīng)不同區(qū)域和不同數(shù)量監(jiān)控對象的快速建設(shè)需求。支持數(shù)據(jù)中心設(shè)計時的統(tǒng)一規(guī)劃、分期部署,并以超大容量的接入能力滿足不斷擴展的需要。
管理服務(wù)組件化,松耦合,支持服務(wù)熱部署,可在線接入相應(yīng)的服務(wù),而不影響系統(tǒng)其他部分的正常運行,保障服務(wù)的連續(xù)可用性。
SOA的架構(gòu)設(shè)計,保障服務(wù)的可獲得性,并通過“基于服務(wù)的業(yè)務(wù)交付”模式劃分服務(wù)粒度,快速組合、封裝、編排,快速發(fā)布,持續(xù)構(gòu)建滿足用戶需求的差異化服務(wù),實現(xiàn)組件、服務(wù)的精細化管理。
規(guī)劃、投資決策
服務(wù)管理的另一個目標(biāo)就是管理量化,借助數(shù)據(jù)來分析系統(tǒng)的狀況、變化趨勢、將來可能遇到的問題等。
基礎(chǔ)設(shè)施運營決策者,需要通過獲取確切、可信的數(shù)據(jù),來分析各系統(tǒng)的容量、性能,從而為其決策提供依據(jù)。因此,要求智慧管理系統(tǒng)能整合資源的利用率與業(yè)務(wù)增長的需求,提供報表、業(yè)務(wù)審計報告,供業(yè)務(wù)投資與決策參考,保障運營投資按計劃進行。
這些預(yù)測性、基于發(fā)展的動態(tài)分析都應(yīng)該基于準(zhǔn)確的管理模型、動態(tài)的數(shù)據(jù)信息,有效支撐投資決策,保障業(yè)務(wù)的有效、適時發(fā)布,在確保服務(wù)可提供、可獲得的基礎(chǔ)上,規(guī)避不必要的資源浪費。參考實現(xiàn):
1) 通過生命周期管理掌控資源的使用狀態(tài)、可使用時限;
2) 借助容量管理,實現(xiàn)對容量的準(zhǔn)確的分析、預(yù)測;
3) 運營成本模型;
4) 業(yè)務(wù)增長預(yù)測;
5) 資源利用率與業(yè)務(wù)量模型。
實現(xiàn)基礎(chǔ)設(shè)施的IaaS
基于ITIL的數(shù)據(jù)中心管理實踐,從建設(shè)模式、運營模式、服務(wù)交互模式等方面推動著數(shù)據(jù)中心發(fā)展,使得IDC管理由傳統(tǒng)的動環(huán)監(jiān)控向融合、統(tǒng)一的集中管理發(fā)展,通過資源、信息整合提供各類隨需而變的服務(wù)。
IDC的運營管理系統(tǒng)建設(shè),不但要關(guān)注基礎(chǔ)設(shè)施部分,也需要考慮與基礎(chǔ)設(shè)施關(guān)聯(lián)的系統(tǒng),如制冷系統(tǒng)、變配電系統(tǒng)、生命安全系統(tǒng)等;不但要關(guān)注設(shè)備本身,也需要關(guān)注設(shè)備與設(shè)備、設(shè)備與系統(tǒng)、系統(tǒng)與系統(tǒng)間的關(guān)聯(lián);不但要關(guān)注基礎(chǔ)設(shè)備的實時監(jiān)控,也需要關(guān)注對歷史數(shù)據(jù)、運行的動態(tài)數(shù)據(jù)的分析和整合,實現(xiàn)主動、自優(yōu)化的智能運營系統(tǒng)。
管理實踐模式的轉(zhuǎn)變催生了DCIM,DCIM的目標(biāo)就是通過IDC基礎(chǔ)設(shè)施的精細化管理,將基礎(chǔ)實施與IT基礎(chǔ)架構(gòu)連接起來,優(yōu)化使用與IT系統(tǒng)性能、IT操作相關(guān)的電源,制冷、空間等資源,通過與ITSM解決方案集成,使得IT服務(wù)以及業(yè)務(wù)服務(wù)管理以最有效的方法實現(xiàn)服務(wù)交付:
1) 借助基礎(chǔ)設(shè)施的融合,DCIM支持跟蹤與管理資產(chǎn),監(jiān)控所有的IT與基礎(chǔ)設(shè)施資源,跟蹤和管理容量使用,支持規(guī)劃、設(shè)計,測量、跟蹤、分析環(huán)境數(shù)據(jù)并轉(zhuǎn)化為關(guān)鍵策略。
2) 根據(jù)業(yè)務(wù)需求,建立數(shù)據(jù)中心基礎(chǔ)設(shè)施的資源池,將機房、模塊化、機架、機位等資源池化,根據(jù)不同資源量和性能需求,提供高可用、經(jīng)濟、安全的解決方案以及相應(yīng)的資源出租和設(shè)計、優(yōu)化、配置服務(wù)。
3) 建立基礎(chǔ)設(shè)施的持續(xù)可用性保障計劃,服務(wù)SLA 保障指標(biāo)量化,差異化的服務(wù)成本,服務(wù)標(biāo)準(zhǔn)可衡量,支撐租賃、托管等多樣性服務(wù)。
4) 按照基于服務(wù)的架構(gòu)基本要求,實現(xiàn)資源、SLA,可服務(wù)能力的組件化配置,并將服務(wù)進行推送到服務(wù)臺,用戶可根據(jù)其業(yè)務(wù)的需求,完成自助式的交互服務(wù)。
多源數(shù)據(jù)的整合,資源池化為建設(shè)適應(yīng)性基礎(chǔ)架構(gòu)(AI:Adaptive Infrastructure)準(zhǔn)備了技術(shù)條件,通過統(tǒng)一的管理、動態(tài)的資源分配、自助式服務(wù)交付、可衡量的服務(wù)標(biāo)準(zhǔn),實現(xiàn)從保障基礎(chǔ)設(shè)施的穩(wěn)定運行,到提供面向業(yè)務(wù)服務(wù)的基礎(chǔ)架構(gòu)的轉(zhuǎn)變,構(gòu)建可服務(wù)的基礎(chǔ)架構(gòu)。
四、結(jié)束語
云計算的發(fā)展,從建設(shè)模式、管理模式、業(yè)務(wù)模式和業(yè)務(wù)承載方面影響著IDC,并使得業(yè)務(wù)向以客戶為中心、以服務(wù)為導(dǎo)向轉(zhuǎn)型,通過整合內(nèi)容、資源的價值鏈運營,在高性能基礎(chǔ)架構(gòu)上提供各類隨需而變的整合服務(wù)。通過精細化的智慧管理,解決當(dāng)前數(shù)據(jù)中心普遍存在的資源利用率低、成本快速增加、資源管理日益復(fù)雜、以及服務(wù)多樣性等問題,是打造與業(yè)務(wù)動態(tài)發(fā)展相適應(yīng)的高可用、經(jīng)濟性運營、可服務(wù)、可持續(xù)發(fā)展的數(shù)據(jù)中心的最佳選擇。