在當(dāng)前的現(xiàn)代化時(shí)代,數(shù)據(jù)中心技術(shù)由云計(jì)算、內(nèi)部部署技術(shù)、以及IT管理方法的組合組成,IT運(yùn)營(yíng)團(tuán)隊(duì)正在努力適應(yīng)這一新的現(xiàn)實(shí),并應(yīng)對(duì)由此帶來(lái)的日益增加的復(fù)雜性。人們通過新聞報(bào)道可以獲知,越來(lái)越多的宕機(jī)和停機(jī)事件導(dǎo)致銀行和金融業(yè)務(wù)癱瘓;迫使機(jī)場(chǎng)停止運(yùn)轉(zhuǎn);以及影響醫(yī)療記錄的可獲取性。
數(shù)據(jù)不斷增長(zhǎng)的影響迫切需要解決。毫無(wú)疑問,人們正在進(jìn)入一個(gè)復(fù)雜性和變化率遠(yuǎn)遠(yuǎn)超過傳統(tǒng)人力資源IT團(tuán)隊(duì)有效管理基礎(chǔ)設(shè)施能力的階段。
與傳統(tǒng)設(shè)施整合
技術(shù)進(jìn)步是一件了不起的事情,但新產(chǎn)品并不總是能夠有效地集成到傳統(tǒng)環(huán)境中,從而導(dǎo)致巨大的漏洞。這導(dǎo)致組織變得不適應(yīng),以致于難以跟上變化的步伐,組織需要掌握這些部署如何影響應(yīng)用程序工作負(fù)載的行為和性能。業(yè)務(wù)中斷和停機(jī)對(duì)客戶造成了影響,將給組織帶來(lái)了巨大的經(jīng)濟(jì)損失,更不用說(shuō)受損的聲譽(yù),以及導(dǎo)致員工失業(yè)。為了走出這條混亂的道路,IT運(yùn)營(yíng)的智能化(AIOps,這是由調(diào)查機(jī)構(gòu)Gartner公司創(chuàng)造的一個(gè)術(shù)語(yǔ))已經(jīng)成為一種解決方案。IT運(yùn)營(yíng)團(tuán)隊(duì)發(fā)現(xiàn),隨著技術(shù)堆棧的增加,他們需要一種新的方法來(lái)管理技術(shù)堆棧的各種元素和復(fù)雜性。
雖然人們普遍認(rèn)為自動(dòng)化是現(xiàn)代數(shù)據(jù)中心的關(guān)鍵優(yōu)先事項(xiàng)(支持IT團(tuán)隊(duì)確保運(yùn)營(yíng)流程的一致運(yùn)行,有助于降低成本和維護(hù)時(shí)間),但人們對(duì)AIOps很少有真正的了解。簡(jiǎn)單來(lái)說(shuō),AIOps能夠以類似的方式使用異常檢測(cè)和機(jī)器學(xué)習(xí)來(lái)增強(qiáng)人類的理解能力,減少定位和診斷性能問題所需的時(shí)間。
應(yīng)用于基礎(chǔ)設(shè)施性能管理(IPM)的AIOps 能夠有效地確保最佳性能,可以監(jiān)督業(yè)務(wù)關(guān)鍵型面向客戶的應(yīng)用程序的運(yùn)行狀況和利用率,能夠在數(shù)據(jù)中心基礎(chǔ)設(shè)施中出現(xiàn)任何潛在阻塞或延遲問題之前提供警報(bào)。
AIOps帶來(lái)的好處
AIOps有效地幫助監(jiān)控和忽略所有不同組件的復(fù)雜性,以及混合數(shù)據(jù)中心的各種部署(無(wú)論是云計(jì)算、閃存、超融合等)。它可以有效地監(jiān)控、關(guān)聯(lián)和優(yōu)先處理IT運(yùn)營(yíng)的基礎(chǔ)設(shè)施流程,從而使其盡可能順利地運(yùn)行,無(wú)論生態(tài)系統(tǒng)面臨何種壓力和困難,無(wú)論是臨時(shí)的還是季節(jié)性的。因此,AIOps用于整個(gè)基礎(chǔ)設(shè)施的容量規(guī)劃,以優(yōu)化應(yīng)用程序可用性和性能。AIOps提供啟發(fā)式和算法,它可以檢測(cè)和暴露異常以及基礎(chǔ)設(shè)施中潛在的漏洞。AIOps事件關(guān)聯(lián)和分析功能意味著它可以挖掘大量不太重要的警報(bào),以突出對(duì)業(yè)務(wù)運(yùn)行至關(guān)重要的警報(bào)。
隨著堆棧變得越來(lái)越復(fù)雜和關(guān)鍵,迫切需要AIOps的功能。在當(dāng)今的混合、虛擬化和多供應(yīng)商環(huán)境中,傳統(tǒng)方法和專有的傳統(tǒng)工具根本無(wú)法勝任工作。
AIOps需要更多的宣傳
然而,為了真正有效,AIOps需要采用機(jī)器學(xué)習(xí)(ML)技術(shù)來(lái)實(shí)現(xiàn)其適當(dāng)?shù)某墒於?。它的能力無(wú)法在短時(shí)間內(nèi)實(shí)現(xiàn)。為了使機(jī)器學(xué)習(xí)對(duì)業(yè)務(wù)有效,需要攝取成千上萬(wàn)的場(chǎng)景以使這種學(xué)習(xí)有效地發(fā)生。這種能力可能需要數(shù)年才能實(shí)現(xiàn)。隨著新公司的宣傳推廣,并聲稱擁有AIOps功能,組織需要清晰了解AIOps的真正含義(以及它不是什么),否則IT團(tuán)隊(duì)將發(fā)現(xiàn)自己無(wú)法實(shí)現(xiàn)其優(yōu)勢(shì),無(wú)法讓他們的混合數(shù)據(jù)中心成型。
主要AIOps功能
為了實(shí)現(xiàn)AIOps的真正承諾,其功能必須超越單純的數(shù)據(jù)聚合和算法應(yīng)用,AIOps必須代表IT運(yùn)營(yíng)的整體轉(zhuǎn)型,其中包括管理模型、智能關(guān)聯(lián)數(shù)據(jù)、分析和場(chǎng)景,以實(shí)現(xiàn)所有元素的自動(dòng)化IT運(yùn)營(yíng)。那么帶來(lái)的問題是,該組織如何實(shí)現(xiàn)這一目標(biāo)?
以應(yīng)用程序?yàn)橹行牡闹匾?/strong>
一個(gè)重要的出發(fā)點(diǎn)是確保AIOps部署采用“以應(yīng)用程序?yàn)橹行?rdquo;的方法。 AIOps產(chǎn)品應(yīng)包括自動(dòng)發(fā)現(xiàn)整個(gè)基礎(chǔ)設(shè)施并將其映射到應(yīng)用程序拓?fù)涞墓δ?。這樣可以深入了解每個(gè)應(yīng)用程序服務(wù)正在使用哪些基礎(chǔ)設(shè)施資源。它應(yīng)該能夠主動(dòng)識(shí)別可能影響性能的資源爭(zhēng)用問題。以應(yīng)用為中心的方法提供的下一層聚合是能夠理解基礎(chǔ)設(shè)施的所有不同元素如何相互關(guān)聯(lián)和相互連接的場(chǎng)景。最重要的是,這必須包括應(yīng)用程序如何與基礎(chǔ)設(shè)施堆棧交互以及應(yīng)用程序?qū)I(yè)務(wù)的價(jià)值。
獲得高質(zhì)量的數(shù)據(jù)
AIOps還必須利用高質(zhì)量的數(shù)據(jù)和分析來(lái)提供有價(jià)值的見解,以幫助決策和優(yōu)化管理。真正的AIOps的力量在于超越單純的聚合警報(bào)。這需要實(shí)時(shí)連續(xù)的反應(yīng)能力,提供解決潛在問題的知識(shí),從而避免問題。正是影響運(yùn)營(yíng)的數(shù)據(jù)和分析的可用性使IT能夠應(yīng)用人工智能,并獲得所需的洞察力,這使IT運(yùn)營(yíng)團(tuán)隊(duì)能夠有效地專注于整體性能優(yōu)化。而這一重要步驟將是AIOps平臺(tái)為下一個(gè)關(guān)鍵的價(jià)值層添加新的內(nèi)容。
自適應(yīng)IT操作的自動(dòng)化
真正的AIOps的下一個(gè)關(guān)鍵屬性是自動(dòng)化,這對(duì)于運(yùn)營(yíng)團(tuán)隊(duì)能夠適應(yīng)變化,并體現(xiàn)主動(dòng)防止宕機(jī)和停機(jī)的能力至關(guān)重要。真正的AIOps通過根據(jù)需要應(yīng)用修復(fù)和優(yōu)化來(lái)實(shí)現(xiàn)這一目標(biāo),從而可以維護(hù)整個(gè)生態(tài)系統(tǒng)的健康狀況,并在整個(gè)堆棧(無(wú)論是在內(nèi)部部署還是在云中)中了解工作負(fù)載行為。
IT運(yùn)營(yíng)團(tuán)隊(duì)專注于簡(jiǎn)單地保持基礎(chǔ)設(shè)施運(yùn)行的日子已經(jīng)一去不復(fù)返了。為了使IT能夠在當(dāng)今的動(dòng)態(tài)環(huán)境中充分支持組織,它不僅必須保持業(yè)務(wù)的一致、平穩(wěn)、可靠運(yùn)行,還必須部署所有AIOps功能:從應(yīng)用程序和業(yè)務(wù)價(jià)值角度利用全棧監(jiān)控,獲取正確的數(shù)據(jù)以提供高質(zhì)量的見解,并將智能自動(dòng)化應(yīng)用于IT運(yùn)營(yíng)以實(shí)時(shí)響應(yīng)。