AIOps成為自動(dòng)數(shù)據(jù)中心出現(xiàn)的關(guān)鍵因素

責(zé)任編輯:cres

作者:David Cumberworth

2019-04-29 10:48:22

來(lái)源:企業(yè)網(wǎng)D1Net

原創(chuàng)

AIOps(用于IT運(yùn)營(yíng)的人工智能)是一個(gè)相對(duì)較新的行業(yè)術(shù)語(yǔ),越來(lái)越多地與新一代IT管理供應(yīng)商聯(lián)系在一起。但是,幾乎所有AIOps公司從一開(kāi)始就沒(méi)有從完全成熟的人工智能功能開(kāi)始,而它們都是從網(wǎng)絡(luò)監(jiān)控、應(yīng)用程序監(jiān)控、服務(wù)臺(tái)或基礎(chǔ)設(shè)施監(jiān)控發(fā)展而來(lái)的。

AIOps(用于IT運(yùn)營(yíng)的人工智能)是一個(gè)相對(duì)較新的行業(yè)術(shù)語(yǔ),越來(lái)越多地與新一代IT管理供應(yīng)商聯(lián)系在一起。但是,幾乎所有AIOps公司從一開(kāi)始就沒(méi)有從完全成熟的人工智能功能開(kāi)始,而它們都是從網(wǎng)絡(luò)監(jiān)控、應(yīng)用程序監(jiān)控、服務(wù)臺(tái)或基礎(chǔ)設(shè)施監(jiān)控發(fā)展而來(lái)的。
 
打破神話
 
要了解AIOps如何在IT環(huán)境中發(fā)揮作用及其真正價(jià)值,必須首先澄清誤解和區(qū)別。很多企業(yè)在人工智能方面進(jìn)行了營(yíng)銷和炒作。與云計(jì)算的情況一樣,人工智能和機(jī)器學(xué)習(xí)技術(shù)在2018年被推廣為IT的下一個(gè)法寶,但一些企業(yè)很快意識(shí)到人工智能不是一夜之間的解決方案,而是為取代現(xiàn)有系統(tǒng)而開(kāi)發(fā)的。實(shí)際上,實(shí)施人工智能行為的機(jī)器學(xué)習(xí)(基本上檢查和比較指標(biāo)和日志數(shù)據(jù),尋找通用模式)是獲得人工智能好處的關(guān)鍵。
 
為了成功實(shí)現(xiàn)機(jī)器學(xué)習(xí),必須處理大量數(shù)據(jù)集,這需要花費(fèi)大量時(shí)間(數(shù)年的數(shù)據(jù)收集、模擬和場(chǎng)景收集),以允許實(shí)際學(xué)習(xí)發(fā)生。這正是潛在客戶應(yīng)該正確驗(yàn)證在其營(yíng)銷策略中聲稱具有相應(yīng)能力的供應(yīng)商的原因。
 
自動(dòng)化數(shù)據(jù)中心的未來(lái)
 
對(duì)于那些聲稱具有基于機(jī)器學(xué)習(xí)這一能力的廠商來(lái)說(shuō),在實(shí)際生產(chǎn)的過(guò)程中,其行業(yè)發(fā)展前景是廣闊的。當(dāng)今世界上人工智能提供價(jià)值的最好例子之一是通過(guò)在數(shù)據(jù)中心內(nèi)采用AIOps。數(shù)字化轉(zhuǎn)型對(duì)很多企業(yè)來(lái)說(shuō)是一個(gè)夢(mèng)想,但現(xiàn)實(shí)是由新系統(tǒng)組成的,這些新系統(tǒng)通常是在傳統(tǒng)體系結(jié)構(gòu)之上分層,從而導(dǎo)致混合IT基礎(chǔ)設(shè)施環(huán)境中的復(fù)雜性增加,因此許多組織都在努力實(shí)施。在利用新技術(shù)升級(jí)和改造組織運(yùn)營(yíng)和流程的過(guò)程中,很明顯AIOps是全面管理和關(guān)聯(lián)大量移動(dòng)和相互依賴元素的性能的最有效方式。AIOps是實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)中心的基礎(chǔ)。
 
AIOps的價(jià)值
 
當(dāng)人工智能應(yīng)用于數(shù)據(jù)中心內(nèi)的IT運(yùn)營(yíng)時(shí),它可以在所有基礎(chǔ)設(shè)施管理工具中提供共享場(chǎng)景,揭示應(yīng)用程序及其基礎(chǔ)資源的趨勢(shì)和行為。AIOps的價(jià)值在于,它能夠在許多不相連的系統(tǒng)之間充當(dāng)核心和大腦,收集、關(guān)聯(lián)、同步大量信息,將自我學(xué)習(xí)結(jié)合起來(lái)形成有意義的模式和聯(lián)系。隨著時(shí)間的推移,通過(guò)機(jī)器學(xué)習(xí)獲得的這種智能可以提供對(duì)基礎(chǔ)設(shè)施性能的準(zhǔn)確實(shí)時(shí)的洞察,其中包括健康、利用率、可用性。
 
如今的混合IT環(huán)境非常復(fù)雜。隨著系統(tǒng)和組件的互連、新采購(gòu)和過(guò)度供應(yīng)的不斷發(fā)生,不斷出現(xiàn)不良影響或噪音鄰接效應(yīng),而這將影響整體基礎(chǔ)設(shè)施性能,并影響最終用戶的體驗(yàn)。在成本昂貴的新系統(tǒng)中獲得的預(yù)期收益可能取決于互操作性問(wèn)題,實(shí)際上適得其反,在IT基礎(chǔ)設(shè)施生態(tài)系統(tǒng)中將會(huì)產(chǎn)生性能問(wèn)題。然后,首席信息官如何證明在未按預(yù)期執(zhí)行的新部署上獲得投資回報(bào)?更糟糕的是,當(dāng)被問(wèn)及原因時(shí),IT團(tuán)隊(duì)所在的一些場(chǎng)景并沒(méi)有更接近問(wèn)題的根源。IT管理員和運(yùn)營(yíng)團(tuán)隊(duì)都有自己的工作,他們很難隨時(shí)掌握最新情況。隨著停機(jī)事件屢見(jiàn)不鮮,表明清晰地了解基礎(chǔ)設(shè)施內(nèi)部正在發(fā)生的事情不再是一件簡(jiǎn)單的事情。
 
AIOps的真正好處
 
根據(jù)調(diào)研機(jī)構(gòu)Gartner 公司的調(diào)查,這個(gè)新領(lǐng)域的核心有兩個(gè)主要組成部分:大數(shù)據(jù)和機(jī)器學(xué)習(xí)。這些系統(tǒng)涉及監(jiān)控、服務(wù)臺(tái)、自動(dòng)化等技術(shù),可以持續(xù)深入了解IT系統(tǒng)的性能,并為業(yè)務(wù)提供數(shù)據(jù)和報(bào)告。AIOps的前提是讓管理層了解IT如何支持業(yè)務(wù)。
 
該領(lǐng)域中的管理產(chǎn)品雖然重疊但不一定相互沖突。它們可以一起部署和集成,以便為用戶、應(yīng)用程序、IT基礎(chǔ)設(shè)施提供可見(jiàn)性和控制,以實(shí)現(xiàn)自動(dòng)化。
 
就目前而言,大多數(shù)大型企業(yè)通常使用數(shù)十種管理和監(jiān)控工具,例如應(yīng)用程序性能監(jiān)控(APM)、網(wǎng)絡(luò)性能監(jiān)控(NPM),以及大量特定于存儲(chǔ)器的基礎(chǔ)設(shè)施監(jiān)控工具的組合。在大多數(shù)情況下,服務(wù)管理和變更管理工具運(yùn)行良好,但監(jiān)控方面是一個(gè)主要問(wèn)題,因?yàn)檫@些工具之間并不相關(guān),而且基本上不兼容。一些組織已經(jīng)實(shí)施了專用的AIOps工具,只需收集和分析警報(bào)或分析來(lái)自其他產(chǎn)品的日志。這些警報(bào)和日志聚合工具有助于故障排除,但它們都是“事后”解決方案,不能用于實(shí)時(shí)性能監(jiān)控或主動(dòng)預(yù)防問(wèn)題。大多數(shù)監(jiān)控工具也是特定于孤島的,沒(méi)有進(jìn)行集成,不提供跨孤島的關(guān)聯(lián),并且缺乏對(duì)應(yīng)用程序的理解或場(chǎng)景。這意味著它們主要是反應(yīng)性工具。換句話說(shuō),它們能更快地發(fā)現(xiàn)事件現(xiàn)場(chǎng),但不能阻止事件的發(fā)生。
 
應(yīng)用程序的歷程:基礎(chǔ)設(shè)施性能優(yōu)化的關(guān)鍵
 
為了真正受益于AIOps,需要一種新的、非孤立的、以應(yīng)用程序?yàn)橹行牡姆椒?。AIOps平臺(tái)不應(yīng)獨(dú)立地查看用戶、應(yīng)用程序和基礎(chǔ)設(shè)施,而應(yīng)該遵循應(yīng)用程序從最終用戶到IT基礎(chǔ)設(shè)施的過(guò)程,然后再次退出。企業(yè)對(duì)部署的技術(shù)(向云平臺(tái)的遷移證明了這一點(diǎn))不感興趣,他們想知道的是,運(yùn)行其業(yè)務(wù)的一個(gè)或多個(gè)應(yīng)用程序是否正在按預(yù)期運(yùn)行。
 
最近發(fā)生了許多關(guān)鍵應(yīng)用程序無(wú)法使用并且損害業(yè)務(wù)及其聲譽(yù)的事件。2019年4月,美國(guó)一家主要的航空公司發(fā)生系統(tǒng)性故障,造成航班延誤。今年3月,谷歌公司的Gmail和云端硬盤遭遇全球中斷,影響了澳大利亞、美國(guó)、歐洲和亞洲的用戶;而Facebook公司經(jīng)歷了被稱為“史詩(shī)般的中斷”,導(dǎo)致其在美國(guó)和歐洲的服務(wù)中斷超過(guò)14小時(shí)。這些事件不僅影響大量用戶,還影響廣告廠商在Facebook公司平臺(tái)上花費(fèi)大量資金對(duì)于潛在客戶發(fā)布的廣告。
 
Gartner 公司指出,“用于IT運(yùn)營(yíng)的人工智能(AIOps)平臺(tái)是結(jié)合大數(shù)據(jù)和人工智能或機(jī)器學(xué)習(xí)功能的軟件系統(tǒng),以增強(qiáng)和部分取代廣泛的IT運(yùn)營(yíng)流程和任務(wù),包括可用性和性能監(jiān)控、事件關(guān)聯(lián)和分析、IT服務(wù)管理和自動(dòng)化。”
 
這個(gè)領(lǐng)域的所有參與者似乎都提供端到端的可視性和實(shí)時(shí)和單一的視圖?,F(xiàn)實(shí)情況非常不同,取決于所部署的技術(shù)。有些技術(shù)整理日志文件,并從歷史角度來(lái)查看基礎(chǔ)設(shè)施的運(yùn)行情況。大多數(shù)技術(shù)收集來(lái)自多個(gè)來(lái)源的數(shù)據(jù),并整理成一個(gè)整體視圖,但這些數(shù)據(jù)來(lái)自代理,并且由于它們將負(fù)載放在實(shí)時(shí)系統(tǒng)上,因此僅限于幾分鐘內(nèi)的結(jié)果。在經(jīng)歷數(shù)字化轉(zhuǎn)型的網(wǎng)絡(luò)世界中,這還不夠準(zhǔn)確。人們需要的是一個(gè)來(lái)自應(yīng)用程序、虛擬機(jī)、主機(jī)、結(jié)構(gòu)和存儲(chǔ)的實(shí)時(shí)報(bào)告,這實(shí)際上是一個(gè)實(shí)時(shí)、端到端、單一的整體視圖。
 
AIOps的關(guān)鍵要素是:
 
(1)自動(dòng)發(fā)現(xiàn):自動(dòng)識(shí)別已安裝的基礎(chǔ)設(shè)施設(shè)備,并映射IT基礎(chǔ)設(shè)施的拓?fù)浣Y(jié)構(gòu),以對(duì)應(yīng)用程序使用的元素、共享資源的位置和可能存在爭(zhēng)用的位置進(jìn)行單一視圖的呈現(xiàn)。
 
(2)數(shù)據(jù)攝?。簲?shù)據(jù)實(shí)時(shí)從應(yīng)用程序性能監(jiān)視器、服務(wù)管理工具和IT基礎(chǔ)設(shè)施內(nèi)的所有元素中攝取。處理的數(shù)據(jù)的容量和粒度對(duì)于真實(shí)驗(yàn)證應(yīng)用程序及其支持的基礎(chǔ)設(shè)施的性能至關(guān)重要。
 
(3)關(guān)聯(lián)性:將IT基礎(chǔ)設(shè)施和機(jī)器數(shù)據(jù)與服務(wù)臺(tái)和應(yīng)用程序性能監(jiān)視器結(jié)合在一起,生成一個(gè)單一的、易于識(shí)別的實(shí)時(shí)報(bào)告。
 
(4)應(yīng)用智能:利用經(jīng)驗(yàn)建議如何通過(guò)建議的行動(dòng)方案優(yōu)化IT基礎(chǔ)設(shè)施,以確保和提高應(yīng)用程序性能。
 
(5)基于人工智能的機(jī)器學(xué)習(xí):了解應(yīng)用程序活動(dòng)的正常模式,確保只有當(dāng)應(yīng)用程序使用的元素超出其正?;顒?dòng)范圍時(shí)才會(huì)發(fā)出警報(bào)。它還將建議采取什么行動(dòng)。
 
(6)可視化:提供易于理解的應(yīng)用程序和基礎(chǔ)設(shè)施視圖,可根據(jù)管理者的要求進(jìn)行定制,從簡(jiǎn)單的紅色、黃色、綠色管理儀表盤到組件、IO度量和容量的全面深入分析。
 
真正的AIOps是一種實(shí)時(shí)、端到端的視圖,組織可以通過(guò)其了解運(yùn)營(yíng)業(yè)務(wù)的關(guān)鍵應(yīng)用程序的運(yùn)行情況,以及如何優(yōu)化支持它們的不斷增長(zhǎng)的IT基礎(chǔ)設(shè)施。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)