有人懷疑在IT運營中應(yīng)用機器學(xué)習(xí)是否可以帶來業(yè)務(wù)和IT價值。有這種疑問是正常的,但是不要為此感到驚訝。AIops是在2021年可能得到提升的Devops功能之一。
在過去十年中,IT環(huán)境變得更加復(fù)雜,其中包括公共云和私有云的應(yīng)用,支持物聯(lián)網(wǎng)(IoT)的邊緣計算基礎(chǔ)設(shè)施、大規(guī)模數(shù)據(jù)庫上的機器學(xué)習(xí)實驗、新集成、應(yīng)用程序的頻繁部署、關(guān)鍵任務(wù)遺留系統(tǒng)以及大量微服務(wù)。在IT控制之外還存在許多變量,例如安全事件、不同的最終用戶計算配置以及易變的應(yīng)用程序使用模式。
如果組織的工作是響應(yīng)事件、解決應(yīng)用程序問題、執(zhí)行根本原因分析、診斷復(fù)雜的用戶問題、驗證操作風(fēng)險、識別安全弱點或預(yù)測計算成本,那么這將面臨一個具有挑戰(zhàn)性的環(huán)境。
這就是AIops解決方案可以提供幫助的地方。以下介紹不同的解決方案如何實現(xiàn)數(shù)據(jù)清理、分析、機器學(xué)習(xí)和自動化,以簡化IT運營并促進(jìn)業(yè)務(wù)開展。
六家AIops解決方案提供商對AIops為業(yè)務(wù)和IT部門解決的問題,他們的解決方案中使用了哪些類型的機器學(xué)習(xí)算法,以及他們的產(chǎn)品如何支持自動化進(jìn)行了闡述和分析。
Devo公司提供實時操作和安全可見性
Devo公司IT運營和可發(fā)現(xiàn)性高級總監(jiān)Paco Huerta表示,AIops可以幫助IT團(tuán)隊解決最終用戶問題。Devo公司的人工智能系統(tǒng)在大規(guī)模的混合環(huán)境中提供了自動的、全面的場景見解,使運營人員能夠在最終用戶受到影響之前查明問題的確切原因。
IT部門承受著不斷的壓力,Devo公司幫助他們迅速找到問題的根本原因并評估風(fēng)險。Devo公司采用了多種開源工具和專有機器學(xué)習(xí)算法,其中包括時間序列異常檢測和用于開發(fā)和部署模型的機器學(xué)習(xí)工作臺。Devo公司的模型可以不斷學(xué)習(xí)并快速適應(yīng)。
Micro Focus公司旨在查找并修復(fù)IT運營問題
Micro Focus公司AIops產(chǎn)品營銷經(jīng)理Michael Procopio表示,“全棧AIops可以幫助IT部門篩選龐大的數(shù)據(jù)集,以發(fā)現(xiàn)并解決問題。當(dāng)今的IT環(huán)境所產(chǎn)生的數(shù)據(jù)量超出了人類的處理能力,而機器學(xué)習(xí)可以將數(shù)百個警報或數(shù)百萬個日志文件精簡到運營人員能夠輕松處理的幾個問題,而自動化是更快地解決這些問題的關(guān)鍵。我們稱之為全棧AIOP,因為將兩者結(jié)合起來可以提供一個解決問題的解決方案,幾乎不需要人工干預(yù)。”
Micro Focus公司的AIops解決方案包括Operations Bridge,它收集所有事件、度量和日志,包括來自200多個第三方工具和技術(shù)的系統(tǒng)補丁和合規(guī)性數(shù)據(jù)。然后,它將服務(wù)映射、拓?fù)浜鸵蕾囮P(guān)系數(shù)據(jù)關(guān)聯(lián)起來,以構(gòu)建準(zhǔn)確的業(yè)務(wù)服務(wù)模型。
該平臺利用無監(jiān)督的機器學(xué)習(xí),其中包括聚類、回歸、推斷統(tǒng)計、自定義邏輯和季節(jié)性算法。它還利用運營人員反饋來提高系統(tǒng)精度和指導(dǎo)未來的行動。
Moogsoft公司增強了IT運營人員的認(rèn)知能力
Moogsoft公司首席技術(shù)官Will Cappelli強調(diào)說,“IT運營需要采用人工智能技術(shù)跟上由開發(fā)人員驅(qū)動變更的快速步伐。現(xiàn)代IT系統(tǒng)表現(xiàn)出復(fù)雜的行為,并且在持續(xù)集成(CI)/持續(xù)交付(CD)頻繁部署的變化壓力下,其組件和連接拓?fù)浣Y(jié)構(gòu)不斷變化。需要人工智能來理解自我描述性數(shù)據(jù),其中包括日志、事件記錄和現(xiàn)代IT系統(tǒng)生成的指標(biāo);預(yù)測問題和中斷;并支持對人工智能技術(shù)所解釋的信號所揭示問題的響應(yīng)的執(zhí)行。”
Moogsoft公司的人工智能系統(tǒng)依次執(zhí)行多項功能。它從日志文件和其他操作系統(tǒng)聚集的噪聲背景中提取高信息數(shù)據(jù)集。然后在那些高信息數(shù)據(jù)集中發(fā)現(xiàn)相關(guān)模式,并確定哪些相關(guān)是因果關(guān)系。最后,它有助于自動執(zhí)行響應(yīng)。
Cappelli指出,AIops將直接影響組織的收入和品牌聲譽。當(dāng)智能響應(yīng)是機器人時,它會縮短影響客戶和員工的事件的平均恢復(fù)時間(MTTR)。
OpsRamp公司幫助IT部門達(dá)到服務(wù)水平目標(biāo)
OpsRamp公司事件管理和自動化的首席產(chǎn)品經(jīng)理Neil Pearson指出,AIops中的自動化可以幫助IT部門更好地執(zhí)行工作,這有利于組織開展業(yè)務(wù)。他說,“AIOps是包括機器學(xué)習(xí)、深度學(xué)習(xí)和機器人流程自動化(RPA)在內(nèi)的各種人工智能技術(shù)的應(yīng)用,可以自動執(zhí)行復(fù)雜、人工密集的重復(fù)性任務(wù)。它通常涉及從不同來源和不同格式提取大量數(shù)據(jù)。我們專注于檢測異常、預(yù)測和防止從最初發(fā)現(xiàn)資源到解決問題的重復(fù)警報和事件。這使人們的工作水平明顯提高,并幫助組織的業(yè)務(wù)發(fā)展得更好。”
OpsRamp公司從多個數(shù)據(jù)源(如指標(biāo)、日志、網(wǎng)絡(luò)數(shù)據(jù)包和跟蹤)中提取并處理大量數(shù)據(jù)集,以確定問題的根本原因。它使用深度學(xué)習(xí)和自然語言處理算法來消除噪音,通過提出解決問題的建議確保其不再重復(fù)來協(xié)助操作。OpsRamp公司可幫助IT設(shè)計自動響應(yīng)策略,從而減少人工干預(yù),并根據(jù)業(yè)務(wù)影響對問題進(jìn)行優(yōu)先排序。
Resolve公司助力敏捷的自主IT運營
Resolve公司首席執(zhí)行官Vijay Kurkal認(rèn)為,使用人工智能和自動化來消除問題和解決方案之間的循環(huán),“自我修復(fù)IT”可以成為現(xiàn)實。他說,“AIops工具可以快速識別現(xiàn)有或潛在的性能問題,發(fā)現(xiàn)異常情況,找出問題的根本原因,甚至可以預(yù)測未來出現(xiàn)的問題,從而在業(yè)務(wù)受到影響之前觸發(fā)主動修復(fù)。通過將人工智能的見解與自動化結(jié)合起來,組織可以最大限度地發(fā)揮這些技術(shù)的價值和潛力,并創(chuàng)建一個發(fā)現(xiàn)、分析、檢測、預(yù)測和自動化的閉環(huán),從而使組織更接近于自我修復(fù)的IT。”
Resolve Insights可以自動發(fā)現(xiàn)應(yīng)用程序和基礎(chǔ)設(shè)施,生成豐富的拓?fù)鋱D,并確定業(yè)務(wù)關(guān)鍵型應(yīng)用程序和基礎(chǔ)設(shè)施之間的依賴關(guān)系。了解這些關(guān)系可以使故障排除更容易,并有助于全面的IT管理,為復(fù)雜的跨域環(huán)境提供了一個單一的視角。該數(shù)據(jù)可以在近實時地被自動推送到配置管理數(shù)據(jù)庫(CMDB),確保準(zhǔn)確的庫存信息,并創(chuàng)建一個強大的IT服務(wù)管理(ITSM)基礎(chǔ)。
Resolve Insights利用許多機器學(xué)習(xí)算法,其中包括異常檢測、事件模式識別和預(yù)測算法。其目標(biāo)是通過改進(jìn)關(guān)鍵應(yīng)用程序和基礎(chǔ)設(shè)施的性能、最大限度地延長正常運行時間以及提供有助于優(yōu)化工作的見解,來增強客戶和員工體驗。
Splunk公司幫助IT管理復(fù)雜的操作環(huán)境
Splunk公司首席技術(shù)官Andi Mann建議,IT人員必須超越傳統(tǒng)的運營模型,應(yīng)側(cè)重于數(shù)據(jù)驅(qū)動、擁抱自動化以及致力于服務(wù)交付實踐的模型。
他說,“隨著現(xiàn)代方法加速技術(shù)在全球電子市場中的采用和參與,現(xiàn)代系統(tǒng)的復(fù)雜性太高,人們無法有效地進(jìn)行管理,而傳統(tǒng)IT運營技術(shù)也無法保持滿足需求。只有采用數(shù)據(jù)驅(qū)動的方法,并應(yīng)用高級算法處理、機器學(xué)習(xí)、人工智能、響應(yīng)自動化和工作流程編排,服務(wù)交付團(tuán)隊才能應(yīng)對這些新的復(fù)雜性。Splunk公司通過采用AIops解決了這些挑戰(zhàn),為ITops、可觀察性和安全性提供了一種數(shù)據(jù)驅(qū)動的方法,以確保其業(yè)務(wù)和客戶所需的性能、可用性、功能性、穩(wěn)定性和影響。”
Splunk采用“白盒”方法進(jìn)行機器學(xué)習(xí),并預(yù)先填充了30種算法,用于異常檢測、分類、聚類、交叉驗證、特征提取、預(yù)處理、回歸和時間序列分析。它還具有來自scikit-learn、pandas、statsmodels、NumPy和SciPy庫的300多種開源Python算法。
AIop對于所有IT團(tuán)隊來說是很大進(jìn)步
當(dāng)客戶和員工將問題上報時,人們知道必須讓系統(tǒng)和應(yīng)用程序監(jiān)控器就位。當(dāng)出現(xiàn)重復(fù)事件類型時,組織制定了行動手冊和標(biāo)準(zhǔn)操作程序來解決這些問題。在可能的情況下,可以構(gòu)建腳本來重新啟動Web服務(wù)器、清理數(shù)據(jù)庫空間,并從主存儲系統(tǒng)歸檔原有文件。
如今的規(guī)模、復(fù)雜性和服務(wù)期望都要求IT加速這些規(guī)程,而這正是AIops解決方案所要解決的問題。AIops平臺集中和清理操作數(shù)據(jù),利用機器學(xué)習(xí)查明不同的問題,并提供一個自動化解決方案的框架。其最終目標(biāo)是提供更好的體驗,減少工作量,并釋放IT部門的精力來開展更具價值的業(yè)務(wù)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。