這就是數(shù)據(jù)中心作為數(shù)據(jù)的中央存儲庫變得至關(guān)重要的地方。他們不僅需要管理越來越多的數(shù)據(jù)、更復(fù)雜的機器和基礎(chǔ)設(shè)施,還需要更快地生成有關(guān)數(shù)據(jù)的改進信息。
在本文中,自動化和基礎(chǔ)設(shè)施服務(wù)提供商現(xiàn)代數(shù)據(jù)中心架構(gòu)師Matthew Beale對機器人過程自動化(RPA)和機器學(xué)習(xí)如何為自動化數(shù)據(jù)中心鋪平道路進行了解析。
為什么需要自動化數(shù)據(jù)中心?
隨著企業(yè)運營方式的轉(zhuǎn)變,產(chǎn)生的數(shù)據(jù)都必須得到適當?shù)奶幚砗褪褂?,以?yōu)化其價值。如果沒有經(jīng)濟高效的存儲和日益強大的硬件,數(shù)字化轉(zhuǎn)型以及與之相關(guān)的新業(yè)務(wù)模式將無法實現(xiàn)。
專家一直預(yù)測,全球工廠中應(yīng)用的自動化技術(shù)將在未來應(yīng)用于數(shù)據(jù)中心。事實上,隨著機器人過程自動化(RPA)和機器學(xué)習(xí)在數(shù)據(jù)中心環(huán)境中的應(yīng)用,人們正在快速推進這種可能性。
傳統(tǒng)的數(shù)據(jù)中心
目前,企業(yè)在處理數(shù)據(jù)中心的升級、補丁、修復(fù)和監(jiān)控方面花費了太多的時間和精力。雖然有些可能運行得很好,但大多數(shù)都面臨三個關(guān)鍵問題:
•缺乏一致的支持,例如,人們在更新補丁或維護導(dǎo)致合規(guī)性問題的網(wǎng)絡(luò)時會出錯。
•缺乏對業(yè)務(wù)的可見性,例如,多個IT人員負責管理多個應(yīng)用程序或網(wǎng)絡(luò)的不同部分,而幾乎不需要協(xié)調(diào)業(yè)務(wù)需求。
•在增加容量或遷移數(shù)據(jù)或更新應(yīng)用程序時缺乏速度。
到目前為止,人為錯誤是導(dǎo)致網(wǎng)絡(luò)停機的最重要原因。接下來是硬件故障。對設(shè)備如何工作幾乎沒有監(jiān)督,只有在停機時間已經(jīng)發(fā)生時才能采取行動。成本影響要高得多,因為其重點是從管理問題原因的其他事項中解脫出來,并結(jié)合實際網(wǎng)絡(luò)停機時間的影響。必須加強穩(wěn)定性、成本和時間管理,以提供更高效的數(shù)據(jù)中心。數(shù)據(jù)中心的自動化有助于實現(xiàn)這一目標。
數(shù)據(jù)中心自動化之旅
數(shù)據(jù)中心實現(xiàn)完全自動化就像是從駕駛汽車轉(zhuǎn)向完全自主的無人駕駛汽車。目前,人類管理、監(jiān)控和操作數(shù)據(jù)中心,這需要人工采用工具和閾值處理。這將非常耗費人力,并且通常需要調(diào)整基礎(chǔ)設(shè)施來處理意外問題。
通往完全自動化的數(shù)據(jù)中心的旅程根據(jù)組織的類型和個體的復(fù)雜性而不同。然而,在未來兩年內(nèi),可以看到許多企業(yè)(特別是在快速發(fā)展的行業(yè)),已經(jīng)存在或正在建立一個完全自主的數(shù)據(jù)中心。
數(shù)據(jù)中心可以實現(xiàn)不同級別的自動化,以使其從當前的人工系統(tǒng)中移動:
輔助行動:旅程的第一步為管理員提供信息,使其能夠以用戶友好和可消費的方式采取行動,例如集中登錄。如果出現(xiàn)故障,它還可以通過檢索備份來確保高可用性。該過程實質(zhì)上取代了管理員點擊“執(zhí)行”按鈕。
部分自動化:此步驟將轉(zhuǎn)移到一個系統(tǒng),該系統(tǒng)為管理員提供建議,以便根據(jù)使用趨勢接受操作。使用動態(tài)資源調(diào)度(DRS),系統(tǒng)會查看性能趨勢,以及哪些區(qū)域變得特別繁忙,以便它可以分配資源以確保均衡,從而獲得更好的性能。這對于計費或人力資源薪酬系統(tǒng)尤其有效,這些系統(tǒng)往往在月底達到峰值。
條件自動化:這導(dǎo)致系統(tǒng)使用現(xiàn)代技術(shù),該系統(tǒng)將自動采取補救措施,并根據(jù)智能警報提高故障單。例如,系統(tǒng)查看安全信息和事件管理,以整理來自許多不同數(shù)據(jù)點的大量信息,例如用戶登錄和正在訪問的數(shù)據(jù)。機器學(xué)習(xí)算法將獲取此信息并將其與歷史使用數(shù)據(jù)進行比較以識別趨勢。根據(jù)這些指標,如果它認為某個帳戶已被泄露,則會采取相應(yīng)措施。
完全自主:利用人工智能(AI)和機器學(xué)習(xí)(ML),自主數(shù)據(jù)中心確定適當?shù)牟襟E,并在需要時自我學(xué)習(xí)和調(diào)整閾值,以實現(xiàn)高效存儲,從而節(jié)省成本。它可以根據(jù)當前和未來的使用模式對方案進行建模,并根據(jù)特定項目所需的存儲量進行更改。
完全自動化數(shù)據(jù)中心的好處
自動化的一個主要好處是引入了自我修復(fù)數(shù)據(jù)中心。機器人和機器學(xué)習(xí)重組并優(yōu)化傳統(tǒng)流程,這意味著工作人員不再需要在半夜對服務(wù)器執(zhí)行補丁。機器可以在問題發(fā)生之前識別和標記問題,從而消除停機時間。自動化最大限度地減少了人工維護數(shù)據(jù)中心所需的時間。
另一個好處是有效的資源規(guī)劃和容量管理。隨著應(yīng)用程序在整個業(yè)務(wù)中的生命周期的變化,需要相應(yīng)地重新部署資源。由于能見度有限,如果不可能的話,人類在不使用機器和機器人的情況下有效地分配資源是極其困難的。自動化可以在應(yīng)用程序生命末期相應(yīng)地增加或減少資源,從而使其他地方的資源最大化。持續(xù)的容量管理還評估多個云平臺上的資源,以優(yōu)化利用率。
人工智能驅(qū)動的操作從自動化開始
在接下來的兩年中,人們將開始看到支持傳統(tǒng)和下一代工作負載的數(shù)據(jù)中心,這些工作負載可以在任何時候以自我修復(fù)的最佳方式實現(xiàn)自動化。這意味著,當涉及到遷移、維護、升級、容量更改、審計、備份、監(jiān)控時,數(shù)據(jù)中心在不需要或幾乎不需要援助或人工干預(yù)的情況下自行采取大部分行動。
無論數(shù)據(jù)中心內(nèi)的流程是什么,自動化機器人都能確保其一致性和準確性,這意味著每項任務(wù)都將更加高效。Ultima公司計算出自動化技術(shù)與人類的生產(chǎn)力比率為6:1,使團隊能夠僅在特殊情況下進行干預(yù),做出決策。這意味著操作工作需求的類型,從確保發(fā)生了什么事情和解決問題,到查詢業(yè)務(wù)和花費時間開發(fā)應(yīng)用程序和平臺,都會發(fā)生變化。
與自動駕駛汽車類似,開發(fā)自動化數(shù)據(jù)中心的潛力永無止境,需要不斷改進工作方式。