云運(yùn)維(CloudOps)的重點(diǎn)應(yīng)該是創(chuàng)建流程、方法、工具堆棧,使企業(yè)能夠長期運(yùn)行基于云計(jì)算的系統(tǒng)而不會(huì)出現(xiàn)中斷,并提高業(yè)務(wù)滿意度。企業(yè)提高業(yè)務(wù)的能力應(yīng)該是其首要目標(biāo)。
以一家名列全球2000強(qiáng)的大型公司為例,該公司已將1000多個(gè)工作負(fù)載遷移到云平臺(tái)上。使用容器處理大約25%的工作負(fù)載,并將其余部分負(fù)載重構(gòu)成為云原生的負(fù)載。
現(xiàn)在,該公司正在將其全部負(fù)載轉(zhuǎn)移到新的CloudOps組織。經(jīng)過數(shù)月的時(shí)間來規(guī)劃需要完成的工作,所需的工具,以及通過培訓(xùn)或招聘所需的技能,似乎都很齊全,但這種看法是錯(cuò)誤的。
以下是行業(yè)專家在企業(yè)CloudOps規(guī)劃中發(fā)現(xiàn)的兩個(gè)常見問題:
首先,企業(yè)很少考慮CloudOps的可擴(kuò)展性。常見的錯(cuò)誤是利用太多的本地監(jiān)控和管理工具。實(shí)際上,CloudOps組織都喜歡采用更多的工具。例如使用一個(gè)工具來管理和監(jiān)控AWS云平臺(tái),采用另一個(gè)工具用于Microsoft Azure,采用第三個(gè)工具用于谷歌云,企業(yè)會(huì)發(fā)現(xiàn)這種方法既復(fù)雜又低效。當(dāng)企業(yè)添加更多公共云和更多云服務(wù)(如計(jì)算、存儲(chǔ)和數(shù)據(jù)庫)時(shí),事情變得如此復(fù)雜,以至于如果沒有更多的資源,CloudOps團(tuán)隊(duì)將無法擴(kuò)展,無法更好地規(guī)劃公共管理層和通用工具。
第二,企業(yè)缺乏安全運(yùn)營或者完全沒有規(guī)劃。常見的錯(cuò)誤是沒有包括運(yùn)營中的安全性,并且在運(yùn)行安全系統(tǒng)和核心運(yùn)營之間有了更大的差距。
很多企業(yè)沒有做好這兩件事。實(shí)際上,驅(qū)動(dòng)身份管理的公共目錄服務(wù)需要被建立和維護(hù)。這涵蓋了核心安全以及管理和監(jiān)控等其他業(yè)務(wù)活動(dòng)。
安全性通常被認(rèn)為是一個(gè)不同的任務(wù)、團(tuán)隊(duì)、工具,但云運(yùn)維(CloudOps)和安全運(yùn)維(SecOps)中的最佳實(shí)踐是保持這些團(tuán)隊(duì)、工具、服務(wù)緊密耦合。
那么企業(yè)可能錯(cuò)過了什么?機(jī)會(huì)是重要的,企業(yè)需要花費(fèi)時(shí)間了解云運(yùn)維(CloudOps)和新興的最佳實(shí)踐。