數(shù)據(jù)中心監(jiān)控為什么要自動化?在我們探討這個問題前,我不可避免的要提到ITL(信息技術(shù)基礎(chǔ)架構(gòu)庫),ITL目前已經(jīng)廣泛的應(yīng)用在政府、企業(yè)等機構(gòu),它是用來幫助IT部門改善服務(wù)流程,提升效率的準(zhǔn)則,如果能將它用在數(shù)據(jù)中心監(jiān)控自動化上,我將不再擔(dān)心自動化管理無法衡量與量化。
誠如我剛才所言,接下來,我將為大家具體的介紹一下在數(shù)據(jù)中心實現(xiàn)自動化的幾種方式。
搜索設(shè)備與連接
首先,需要確保你的設(shè)備可以通過各種方式各種方式能連網(wǎng)。
接下來 進(jìn)入子網(wǎng)
輸入IP地址或者域名
通過查找已經(jīng)連接的設(shè)備,你就能在網(wǎng)絡(luò)上發(fā)現(xiàn)剛才輸入的設(shè)備名稱。
指定Active Directory(活動目錄服務(wù))(AD)OU(組織單位),掃描該OU中的計算機設(shè)備。
它可以幫你找到不易找到的設(shè)備。這種功能也是采用剛才提到的輸入方式,跟剛才提到的子網(wǎng)、IP地址、活動目錄的輸入方式是一樣的。
搜索設(shè)備的時候,應(yīng)盡可能用簡單的方法詢問(設(shè)備類型,硬件類型等),查詢設(shè)備基本信息,如設(shè)備名稱,供應(yīng)商、型號等信息,詢問時,應(yīng)詢問這個設(shè)備特有的信息特征,而不是單一的查詢一系列的數(shù)字信息。 同時,你會發(fā)現(xiàn)搜索不僅限于SNMP,對WMI和API同樣適用(Cisco UCS,VMWare和Microsoft Hyper-V等都適用)
最終,要確認(rèn)設(shè)備是否被掃描到?是否已經(jīng)建立連接?連接后的設(shè)備可以在網(wǎng)絡(luò)上看到它的所有信息,包括服務(wù)器都連到什么交換機,以及連到數(shù)據(jù)中心哪臺集群服務(wù)器或者其它地方的集群服務(wù)器 。
自動化探索
剛才那個程序只是通過地址掃描,能不能通過其它方式掃描呢?
接下來掃描整個文件,通過數(shù)據(jù)中心監(jiān)控系統(tǒng)定期監(jiān)控運行狀態(tài)
可以設(shè)定為以下時間進(jìn)行加農(nóng)
每隔幾個小時/每過幾天/每過幾周
每個星期的某一天
每個月的某一天
一天中的某個時間段
除此之外,當(dāng)程序運行超過一天中某個時間或者運行超過一個固定的時間段后,你可以設(shè)定關(guān)閉程序。這樣,你就可以避免在掃面程序時濫用數(shù)據(jù)中心的監(jiān)控系統(tǒng),同時,你還可以將整個文件進(jìn)行分區(qū)管理,建立安全、強健的搜索程序,提升搜索效率。
最后,除了按計劃運行之外,還應(yīng)將掃描設(shè)定為由事件觸發(fā)。 比如,如果路由器上的接口已關(guān)閉超過30分鐘,則應(yīng)將掃描設(shè)置為在接口所屬的子網(wǎng)上觸發(fā),以檢查新接口是否已啟動,以及是否有任何新的遠(yuǎn)端設(shè)備已上線。不管觸發(fā)事件如何,所需的功能是基于數(shù)據(jù)中心中的實時事件來設(shè)置受控發(fā)現(xiàn)的。
如何處理搜索到的設(shè)備
這給我們帶來了一個問題,當(dāng)發(fā)現(xiàn)新硬件時如何處理? 我們許多人深受其害的是,并不是所有的數(shù)據(jù)中心硬件都需要監(jiān)控,即使在高度嚴(yán)格的和受控制的環(huán)境中,也不是每個出現(xiàn)在子網(wǎng)中的設(shè)備都會存在。
因此,首先,希望您的監(jiān)控系統(tǒng)中已列出通過審核的新設(shè)備名單。第二,列出設(shè)備特征。第三,獲得篩選某些設(shè)備類型的能力; 例如,沒人需要監(jiān)視CD驅(qū)動器的磁盤容量。更重要的是,應(yīng)該對過濾器中指定一些設(shè)備類型是不被監(jiān)控的。
應(yīng)用發(fā)現(xiàn)
發(fā)現(xiàn)硬件設(shè)備固然重要,可它對于監(jiān)控系統(tǒng)而言是最簡單的。從那以后我開始進(jìn)入IT領(lǐng)域,研究硬件搜索,識別硬件和列舉硬件都已經(jīng)的標(biāo)準(zhǔn)化,并且可以預(yù)測。但應(yīng)用程序繼續(xù)自己的運行規(guī)則。想弄清楚什么程序被安裝在服務(wù)器上,運行了什么程序以及這些運行的應(yīng)用都在做什么?時至今日,這依然是一個挑戰(zhàn),即使對業(yè)內(nèi)人士,同樣是個棘手的問題。
勿需多言,對于大部分程序的供應(yīng)商而言,它們在不遺余力的維護(hù)應(yīng)用程序的正常運行,保護(hù)程序內(nèi)的配置文件不被修改、提高安全性,保障程序內(nèi)的個人信息不被泄露等,監(jiān)控系統(tǒng)能為程序運行提供良好的保障。
那么,如何確保核心業(yè)務(wù)得到恰當(dāng)?shù)乇O(jiān)控? 除了常規(guī)的軟件項目外,有一種形式的數(shù)據(jù)中心自動化的方式,可保障監(jiān)控程序簡單操作:角色分配。為了理解這個概念,讓我澄清一些假設(shè):
并不是所有的應(yīng)用程序都是相等的,即使它們是一樣的。我的意思是,比如我們在DMZ中運行Exchange服務(wù)器, 在有防火墻的數(shù)據(jù)中心運行Exchange服務(wù)器,在云中Exchange運行Exchange服務(wù)器,雖然它們都是在運行Exchange,可他們在具體運行中的配置文件以及安全需求是完全不同的。在這些形式當(dāng)中,單一的服務(wù)器將在使其使用期限中具有多種使用狀態(tài),使用哪種狀態(tài)的同時對應(yīng)的監(jiān)控的級別也有所不同:建立與測試對應(yīng)的生產(chǎn)與停用。
您(即組織中正在請求和配置這些服務(wù)器的技術(shù)團隊)已經(jīng)知道使用情況和需求。
考慮到這些假設(shè),希望很清楚,監(jiān)控自動化需要同一模板或一組應(yīng)用程序監(jiān)視組件的多個變體。 但你怎么知道什么時候應(yīng)用正確的?
答案是使用資產(chǎn)管理系統(tǒng),配置請求或者您的命名約定中已經(jīng)包含的信息。 通過使用以下屬性,您可以利用大多數(shù)魯棒監(jiān)控工具的能力,根據(jù)角色,狀態(tài),位置等自動分配或取消分配監(jiān)控:
網(wǎng)絡(luò)位置:DMZ,數(shù)據(jù)中心,數(shù)據(jù)倉庫,遠(yuǎn)程控制等。
配置:建立,階段,測試,試制,生產(chǎn),關(guān)閉等
關(guān)鍵業(yè)務(wù):1到5
主要用途:SQL(Structured Query Language結(jié)構(gòu)化查詢語言),AD(Active Directory活動目錄),Tomcat服務(wù)器,文件服務(wù)器等
關(guān)聯(lián)應(yīng)用程序:電子郵件,訂單登錄,XYZ_App等
正確應(yīng)用這些屬性后,您可以繼續(xù)進(jìn)行應(yīng)用程序監(jiān)視,而無需頻繁掃描,因為您應(yīng)用的監(jiān)視基于您對服務(wù)器的預(yù)期用途。
什么是云?
所有這些關(guān)于服務(wù)器和應(yīng)用程序的討論都可能聽起來很難以金屬為中心,就像在“具有手動安裝的應(yīng)用程序的舊式裸機服務(wù)器”。但實際上,所有這些監(jiān)視自動化技術(shù)都適用于混合IT甚至純云環(huán)境 。
基于云系統(tǒng),監(jiān)控可以直接(應(yīng)該)包含在程序的腳本中,以便服務(wù)器能夠受到監(jiān)控系統(tǒng)的保護(hù),從而保護(hù)云中的相關(guān)數(shù)據(jù)信息。
還少什么?
精明的讀者可能已經(jīng)注意到,我剛才講的這些都是圍繞數(shù)據(jù)中心監(jiān)控自動化關(guān)于搜索、報警的方法。 最好永遠(yuǎn)都在后面。因此,你們也不應(yīng)懈怠,應(yīng)繼續(xù)尋找更多的自動化的實例,從而幫助你降低成本,提高效率,保障應(yīng)用程序正常運行。