了解您企業(yè)IT基礎設施的性能無疑是一項相當艱巨的任務。事實上,人們往往感覺IT專業(yè)人士就像是偵探小說一樣,需要偵查并探索其所在企業(yè)系統(tǒng)和基礎設施只是為了了解最基本的性能問題。企業(yè)的IT團隊對于其數(shù)據(jù)中心的性能問題往往缺乏全面的,完整的整體性把控,因此必須拼湊出不同的線索。每套基礎設施堆棧的每一層均有其自己的一套線索,而由于缺乏對于整個數(shù)據(jù)中心環(huán)境的整體視圖把控,IT人員必須推斷各種不同的線索會引導得出什么不同的結論。而隨著數(shù)據(jù)中心基礎設施變得更加復雜,上述各種線索變得更加難以分析和解讀,因此數(shù)據(jù)中心的穩(wěn)定可靠的性能也就很難實現(xiàn)。
數(shù)據(jù)中心復雜性增強的其中一個因素是:盡管相關的基礎設施和設備已經(jīng)過時,但其并沒有消失。那些資金預算緊張或人員有限的企業(yè)仍然在繼續(xù)采用著這些傳統(tǒng)的遺留系統(tǒng)、在新設備上的分層并試圖將新舊兩種系統(tǒng)整合成一個連貫的系統(tǒng),以維持企業(yè)的繼續(xù)經(jīng)營。這樣的系統(tǒng)結合使用的情況下,企業(yè)業(yè)務部門對于可用性和性能的要求和期望比以往任何時候都高,所以,此時企業(yè)的IT專業(yè)人士在受到業(yè)務部門的尋求全面的可見性方面的質疑,也就不足為怪了。簡單來說,這是由于相關設備的可用性信息與實際性能之間存在的一定差距所造成的,這種差距導致了企業(yè)團隊之間互相信任度亦受到影響。
來自過去的線索:您企業(yè)的傳統(tǒng)遺留設備所傳達的信息
幾十年前,在20世紀70年代和80年代初,大型主機是最早的“云計算”。只有最大的企業(yè)才能采用這些系統(tǒng),其高昂的成本和所需的具備專業(yè)技能的技術專家是小企業(yè)可望而不可即的。
然而,由于主機是一個專有的“封閉系統(tǒng)”,那些具備了專業(yè)知識和數(shù)據(jù)的企業(yè)需要確保最高級別的性能和數(shù)據(jù)的可用性,這也使其成為了那些負擔得起這筆高昂投資的企業(yè)所能獲得的高附加值。技術基礎設施的下一步發(fā)展是客戶端服務器的問世。但他們屬于經(jīng)典的“開放系統(tǒng)”,缺乏大型機的急性管理能力。正因為如此,這一變化迎來了企業(yè)系統(tǒng)管理(ESM)解決方案的出現(xiàn),其提供了一定程度的容量能力和配置管理,但缺乏對于整個系統(tǒng)性能的可視性。
快進到今天,當虛擬化已然成為數(shù)據(jù)中心的標準而無處不在。ESM和網(wǎng)絡性能監(jiān)控(NPM)技術在過去幾十年內已經(jīng)在很大程度上成為無關緊要、用途有限的技術,作為堆棧的現(xiàn)代層,其每一個都由不同供應商提供的,由此創(chuàng)造了一個異構的環(huán)境:有內置的、特異性層的管理工具。盡管有了這一集成整合,可視能見度間隙卻進一步拉大,因為這些工具不能有效地實現(xiàn)彼此之間的溝通,并且鼓勵異質性,甚至使得系統(tǒng)組件之間的合作水平更低。
過去的狀況如何影響今天數(shù)據(jù)中心的性能
無論數(shù)據(jù)中心的IT專業(yè)人員發(fā)現(xiàn)自己監(jiān)測的內容是什么,IT應用基礎設施演變所導致的機會是非常有限的,具有挑戰(zhàn)性的性能管理與設備特定的工具監(jiān)控部分是整體基礎設施的基礎組件。不同的,孤立的系統(tǒng)經(jīng)常會導致出現(xiàn)同樣孤立且互無交流的IT團隊,而這一問題繼續(xù)惡化即形成了性能差距,因此需要一個偵查團隊以發(fā)現(xiàn)和破譯相關性能問題產(chǎn)生的原因。而且也所面臨的挑戰(zhàn)是如何滿足業(yè)務部門需要解決的復合性需求,以滿足客戶不斷增長的期望并繼續(xù)投資新技術。隨著IT團隊員工數(shù)量增長停滯和IT預算蝸牛般的增長速度,數(shù)據(jù)中心需要一個新的解決方案來解決所需要的信息和實際可獲得的信息之間的鴻溝。
那么,IT團隊怎樣才能確保他們能夠監(jiān)控到企業(yè)整個環(huán)境中所發(fā)生的一切呢?包括從存儲陣列和堆棧,并了解整個系統(tǒng)的性能?此外,IT團隊如何能夠得到他們所需要的實時洞察,以確保性能問題能夠被盡早的識別并在早期得到緩解?對于這一級別的洞察需要性能管理解決方案,以監(jiān)視端至端系統(tǒng)的操作,其中包括存在于數(shù)據(jù)中心的現(xiàn)代技術旁部署的傳統(tǒng)技術。
通過全系統(tǒng)的可視性獲得性能保證
現(xiàn)如今,任何企業(yè)所收集的數(shù)據(jù)量均成倍于以往任何時候,而且這一數(shù)據(jù)量及其復雜程度還在繼續(xù)增加早已經(jīng)不是什么秘密了。我們已經(jīng)進入了大數(shù)據(jù)的時代,企業(yè)的IT團隊才剛剛開始處理這一數(shù)據(jù)流,并防止大規(guī)模的數(shù)據(jù)量影響到系統(tǒng)的性能。企業(yè)已處理的數(shù)據(jù)有相當長一段時間了,特別是對于那些選擇增加新的設備來替換其傳統(tǒng)遺留系統(tǒng)的企業(yè),正面臨著大數(shù)據(jù)所帶來的挑戰(zhàn),因為他們需要尋求利用過去的系統(tǒng)來處理當前所收集的這些數(shù)據(jù)信息。
在過去,企業(yè)用戶依靠服務水平協(xié)議(SLA)在存儲或服務器層向服務供應商提出在堆棧中的性能要求承諾。如在數(shù)據(jù)中心中的傳統(tǒng)遺留系統(tǒng),這種方法的SLA已經(jīng)不再足夠。性能保證需要涵蓋整個IT環(huán)境,由于基礎設施的一個組成部分也可以影響到企業(yè)提供給客戶的服務,甚至可能會損害企業(yè)的聲譽。
提供性能保證的關鍵要從對于企業(yè)當前的系統(tǒng)為何存在的理解開始。IT團隊所采用的并不是最新的設備或正在考慮構建恰好滿足他們需求的新的基礎設施,但這并不意味著現(xiàn)有的基礎設施就全是一文不值的。相反,在企業(yè)內部偵查各個基礎設施性能狀況的團隊成員必須通過對各種IT組件的拼湊,獲得對于企業(yè)整體基礎設施情況的掌握。其次,IT團隊需要繼續(xù)轉向側重于最終用戶,其中既包括企業(yè)的員工和客戶。獲得能夠解決上述兩大需求的性能,將有助于企業(yè)業(yè)務的成功。第三,IT團隊應尋求性能監(jiān)控解決方案,提供對于IT應用基礎設施的與供應商無關的視覺觀點。這種方法將使團隊對于分別由不同的供應商所提供的各種基礎設施組件有全面的理解,進而促進與業(yè)務部門的協(xié)調工作。通常情況下,最好通過引進外部專家支持這種水平的可見性。最后,IT團隊需要堅持將SLA納入到整個基礎設施堆棧,而不僅僅是一個組件。每件系統(tǒng)的連接都是錯綜復雜的,所以對它們進行隔離,并實施不同的SLA已經(jīng)不再有意義。
在流行文化中,偵探有引人入勝的任務,通過將各種線索拼湊在一起追查罪犯和破案。雖然我們可以欣賞文學或在電視上偵探的吸引力,但IT專業(yè)人員應該需要擺脫他們工作的各個組成部分,專注于自己的工作的關鍵環(huán)節(jié),這樣,性能管理就將不再是偵探小說一類的東西了。