無論企業(yè)是使用AWS,Azure,或其他的IaaS提供商,作為一個MSP(管理服務(wù)提供商)就是要確??蛻臬@得最佳的實踐。每天你應(yīng)該監(jiān)控他們的用法,以找到問題所在。通過監(jiān)控他們的工作量,可以根據(jù)客戶目前的需求提出縮放建議。
這些監(jiān)控就包括以下方面:
1.虛擬機
從基礎(chǔ)開始。你需要監(jiān)視CPU使用率(百分比,用戶時間,閑置時間等)。你需要監(jiān)視內(nèi)存以及(正在使用的百分比,可用的百分比)。
2.網(wǎng)絡(luò)
這指的是在進出VM的網(wǎng)絡(luò)流量。監(jiān)視此通信(網(wǎng)絡(luò),TCP連接建立和失敗的),可以在達到飽和之前,提醒你的問題。
3.磁盤I / O
監(jiān)視磁盤I / O(讀取字節(jié),寫入字節(jié)交換比例,和磁盤隊列長度)可以讓你了解如何影響虛擬機客戶的應(yīng)用程序。例如,發(fā)現(xiàn)太多的讀取/磁盤可能表明需要緩存層。如果你發(fā)現(xiàn)磁盤I / O瓶頸,它可以表示需要升級到一個新的虛擬機。
4.存儲
如果成千上萬的人同時使用系統(tǒng),云存儲的磁盤空間很快就會耗盡.。監(jiān)控存儲(隊列可用性,隊列總請求等)可以讓你的客戶知道之前發(fā)生的問題,他們需要升級存儲。
5.數(shù)據(jù)庫
監(jiān)測數(shù)據(jù)庫(CPU利用率,成功連接等),可以讓你了解你的客戶是否需要放大或縮小他們的數(shù)據(jù)庫規(guī)模以達到最佳性能。當(dāng)客戶有能力調(diào)整性能,在MSP妥善的監(jiān)控之下,讓客戶知道什么時候可能有一個潛在問題。
6.成本
看成本是非常重要的,因為大多數(shù)云提供商或基于使用模型的基礎(chǔ)上建立服務(wù)收費。重要的是如果知道成本超過預(yù)算,就要迅速采取行動
7.平臺
同時監(jiān)控各個資源是非常重要的,每個人都應(yīng)該關(guān)注平臺范圍的警報。無論AWS和Azure的狀態(tài)頁沒有提供更新。
最佳實踐
告訴你的客戶需要高度重視監(jiān)測的重要性,因為它直接影響IaaS的性能和成本。監(jiān)測可以在問題出現(xiàn)之前發(fā)現(xiàn)并解決,以避免性能問題和停機時間。