錯誤1:不了解詳細的應用程序工作負載模式
并不是所有的工作負載都是平等的,無論企業(yè)正在采用哪個公有云,最大的問題就是關于云實例選擇的細節(jié)。理解工作負載的用途和工作負載利用模式的詳細性質,這一點很重要。
在每個月底完成一次工作的公有云中運行批處理工作負載的經濟性與那些全天忙于各種高峰和低谷的應用程序有很大的不同。要正確地選擇正確的資源和云實例,企業(yè)確實需要了解一天之內工作負載模式以及該模式如何在業(yè)務周期中發(fā)生變化。
不幸的是,許多組織采取簡單的方法分析其工作量,而只查看每天的平均數或百分位數并不是徹底的方法,不能深入地了解具體的模式。結果是對資源需求的不準確的描述,這可能導致過度配置和性能問題。這些簡單的方法很少做到正確。當企業(yè)在尋找?guī)椭溥x擇正確的云實例的解決方案時,請選擇真正了解工作負載的詳細使用模式的東西。
錯誤#2:沒有利用基準來平衡平臺之間的數據
調整云計算資源分配的一個常見方法是在從一個虛擬環(huán)境或云環(huán)境移動到另一個虛擬環(huán)境或云環(huán)境時,將其分配差不多的大小。這意味著將工作負載分配給舊的資源。但并不是每個環(huán)境都運行相同規(guī)格的硬件。如果企業(yè)不使用基準來規(guī)范工作負載數據,并適應環(huán)境中底層硬件之間的性能差異,那么就無法準確地了解該工作負載將如何在新環(huán)境中執(zhí)行。
較新的環(huán)境通常具有更強大的硬件,從而使企業(yè)更容易獲得回報,因此,工作負載并不需要分配相同數量的資源。這是在轉換服務器和優(yōu)化公有云使用時的關鍵所在,因為提供者不斷提供新硬件上運行的更新的云實例類型。為了避免大量占用資金,你需要能夠進行比較,唯一的辦法就是通過數據的標準化。
錯誤3:著眼于調整規(guī)模,并忽視現代化的工作量
將工作負載實現現代化,在更新的性能更強大的硬件上運行版本更新的云實例產品,可以成為降低成本的有效手段。事實上,人們已經發(fā)現,適當規(guī)模的實例可以在公有云計算中節(jié)省20%的成本,而現代化和適當的調整則平均節(jié)省了41%的成本。
隨著公有云供應商提供的服務和實例類型多的令人眼花繚亂,企業(yè)很難選擇適合的實例,更不用說跟上新的選擇。盡管潛在的節(jié)省成本值得努力。要做到這一點,需要詳細了解工作負載,云實例目錄,成本以及規(guī)范化數據的能力,以解決環(huán)境之間的性能差異。這不是人工可以完成的,需要進行徹底的分析才能找到正確的組合來節(jié)省資金并確保業(yè)績。這也是應該定期完成的事情,甚至幾個月前部署的應用程序可能就是很好的候選者。
錯誤4:陷入“Bump-up循環(huán)”
“Bump-up循環(huán)”是一個惡性的循環(huán),會導致過度配置和超支。假設工作負載正在運行,其CPU使用率是100%。采用一個簡單的工具將會看到這一點,認為它的配置不足,并且建議調高CPU資源(以及云實例的成本)。這里的問題是某些工作負載將使用與它們相同的資源。如果提供更多的CPU,這些應用程序將采用它,仍然運行在100%,也許只是更短的時間。這個循環(huán)重復執(zhí)行,被困在代價昂貴的Bump-up循環(huán)中。
為了避免這種資源吸引循環(huán),您需要準確了解工作負載的工作情況以及其工作原理。再次,我們回到需要了解各個工作負載模式和工作負載的性質。當查看內存時,這是特別重要的,這是云計算成本的主要驅動力。
錯誤5:無法管理空閑的僵尸實例
大多數組織沒有一個有效的過程來識別空閑的“僵尸”實例,導致他們隨著時間的推移而堆積。它們通常是由于倉促地為短期部署實例而忘記關閉實例的結果。僵尸實例只是浪費預算。為了避免這種不必要的成本,組織必須使用足夠的歷史來查看整個業(yè)務周期(數周或數月)的工作量模式。識別和消除這種實例可以節(jié)省成本,但它需要比大多數工具提供更長期的工作量可見性。
大多數組織沒有意識到他們在公有云中花費的費用是多少。節(jié)省這筆資金需要更加注意了解企業(yè)工作負載如何利用資源以及他們真正需要在不影響性能的前提下盡可能高效地工作。要明白細節(jié)是避免云預算超支的唯一途徑。