如何使用AWS Spot實例將云計算成本降低90%

責(zé)任編輯:cres

作者:HERO編譯

2021-05-08 13:27:14

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

本文介紹了如何處理Spot實例并在云計算賬單上節(jié)省大量成本的6個技巧。

一些企業(yè)的IT團隊通常選擇保留容量,而不是利用現(xiàn)場實例。但是保留容量可能會被云計算供應(yīng)商鎖定,并支付更多費用。
 
如果只是因為AWS云平臺可以在兩分鐘內(nèi)運行實例,就會錯失按需價格折扣的機會(最多可以節(jié)省90%成本)是沒有意義的。即使對于生產(chǎn)工作負載,用戶也可以有效地使用Spot實例。
 
以下是如何處理Spot實例并在云計算賬單上節(jié)省大量成本的6個技巧:
 
#1:知道何時使用Spot實例
 
第一步是大致了解哪些服務(wù)可以從Spot實例中受益更多。
 
例如,如果用戶的服務(wù)是無狀態(tài)的并且可以擴展(具有多個副本),那么可以在這里使用Spot實例。如今,現(xiàn)代架構(gòu)中的大多數(shù)服務(wù)都是無狀態(tài)的。
 
以下是一些可以從Spot實例受益的工作負載示例:
 
•具有容錯性和實例靈活性的批處理作業(yè)。
•容器和微服務(wù)通常是獨立的、高度可用的、能夠處理中斷和容錯的。
•高性能計算(HPC)和機器學(xué)習(xí)應(yīng)用程序需要高性能的計算能力、大量的內(nèi)存、超快速的存儲和較高的網(wǎng)絡(luò)性能。Spot實例可以提供幫助,甚至可以作為它們的主要計算基礎(chǔ)設(shè)施。
•持續(xù)集成(CI)/ 持續(xù)交付(CD)操作,無論使用什么工具,Spot實例都可以在部署過程中提供幫助。
•分布式數(shù)據(jù)庫(例如Elasticsearch或MongoDB)能夠處理中斷,而不會丟失任何數(shù)據(jù)或影響服務(wù)。
•編排環(huán)境中的任何應(yīng)用程序。
 
#2:檢查工作負載是否已準(zhǔn)備就緒
 
在尋找Spot實例的潛在候選對象時,需要了解一些有關(guān)它的信息。
 
以下是一些可以更進一步研究的問題:
 
•需要多少時間才能完成工作?
•是否對任務(wù)和時間至關(guān)重要?
•可以處理中斷嗎?
•實例節(jié)點之間是否緊密耦合?
•AWS云服務(wù)中斷后,將使用哪些工具來轉(zhuǎn)移工作量?
 
回答了這些問題,用戶就會知道Spot實例是否適合自己的工作負載。
 
#3:選擇正確的Spot實例
 
了解一下AWS云平臺提供的服務(wù)??梢赃x擇一些不太主流的實例,這樣就會降低中斷的數(shù)量,并且可能會穩(wěn)定運行更長的時間。
 
在尋找最佳虛擬機類型以完成工作時,需要查看其中斷頻率。這是實例在過去一個月中回收容量的速率。
 
AWS在Spot實例顧問中將其顯示在以下范圍內(nèi):<5%,5%~10%,10%~15%,15%~20%,> 20%:
 
可以將Spot實例用于具有特定類型的競價型實例的生產(chǎn)工作負載。AWS為用戶提供了一個可以保證不中斷工作(最多6個小時)的信息(以小時為單位),而用戶只需要為此多支付一些費用。但是與按需定價相比,仍然可以獲得高達30%~50%的折扣。
 
#4:設(shè)定價格
 
知道要使用的Spot實例后,就可以設(shè)置愿意為它們支付的最高價格。這是一個很好的經(jīng)驗法則:將價格設(shè)置為與按需定價相匹配的最大值。
 
需要注意的是,用戶的Spot實例只有在其市場價格與其出價相匹配(或低于出價)時才會運行。如果用戶的自定義價格低于按需定價,并且Spot實例的價格上漲,那么用戶的Spot實例可能會面臨中斷的風(fēng)險。
 
#5:分組管理Spot實例
 
這是一個明智的舉動,因為它使用戶可以選擇同時請求多個實例類型,并增加了為工作負載獲取一個實例的機會(避免出現(xiàn)任何中斷)。
 
另一個好處是,用戶可以為整個實例隊列(而不是給定的現(xiàn)貨池)設(shè)置每小時的最高價格。競價池是一組具有相同類型、操作系統(tǒng)、可用性區(qū)域和網(wǎng)絡(luò)的實例。
 
在AWS云平臺中,這稱為AWS Spot Fleets。這一功能使用戶可以使用各種分配策略來管理大量的Spot實例。例如,只考慮最低價格或容量優(yōu)化的實例類型。
 
需要注意的是:為許多人工配置、設(shè)置和維護任務(wù)做好準(zhǔn)備。
 
#6:自動化Spot實例
 
用戶如何避免丟失現(xiàn)場實例造成的停機時間?一個最好的策略是實施自動化工具,該工具使用策略和自動擴展功能為用戶管理云計算基礎(chǔ)設(shè)施。
 
通過使用自動化的云計算成本優(yōu)化解決方案,用戶可以選擇在現(xiàn)場實例上運行多少工作負載,然后在發(fā)生中斷時自動返回到按需實例。
 
用戶的工作負載將始終有運行的地方。由于AWS可以重新平衡事件,即使在用戶收到兩分鐘的中斷通知之前,也有可能降低風(fēng)險。
 
為了獲得最佳結(jié)果,需要采用一個基于預(yù)測分析(如CAST AI)的自動化操作的解決方案。
 
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號