盡管虛擬化有助于提高IT靈活性,但其也可能導(dǎo)致計算資源的浪費,而且如果管理不善,甚至?xí)斐尚阅艿钠款i問題。在本文中,來自SearchServerVirtualization.com網(wǎng)站的這方面的專家們將與我們廣大讀者諸君共同探索企業(yè)組織機構(gòu)如何進行虛擬環(huán)境容量規(guī)劃的問題。進而幫助您了解在何處整合資源以及如何在您企業(yè)的基礎(chǔ)架構(gòu)中利用災(zāi)難恢復(fù)。此外,本文還將為廣大讀者們介紹當涉及到企業(yè)的容量規(guī)劃時所犯的常見的錯誤及被忽視的問題。并幫助您找出在您企業(yè)的虛擬環(huán)境中解決容量規(guī)劃問題的最好的辦法。
虛擬環(huán)境中的容量規(guī)劃
無論您企業(yè)的服務(wù)器虛擬化項目是剛剛開始抑或是幾近結(jié)束,容量規(guī)劃都是一個相當惱人的問題。在這篇文章中,我將與廣大讀者朋友們一起來看看什么容量規(guī)劃;其中需要被捕獲的關(guān)鍵變量是什么;以及如何通過人工手動的計劃來滿足您企業(yè)未來的需求。
什么是容量規(guī)劃?
首先,什么是在虛擬環(huán)境中的容量規(guī)劃?其與貴公司到底需要多少存儲、以及這些存儲將如何部署其實幾乎沒有半毛錢關(guān)系。在虛擬環(huán)境中,我們正在考慮的是您企業(yè)目前的應(yīng)用程序究竟需要多少計算處理能力;而您企業(yè)當前可獲得的計算處理能力又有多少;以及如何在虛擬環(huán)境中分配該負載。此外,還需要考慮為工作負載的額外的計算需求分配“空間”,其可能需要通過貴公司的虛擬化軟件在物理主機之間遷移虛擬機(VM)的能力來重新分配。容量規(guī)劃并不是一個一次性完成后就可以一勞永逸的事件,而是一個持續(xù)的過程。這是一個可以通過人工手動完成的工作,但其不是一個精確的科學(xué),很大程度上依賴于IT工作人員的直覺。而自動化解決方案通過收取一定的費用,嘗試使容量規(guī)劃變得更科學(xué)。
即使您企業(yè)打算使用一款自動化的工具,了解您需要對哪些要素進行分析也是相當重要的,這樣您才能夠確保其能夠為您提供您所需要的精確的視圖。在今天的市場上,許多工具都試圖通過將這些功能添加到他們目前的產(chǎn)品上,來搶占一定的容量規(guī)劃市場。一般而言,這只是帶來了對于該款工具最初是設(shè)計用來分析相關(guān)領(lǐng)域的分析。例如,一款增加了容量規(guī)劃功能的存儲工具,可能只報告虛擬機存儲資源的分配情況,而不會涉及到容量規(guī)劃的其他重要方面。
在大多數(shù)情況下,對于容量規(guī)劃并沒有優(yōu)先級順序,因為整個環(huán)境是作為一個整體而存在的,而各個組件成分都是互相影響的。對于基礎(chǔ)設(shè)施的一個整體視圖是必需的,而每一個感興趣的領(lǐng)域則必須被視為一個整體。如下所介紹的人工手動規(guī)劃過程側(cè)重于簡單而快速的完成工作。如前所述,這在很大程度上依靠的IT人員的直覺本能,通常是非常準確的。
庫存
企業(yè)進行容量規(guī)劃的第一步是庫存盤點。在這一步,您將收集關(guān)于您企業(yè)當前都擁有哪些物理硬件、以及在其之上都運行了哪些應(yīng)用程序的相關(guān)信息。在應(yīng)用程序方面,您需要記錄應(yīng)用程序;處理器的平均利用率如何;而且如果可能的話,還有必要記錄峰值時期的利用率;以及達到峰值負載的頻率和時間。但不要僅僅只是衡量利用率。此外,請務(wù)必衡量其作為CPU容量的百分比。
例如,如果您企業(yè)有一款應(yīng)用程序,使用了一款3千兆赫處理器的10%的處理能力,那么其真的是只使用了300兆赫。同時還需要確保搞清楚32位或64位處理器的庫存比例。您企業(yè)要盡可能準確地捕獲的應(yīng)該是對應(yīng)用程序的工作負載的測量(涉及到應(yīng)用程序相關(guān)的利用率),而不是處理器的容量的測量。
根據(jù)您企業(yè)的操作系統(tǒng)和可用的資源,您可能需要定期檢查相關(guān)峰值負載的發(fā)生時間。此外,請注意需要多少內(nèi)存;及被應(yīng)用程序所使用的內(nèi)存有多少;開發(fā)一款存儲和網(wǎng)絡(luò)I / O帶寬需要多少內(nèi)存?,F(xiàn)有的工具可能會限制這種測量的精確性。有時,相當模糊的測量都是可以接受的。再次強調(diào),盡管這不是一個完美的科學(xué),但這肯定是一個好的開始。
庫存盤點過程的下一步是通過分析您企業(yè)的服務(wù)器來考察您企業(yè)當前可用的物理計算資源。一個捷徑是:只盤點那些您會考慮將其作為您的虛擬基礎(chǔ)設(shè)施的一部分的服務(wù)器。肯定存在的一定風(fēng)險是您可能會因此而錯過大量未充分利用的服務(wù)器,故而您將需要在項目完成時間和不浪費任何資源之間作出決定。這是一個持續(xù)的過程;而讓最初的工作得以完成的一個可接受的目標可能是先對明顯的服務(wù)器進行庫存盤點,然后隨著時間的推移來擴大庫存盤點的范圍。與應(yīng)用程序的庫存盤點所不同的是,計算資源的庫存盤點需要您企業(yè)捕獲原始容量,其涉及處理器的數(shù)量、內(nèi)核的數(shù)量、處理器的速度和可用的物理內(nèi)存。此外,還需要捕獲服務(wù)器的I/O 性能、網(wǎng)絡(luò)接口卡的數(shù)量和存儲接口卡的數(shù)量(如果有的話)。
如何以及在何處進行整合
正如我們在上文中所已經(jīng)討論的那樣,您企業(yè)的服務(wù)器虛擬化過程的具體發(fā)生情況將部分的決定您的下一步操作,但分配的基本知識則是大致相同的。如果您企業(yè)還沒有部署虛擬化,您希望開始將應(yīng)用程序映射到可用的計算資源。大多數(shù)虛擬化進程是從少數(shù)新的物理服務(wù)器開始的,然后將舊的服務(wù)器添加或創(chuàng)建為虛擬機,并遷移工作負載。另外,大多數(shù)虛擬化項目將通過從低重要性、低負載的應(yīng)用程序虛擬化開始,這些具有最小的I/O需求。因此,這些最初的虛擬化部署進展得出奇的好。
隨著虛擬化基礎(chǔ)設(shè)施的日趨成熟,以及更多的服務(wù)器添加到虛擬化環(huán)境中,企業(yè)組織具有準確的庫存清單將允許一些企業(yè)組織得以進一步該部署過程。捕獲庫存是第一步,但每項工作負載的附加數(shù)據(jù)也必須被捕獲。其是否是您企業(yè)想要將其遷移到虛擬服務(wù)器的應(yīng)用程序?如果是這樣的話,您應(yīng)該分配主要的遷移目標,然后進行分配,至少在邏輯上,轉(zhuǎn)移工作負載將消耗資源需求。您企業(yè)肯定不想遇到諸如一款應(yīng)用程序工作負載的遷移是由于物理服務(wù)器出現(xiàn)故障將造成遷移目標的失敗,并因此無法使用資源這樣的情況。
雖然這種分配確實減少了整合的一些好處,但其并不會將項目推到使得服務(wù)器整合所帶來的成本節(jié)省被消除的地步。服務(wù)器的利用率是如此的不充分,導(dǎo)致占兩倍的計算配置通常仍然未達到可用的資源量。
虛擬化環(huán)境中容量規(guī)劃的常見問題
對于任何企業(yè)組織的數(shù)據(jù)中心而言,容量規(guī)劃都是一項相當重要的實踐。其數(shù)據(jù)中心管理人員必須隨著時間的推移,基于對趨勢的監(jiān)控分析,并結(jié)合對企業(yè)業(yè)務(wù)目標的明確了解,來預(yù)測未來的計算負荷。
實際上,容量規(guī)劃允許企業(yè)組織得以能夠圖表化其數(shù)據(jù)中心的規(guī)劃。這使得他們能做出符合成本效益的采購方案,以跨預(yù)期的用戶群滿足業(yè)務(wù)應(yīng)用程序的需求。
容量規(guī)劃與一個虛擬環(huán)境的設(shè)置同樣重要。雖然虛擬化為企業(yè)數(shù)據(jù)中心帶來了靈活性,但其也可能造成計算資源的浪費,而且如果管理不善,甚至?xí)斐尚阅艿钠款i問題。因此,虛擬化的部署近一步增加了對于深入研究容量規(guī)劃的需要。以下,是企業(yè)在進行容量規(guī)劃時涉及虛擬化技術(shù)的一些常見的問題及答案:
虛擬化如何影響容量規(guī)劃?
虛擬化并不會改變?nèi)萘恳?guī)劃的基本目標或益處。但虛擬化的主要目標是為樂提高計算資源的利用率,因此,在虛擬化數(shù)據(jù)中心實施容量規(guī)劃的需要實際上更為敏感——這是活躍在虛擬化領(lǐng)域的IT專業(yè)人士們的一個情緒的共鳴。
虛擬化也帶來了額外的規(guī)劃考慮:如服務(wù)器負載均衡和故障轉(zhuǎn)移,以確保虛擬機以能夠使得服務(wù)器的計算資源得到最有效的利用的一種方式進行分配。這也保證了足夠的計算能力仍然可以接受來自其他主機服務(wù)器遷移到虛擬機需要。
在虛擬環(huán)境中的容量規(guī)劃最大的錯誤或被忽視的問題是什么?
虛擬化的最大錯誤之一便是將盡可能多的虛擬機打包到每臺主機服務(wù)器,作為其計算資源。這在技術(shù)上是可行的,但通常并不被鼓勵,因為遷移或故障轉(zhuǎn)移虛擬機到一臺已是滿負荷的主機服務(wù)器是不可能的。大多數(shù)IT專業(yè)人士并非試圖從每臺服務(wù)器均獲得100%的利用率,而是挖掘出大約50%?80%的利用率,并留下剩余的容量用于虛擬機的故障轉(zhuǎn)移。
虛擬化蔓延是虛擬機的數(shù)量增長失控,直到他們對重要的計算資源造成妨礙,這是一個常常被忽略的問題,直到額外的計算資源成為負擔(dān)。新的虛擬機經(jīng)常被推出,以滿足重要的業(yè)務(wù)需求,但非關(guān)鍵性的虛擬機的增長必須在數(shù)據(jù)中心得到禁止,特別是對于生產(chǎn)服務(wù)器。虛擬機生命周期管理的實踐方案有助于通過建立業(yè)務(wù)流程和規(guī)范虛擬機創(chuàng)建政策來減輕虛擬化的蔓延,并最終從數(shù)據(jù)中心服務(wù)器消除虛擬機。
我認為虛擬機依賴于諸如像CPU、內(nèi)存和I/O,那么為什么在虛擬數(shù)據(jù)中心的存儲能力如此重要呢?
虛擬機肯定是受一臺服務(wù)器底層的計算資源影響的。CPU周期,內(nèi)存空間和I / O容量將分別影響到被托管到特定物理機的虛擬機的數(shù)量,并會間接影響這些虛擬機的性能和穩(wěn)定性。
例如,在一臺服務(wù)器上的所有虛擬機的CPU、內(nèi)存和I/O需求的總和不應(yīng)該超過服務(wù)器的總CPU、內(nèi)存和I /O容量。如果一個或多個計算資源短缺,虛擬機可能會出現(xiàn)性能不佳或其穩(wěn)定性可能會受到影響。
但是,虛擬機需要數(shù)據(jù)保護。他們通常使用常規(guī)快照,捕捉虛擬機的準確狀態(tài),并將這臺機器的狀態(tài)保存到存儲來進行保護。被捕獲到存儲虛擬機也可以根據(jù)需求復(fù)制或重新啟動到其他服務(wù)器——甚至復(fù)制到場外異地存儲以便進行災(zāi)難恢復(fù)保護。SAN幾乎都是用于最佳的性能表現(xiàn),但卻是使用虛擬機生命周期管理等戰(zhàn)術(shù),以防止虛擬化蔓延,并配置盡可能小的虛擬機,以提高應(yīng)用程序的性能。
這意味著數(shù)據(jù)中心虛擬機的存儲需求必須與CPU、內(nèi)存和I/O需求保持一致。作為最低要求,應(yīng)該有足夠的存儲空間來保存每臺虛擬機的快照,而如果快照被異地復(fù)制,存儲空間需要增加一倍。存儲需求也將隨著時間的推移而增加,因為更多或更大的虛擬機添加到企業(yè),所以監(jiān)視和規(guī)劃存儲的增長是非常重要的,而不僅僅只是關(guān)注服務(wù)器的增長。
虛擬容量規(guī)劃的最佳方法是什么?您對于在一個虛擬的環(huán)境中應(yīng)采用的工具或技術(shù)有什么建議?
在一個虛擬環(huán)境中進行容量規(guī)劃的最佳方法是采取一個全面的觀點,結(jié)合了隨著時間的推移,對于資源利用率的技術(shù)評估,并了解企業(yè)業(yè)務(wù)需求和目標。測量資源的使用是一個相對簡單的問題。例如, Windows操作系統(tǒng)提供的數(shù)據(jù)收集工具,可以跟蹤不同的計算資源和性能標準。
微軟公司還提供了專門的容量規(guī)劃工具,如System Center Capacity Planner 2007。同樣,也有一些第三方的工具可用于容量規(guī)劃,包括來自Uptime Software公司的容量規(guī)劃和管理軟件、以及來自Tevron公司的TeamQuest性能軟件和CitraTest VU。
但良好的容量規(guī)劃不僅僅只是對于趨勢的觀察。這些趨勢必須在企業(yè)正式采取行動前,充分融入到企業(yè)業(yè)務(wù)目標或計劃的確立過程中去。
例如,假設(shè)新的應(yīng)用程序?qū)⒃谖磥?0天內(nèi)添加10臺新的虛擬機到數(shù)據(jù)中心。通過提前測量每臺新的虛擬機的資源需求,兼顧考慮每一臺新的虛擬機對于企業(yè)業(yè)務(wù)的相對重要性,分配新的虛擬機到有足夠計算資源的服務(wù)器是可能的。更為關(guān)鍵的虛擬機可以放置在虛擬集群或其他高可用性的服務(wù)器,較少使用的虛擬機可以被重新分配到其他服務(wù)器,并根據(jù)需求采購新的服務(wù)器,確保足夠的計算能力。
關(guān)于作者
George Crump是Storage Switzerland公司的總裁。Storage Switzerland公司是一家專注于存儲和虛擬化領(lǐng)域的IT分析公司。憑借其超過25年的跨全美國數(shù)據(jù)中心存儲解決方案的設(shè)計經(jīng)驗, George見證了諸如RAID、NAS和SAN等技術(shù)的誕生。在創(chuàng)建Storage Switzerland公司之前,George曾擔(dān)任全美國最大的存儲集成商之一的首席技術(shù)官,主要負責(zé)技術(shù)測試、集成和產(chǎn)品的選擇。
Stephen J. Bigelow是TechTarget Inc.公司數(shù)據(jù)中心和虛擬化媒體集團的高級技術(shù)編輯,擁有超過20年的PC/技術(shù)行業(yè)的技術(shù)寫作經(jīng)驗。他擁有電氣工程學(xué)士學(xué)位,以及CompTIA A+、Network+、Security+、Server+認證,并曾就電腦故障排除領(lǐng)域撰寫過數(shù)百篇文章和15本專業(yè)書籍。其中包括《Bigelow’s PC Hardware Desk Reference》和《Bigelow’s PC Hardware Annoyances》。您可以在推特和LinkedIn上關(guān)注他(@Stephen_Bigelow)。