PowerVM虛擬化中LPAR的動態(tài)遷移

責任編輯:editor006

2014-08-08 16:54:50

摘自:it168網(wǎng)站

在IT技術(shù)快速發(fā)展的今天,虛擬化技術(shù)日趨成熟,由于其在資金節(jié)省和IT效率提高上的優(yōu)勢日益明顯,越來越多的企業(yè)也開始部署虛擬化平臺。鑒于IBM Power平臺杰出的穩(wěn)定性和運算性能

在IT技術(shù)快速發(fā)展的今天,虛擬化技術(shù)日趨成熟,由于其在資金節(jié)省和IT效率提高上的優(yōu)勢日益明顯,越來越多的企業(yè)也開始部署虛擬化平臺。鑒于IBM Power平臺杰出的穩(wěn)定性和運算性能,所以越來越多的重要應用已經(jīng)遷移到Power平臺上運行,為用戶提供可靠的服務。為了提高業(yè)務的連續(xù)性,防止由于物理Power停機維護,硬件更換帶來的停機窗口,本文將針對IBM PowerVM環(huán)境中的Lpar進行動態(tài)遷移進行講解,實現(xiàn)服務的連續(xù)性和避免停機窗口對業(yè)務的影響。本文介紹如何配置動態(tài)分區(qū)遷移(LPM)并對其進行故障診斷。還簡要解釋了一些 LPM 基礎(chǔ)概念。主要有以下幾個主要內(nèi)容。

·簡介

· LPM的規(guī)劃

· LPM環(huán)境的部署

· LPM的配置

· LPM的測試

一、簡介

1、背景介紹

由于虛擬化在資金節(jié)省和IT效率提高上的優(yōu)勢日益明顯,越來越多的企業(yè)也開始部署虛擬化平臺,并將大部分業(yè)務遷移到虛擬化的平臺。通過虛擬化技術(shù)提供的各種高級特性,如動態(tài)遷移、快速部署、資源動態(tài)遷移等功能保證業(yè)務的連續(xù)性和穩(wěn)定性。針對這樣的發(fā)展趨勢,項目采用IBM領(lǐng)先的虛擬化技術(shù)PowerVM實現(xiàn)服務器虛擬化,并運用最新的PowerVM特性之一--Live Partition Mobility,在機器硬件需要升級和維護的時候,來實現(xiàn)業(yè)務的連續(xù)性運行,保持較高的SLA (Service Level Agreement)。

2、LPM介紹

LPM是 IBM 基于 POWER6 技術(shù)提供的新特性,它特指將運行 AIX 或 Linux 操作系統(tǒng)的邏輯分區(qū)從一臺物理系統(tǒng)遷移到另外一臺完全不同的物理系統(tǒng)的過程。在這個過程中,操作系統(tǒng)和應用程序不受任何破壞,對外提供的服務也不受任何影響。

動態(tài)分區(qū)遷移(Live Partition Mobility,以下簡稱 LPM)給予管理員更加靈活的控制職能,當邏輯分區(qū)所在的系統(tǒng)需要進行硬件升級或者維護的時候,又不想因為維護而將服務停止,就可以利用LPM功能將它先遷移到另一臺物理系統(tǒng)上,待升級或維護完成后,再將邏輯分區(qū)遷移回來。隨著業(yè)務的發(fā)展,邏輯分區(qū)上的工作量可能會越來越大,這時可以利用 LPM功能將邏輯分區(qū)遷移到資源更多的物理系統(tǒng)上,以提供更優(yōu)質(zhì)的服務,達到一個負載均衡的目的。

3、LPM的術(shù)語和原理

要應用和配置LPM特性就必須先了解一下LPM中所涉及的常用術(shù)語和遷移原理。


▲圖1-1 LPM 工作原理

理解LPM的工作原理對于成功的規(guī)劃和部署Lpar遷移至關(guān)重要。其工作原理如圖1-1所示:

1、分區(qū)配置文件(此時處于活動狀態(tài))從源復制到目標 FSP。

2、配置目標上的存儲器。

3、移動程序服務分區(qū)(Mover Service Partition,MSP)被激活。

4、分區(qū)遷移開始。

A 大部分內(nèi)存頁面被移動。

B .所有線程轉(zhuǎn)為閑置狀態(tài)。

5、激活過程在目標上恢復。

A 最后的內(nèi)存頁面被移動。

B 清理存儲器和網(wǎng)絡(luò)流量。

6、取消源上的存儲器資源配置。

7、從源 FSP(Flexible Service Processor)移除分區(qū)配置文件。

完成上述步驟之后,原來的主機資源將被順利移動到目標主機繼續(xù)提供服務。

4、名詞解釋

活動分區(qū)(Mobile Partition):被遷移的邏輯分區(qū)。

源系統(tǒng)(Source System):活動分區(qū)原來所在的系統(tǒng)。

目標系統(tǒng)(Target System):活動分區(qū)將要被遷移到的系統(tǒng)。

VIOS(Virtual I/O Server):即虛擬 I/O 服務器。是一個安裝了特殊定制的 AIX 操作系統(tǒng)的邏輯分區(qū)。它可以將各種物理資源轉(zhuǎn)化為虛擬資源,從而使得各個邏輯分區(qū)通過 VIOS 來共享這些物理資源。

HMC(Hardware Management Console):即硬件管理平臺。用來管理一臺或多臺系統(tǒng)的平臺,它有自己獨立的硬件。用戶可以通過 HMC 的可視化界面或命令行對邏輯分區(qū)和系統(tǒng)等進行一系列的管理工作。

FSP(Flexible Service Processor):Power 服務器中用來管理主機硬件的板卡,系統(tǒng)插電后 FSP 即開始工作。該板上有插口用于將系統(tǒng)連接到 HMC 網(wǎng)絡(luò)??梢酝ㄟ^ ASMI(Advanced System Management Interface)控制 FSP 進而執(zhí)行電源重啟、查看系統(tǒng)信息等操作。

MSP(Mover Service Partition):即移動服務分區(qū)。VIOS 的一個系統(tǒng)設(shè)置,由它控制是否允許遷移邏輯分區(qū)的狀態(tài)。

RMC(Resource Monitor and Control):RMC 是一個分布式的框架和體系結(jié)構(gòu),它允許 HMC 和被管理的邏輯分區(qū)進行通訊

5、LPM的分類

標準的 LPM 過程是由驗證操作和遷移操作兩部分組成的。即:

驗證操作(Validation):驗證是進行 LPM 之前可選的一步操作,它可以幫助用戶檢查環(huán)境是否已經(jīng)準備就緒。驗證操作提供的錯誤信息和警告信息可以幫助用戶及時修正錯誤,以保證遷移過程的順利進行。

遷移操作(Migration):由 HMC 或 IVM 提供的功能。使用遷移操作,可以完成活動分區(qū)從源系統(tǒng)到目標系統(tǒng)的動態(tài)分區(qū)遷移。

LPM 按照邏輯分區(qū)的情況分為下面兩種類型的遷移:

非活動遷移(Inactive Migration):被遷移的邏輯分區(qū)是斷電的。在參考資料中稱為非活動遷移

活動遷移(Active Migration):被遷移的邏輯分區(qū)是不斷電的,且一直對外提供服務。在遷移過程中邏輯分區(qū)能繼續(xù)提供服務,不會影響用戶行為。在參考資源中稱為活動遷移

LPM 按照系統(tǒng)的管理方式分為下面兩種類型的遷移:

HMC 之間的動態(tài)分區(qū)遷移:邏輯分區(qū)使用 HMC 管理的 LPM。

IVM 之間的動態(tài)分區(qū)遷移:邏輯分區(qū)使用 IVM 管理的 LPM。

二、LPM的規(guī)劃

在文章所描述的架構(gòu)設(shè)計中,兩個Power主機分別規(guī)劃出兩個分區(qū),一個用于VIOS,一個用于數(shù)據(jù)庫安裝。兩個VIOS共享一個存儲區(qū)域,并將共享區(qū)域劃分給相關(guān)的Lpar使用。通過HMC操作實現(xiàn)Lpar的動態(tài)遷移。

所有硬件均采用IBM Power 740+服務器、V7000存儲設(shè)備和HMC。

1、硬件列表

  2、部署架構(gòu)圖

[page]

三、LPM環(huán)境的部署

1、LPM的先決條件

主要準備過程包括以下若干方面:

○ 源系統(tǒng)和目標系統(tǒng)的 FSP 的設(shè)置。具體包括:

(1)Power VM 企業(yè)版代碼已被激活

(2)邏輯內(nèi)存塊的大小相同

○ 管理源系統(tǒng)和目標系統(tǒng)的 HMC 或 IVM 滿足如下要求:

(1)HMC的硬件支持LPM功能

(2)HMC和IVM 的操作系統(tǒng)版本支持LPM功能

(3)遠程的HMC和IVM 之間已建立密鑰認證(如果主機位于不通的HMC或者IVM中)

○ 源系統(tǒng)和目標系統(tǒng)的設(shè)置。具體包括:

(1)源系統(tǒng)和目標系統(tǒng)使用Power 6或者更高版本的硬件

(2)源系統(tǒng)和目標系統(tǒng)的管理方式相同,即都使用HMC或都使用IVM進行管理

(3)源系統(tǒng)和目標系統(tǒng)的Firmware版本支持LPM功能

(4)目標系統(tǒng)上有足夠閑置的內(nèi)存和處理器用來支持LPM功能

○ 源VIOS和目標VIOS滿足如下要求:

(1)VIOS的版本支持 LPM 功能

(2)啟用 MSP 功能(冷遷移無此要求)

(3)時鐘同步(冷遷移無此要求)

○ 活動分區(qū)滿足如下要求:

(1)運行的操作系統(tǒng)支持LPM功能

(2)RMC連接已建立(冷遷移無此要求)

(3)關(guān)閉冗余錯誤路徑報告功能

(4)虛擬串行適配器(Virtual Serial Adapter)不得多于 2 個,即只能通過 HMC 或 IVM 取得對活動分區(qū)的虛擬終端連接

(5)不能使用大頁內(nèi)存(Huge Page)

(6)不能使用物理或?qū)俚?I/O 設(shè)備(冷遷移無此要求)

○ 外部存儲滿足如下條件:

(1)源系統(tǒng)和目標系統(tǒng)連接相同的 SAN 存儲

(2)將整塊的 SAN 存儲以虛擬磁盤的形式分配給活動分區(qū)

(3)SAN 邏輯單元的 reserve_policy 屬性置為 no_reserve

(4)目標系統(tǒng)上有足夠的虛擬插槽(Virtual Slot)

○ 網(wǎng)絡(luò)配置滿足 :

(1)源 VIOS 和目標 VIOS 配置共享以太網(wǎng)適配器

(2)活動分區(qū)使用虛擬網(wǎng)卡

2、劃分Lpar

所有的服務都是通過Lpar的方式提供。這樣可以充分利用Power VM虛擬化的優(yōu)勢和特有功能來按需分配和提供所需的性能和計算能力。CPU和內(nèi)存方面不用過多的設(shè)置,按照0.8和8G的標準。通過HMC按照下表標準,創(chuàng)建一個Lpar。

Lpar的具體創(chuàng)建方法可以參考IBM 紅皮書(www.redbooks.ibm.com)。


▲表4:LPAR配置表

3、劃分存儲

由于LPM要求所有的盤必須從共享的存儲上供給才能實現(xiàn)遷移。所以本次試驗,將啟動盤和數(shù)據(jù)盤均放在共享存儲上。通過V7000提供的控制界面,劃分兩個LUN作為啟動盤和數(shù)據(jù)盤分別映射給兩個不同的VIO。


▲圖3-1 劃分共享存儲

四、LPM的配置

1、配置VIOS

通過VIOS發(fā)現(xiàn)之前劃分的存儲,可以通過oem_setup_env下的cfgmgr來發(fā)現(xiàn)。此命令分別在不同的VIOS上執(zhí)行。


▲圖4-1發(fā)現(xiàn)存儲

從上圖可以看出,hdisk5和hdisk6就是我們之前所劃分的兩塊存儲。其中hdisk5為啟動盤,hdisk6為數(shù)據(jù)盤。為了可以在多個VIOS中共享存儲,需要提前改變hdisk的屬性為reserve_policy=no_reserve。


▲圖4-2 變更磁盤屬性

為了實現(xiàn)遷移,我們需要將各個VIOS的 MSP(Mover Service Partition)功能啟用。當然如果是冷遷移的話,是可以不啟用的。


▲圖4-3 激活MSP功能

如果想讓Lpar識別到之前劃分的存儲,需要在VIO中做相關(guān)mapping。進入其中一個VIO服務器,進入到配置模式(oem_setup_env)。通過如下命令,將hdisk5和hdisk6分別映射到vhost0和vhost15,作為lpar的系統(tǒng)盤和數(shù)據(jù)盤。


▲圖4-4 映射磁盤

2、配置Lpar

選擇上述VIO所對應的lpar,添加兩個Client SCSI適配器如圖4-5所示。通過這兩個vscsi來連接VIO中剛分配的兩塊磁盤,分別作為啟動盤和數(shù)據(jù)盤使用。通過HMC勾選預添加的Lpar ,選擇manage profiles,點擊virtual adapters,添加client scsi31和51。


▲圖4-5 添加虛擬適配器

對于目標VIO只需要在Lpar和VIO中劃分相關(guān)的vSCSI,用于連接兩塊磁盤,此處添加為client scsi 43和63。至于mapping關(guān)系將由遷移動作完成。


▲圖4-6 添加虛擬適配器

部署操作系統(tǒng)和應用到VIO1的兩塊硬盤,詳細步驟可以參考IBM的官方文檔。(地址詳見參考資料)。

[page]

五、LPM的測試

1、驗證遷移過程

進行 LPM 之前,需要驗證源和目標兩端的資源可用性。如果驗證由于某種錯誤而失敗,則

需要修復錯誤才能繼續(xù)下一步,否則可能會影響后面的遷移過程。


▲圖5-1 驗證遷移

驗證屏幕(如圖 5-1 所示)顯示,依次執(zhí)行勾選Lpar,選擇Operations---Mobility---Validate以便從一個主機遷移到另一個物理主機 。

在如下的遷移窗口需要確認源主機和目標主機,如果是跨HMC的,需要額外指定HMC信息。


▲圖5-2 填寫目標主機

此時系統(tǒng)將進行遷移前的驗證工作,如果沒有錯誤發(fā)生,就可以執(zhí)行實際的遷移工作。

2、遷移

在HMC中選擇預遷移的lpar,依次選擇Operations---Mobility--Migrate,如下圖所示


▲圖5-3 執(zhí)行遷移

如無錯誤,將顯示5-4的遷移過程,此時需要做的就是默默的等待。在此過程中,業(yè)務連續(xù)性不會被破壞,不會終止用戶的訪問,如圖5-4所示。


▲圖5-4 Ping操作


▲圖5-5 遷移過程

六、總結(jié)

本文介紹了如何通過IBM Power VM中提供的高級功能LPM實現(xiàn)活動分區(qū)的動態(tài)遷移的方法和原理。

通過LPM的建立和實施,可以降低硬件維護成本,實現(xiàn)業(yè)務的無縫遷移。特別指出一點,LPM 并不是一個高可用性或災難恢復解決方案。其主要設(shè)計目標是在預定的維護活動期間保持應用程序狀態(tài)良好且正常運行。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號