PowerVM虛擬化中LPAR的動(dòng)態(tài)遷移

責(zé)任編輯:editor006

2014-11-11 17:16:48

摘自:論壇

在IT技術(shù)快速發(fā)展的今天,虛擬化技術(shù)日趨成熟,由于其在資金節(jié)省和IT效率提高上的優(yōu)勢(shì)日益明顯,越來越多的企業(yè)也開始部署虛擬化平臺(tái)。

在IT技術(shù)快速發(fā)展的今天,虛擬化技術(shù)日趨成熟,由于其在資金節(jié)省和IT效率提高上的優(yōu)勢(shì)日益明顯,越來越多的企業(yè)也開始部署虛擬化平臺(tái)。鑒于IBM Power平臺(tái)杰出的穩(wěn)定性和運(yùn)算性能,所以越來越多的重要應(yīng)用已經(jīng)遷移到Power平臺(tái)上運(yùn)行,為用戶提供可靠的服務(wù)。為了提高業(yè)務(wù)的連續(xù)性,防止由于物理Power停機(jī)維護(hù),硬件更換帶來的停機(jī)窗口,本文將針對(duì)IBM PowerVM環(huán)境中的Lpar進(jìn)行動(dòng)態(tài)遷移進(jìn)行講解,實(shí)現(xiàn)服務(wù)的連續(xù)性和避免停機(jī)窗口對(duì)業(yè)務(wù)的影響。本文介紹如何配置動(dòng)態(tài)分區(qū)遷移(LPM)并對(duì)其進(jìn)行故障診斷。還簡要解釋了一些 LPM 基礎(chǔ)概念。主要有以下幾個(gè)主要內(nèi)容。

·簡介

· LPM的規(guī)劃

· LPM環(huán)境的部署

· LPM的配置

· LPM的測(cè)試

一、簡介

1、背景介紹

由于虛擬化在資金節(jié)省和IT效率提高上的優(yōu)勢(shì)日益明顯,越來越多的企業(yè)也開始部署虛擬化平臺(tái),并將大部分業(yè)務(wù)遷移到虛擬化的平臺(tái)。通過虛擬化技術(shù)提供的各種高級(jí)特性,如動(dòng)態(tài)遷移、快速部署、資源動(dòng)態(tài)遷移等功能保證業(yè)務(wù)的連續(xù)性和穩(wěn)定性。針對(duì)這樣的發(fā)展趨勢(shì),項(xiàng)目采用IBM領(lǐng)先的虛擬化技術(shù)PowerVM實(shí)現(xiàn)服務(wù)器虛擬化,并運(yùn)用最新的PowerVM特性之一--Live Partition Mobility,在機(jī)器硬件需要升級(jí)和維護(hù)的時(shí)候,來實(shí)現(xiàn)業(yè)務(wù)的連續(xù)性運(yùn)行,保持較高的SLA (Service Level Agreement)。

2、LPM介紹

LPM是 IBM 基于 POWER6 技術(shù)提供的新特性,它特指將運(yùn)行 AIX 或 Linux 操作系統(tǒng)的邏輯分區(qū)從一臺(tái)物理系統(tǒng)遷移到另外一臺(tái)完全不同的物理系統(tǒng)的過程。在這個(gè)過程中,操作系統(tǒng)和應(yīng)用程序不受任何破壞,對(duì)外提供的服務(wù)也不受任何影響。

動(dòng)態(tài)分區(qū)遷移(Live Partition Mobility,以下簡稱 LPM)給予管理員更加靈活的控制職能,當(dāng)邏輯分區(qū)所在的系統(tǒng)需要進(jìn)行硬件升級(jí)或者維護(hù)的時(shí)候,又不想因?yàn)榫S護(hù)而將服務(wù)停止,就可以利用LPM功能將它先遷移到另一臺(tái)物理系統(tǒng)上,待升級(jí)或維護(hù)完成后,再將邏輯分區(qū)遷移回來。隨著業(yè)務(wù)的發(fā)展,邏輯分區(qū)上的工作量可能會(huì)越來越大,這時(shí)可以利用 LPM功能將邏輯分區(qū)遷移到資源更多的物理系統(tǒng)上,以提供更優(yōu)質(zhì)的服務(wù),達(dá)到一個(gè)負(fù)載均衡的目的。

3、LPM的術(shù)語和原理

要應(yīng)用和配置LPM特性就必須先了解一下LPM中所涉及的常用術(shù)語和遷移原理。

  ▲圖1-1 LPM 工作原理

理解LPM的工作原理對(duì)于成功的規(guī)劃和部署Lpar遷移至關(guān)重要。其工作原理如圖1-1所示:

1、分區(qū)配置文件(此時(shí)處于活動(dòng)狀態(tài))從源復(fù)制到目標(biāo) FSP。

2、配置目標(biāo)上的存儲(chǔ)器。

3、移動(dòng)程序服務(wù)分區(qū)(Mover Service Partition,MSP)被激活。

4、分區(qū)遷移開始。

A 大部分內(nèi)存頁面被移動(dòng)。

B .所有線程轉(zhuǎn)為閑置狀態(tài)。

5、激活過程在目標(biāo)上恢復(fù)。

A 最后的內(nèi)存頁面被移動(dòng)。

B 清理存儲(chǔ)器和網(wǎng)絡(luò)流量。

6、取消源上的存儲(chǔ)器資源配置。

7、從源 FSP(Flexible Service Processor)移除分區(qū)配置文件。

完成上述步驟之后,原來的主機(jī)資源將被順利移動(dòng)到目標(biāo)主機(jī)繼續(xù)提供服務(wù)。

4、名詞解釋

活動(dòng)分區(qū)(Mobile Partition):被遷移的邏輯分區(qū)。

源系統(tǒng)(Source System):活動(dòng)分區(qū)原來所在的系統(tǒng)。

目標(biāo)系統(tǒng)(Target System):活動(dòng)分區(qū)將要被遷移到的系統(tǒng)。

VIOS(Virtual I/O Server):即虛擬 I/O 服務(wù)器。是一個(gè)安裝了特殊定制的 AIX 操作系統(tǒng)的邏輯分區(qū)。它可以將各種物理資源轉(zhuǎn)化為虛擬資源,從而使得各個(gè)邏輯分區(qū)通過 VIOS 來共享這些物理資源。

HMC(Hardware Management Console):即硬件管理平臺(tái)。用來管理一臺(tái)或多臺(tái)系統(tǒng)的平臺(tái),它有自己獨(dú)立的硬件。用戶可以通過 HMC 的可視化界面或命令行對(duì)邏輯分區(qū)和系統(tǒng)等進(jìn)行一系列的管理工作。

FSP(Flexible Service Processor):Power 服務(wù)器中用來管理主機(jī)硬件的板卡,系統(tǒng)插電后 FSP 即開始工作。該板上有插口用于將系統(tǒng)連接到 HMC 網(wǎng)絡(luò)??梢酝ㄟ^ ASMI(Advanced System Management Interface)控制 FSP 進(jìn)而執(zhí)行電源重啟、查看系統(tǒng)信息等操作。

MSP(Mover Service Partition):即移動(dòng)服務(wù)分區(qū)。VIOS 的一個(gè)系統(tǒng)設(shè)置,由它控制是否允許遷移邏輯分區(qū)的狀態(tài)。

RMC(Resource Monitor and Control):RMC 是一個(gè)分布式的框架和體系結(jié)構(gòu),它允許 HMC 和被管理的邏輯分區(qū)進(jìn)行通訊

5、LPM的分類

標(biāo)準(zhǔn)的 LPM 過程是由驗(yàn)證操作和遷移操作兩部分組成的。即:

驗(yàn)證操作(Validation):驗(yàn)證是進(jìn)行 LPM 之前可選的一步操作,它可以幫助用戶檢查環(huán)境是否已經(jīng)準(zhǔn)備就緒。驗(yàn)證操作提供的錯(cuò)誤信息和警告信息可以幫助用戶及時(shí)修正錯(cuò)誤,以保證遷移過程的順利進(jìn)行。

遷移操作(Migration):由 HMC 或 IVM 提供的功能。使用遷移操作,可以完成活動(dòng)分區(qū)從源系統(tǒng)到目標(biāo)系統(tǒng)的動(dòng)態(tài)分區(qū)遷移。

LPM 按照邏輯分區(qū)的情況分為下面兩種類型的遷移:

非活動(dòng)遷移(Inactive Migration):被遷移的邏輯分區(qū)是斷電的。在參考資料中稱為非活動(dòng)遷移

活動(dòng)遷移(Active Migration):被遷移的邏輯分區(qū)是不斷電的,且一直對(duì)外提供服務(wù)。在遷移過程中邏輯分區(qū)能繼續(xù)提供服務(wù),不會(huì)影響用戶行為。在參考資源中稱為活動(dòng)遷移

LPM 按照系統(tǒng)的管理方式分為下面兩種類型的遷移:

HMC 之間的動(dòng)態(tài)分區(qū)遷移:邏輯分區(qū)使用 HMC 管理的 LPM。

IVM 之間的動(dòng)態(tài)分區(qū)遷移:邏輯分區(qū)使用 IVM 管理的 LPM。

二、LPM的規(guī)劃

在文章所描述的架構(gòu)設(shè)計(jì)中,兩個(gè)Power主機(jī)分別規(guī)劃出兩個(gè)分區(qū),一個(gè)用于VIOS,一個(gè)用于數(shù)據(jù)庫安裝。兩個(gè)VIOS共享一個(gè)存儲(chǔ)區(qū)域,并將共享區(qū)域劃分給相關(guān)的Lpar使用。通過HMC操作實(shí)現(xiàn)Lpar的動(dòng)態(tài)遷移。

所有硬件均采用IBM Power 740+服務(wù)器、V7000存儲(chǔ)設(shè)備和HMC。

1、硬件列表

  2、部署架構(gòu)圖

三、LPM環(huán)境的部署

1、LPM的先決條件

主要準(zhǔn)備過程包括以下若干方面:

○ 源系統(tǒng)和目標(biāo)系統(tǒng)的 FSP 的設(shè)置。具體包括:

(1)Power VM 企業(yè)版代碼已被激活

(2)邏輯內(nèi)存塊的大小相同

○ 管理源系統(tǒng)和目標(biāo)系統(tǒng)的 HMC 或 IVM 滿足如下要求:

(1)HMC的硬件支持LPM功能

(2)HMC和IVM 的操作系統(tǒng)版本支持LPM功能

(3)遠(yuǎn)程的HMC和IVM 之間已建立密鑰認(rèn)證(如果主機(jī)位于不通的HMC或者IVM中)

○ 源系統(tǒng)和目標(biāo)系統(tǒng)的設(shè)置。具體包括:

(1)源系統(tǒng)和目標(biāo)系統(tǒng)使用Power 6或者更高版本的硬件

(2)源系統(tǒng)和目標(biāo)系統(tǒng)的管理方式相同,即都使用HMC或都使用IVM進(jìn)行管理

(3)源系統(tǒng)和目標(biāo)系統(tǒng)的Firmware版本支持LPM功能

(4)目標(biāo)系統(tǒng)上有足夠閑置的內(nèi)存和處理器用來支持LPM功能

○ 源VIOS和目標(biāo)VIOS滿足如下要求:

(1)VIOS的版本支持 LPM 功能

(2)啟用 MSP 功能(冷遷移無此要求)

(3)時(shí)鐘同步(冷遷移無此要求)

○ 活動(dòng)分區(qū)滿足如下要求:

(1)運(yùn)行的操作系統(tǒng)支持LPM功能

(2)RMC連接已建立(冷遷移無此要求)

(3)關(guān)閉冗余錯(cuò)誤路徑報(bào)告功能

(4)虛擬串行適配器(Virtual Serial Adapter)不得多于 2 個(gè),即只能通過 HMC 或 IVM 取得對(duì)活動(dòng)分區(qū)的虛擬終端連接

(5)不能使用大頁內(nèi)存(Huge Page)

(6)不能使用物理或?qū)俚?I/O 設(shè)備(冷遷移無此要求)

○ 外部存儲(chǔ)滿足如下條件:

(1)源系統(tǒng)和目標(biāo)系統(tǒng)連接相同的 SAN 存儲(chǔ)

(2)將整塊的 SAN 存儲(chǔ)以虛擬磁盤的形式分配給活動(dòng)分區(qū)

(3)SAN 邏輯單元的 reserve_policy 屬性置為 no_reserve

(4)目標(biāo)系統(tǒng)上有足夠的虛擬插槽(Virtual Slot)

○ 網(wǎng)絡(luò)配置滿足 :

(1)源 VIOS 和目標(biāo) VIOS 配置共享以太網(wǎng)適配器

(2)活動(dòng)分區(qū)使用虛擬網(wǎng)卡

2、劃分Lpar

所有的服務(wù)都是通過Lpar的方式提供。這樣可以充分利用Power VM虛擬化的優(yōu)勢(shì)和特有功能來按需分配和提供所需的性能和計(jì)算能力。CPU和內(nèi)存方面不用過多的設(shè)置,按照0.8和8G的標(biāo)準(zhǔn)。通過HMC按照下表標(biāo)準(zhǔn),創(chuàng)建一個(gè)Lpar。

Lpar的具體創(chuàng)建方法可以參考IBM 紅皮書(www.redbooks.ibm.com)。

  ▲表4:LPAR配置表

3、劃分存儲(chǔ)

由于LPM要求所有的盤必須從共享的存儲(chǔ)上供給才能實(shí)現(xiàn)遷移。所以本次試驗(yàn),將啟動(dòng)盤和數(shù)據(jù)盤均放在共享存儲(chǔ)上。通過V7000提供的控制界面,劃分兩個(gè)LUN作為啟動(dòng)盤和數(shù)據(jù)盤分別映射給兩個(gè)不同的VIO。

  ▲圖3-1 劃分共享存儲(chǔ)

四、LPM的配置

1、配置VIOS

通過VIOS發(fā)現(xiàn)之前劃分的存儲(chǔ),可以通過oem_setup_env下的cfgmgr來發(fā)現(xiàn)。此命令分別在不同的VIOS上執(zhí)行。

  ▲圖4-1發(fā)現(xiàn)存儲(chǔ)

從上圖可以看出,hdisk5和hdisk6就是我們之前所劃分的兩塊存儲(chǔ)。其中hdisk5為啟動(dòng)盤,hdisk6為數(shù)據(jù)盤。為了可以在多個(gè)VIOS中共享存儲(chǔ),需要提前改變hdisk的屬性為reserve_policy=no_reserve。

  ▲圖4-2 變更磁盤屬性

為了實(shí)現(xiàn)遷移,我們需要將各個(gè)VIOS的 MSP(Mover Service Partition)功能啟用。當(dāng)然如果是冷遷移的話,是可以不啟用的。

  ▲圖4-3 激活MSP功能

如果想讓Lpar識(shí)別到之前劃分的存儲(chǔ),需要在VIO中做相關(guān)mapping。進(jìn)入其中一個(gè)VIO服務(wù)器,進(jìn)入到配置模式(oem_setup_env)。通過如下命令,將hdisk5和hdisk6分別映射到vhost0和vhost15,作為lpar的系統(tǒng)盤和數(shù)據(jù)盤。

  ▲圖4-4 映射磁盤

2、配置Lpar

選擇上述VIO所對(duì)應(yīng)的lpar,添加兩個(gè)Client SCSI適配器如圖4-5所示。通過這兩個(gè)vscsi來連接VIO中剛分配的兩塊磁盤,分別作為啟動(dòng)盤和數(shù)據(jù)盤使用。通過HMC勾選預(yù)添加的Lpar ,選擇manage profiles,點(diǎn)擊virtual adapters,添加client scsi31和51。

  ▲圖4-5 添加虛擬適配器

對(duì)于目標(biāo)VIO只需要在Lpar和VIO中劃分相關(guān)的vSCSI,用于連接兩塊磁盤,此處添加為client scsi 43和63。至于mapping關(guān)系將由遷移動(dòng)作完成。

  ▲圖4-6 添加虛擬適配器

部署操作系統(tǒng)和應(yīng)用到VIO1的兩塊硬盤,詳細(xì)步驟可以參考IBM的官方文檔。(地址詳見參考資料)。

五、LPM的測(cè)試

1、驗(yàn)證遷移過程

進(jìn)行 LPM 之前,需要驗(yàn)證源和目標(biāo)兩端的資源可用性。如果驗(yàn)證由于某種錯(cuò)誤而失敗,則

需要修復(fù)錯(cuò)誤才能繼續(xù)下一步,否則可能會(huì)影響后面的遷移過程。

  ▲圖5-1 驗(yàn)證遷移

驗(yàn)證屏幕(如圖 5-1 所示)顯示,依次執(zhí)行勾選Lpar,選擇Operations---Mobility---Validate以便從一個(gè)主機(jī)遷移到另一個(gè)物理主機(jī) 。

在如下的遷移窗口需要確認(rèn)源主機(jī)和目標(biāo)主機(jī),如果是跨HMC的,需要額外指定HMC信息。

  ▲圖5-2 填寫目標(biāo)主機(jī)

此時(shí)系統(tǒng)將進(jìn)行遷移前的驗(yàn)證工作,如果沒有錯(cuò)誤發(fā)生,就可以執(zhí)行實(shí)際的遷移工作。

2、遷移

在HMC中選擇預(yù)遷移的lpar,依次選擇Operations---Mobility--Migrate,如下圖所示

  ▲圖5-3 執(zhí)行遷移

如無錯(cuò)誤,將顯示5-4的遷移過程,此時(shí)需要做的就是默默的等待。在此過程中,業(yè)務(wù)連續(xù)性不會(huì)被破壞,不會(huì)終止用戶的訪問,如圖5-4所示。

  ▲圖5-4 Ping操作

  ▲圖5-5 遷移過程

六、總結(jié)

本文介紹了如何通過IBM Power VM中提供的高級(jí)功能LPM實(shí)現(xiàn)活動(dòng)分區(qū)的動(dòng)態(tài)遷移的方法和原理。

通過LPM的建立和實(shí)施,可以降低硬件維護(hù)成本,實(shí)現(xiàn)業(yè)務(wù)的無縫遷移。特別指出一點(diǎn),LPM 并不是一個(gè)高可用性或?yàn)?zāi)難恢復(fù)解決方案。其主要設(shè)計(jì)目標(biāo)是在預(yù)定的維護(hù)活動(dòng)期間保持應(yīng)用程序狀態(tài)良好且正常運(yùn)行。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)