對(duì)服務(wù)器產(chǎn)業(yè)而言,2010年是很有紀(jì)念意義的一年。在產(chǎn)品上,我們迎來了包括英特爾至強(qiáng)7500、IBM POWER7在內(nèi)的十多款重量級(jí)芯片及一系列服務(wù)器新產(chǎn)品的大發(fā)布;在應(yīng)用上,從虛擬化到云計(jì)算,從 Web2.0的大規(guī)模分布式處理到超算中心里的高性能異構(gòu)并行計(jì)算,我們看到了許多新的變化。那么,具體到x86服務(wù)器來說,這一年又給我們帶來了哪些啟示呢?特別是對(duì)于企業(yè)里的 CIO 和 IT 經(jīng)理們,有哪些技術(shù)變化和應(yīng)用特點(diǎn)需要關(guān)注呢?對(duì)此,筆者整理出了以下九點(diǎn),供大家參考。
1. 重新審視 x86服務(wù)器的作用
傳統(tǒng)上,x86服務(wù)器被定位于中低端服務(wù)器,因?yàn)樵谙蛏蠑U(kuò)展(Scale-up)、性能和 RAS 可靠性等方面明顯要比 RISC 小型機(jī)矮上一截。不過進(jìn)入 2010年以來,這種定位發(fā)生了一些變化,特別是上半年推出的英特爾至強(qiáng)7500處理器,通過 QPI 直連架構(gòu)、8核16線程設(shè)計(jì)、22條 RAS、最大32路 SMP 擴(kuò)展等特性,將 x86平臺(tái)推向了一個(gè)新的高度,并引發(fā)了服務(wù)器廠商的積極跟進(jìn),如富士通在推八路 PRIMEQUEST 1800E 時(shí)甚至打出“x86架構(gòu)小型機(jī)”的概念,浪潮與華為等國產(chǎn)廠商在開發(fā)基于這一平臺(tái)的高端容錯(cuò)計(jì)算機(jī),IBM 則依托其新一代企業(yè)級(jí)eX5架構(gòu)在內(nèi)存擴(kuò)展、I/O 虛擬化等方面的五大創(chuàng)新技術(shù)重新定義了 x86服務(wù)器的工業(yè)標(biāo)準(zhǔn)。
這些技術(shù)進(jìn)步使得今天的x86服務(wù)器在性能、可靠性、可擴(kuò)展性、可管理性等方面大幅提升,進(jìn)而可以承擔(dān)更多、更關(guān)鍵的業(yè)務(wù)負(fù)載,如服務(wù)器整合、虛擬化、大規(guī)模數(shù)據(jù)處理等,甚至吸引一部分傳統(tǒng)小型機(jī)用戶的應(yīng)用遷移。因此,對(duì)于用戶而言,特別是在那些大規(guī)模整合或核心關(guān)鍵應(yīng)用的場(chǎng)合,需要重新審視和考慮x86服務(wù)器的用途,進(jìn)行相應(yīng)的測(cè)試和部署。
2. 重視I/O瓶頸
盡管應(yīng)用負(fù)載會(huì)存在計(jì)算密集型、內(nèi)存密集型和 I/O 密集型等差異,但對(duì)于 CPU 芯片和通用服務(wù)器系統(tǒng)來說,這些應(yīng)用需求都需要照顧到。值得注意的是,在不同時(shí)期,隨著應(yīng)用需求的變化,要考慮的側(cè)重點(diǎn)會(huì)有所不同。
對(duì)x86服務(wù)器來說,今天 CPU 的發(fā)展速度遠(yuǎn)遠(yuǎn)超過了內(nèi)存、磁盤、網(wǎng)絡(luò)等 I/O 系統(tǒng),使得 I/O 瓶頸在實(shí)際應(yīng)用中越來越突出,特別是對(duì)于虛擬化、大規(guī)模數(shù)據(jù)庫等內(nèi)存密集型應(yīng)用而言,更是如此。我們知道,在一個(gè)向上擴(kuò)展的多核系統(tǒng)中,數(shù)據(jù)存取的層次是 CPU、緩存、內(nèi)存、硬盤,越往外層,I/O 越慢,因此,隨著 CPU 的核心數(shù)量越多,CPU 喂不飽的現(xiàn)象會(huì)更加嚴(yán)重,I/O 因此成為多核計(jì)算之路上最重要的因素。
這一點(diǎn)也得到了從芯片廠商到服務(wù)器廠商的一致認(rèn)同,如英特爾最新的至強(qiáng) 7500處理器通過引入 QPI 直連架構(gòu)、集成內(nèi)存控制器和大容量緩存,跟上一代產(chǎn)品相比,內(nèi)存帶寬提高了 9倍;甚至還發(fā)布了至強(qiáng) 6500這樣一款處理器來滿足那些需要“雙路服務(wù)器計(jì)算性能+四路服務(wù)器內(nèi)存容量”的用戶,比如一些內(nèi)存密集型的高性能計(jì)算應(yīng)用。在服務(wù)器廠商層面,IBM 在其新一代 eX5系統(tǒng)設(shè)計(jì)架構(gòu)中更是著重考慮 I/O 問題,如 MAX5 內(nèi)存擴(kuò)展技術(shù)可以提高 2倍內(nèi)存容量,eXFlash 固態(tài)存儲(chǔ)子系統(tǒng)大幅提高磁盤 I/O,同時(shí)將網(wǎng)絡(luò) I/O 虛擬化技術(shù)引入 x86系統(tǒng)。比如,IBM System x3690 X5就是一款采用eX5架構(gòu)設(shè)計(jì)的雙路機(jī)架服務(wù)器,支持英特爾至強(qiáng) 6500系列(Nehalem-EX)處理器。一臺(tái) x3690 X5機(jī)箱里可以支持32個(gè)內(nèi)存 DIMM,如果再配上 MAX5 內(nèi)存擴(kuò)展單元(上有 32個(gè)內(nèi)存 DIMM),即可以擴(kuò)展到 64個(gè) DIMM; 而如果通過 QPI 線纜將兩臺(tái) x3690 X5 連在一起,形成四路系統(tǒng),總共內(nèi)存 DIMM 數(shù)就可以達(dá)到 128條!可見,IBM 的 eX5已經(jīng)巔覆了劃分雙路、四路系統(tǒng)的傳統(tǒng)標(biāo)準(zhǔn)
3. 根據(jù)工作負(fù)載智能化調(diào)節(jié)資源
由于用戶需求千差萬別,理想的情況是讓服務(wù)器變得更加“智能化”,即可以根據(jù)負(fù)載的變化實(shí)現(xiàn)自動(dòng)調(diào)節(jié)資源。近兩年來,這種智能特性已經(jīng)開始呈現(xiàn)。比如,英特爾在其最新的處理器中增加了睿頻加速 (Turboost)和超線程技術(shù),可以通過感知工作負(fù)載的變化來打開或關(guān)閉核心,進(jìn)而提高主頻或增加并行線程,以滿足不同需求。
除了性能,功耗也可以動(dòng)態(tài)控制。比如 IBM 在服務(wù)器中使用了“海拔高度計(jì)”,通過測(cè)量服務(wù)器所在地的海拔高度來判斷空氣的密度,進(jìn)而調(diào)整風(fēng)扇的轉(zhuǎn)速和送風(fēng)量;另一家服務(wù)器廠商惠普公司則使用了“海洋式傳感器”,通過機(jī)箱里多達(dá)32個(gè)溫度傳感器來實(shí)時(shí)地對(duì)系統(tǒng)進(jìn)行細(xì)致的環(huán)境監(jiān)測(cè),防止過度散熱和調(diào)整風(fēng)扇轉(zhuǎn)速以避免浪費(fèi)電力。另外,服務(wù)器廠商也開始優(yōu)化各自的功耗管理軟件,如 IBM Director Active Energy Manager,以實(shí)現(xiàn)功耗封頂、監(jiān)控調(diào)節(jié)等更多高級(jí)功能。
當(dāng)然,虛擬化和云計(jì)算本質(zhì)上就是為了實(shí)現(xiàn)靈活 IT 部署和服務(wù)而存在的。因此,今天在選購服務(wù)器時(shí),你不僅僅要看性能、價(jià)格、可用性等方面,還應(yīng)該把“智能”這一因素也考慮進(jìn)去,以更好的應(yīng)對(duì)“IT 系統(tǒng)僵化”、“功耗高漲”、“管理人手不足”等諸多困擾。特別是當(dāng)你作為一個(gè)數(shù)據(jù)中心管理員,面對(duì)數(shù)以百計(jì)、甚至數(shù)以千計(jì)的服務(wù)器需要管理時(shí),相信對(duì)系統(tǒng)智能特性的渴求會(huì)更加突出。
4. 用系統(tǒng)的觀點(diǎn)考慮節(jié)能問題
IT經(jīng)理對(duì)于服務(wù)器能耗的關(guān)注程度越來越高,特別是對(duì)于中大型數(shù)據(jù)中心來說,節(jié)能不僅意味著一種社會(huì)責(zé)任,也會(huì)實(shí)實(shí)在在地影響到成本支出。不過,對(duì)于用戶來說,考慮節(jié)能問題既要有系統(tǒng)的觀點(diǎn),也要抓住重點(diǎn),對(duì)癥下藥。因?yàn)閺男酒?、組件、整機(jī)、管理軟件到空調(diào)制冷系統(tǒng)、供電系統(tǒng)乃至數(shù)據(jù)中心建設(shè),很多個(gè)環(huán)節(jié)都需要消耗能源。
就x86服務(wù)器而言,在選型時(shí)一方面可以用 SpecPower 等指標(biāo)來比較不同系統(tǒng)的性能功耗比,同時(shí)也要注意比較不同廠商的節(jié)能技術(shù)和功能,如機(jī)箱內(nèi)的散熱系統(tǒng)設(shè)計(jì)是否科學(xué)合理?電源轉(zhuǎn)換效率能否達(dá)到 90%以上的級(jí)別?能耗控制與管理軟件有什么樣的功能?能否根據(jù)負(fù)載自動(dòng)調(diào)節(jié) CPU 主頻和風(fēng)扇轉(zhuǎn)速?能否通過光通路診斷顯示屏便捷地對(duì)主要部件進(jìn)行監(jiān)控?等等。
5. 向管理要效率
“向管理要效率”,并非一句空言。隨著業(yè)務(wù)應(yīng)用的發(fā)展變化,企業(yè)后臺(tái)的 IT 系統(tǒng)和數(shù)據(jù)中心日益復(fù)雜,管理支出也在不斷攀升。有統(tǒng)計(jì)表明,企業(yè) IT 部門把 70%的預(yù)算用在了 IT 運(yùn)維管理方面,而只有 30%的資源可以用來支持業(yè)務(wù)創(chuàng)新。因此,向管理要效率,不僅必要,而且也大有可為。
在考察x86服務(wù)器的可管理性和可維護(hù)性時(shí),關(guān)鍵要看廠商能否提供齊全的管理模塊和功能,包括安裝配置、遠(yuǎn)程管理、光通路診斷、組件熱插拔、高級(jí)管理軟件等。同時(shí)也要注意廠商是否支持最新的管理技術(shù),如統(tǒng)一可擴(kuò)展固件接口(UEFI)?因?yàn)樽钚碌?BIOS 不僅方便配置和部署,而且比上一代 BIOS 提供了更多的管理功能。當(dāng)然,對(duì)于不同的用戶來說,碰到的“痛點(diǎn)”是不一樣的,需要的管理功能也不同,如有的注重功耗管理,有的注重虛擬化管理,有的關(guān)心管理的便捷性。
6. 給刀片潑點(diǎn)冷水
憑借高密度、高可管理性、高度整合等優(yōu)勢(shì)特性,刀片服務(wù)器一度被認(rèn)為是機(jī)架產(chǎn)品的替代品,甚至有廠商喊出了“Blade Everything”的口號(hào)。但刀片真的能適應(yīng)所有環(huán)境,并完全取代機(jī)架嗎?答案顯然是否定的,因?yàn)闆]有一種架構(gòu)完美到可以適用所有的場(chǎng)合,什么時(shí)候用刀片,關(guān)鍵還得具體情況具體分析。
由于刀片機(jī)箱在很小的空間里把服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、供電、散熱、管理等模塊集成在一起,使得其單位空間的能耗大大提升,一般功率都在 2000-5000W 之間,遠(yuǎn)遠(yuǎn)高于同等空間大小的機(jī)架服務(wù)器。而且,實(shí)際上并不是所有的客戶和機(jī)房都能支持這種高密度的設(shè)備,由于供電能力有限,數(shù)據(jù)中心里往往出現(xiàn)一個(gè) 42U機(jī)柜里只能放置 1-2臺(tái)刀片機(jī)箱的情況,寶貴的機(jī)柜空間反而被大大浪費(fèi)。此外,機(jī)架服務(wù)器由于有足夠的散熱空間,可靠性也比刀片服務(wù)器更高,并且機(jī)箱里也有足夠的空間去支持更高的 I/O 擴(kuò)展能力。而這些因素對(duì)于關(guān)鍵業(yè)務(wù)應(yīng)用而言都是不可忽視的。因此,用戶在選型時(shí)應(yīng)該根據(jù)應(yīng)用特點(diǎn)來決定,特別是對(duì)于 I/O 吞吐比較大的應(yīng)用,如數(shù)據(jù)庫、大規(guī)模網(wǎng)絡(luò)輸入輸出等,機(jī)架式產(chǎn)品反而更有優(yōu)勢(shì)。
7. 標(biāo)準(zhǔn)化與定制化
由于應(yīng)用負(fù)載多種多樣,一般會(huì)存在計(jì)算密集型、內(nèi)存密集型、I/O 密集型等差異,而且對(duì)于某些用戶,特別是大規(guī)模 Web2.0企業(yè)、超級(jí)計(jì)算中心、云計(jì)算數(shù)據(jù)中心等,還有著更多的特殊需求,因此,我們看到服務(wù)器定制化在 2010年得到了長(zhǎng)足的發(fā)展。
這種定制化體現(xiàn)在兩個(gè)方面。第一種是工業(yè)標(biāo)準(zhǔn)服務(wù)器的“定制化模塊”,如 IBM 在其最新的 eX5 架構(gòu)中,引入了 FlexNode 節(jié)點(diǎn)互聯(lián)技術(shù)和 MAX5 內(nèi)存擴(kuò)展技模塊,可以把 HX5、x3690 X5、x3850 X5等三款產(chǎn)品擴(kuò)展成覆蓋“普通應(yīng)用、內(nèi)存饑渴型、計(jì)算密集型和復(fù)雜大型應(yīng)用”在內(nèi)的 12種不同優(yōu)化配置。第二種是專門針對(duì)某類應(yīng)用進(jìn)行優(yōu)化的功能型服務(wù)器,如面向高性能計(jì)算的 CPU+GPU 混合架構(gòu)服務(wù)器集群,針對(duì)高密度互聯(lián)網(wǎng)數(shù)據(jù)中心的“雙胞胎”或“四胞胎”高密度服務(wù)器(即一臺(tái)服務(wù)器里裝有多塊主板),針對(duì)云環(huán)境部署的軟硬件集成化機(jī)柜式系統(tǒng)等等。
可見,前一種仍然是標(biāo)準(zhǔn)化服務(wù)器,只是通過技術(shù)創(chuàng)新實(shí)現(xiàn)了更好的擴(kuò)展性,因此適用面更廣,而后一種定制化服務(wù)器往往適用面比較窄,一般適合的都是“服務(wù)器大戶”。當(dāng)然,對(duì)具體用戶來說,在選型時(shí)仍然是要首先分析自己的工作負(fù)載,然后衡量投入產(chǎn)出比。
8. 從虛擬化到私有云
進(jìn)入2010年以來,虛擬化技術(shù)應(yīng)用的廣度和程度不斷加深。一方面是虛擬化的范疇更廣,不再只局限于服務(wù)器,很多用戶開始考慮存儲(chǔ)虛擬化和I/O虛擬化;另一方面是虛擬化與行業(yè)應(yīng)用結(jié)合得會(huì)更加緊密,而不只是針對(duì)基礎(chǔ)架構(gòu)的虛擬化。如果我們把私有云建設(shè)當(dāng)成一個(gè)過程來看,隨著用戶應(yīng)用愈加深入,對(duì)虛擬化技術(shù)的要求也會(huì)越來越高,考慮的問題也會(huì)增多,比如虛擬化的效率、更高級(jí)功能、安全性、擴(kuò)展性以及對(duì)虛擬化數(shù)據(jù)中心的管理等。
因此,為虛擬化應(yīng)用選擇 x86服務(wù)器時(shí),我們需要有一種動(dòng)態(tài)發(fā)展的觀點(diǎn),即你所選擇的平臺(tái)能否靈活按需擴(kuò)展。如 CPU 和內(nèi)存等資源是否方便擴(kuò)展,比如 IBM eX5 架構(gòu)中的 MAX5 內(nèi)存擴(kuò)展單元?是否支持 I/O 虛擬化功能?服務(wù)器廠商在云計(jì)算方面是否有相對(duì)應(yīng)的升級(jí)產(chǎn)品或方案服務(wù),如 IBM 的 CloudBurst 等等。對(duì)于某些用戶來說,還要考慮 x86服務(wù)器與小型機(jī)甚至是大型機(jī)在虛擬化環(huán)境下的資源統(tǒng)一管理問題。
9. 關(guān)注架構(gòu)融合與統(tǒng)一管理
俗話說,“分久必合,合久必分。”IT 領(lǐng)域也是如此。大型機(jī)時(shí)代以集中為主,互聯(lián)網(wǎng)時(shí)代強(qiáng)調(diào)分布式應(yīng)用,而到了今天的虛擬化與云計(jì)算時(shí)代,又出現(xiàn)了融合的趨勢(shì),這一方面是得益于技術(shù)的進(jìn)步,另一方面也是應(yīng)用發(fā)展的需要。
具體到服務(wù)器領(lǐng)域來看,這種融合至少體現(xiàn)在了兩個(gè)方面。一是計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源的整合,如刀片服務(wù)器、模塊化數(shù)據(jù)中心等,甚至開始把各種系統(tǒng)軟件和中間件也集成在一起,以實(shí)現(xiàn)“Cloud in a Box”,如 IBM 的 Cloudburst 和 Oracle 的 Exalogic Elastic Cloud。另一種是不同體系架構(gòu)之間的融合,如 CPU 與 GPU 的協(xié)同并行計(jì)算,又比如 IBM 最新一代的 zEnterprise 開始把大型主機(jī)與基于 POWER 和 x86 架構(gòu)的刀片服務(wù)器資源整合在一起,并實(shí)現(xiàn)統(tǒng)一管理,以適應(yīng)更多新興的工作負(fù)載需求。
其實(shí),從長(zhǎng)遠(yuǎn)來看,在虛擬化和云計(jì)算環(huán)境下,軟硬件架構(gòu)和產(chǎn)品本身之間的差異性會(huì)變得不象以前那么明確和重要,而用戶自身的業(yè)務(wù)創(chuàng)新和工作負(fù)載要求會(huì)變得越來越關(guān)鍵。
總之,從整個(gè)產(chǎn)業(yè)的角度來看,2010年是 x86服務(wù)器具有“轉(zhuǎn)折意義”的一年,不僅性能上了一個(gè)大臺(tái)階,而且應(yīng)用領(lǐng)域也在不斷拓展。比如,以前你可能沒想到把 x86服務(wù)器做成小型機(jī)?沒想到 x86可以與 GPU 協(xié)同計(jì)算?沒想到把 x86與大型機(jī)整合在一起?沒想到把標(biāo)準(zhǔn)的 x86服務(wù)器做得跟“變形金剛”一樣可以靈活配置?沒想到 x86服務(wù)器芯片也能“超頻”?……2010年,這些或得到進(jìn)一步增強(qiáng),或成為新的現(xiàn)實(shí)!所以,作為用戶,你也需要用發(fā)展的眼光來重新審視 x86技術(shù)以及你的工作負(fù)載:沒有不可能,只有想不到!