企業(yè)網(wǎng)D1Net 3月12日 眾所周知,傳統(tǒng)數(shù)據(jù)中心基本上采用的是二層加三層的組網(wǎng)架構(gòu),數(shù)據(jù)中心內(nèi)部采用二層組網(wǎng),數(shù)據(jù)中心外部通常用三層網(wǎng)絡(luò)進(jìn)行互聯(lián)。隨著服務(wù)器虛擬化技術(shù)的普及,數(shù)據(jù)中心正式進(jìn)入云計(jì)算時(shí)代,為提升大量閑置服務(wù)器的資源利用率,計(jì)算虛擬化技術(shù)已經(jīng)逐步在數(shù)據(jù)中心進(jìn)行應(yīng)用,VM(Virtual Manufacturing)主機(jī)逐漸成為數(shù)據(jù)中心承載應(yīng)用業(yè)務(wù)的重要形式,然而VM只能在一個(gè)二層的網(wǎng)絡(luò)內(nèi)進(jìn)行遷移,如果需要跨二層區(qū)域遷移,就需要更改VM的IP地址。若沒(méi)有負(fù)載均衡等其它特殊手段,VM上的應(yīng)用會(huì)中斷。這樣VM技術(shù)在傳統(tǒng)數(shù)據(jù)中心中使用就受到了極大限制,因?yàn)榻^大部分的數(shù)據(jù)中心都是由多個(gè)分布在世界各地的分中心所組成,將VM限制在一個(gè)數(shù)據(jù)中心內(nèi)使用,數(shù)據(jù)中心為了更充分的利用資源,就需要VM在更大的范圍內(nèi)無(wú)縫遷移,受傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的影響,VM顯然無(wú)法充分展現(xiàn)出其技術(shù)優(yōu)勢(shì)。另外,即使在數(shù)據(jù)中心內(nèi)部,設(shè)備數(shù)量也越來(lái)越多,二層網(wǎng)絡(luò)規(guī)模變得非常龐大,傳統(tǒng)數(shù)據(jù)中心的網(wǎng)絡(luò)難以負(fù)重。顯然VM在數(shù)據(jù)中心服務(wù)器上的應(yīng)用已經(jīng)成為潮流,不可逆轉(zhuǎn)。為了解決這些問(wèn)題,數(shù)據(jù)中心網(wǎng)絡(luò)必須做出改變,革自己的命。這樣關(guān)于新二層的技術(shù)如雨后春筍般地出現(xiàn)了。
現(xiàn)在所有的新二層技術(shù)都是基于傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)面臨的問(wèn)題而設(shè)計(jì)實(shí)現(xiàn)的,本質(zhì)上都是在原有IP報(bào)文頭協(xié)議上新增部分協(xié)議定義,然后再制定一些獨(dú)特算法,從而滿足VM主機(jī)在數(shù)據(jù)中心內(nèi)部、之間任意遷移,業(yè)務(wù)無(wú)感知的目的。按照技術(shù)部署的物理范圍可分為兩大部分:
第一部分:在數(shù)據(jù)中心內(nèi)部,新二層技術(shù)要解決數(shù)據(jù)中心內(nèi)部的網(wǎng)絡(luò)擴(kuò)展問(wèn)題。數(shù)據(jù)中心為了滿足業(yè)務(wù)增長(zhǎng)的需求,每個(gè)季度都會(huì)引入大量的設(shè)備,對(duì)現(xiàn)有的數(shù)據(jù)中心進(jìn)行擴(kuò)容,二層網(wǎng)絡(luò)規(guī)模變得越來(lái)越大,傳統(tǒng)的二層網(wǎng)絡(luò)通常采用STP協(xié)議。STP協(xié)議計(jì)算出的路徑非最優(yōu),鏈路冗余,可靠性差,規(guī)模也有限,隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大,收斂時(shí)間呈幾何倍數(shù)增長(zhǎng)。為了解決現(xiàn)有STP協(xié)議的問(wèn)題,通過(guò)大規(guī)模二層網(wǎng)絡(luò)和VLAN延伸,實(shí)現(xiàn)VM在數(shù)據(jù)中心內(nèi)部的大范圍遷移,在數(shù)據(jù)中心內(nèi)二層網(wǎng)絡(luò)里出現(xiàn)多種有代表性的技術(shù):網(wǎng)絡(luò)設(shè)備的虛擬化技術(shù):IRF/VSS/CSS、TRILL、SPB、Fabric Path等。
IRF/VSS/CSS分別是惠普、思科、華為的網(wǎng)絡(luò)設(shè)備虛擬化技術(shù),類(lèi)似于Linux服務(wù)器的VMware技術(shù),其可以將多個(gè)網(wǎng)絡(luò)設(shè)備虛擬化為一臺(tái)設(shè)備,也可以將一臺(tái)設(shè)備虛擬化為多個(gè)獨(dú)立的虛擬設(shè)備。不過(guò)這種技術(shù)都是設(shè)備商私有技術(shù),只能在自己的設(shè)備上部署,設(shè)備商之間不能互通。加上網(wǎng)絡(luò)設(shè)備虛擬化對(duì)虛擬設(shè)備的數(shù)量都有要求,一般規(guī)模不能很大,無(wú)論是一虛多還是多虛一,都不能超過(guò)10臺(tái)。這樣在一個(gè)大中型數(shù)據(jù)中心里,成百上千的網(wǎng)絡(luò)設(shè)備還是不能充分利用虛擬化技術(shù)完全解決現(xiàn)有問(wèn)題。
TRILL和SPB都是針對(duì)STP協(xié)議的缺陷,IEEE/IETF提出的標(biāo)準(zhǔn)新二層技術(shù)。TRILL和SPB協(xié)議格式不同,SPB通過(guò)外層目的MAC轉(zhuǎn)發(fā),而TRILL通過(guò)Nickname逐跳轉(zhuǎn)發(fā)表轉(zhuǎn)發(fā),SPB/TRILL都可以實(shí)現(xiàn)全路徑轉(zhuǎn)發(fā)。SPB通過(guò)IS-IS協(xié)議來(lái)共享網(wǎng)絡(luò)設(shè)備間的多個(gè)學(xué)習(xí)拓?fù)洌⒀杆賹W(xué)習(xí)以太網(wǎng)連接中各端點(diǎn)之間的最短路徑。TRILL則是在SPB基礎(chǔ)之上演化而來(lái)的,是現(xiàn)有最為成熟的數(shù)據(jù)中心內(nèi)部新二層技術(shù)。
Fabric Path是思科的私有協(xié)議,相比TRILL/SPB實(shí)現(xiàn)更為完善,不過(guò)由于是私有協(xié)議,在互聯(lián)網(wǎng)如此開(kāi)放的今天,飽受詬病。Fabric Path通過(guò)思科自己定義的Switch ID來(lái)轉(zhuǎn)發(fā),支持L2 ISIS認(rèn)證,拓?fù)涓綦xVLAN。
表1列出了三大類(lèi)新技術(shù)之間的大致區(qū)別。
|
IRF/VSS/CSS |
TRILL/SPB |
Fabric Path |
封裝類(lèi)型 |
內(nèi)部私有實(shí)現(xiàn) |
M-in-M/Ethernet+Trill |
Ethernet+L2MP |
轉(zhuǎn)發(fā)方式 |
目的MAC |
目的MAC/Nickname |
Switch ID |
環(huán)路避免 |
端口阻塞 |
RPFC |
RPFC |
切換速度 |
毫米級(jí) |
毫米級(jí) |
毫米級(jí) |
部署規(guī)模 |
10臺(tái)以下 |
1000臺(tái)以上,2萬(wàn)臺(tái)以下 |
1000臺(tái)以上,1萬(wàn)臺(tái)以下 |
用戶(hù)MAC |
基于源MAC學(xué)習(xí) |
基于源MAC加解封裝報(bào)文學(xué)習(xí) |
交互式學(xué)習(xí) |
表1:數(shù)據(jù)中心內(nèi)部新二層技術(shù)比較
第二部分:在數(shù)據(jù)中心外部,數(shù)據(jù)中心之間。隨著數(shù)據(jù)中心多中心的部署,虛擬機(jī)的跨數(shù)據(jù)中心遷移,跨數(shù)據(jù)中心業(yè)務(wù)負(fù)載分擔(dān)等需求,使得二層網(wǎng)絡(luò)的擴(kuò)展不僅是在數(shù)據(jù)中心的邊界為止,還需要考慮跨數(shù)據(jù)中心機(jī)房的區(qū)域,延伸到同城備份中心、遠(yuǎn)程災(zāi)備中心。但是傳統(tǒng)的數(shù)據(jù)中心都是二層加三層的網(wǎng)絡(luò),多數(shù)據(jù)中心之間的連接是通過(guò)三層路由連通的,而要實(shí)現(xiàn)三層網(wǎng)絡(luò)連接的兩個(gè)二層網(wǎng)絡(luò)互通,就不能按照傳統(tǒng)的基于MAC來(lái)轉(zhuǎn)發(fā)。在數(shù)據(jù)中心之間也涌現(xiàn)出了多種有代表性的技術(shù):VPLS(MPLS L2VPN)、OTV、EVI、VPLS over GRE等等。
由于數(shù)據(jù)中心之間的跨三層的二層轉(zhuǎn)發(fā)實(shí)現(xiàn)復(fù)雜,現(xiàn)在除了VPLS是業(yè)界現(xiàn)有標(biāo)準(zhǔn)外,其它全部是私有協(xié)議,而VPLS協(xié)議顯然不是為了VM技術(shù)而專(zhuān)門(mén)設(shè)計(jì)的,就是VPN技術(shù)的一種,并不能完全滿足VM的使用需要,包括思科私有的VPLS over GRE技術(shù),也是較早時(shí)期提出的一種VPN技術(shù)。這里只有OTV和EVI是針對(duì)跨數(shù)據(jù)中心VM遷移問(wèn)題而設(shè)計(jì)的新二層協(xié)議技術(shù)。
OTV是思科的跨二層私有技術(shù),思科對(duì)數(shù)據(jù)報(bào)文進(jìn)行了特殊封裝,自己定義了一種Shim封裝格式來(lái)實(shí)現(xiàn)二層報(bào)文跨三層轉(zhuǎn)發(fā)功能,通過(guò)組播與單播兩種方式形成建立鄰接關(guān)系,與STP自動(dòng)隔離,不通過(guò)互聯(lián)核心設(shè)備泛洪,而是指定未知單播泛洪。OTV是一種全新的協(xié)議設(shè)計(jì),若需要在數(shù)據(jù)中心部署,則需要數(shù)據(jù)中心完全重建。而來(lái)自H3C的EVI技術(shù),則可以基于現(xiàn)有的數(shù)據(jù)中心架構(gòu),在多個(gè)跨區(qū)域的數(shù)據(jù)中心整合成一個(gè)大二層組網(wǎng),通過(guò)MAC in IP的GRE封裝技術(shù)充分利用現(xiàn)有三層網(wǎng)路鏈路實(shí)現(xiàn),成本低廉,運(yùn)行維護(hù)簡(jiǎn)單,這個(gè)有點(diǎn)像是思科的VPLS over GRE技術(shù)。當(dāng)然,既然是基于現(xiàn)有網(wǎng)絡(luò)進(jìn)行的優(yōu)化實(shí)現(xiàn),與OTV相比,轉(zhuǎn)發(fā)效果并不高,EVI更像是一種過(guò)渡的技術(shù),即不丟棄原有的數(shù)據(jù)中心架構(gòu),又可以實(shí)現(xiàn)VM的跨數(shù)據(jù)中心遷移。
不論是數(shù)據(jù)中心內(nèi)部還是數(shù)據(jù)中心外部,新二層技術(shù)會(huì)將數(shù)據(jù)中心帶向大二層網(wǎng)絡(luò)架構(gòu),未來(lái)的數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)更為簡(jiǎn)化,數(shù)萬(wàn)臺(tái)設(shè)備都會(huì)在一個(gè)大二層網(wǎng)絡(luò)中。不管采用哪種新二層技術(shù),這種趨勢(shì)已經(jīng)成為必然,新二層技術(shù)一定會(huì)給數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)做減法。