數(shù)十年來,傳統(tǒng)的核心/匯聚/接入網(wǎng)絡(luò)架構(gòu)一直是企業(yè)數(shù)據(jù)中心的主流架構(gòu),而當(dāng)計(jì)算和存儲(chǔ)變得越來越靈活、動(dòng)態(tài)、可以“軟件定義”之時(shí),數(shù)據(jù)中心網(wǎng)絡(luò)卻一直在抗拒改變,因而也成了數(shù)據(jù)中心自動(dòng)化和彈性擴(kuò)展的瓶頸。
那么,數(shù)據(jù)中心網(wǎng)絡(luò)如何才能像計(jì)算與存儲(chǔ)那樣,具備靈活自適性呢?Big Switch的共同創(chuàng)始人Kyle Farster和Facebook的網(wǎng)絡(luò)工程師Petr Lapukhov一致主張,數(shù)據(jù)中心網(wǎng)絡(luò)的運(yùn)營者們應(yīng)該尋求一種內(nèi)核艙式(core and pod)設(shè)計(jì),可以讓超大規(guī)模數(shù)據(jù)中心從小起步,逐步試驗(yàn),逐步適應(yīng)日益變化的網(wǎng)絡(luò)需求,而不必全盤放棄現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。
20年來,3層的網(wǎng)絡(luò)設(shè)計(jì)一直在做優(yōu)化,唯獨(dú)創(chuàng)新不屬于它。
將近20年來,大多數(shù)網(wǎng)絡(luò)專家們所學(xué)的最主要的數(shù)據(jù)中心設(shè)計(jì)就是3層架構(gòu):核心(L3)、匯聚(L2/L3)和接入(L2)。而且這種基本設(shè)計(jì)取得了巨大的成功,可以輕松且低成本地構(gòu)建出可靠而且可擴(kuò)展的網(wǎng)絡(luò),但是這樣的優(yōu)勢正在面臨著新一代數(shù)據(jù)中心網(wǎng)絡(luò)需求的巨大挑戰(zhàn)。
3層的網(wǎng)絡(luò)設(shè)計(jì)構(gòu)想,當(dāng)時(shí)是因?yàn)長3的路由器與L2的交換機(jī)之間存在著明顯的價(jià)格差,而網(wǎng)絡(luò)流量又主要是南北向而非東西向的,且核心以及匯聚層的速度也要比邊緣的速度快上至少10倍。但是現(xiàn)在,這些考慮因素全都不存在了。
更糟的是,3層設(shè)計(jì)在支持今日數(shù)據(jù)中心的業(yè)務(wù)創(chuàng)新方面全面潰敗。而且3層設(shè)計(jì)中的一些小模塊嚴(yán)重固化,想要對其進(jìn)行快速升級迭代或者創(chuàng)新實(shí)驗(yàn)幾乎是不可能的,要想提升其性價(jià)比也幾乎毫無希望。從實(shí)際情形上看,3層設(shè)計(jì)是將網(wǎng)絡(luò)鎖定在了一個(gè)“最小公分母”的功能集合中,鎖定在了單一廠商、產(chǎn)品換代緩慢的困境中。
如今,數(shù)據(jù)中心網(wǎng)絡(luò)的設(shè)計(jì)已經(jīng)走到了一個(gè)新的節(jié)點(diǎn)上。業(yè)界人士也都不斷地在聽說一些超大規(guī)模數(shù)據(jù)中心的運(yùn)營者們在構(gòu)建自己的創(chuàng)新網(wǎng)絡(luò)。這些數(shù)據(jù)中心盡管規(guī)模龐大,但是其網(wǎng)絡(luò)設(shè)計(jì)卻可以允許你從小起步,快速地進(jìn)行創(chuàng)新。
這種內(nèi)核艙式創(chuàng)新的主要觀點(diǎn)是:超大規(guī)模數(shù)據(jù)中心沒必要一天就建成,而是可以添磚加瓦式的有機(jī)成長,每次只前進(jìn)一小步即可。
從小起步的內(nèi)核艙式創(chuàng)新
所謂內(nèi)核艙式創(chuàng)新就是利用多個(gè)懸掛在路由核心層上、每個(gè)都單獨(dú)設(shè)計(jì)的“艙”(內(nèi)部結(jié)構(gòu)不必相同)。路由核心可串起很多多次迭代的艙,并為其提供快速且簡單的內(nèi)部連接,將每個(gè)艙視為一個(gè)原子單元。而在每個(gè)艙內(nèi),可以只有單一的接入層,或者更常見的“葉片加脊柱”式網(wǎng)絡(luò)。如果在一個(gè)艙內(nèi)使用了“葉片加脊柱”拓?fù)?,那么核心層往往?huì)被稱為“脊柱的脊柱”,整個(gè)網(wǎng)絡(luò)就代表一棵“胖樹”或“層疊式(Clos)”拓?fù)洹?/p>
為了匹配新增的需求,新的艙可以在設(shè)計(jì)、工程、安裝和摘除上都只作為一個(gè)單元或網(wǎng)元來對待。在一個(gè)數(shù)據(jù)中心里,可以有不同迭代的艙,例如v1、v2和v3代的筴可以同時(shí)共存,都懸掛在共享的核心上。在很多迭代方法中,每個(gè)艙的設(shè)計(jì)都在前一代的基礎(chǔ)上升級——比如說可以在性價(jià)比曲線上的一些更好的點(diǎn)上構(gòu)建較新的硬件平臺(tái)。
內(nèi)核艙設(shè)計(jì)的好處是網(wǎng)絡(luò)、計(jì)算和存儲(chǔ)都可以自行迭代,然后組合成一個(gè)單元,這樣在運(yùn)營和自動(dòng)化上就非常簡單了。這種方法可適應(yīng)數(shù)據(jù)中心內(nèi)的設(shè)計(jì)多樣性,保證每個(gè)單元在艙的邊界內(nèi)是完全一致的。盡管使用各種不同的艙可能會(huì)傷害到整體網(wǎng)絡(luò)的一致性,但卻增加了小步試驗(yàn)、迭代成長的靈活性,同時(shí)又有足夠的一致性可進(jìn)行統(tǒng)一管理。
當(dāng)然,這種方法也存在短板,那就是增加了操作的復(fù)雜性,它要求員工具備多種設(shè)計(jì)知識(+本站微信 networkworldweixin),可能還要用到各種不同的工具來管理和操作迭代層級不一樣的多個(gè)單元。但無論如何,如果想要維護(hù)一個(gè)簡單且統(tǒng)一的艙結(jié)構(gòu),對大多數(shù)任務(wù)進(jìn)行自動(dòng)化也顯然要比對蔓延整個(gè)數(shù)據(jù)中心的傳統(tǒng)3層網(wǎng)絡(luò)進(jìn)行自動(dòng)化容易得多。
內(nèi)核艙式設(shè)計(jì)也不會(huì)遭遇“最小公分母”或“單一廠商鎖定”等3層架構(gòu)所固有的問題。因?yàn)槊總€(gè)單獨(dú)的艙在合理的范圍內(nèi)都可以是一個(gè)新的開始。
網(wǎng)絡(luò)設(shè)計(jì)適應(yīng)變化
內(nèi)核艙式設(shè)計(jì)最早由一些超大規(guī)模數(shù)據(jù)中心的架構(gòu)師們所采用,作為一種橫向擴(kuò)展的方法,而與之前所采用的昂貴的經(jīng)典樹拓?fù)淇v向擴(kuò)展模型相對立。傳統(tǒng)的核心/匯聚/邊緣設(shè)計(jì)一般需要在擴(kuò)容時(shí)替換/重新設(shè)計(jì)/重建所有的3層架構(gòu)(這在大多數(shù)企業(yè)的數(shù)據(jù)中心建設(shè)中是一種常態(tài))。而采用內(nèi)核艙式設(shè)計(jì),你只須給核心增加新的艙便可擴(kuò)容,也可以更新最新的艙設(shè)計(jì)(無須更改整個(gè)數(shù)據(jù)中心設(shè)計(jì))而適應(yīng)新的需求。
設(shè)想一個(gè)應(yīng)用需要在接入交換機(jī)上有雙倍的上行鏈路。在傳統(tǒng)的3層設(shè)計(jì)中,一旦所需端口密度超過了設(shè)備的容量,唯一的選擇就只能是在整個(gè)數(shù)據(jù)中心范圍內(nèi)重新設(shè)計(jì)更大、更高密度的盒子用于匯聚。而在內(nèi)核艙式設(shè)計(jì)中,只須將一個(gè)新一代的艙集成進(jìn)來便可,不會(huì)影響到數(shù)據(jù)中心的整體設(shè)計(jì)。
持續(xù)的創(chuàng)新不可避免地要求軟件不斷更新。那么內(nèi)核艙式設(shè)計(jì)的一個(gè)重大優(yōu)勢就是能夠讓升級變得非常簡單。所有的艙都可以獨(dú)立升級,因?yàn)镃los或胖樹網(wǎng)絡(luò)的設(shè)計(jì)是在整個(gè)層上采用N+1冗余(最常見的是3+1),因此升級的操作風(fēng)險(xiǎn)很低。而傳統(tǒng)的1+1三層設(shè)計(jì),大多數(shù)升級都是高風(fēng)險(xiǎn)的或繁重不堪的。
對業(yè)界而言,已經(jīng)有一些用例展示了這一革命性的和模塊化的數(shù)據(jù)中心設(shè)計(jì)方法,可以查看微軟或eBay的艙部署(一般是以術(shù)語“容器”展現(xiàn)的)。
內(nèi)核艙式思維模式
我們看到,在網(wǎng)絡(luò)設(shè)計(jì)上領(lǐng)風(fēng)氣之先(例如采用SDN軟件和裸金屬硬件)的一批數(shù)據(jù)中心架構(gòu)師們已經(jīng)開始擁抱內(nèi)核艙式設(shè)計(jì)了。他們不會(huì)再整個(gè)數(shù)據(jù)中心內(nèi)采用SDN,但卻會(huì)在某一代的艙設(shè)計(jì)中用到。他們可通過一個(gè)集中控制器獲得自動(dòng)化,不再需要打包的“最小公分母”設(shè)計(jì),且可以更容易從小起步,逐步試用,最終適應(yīng)未來的各種業(yè)務(wù)需求。
頗具諷刺意味的是,很多企業(yè)架構(gòu)師在描述其數(shù)據(jù)中心時(shí),首先都會(huì)說到3層設(shè)計(jì),但在細(xì)節(jié)上卻各有不同。對于很多數(shù)據(jù)中心架構(gòu)師來說,向內(nèi)核艙式設(shè)計(jì)的轉(zhuǎn)變更多的是在心智上而非現(xiàn)有網(wǎng)絡(luò)上的。
當(dāng)數(shù)據(jù)中心的架構(gòu)師們認(rèn)可了這種新的思維模式時(shí),就會(huì)有更多的數(shù)據(jù)中心網(wǎng)絡(luò)(無論其規(guī)模如何)從小處起步。數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)計(jì)一直是一門需要在諸多優(yōu)先項(xiàng)之間進(jìn)行權(quán)衡的學(xué)問,如果能在優(yōu)先項(xiàng)列表中出現(xiàn)內(nèi)核艙式設(shè)計(jì),并由此而實(shí)現(xiàn)“創(chuàng)新”,那將是一個(gè)重大的利好消息。