隨著互聯(lián)網(wǎng)和云計算行業(yè)的快速發(fā)展,數(shù)據(jù)中心網(wǎng)絡(luò)的重要性前所未有的凸顯。展望2020年,數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)會有哪些熱點問題受業(yè)界關(guān)注,面臨這些技術(shù)熱點問題你會如何應(yīng)對?
熱點5: 下一代數(shù)據(jù)中心主干以太網(wǎng)演進,200G or 400G?
上榜指數(shù):★★★★☆
上榜原因:大家都在等米下鍋。
如果說從2016年開始的大規(guī)模數(shù)據(jù)中心主干網(wǎng)絡(luò)升級的浪潮是從40G升級到100G,那么2020年的下一代升級浪潮應(yīng)該是怎么樣的?業(yè)界因此有200G和400G兩種路線。
圖1 以太網(wǎng)標準進展(來源:Ethernet Alliance)
200G的優(yōu)勢是所需的QSFP及50G Serdes均已成熟商用,缺點是相對100G的每G帶寬成本降低幅度不算太大;400G正好相反,預(yù)期的每G帶寬成本下降幅度足夠大,但需要QSFP搭載100G Serdes,或8通道的新標準(如OSFP、QSFP-DD)搭載50G Serdes,而100G Serdes、OSFP、QSFP-DD商用時間預(yù)計都要在2018年以后。
根據(jù)Google、Facebook等披露的數(shù)據(jù),這些互聯(lián)網(wǎng)巨頭數(shù)據(jù)中心內(nèi)部流量每年增長幅度接近100%,那么,部署100G較早的少數(shù)互聯(lián)網(wǎng)巨頭,比如Google,很可能會謀求盡快獲得200G,而其它企業(yè)則可以選擇跳過200G等待400G獲得更好的性價比。IEEE的400G以太網(wǎng)標準預(yù)計2017年完成,而200G以太網(wǎng)標準預(yù)計2018~2019年完成,也許也反應(yīng)了業(yè)界大部分企業(yè)的心態(tài)——更看好400G。
考慮到即便只有Google采用200G也會有足夠的市場影響力,可以預(yù)計,2020年200G和400G均商用就緒,但400G會更加主流,性價比更優(yōu)。
熱點4: 400G數(shù)據(jù)中心網(wǎng)絡(luò),光纖選多模還是單模?
上榜指數(shù):★★★★☆
上榜原因:多模和單模一直是一道沒有標準答案的選擇題
數(shù)據(jù)中心集群內(nèi)布線選擇多模光纖還是單模光纖一直是一個業(yè)界在討論的話題,各大玩家也各有選擇,比如100G時代,F(xiàn)acebook選擇單模,Google選擇多模和單模同時部署,BAT則選擇多模。
從成本角度,多模光纖貴但多模光模塊便宜,單模光纖便宜而單模光模塊貴,因此很容易將光纖和光模塊成本進行組合評估,得出距離和成本的關(guān)系。比如100G,光纖距離在100米以內(nèi)時多模解決方案的成本優(yōu)勢非常明顯。
從技術(shù)角度,傳統(tǒng)上多模解決方案代表光纖并行方向,單模解決方案代表波長復(fù)用方向(PSM4是個新的方向,單模并行)。40G和100G時代這兩種解決方案分別在短距和中長距場景各有千秋相安無事共同發(fā)展。然而400G時代情況有了變化,并行技術(shù)路線似乎在400G時代觸碰到了天花板。
并行技術(shù)路線的特點是每一對多模光纖分別承載一路光信號。目前IEEE的400G SR16標準是16*25G并行方案,需要16對多模光纖,遠遠超過100G時代廣泛使用的12芯MPO,會導(dǎo)致成本大幅上升;更重要的是,多模光模塊所依賴的低成本VCSEL光芯片方案,2020年很可能仍然只能提供每路50G的能力,400G SR8的8*50G方案仍然需要超過12芯MPO的8對多模光纖?,F(xiàn)有的12芯MPO能夠容納的400G SR4看上去遙遙無期。
圖2 400G網(wǎng)絡(luò)技術(shù)演講(紅色部分為IEEE 802.3bs baseline規(guī)定)
多模實際上也可以有波長復(fù)用解決方案。目前的一些私有技術(shù),如SWDM,可以實現(xiàn)一對多模光纖上4路光信號的傳輸。但私有技術(shù)封閉性導(dǎo)致的光模塊互通性問題和成本的提升,是這類解決方案大規(guī)模普遍應(yīng)用難以逾越的大山。
因此在2020年,如果沒有開放且標準化的多模波長復(fù)用技術(shù)出現(xiàn),低成本VCSEL 100G技術(shù)也不能取得突破,400G多模光纖解決方案成本優(yōu)勢將不再明顯,單模光纖在大規(guī)模數(shù)據(jù)中心也許將成為主流,而中短距的單模并行解決方案也許會是替代多模并行解決方案的高性價比選擇。
擁有多模波分復(fù)用私有技術(shù)的玩家,會為了避免400G多模解決方案的困境彼此妥協(xié)形成一個統(tǒng)一的標準嗎?讓我們拭目以待。
熱點3: 數(shù)據(jù)中心400G光模塊封裝,OSFP、QSFP-DD該如何選擇?
上榜指數(shù):★★★★★
上榜原因:。一個小小的封裝問題,牽動多少網(wǎng)絡(luò)大咖的心。
歷史上光模塊封裝一直有多個標準并行,但像OSFP、QSFP-DD這樣如此受到關(guān)注的卻不多見。400G光模塊封裝目前有多個標準,除了OSFP、QSFP-DD外還包括CFP8、CDFP等,其中OSFP、QSFP-DD是面向數(shù)據(jù)中心數(shù)通網(wǎng)絡(luò)的兩個標準。
OSFP和QSFP-DD的共同點是都將QSFP的4通道擴展為8通道,8*50G的支持來實現(xiàn)400G,未來還可以通過8*100G實現(xiàn)800G。
OSFP的優(yōu)勢是體積大散熱好工程實現(xiàn)相對容易,外加有Google的加持,缺點是1U面板的尺寸基本只能做32*400G。OSFP預(yù)計2018年商用
QSFP-DD的優(yōu)勢是1U面板可以做到36*400G的密度,并且對QSFP前向和后向兼容,可兼容現(xiàn)有的QSFP28光模塊及AOC/DAC等,缺點是尺寸較緊湊對設(shè)計和散熱有更高要求(之前QSFP-DD的散熱方面認為有較大局限,但現(xiàn)在也可以做到12W不再是瓶頸)。QSFP-DD得到Facebook的公開支持。從OFC 2017來看,QSFP-DD得到業(yè)界越來越多的支持。QSFP-DD預(yù)計2019年商用。
圖3 QSFP-DD與QSFP對比
預(yù)計2020年,很多交換機、光模塊廠商都會同時支持兩種封裝,但QSFP-DD攜更高端口密度和前后向兼容性的優(yōu)勢很可能會成為市場主流。
熱點2: 數(shù)據(jù)中心框式交換機,體系架構(gòu)會如何變化?
上榜指數(shù):★★★★★
上榜原因:昂貴而復(fù)雜的東西,天然會留下被顛覆的空間。
長久以來,框式交換機的軟硬件設(shè)計復(fù)雜,產(chǎn)品研發(fā)周期長,成本高昂,強烈依賴特定芯片?;陬愃菩旁膬?nèi)部轉(zhuǎn)發(fā)、大片外緩存、N+1交換矩陣冗余等都是框式交換機給人留下的特有印象。
OCP的6-Pack、Backpack的發(fā)布給業(yè)界展示了互聯(lián)網(wǎng)巨頭們一直在嘗試的另外的方向。Backpack采用100G以太網(wǎng)互聯(lián)的CLOS架構(gòu),使用Tomahawk這樣主要用于TOR的芯片而不是傳統(tǒng)的Dune芯片,交換矩陣無N+1冗余,實際上它們就可以看作是用一堆Wedge接入交換機像樂高積木那樣搭建起來的。
圖4 Backpack G4前視效果圖(來源Backpack_OCP_Spec_V1.10)
圖5 Backpack G4線卡與矩陣互聯(lián)架構(gòu)(來源Backpack_OCP_Spec_V1.10)
從數(shù)據(jù)中心應(yīng)用場景來看,不依賴特定交換芯片的以太網(wǎng)架構(gòu)比信元架構(gòu)轉(zhuǎn)發(fā)效率雖然要低10%左右但成本可以大幅降低,流數(shù)量巨大且不是同步突發(fā)、端口速率一致匹配、收斂比設(shè)計合理時對緩存要求會降低,交換矩陣無N+1冗余可以進一步降低成本。
當(dāng)然,6-Pack、Backpack這樣的框式交換機每一塊線卡、交換矩陣等在管理層面實際上是獨立的一臺臺交換機,對網(wǎng)絡(luò)運維管理能力要求很高,實際上是以強大的架構(gòu)、研發(fā)和運維能力換取成本收益。所以,是否能夠仍然作為一個管理節(jié)點進行管理對大部分用戶來說會是一個重要考量點。實際上,已經(jīng)有OEM廠商開始嘗試推出類似這樣架構(gòu)但仍然是一個管理節(jié)點的框式交換機產(chǎn)品,體系架構(gòu)改變帶來的成本明顯優(yōu)勢大大提升了其產(chǎn)品在市場上的競爭力。
可以預(yù)計,2020年,適用于大規(guī)模數(shù)據(jù)中心框式交換機的體系架構(gòu)將會趨向400G以太網(wǎng)CLOS架構(gòu),不使用片外擴展緩存,采用和TOR一致的交換芯片種類,而且極可能取消N+1冗余交換矩陣換取更低的成本。
熱點1: 數(shù)據(jù)中心白盒交換機+開源OS的模式是否會大行其道?
上榜指數(shù):★★★★★
上榜原因:白盒,想說愛你不容易。
白盒交換機很容易獲得,但搭載的交換機OS卻是一個難題。如果沒有很大的網(wǎng)絡(luò)規(guī)模和足夠的決心,單一用戶難以承受獨立進行自有交換機OS研發(fā)的長期投入成本和研發(fā)節(jié)奏。因此,大家都期盼能有一個好用的數(shù)據(jù)中心開源交換機OS。
然而開源交換機OS也不容易。首先,從社區(qū)運作角度,如果沒有用戶主導(dǎo)方向、用戶自己投入研發(fā)資源,僅依靠商業(yè)廠商,社區(qū)難以持久有效的運作;其次,需要有一個良好的軟件架構(gòu),具備良好擴展性可以支持未來SDN網(wǎng)絡(luò)的發(fā)展,同時模塊之間可以松耦合便于不同用戶的研發(fā)協(xié)同;再次,需要輕量專注,僅研發(fā)數(shù)據(jù)中心網(wǎng)絡(luò)必須的特性;最后,需要有同步發(fā)展和包容的生態(tài),借助更多的用戶、芯片廠商、ODM/OEM、服務(wù)商等的有效參與,活躍相關(guān)的研發(fā)、部署、推廣。Linux、Openstack、Ceph等均是開源社區(qū)成功運作的典范。
目前,開源交換機OS的典型代表是SONiC,SONiC開源社區(qū)已經(jīng)有一個良好的起步,然而還任重道遠。1.0天使階段,開源社區(qū)需要依靠有實力的社區(qū)成員共同投入較多研發(fā)資源獲得一個可用的版本并在社區(qū)成員的數(shù)據(jù)中心網(wǎng)絡(luò)規(guī)模部署完成驗證;2.0發(fā)展階段,更多的有一定研發(fā)能力的較大網(wǎng)絡(luò)規(guī)模用戶開始加入并嘗試使用,版本日趨完善和成熟;3.0普惠階段,大量普通用戶開始直接使用,眾多服務(wù)商可以提供白盒+開源OS的部署和運維服務(wù)。
可以樂觀的預(yù)計,2020年,開源OS社區(qū)將發(fā)展到2.0階段后期,白盒交換機市場將迎來井噴式發(fā)展,白盒交換機+開源OS將成為很多企業(yè)CTO/CIO的選項之一。
更多前瞻網(wǎng)絡(luò)技術(shù)話題和干貨,請關(guān)注并參與8月22日ODCC 2017峰會。
本文作者:楊志華,ODCC網(wǎng)絡(luò)工作組組長、阿里巴巴資深網(wǎng)絡(luò)專家