區(qū)別于傳統(tǒng)基建,“新基建”主要發(fā)力于科技端,主要包括5G建設(shè)等七大領(lǐng)域。隨著互聯(lián)網(wǎng)進(jìn)入云2.0時代,行業(yè)云興起,更多的企業(yè)成為云化、數(shù)字化的主角,5G、云計算、工業(yè)互聯(lián)網(wǎng)等新一代信息技術(shù)的應(yīng)用離不開海量數(shù)據(jù)的處理、存儲和軟件的云化。隨著“新基建”的推進(jìn),云計算服務(wù)部署提速,相關(guān)設(shè)備及服務(wù)需求增加,數(shù)據(jù)中心作為底層基礎(chǔ)設(shè)施有望持續(xù)增長,數(shù)據(jù)中心建設(shè)及擴(kuò)容的步伐也會相應(yīng)加快。
從中長期看,數(shù)據(jù)中心等數(shù)字經(jīng)濟(jì)領(lǐng)域的基礎(chǔ)設(shè)施應(yīng)該在技術(shù)和資金允許的情況下適度超前布局,帶動應(yīng)用市場的繁榮。在當(dāng)前大國科技競爭的大背景下,加大對新基建領(lǐng)域的投入,有助于穩(wěn)增長、穩(wěn)就業(yè),釋放國內(nèi)經(jīng)濟(jì)增長潛力,有效緩解新冠肺炎疫情對全國經(jīng)濟(jì)的沖擊,縮小與發(fā)達(dá)國家的數(shù)字鴻溝??梢灶A(yù)見,“新基建”來襲會對數(shù)據(jù)中心產(chǎn)業(yè)產(chǎn)生重大影響,勢必將開啟新一輪增長期。
數(shù)據(jù)中心規(guī)模化效益凸顯,超大規(guī)模組網(wǎng)亟需破局
互聯(lián)網(wǎng)行業(yè)的蓬勃發(fā)展帶動了數(shù)據(jù)和流量不斷向數(shù)據(jù)中心聚集。為充分發(fā)揮數(shù)據(jù)中心的規(guī)模效益,大幅降低業(yè)務(wù)部署成本和維護(hù)成本,運營商、互聯(lián)網(wǎng)、云服務(wù)提供商等行業(yè)中的大型公司紛紛建設(shè)了超大規(guī)模數(shù)據(jù)中心。自2013年以來,超大規(guī)模數(shù)據(jù)中心的數(shù)量增長了兩倍,其中以亞馬遜、蘋果、谷歌、Facebook和微軟為首,單園區(qū)最大服務(wù)器規(guī)模已經(jīng)突破30萬臺,很多大型園區(qū)服務(wù)器規(guī)模在2萬臺到10萬臺之間。到2019年第三季度末,這些大型數(shù)據(jù)中心中有504個正在運營,還有超過150個新的超大規(guī)模中心正在建設(shè)中。
可以預(yù)見,在“新基建”的推動下,“撒胡椒面”式數(shù)據(jù)中心投資建設(shè)方式或?qū)⒊蔀檫^去,更多的集中式、大手筆的投資方式將加速超大規(guī)模數(shù)據(jù)中心的建設(shè)。在這個大背景下,如何繼續(xù)提高數(shù)據(jù)中心規(guī)?;б?,構(gòu)建更大規(guī)模的數(shù)據(jù)中心網(wǎng)絡(luò),是每個數(shù)據(jù)中心架構(gòu)設(shè)計師都要面對的挑戰(zhàn)。
組建超大規(guī)模數(shù)據(jù)中心主要受限于兩方面的因素:一個是業(yè)界主流的交換網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)能力和端口密度;另一個則是網(wǎng)絡(luò)架構(gòu)設(shè)計思想,需具備極高的可擴(kuò)展性和可管理性,以期能按POD進(jìn)行數(shù)據(jù)中心網(wǎng)絡(luò)的交付,并最終具備靈活擴(kuò)展到承載更大規(guī)模集群的能力。目前業(yè)界主流設(shè)備已經(jīng)可以提供基于12.8T芯片、支持32個400G端口的TOR交換機(jī),預(yù)計2022年將會出現(xiàn)50T以上的大容量芯片,支持64個800G端口以及最新的112G SerDes技術(shù)。
同時,數(shù)據(jù)中心網(wǎng)絡(luò)已經(jīng)從最初傳統(tǒng)的3-Tier架構(gòu)演進(jìn)到扁平化、無阻塞的葉脊(Leaf-Spine)架構(gòu),并基于這種架構(gòu)還在不斷進(jìn)行迭代演進(jìn)。Facebook去年公開了其新一代的數(shù)據(jù)中心架構(gòu)F16,在spine平面對其上一代數(shù)據(jù)中心架構(gòu)F4進(jìn)行擴(kuò)展,把4個128端口、400Gbit/s交換機(jī)升級為16個128端口、100Gbit/s架構(gòu)的交換機(jī),并采用Minipack spine交換機(jī)和基于Tomahawk-3(Minipack)、Tomahawk-2(Wedge 100S)ASIC的Wedge 100S交換機(jī),據(jù)稱可以擁有4倍于F4架構(gòu)的容量,更加方便升級和使用??梢灶A(yù)見,未來在業(yè)界的共同努力下,數(shù)據(jù)中心在網(wǎng)絡(luò)架構(gòu)、設(shè)備轉(zhuǎn)發(fā)能力以及端口密度等方面有望取得新的突破,以支持更超大規(guī)模的數(shù)據(jù)中心組網(wǎng)。
無損、智慧、開源或成為數(shù)據(jù)中心網(wǎng)絡(luò)能力的“三駕馬車”新基建勢必將推進(jìn)5G、AI、大數(shù)據(jù)、云計算等業(yè)務(wù)飛速發(fā)展,這些新業(yè)務(wù)對網(wǎng)絡(luò),尤其是數(shù)據(jù)中心網(wǎng)絡(luò)在轉(zhuǎn)發(fā)效率、高效運維、開放架構(gòu)等諸多方面提出了更為苛刻的需求,未來數(shù)據(jù)中心網(wǎng)絡(luò)需要在無損、智慧、開源這三大方面全面提升能力,為新一代業(yè)務(wù)應(yīng)用保駕護(hù)航。
無損數(shù)據(jù)中心提升網(wǎng)絡(luò)確定性和高效轉(zhuǎn)發(fā)能力
未來在公有云、人工智能等應(yīng)用中將廣泛采用語音交互、圖像交互等新型的技術(shù),這些交互服務(wù)通過訪問線上數(shù)據(jù)庫、云數(shù)據(jù)中心等來滿足不同需求,諸如浸入式體驗、全息通信、機(jī)器人看護(hù)等應(yīng)用。由于這些應(yīng)用需要通過網(wǎng)絡(luò)傳輸和處理大規(guī)模多媒體信息,且設(shè)備密度和總信息量巨大,需要數(shù)據(jù)中心網(wǎng)絡(luò)在極短時間內(nèi)將大量的數(shù)據(jù)轉(zhuǎn)換成實時的信息以及行為,保證交互服務(wù)在后臺訪問的時候能夠避免丟包,減少時延并提高吞吐量,由此對數(shù)據(jù)中心網(wǎng)絡(luò)提出了無損轉(zhuǎn)發(fā)的需求。
目前,無損網(wǎng)絡(luò)技術(shù)已經(jīng)在互聯(lián)網(wǎng)、金融等行業(yè)得到應(yīng)用。以某銀行業(yè)為例,基于無損網(wǎng)絡(luò)技術(shù),在數(shù)據(jù)中心引入智能擁塞調(diào)度手段來加速網(wǎng)絡(luò)通信,經(jīng)實測最終存儲集群IOPS性能提升了20%,單卷性能達(dá)到35萬IOPS,可以為用戶提供像訪問本地盤一樣的使用體驗。隨著人工智能的飛速發(fā)展,工業(yè)控制、遠(yuǎn)程醫(yī)療、自動駕駛等越來越多的應(yīng)用將走入我們的生活,而無損數(shù)據(jù)中心網(wǎng)絡(luò)無疑為我們提供了一個極佳選擇。
智慧化能力有望解決海量數(shù)據(jù)中心運維困境
數(shù)據(jù)中心規(guī)模擴(kuò)張以后,設(shè)備數(shù)量呈倍數(shù)增長,設(shè)備種類也大大增多,如何實現(xiàn)海量設(shè)備的統(tǒng)一管理,實現(xiàn)業(yè)務(wù)到網(wǎng)絡(luò)的聯(lián)動,提高運維效率,降低運維成本,是大規(guī)模數(shù)據(jù)中心急需解決的問題之一。此外隨著云、SDN、NFV等技術(shù)在數(shù)據(jù)中心加速落地,轉(zhuǎn)控分離、三層解耦以及統(tǒng)一編排等技術(shù)引入也使得數(shù)據(jù)中心業(yè)務(wù)邏輯愈加復(fù)雜,故障排障難度大幅提升,傳統(tǒng)運維模式已經(jīng)難以為繼。
基于AI和Telemetry的智能運維是利用數(shù)據(jù)智能替換人工經(jīng)驗,期望在自動化的基礎(chǔ)上實現(xiàn)遙測、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和網(wǎng)絡(luò)引導(dǎo)等功能,監(jiān)控和管理潛在的網(wǎng)絡(luò)安全問題,幫助數(shù)據(jù)中心更快地適應(yīng)不斷變化的業(yè)務(wù)需求,提高運營的洞察力,最終實現(xiàn)基于意圖的網(wǎng)絡(luò)。
當(dāng)前網(wǎng)絡(luò)智慧化產(chǎn)業(yè)處于蓬勃發(fā)展中,重點集中在網(wǎng)絡(luò)開局部署、網(wǎng)絡(luò)變更校驗、故障智能定界/定位、故障預(yù)測、業(yè)務(wù)分析以及預(yù)測等方面,尋求在數(shù)據(jù)采集、大數(shù)據(jù)分析、AI、決策閉環(huán)等環(huán)節(jié)實現(xiàn)精細(xì)化檢測和可視化管理,變被動運維為主動運維。雖然目前還受制于AI學(xué)習(xí)模型的精確、網(wǎng)絡(luò)設(shè)備特性不足等制約因素,但人工智能的發(fā)展必將引發(fā)再一次網(wǎng)絡(luò)運維的變革。
開放架構(gòu)設(shè)備催生數(shù)據(jù)中心新的產(chǎn)業(yè)生態(tài)
數(shù)據(jù)中心開放式的架構(gòu)給白盒交換機(jī)提供了發(fā)展良機(jī),白盒交換機(jī)與傳統(tǒng)交換機(jī)的區(qū)別在于:白盒交換機(jī)采用開放的體系架構(gòu),可實現(xiàn)硬件與軟件的解耦,需要部署一套集中的網(wǎng)絡(luò)操作系統(tǒng)。
目前SONIC操作系統(tǒng)逐漸成為白盒交換機(jī)的事實標(biāo)準(zhǔn),SONIC通過SAI層,將交換機(jī)進(jìn)行接口抽象設(shè)計,向上提供統(tǒng)一的API接口,向下對接不同ASIC芯片,徹底解決了上層軟件需適配不同ASIC芯片的問題。此外,芯片層面也不斷開放,通過可編程接口來自定義芯片對于數(shù)據(jù)包的處理邏輯,實現(xiàn)按需添加新功能、新協(xié)議或者對原有協(xié)議進(jìn)行優(yōu)化等能力,極大提升了靈活性。
隨著白盒交換機(jī)生態(tài)系統(tǒng)的發(fā)展,硬件、網(wǎng)絡(luò)操作系統(tǒng)以及協(xié)議軟件等逐步成熟,越來越多的客戶投入到白盒交換機(jī)的研發(fā)和使用中,尤其在互聯(lián)網(wǎng)行業(yè),基于開放架構(gòu)的白盒交換機(jī)已經(jīng)在大型互聯(lián)網(wǎng)公司的云數(shù)據(jù)中心規(guī)模部署。隨著業(yè)務(wù)的精細(xì)化發(fā)展,對網(wǎng)絡(luò)的定制化的需求越來越多,自主可控的開源設(shè)備將會發(fā)揮出更大的作用。