谷歌WAN鏈路利用率100%背后技術(shù)
作為軟件定義網(wǎng)絡(luò)和OpenFlow早期支持者,谷歌在近日舉行的開放網(wǎng)絡(luò)峰會(Open Networking Summit)上分享了他們?nèi)绾问褂眠@種技術(shù)通過10G網(wǎng)絡(luò)鏈接分布在全球各地的12個數(shù)據(jù)中心。記者采訪了谷歌首席工程師Amin Vahdat來了解更多信息。
谷歌首席工程師Amin Vahdat
為什么你們會選擇OpenFlow?你們試圖解決什么問題呢?
我們對我們的廣域網(wǎng)進(jìn)行了大量投資,而且我們想要更有效地運行廣域網(wǎng)。這里的效率也意味著提高可用性和容錯能力,提高效率的最大的好處是能夠更好地利用我們現(xiàn)有的線路。這個行業(yè)的最好水平就是線路實現(xiàn)30%-40%的利用率,而我們能夠以接近100%的利用率來運行我們的廣域線路,通過周密的流量工程和優(yōu)先次序工作。換句話說,當(dāng)出現(xiàn)故障時,我們可以通過沒有嚴(yán)格傳輸時間限制的彈性流量來保護(hù)高優(yōu)先級流量。我們還可以使用非最短路徑轉(zhuǎn)發(fā)來路由繞過故障鏈路,也是通過全球范圍的網(wǎng)絡(luò)拓?fù)浜蛣討B(tài)地改變通信特征。
標(biāo)準(zhǔn)網(wǎng)絡(luò)協(xié)議試圖根據(jù)本地通信來理解全球網(wǎng)絡(luò)情況。換句話說,每個人將他們對本地網(wǎng)絡(luò)狀態(tài)的觀點廣播給其他人。這意味著如果你想要使用標(biāo)準(zhǔn)協(xié)議來影響任何全球政策,根本不可能。沒有什么中央控制計劃可供你使用。而OpenFlow為我們提供了一個邏輯中央控制計劃,對整個網(wǎng)絡(luò)架構(gòu)擁有全球視野,并且可以根據(jù)全球網(wǎng)絡(luò)狀態(tài)來進(jìn)行計算和確定。
100%的利用率簡直令人難以置信,你們會擔(dān)心災(zāi)難的發(fā)生嗎?
是的,因為我們可以區(qū)分流量。換句話說,我們可以很仔細(xì)地確保,當(dāng)發(fā)生災(zāi)難時,受到影響的是相對不太重要的流量。
對網(wǎng)絡(luò)的控制完全從路由硬件刪除,并轉(zhuǎn)移到服務(wù)器嗎?
你用了一個很有趣的詞:完全。我們會有一些控制留在主設(shè)備上,但是為了更簡單化,我們會將其完全清除。我們將網(wǎng)絡(luò)控制從單個交換機(jī)中的嵌入處理器(這些嵌入處理器通常比較舊)轉(zhuǎn)移到服務(wù)器(可能是最新版本,例如多核處理器)。所以提高十倍性能是很容易的事情,十倍以上的性能提升也不是難事。
我知道你們?yōu)榱诉@個網(wǎng)絡(luò)制造了自己的設(shè)備?
我們制造了自己的網(wǎng)絡(luò)設(shè)備,因為當(dāng)我們在兩年前開始這個項目時,市面上并沒有支持OpenFlow的設(shè)備。
你取代了現(xiàn)有的設(shè)備嗎?
當(dāng)時,我們建立的是一個新網(wǎng)絡(luò),所以我們沒有移除任何設(shè)備,只是隨著時間的推移,我們意識到現(xiàn)在有必要更換設(shè)備了。
你們會繼續(xù)使用自己制造的設(shè)備還是選擇其他公司推出的OpenFlow工具?
我們的立場是這樣的:如果市面上出現(xiàn)的交換機(jī)產(chǎn)品能夠提供我們需要的功能,我們會很樂意選擇這樣的產(chǎn)品。
交換機(jī)和服務(wù)器存在很明顯的差異嗎?
除了接口外,交換機(jī)和服務(wù)器之間存在很明顯的差異嗎?
這是個很好的問題。我認(rèn)為從指令集和靈活性角度來看,這兩者存在相當(dāng)大的差別,不過,這兩者的相似性越來越多。其中,我認(rèn)為交換領(lǐng)域能夠受益的事情就是可編程性的增加。另外,更多的靈活性能夠讓你使用數(shù)據(jù)包中不同的bit來進(jìn)行不同的工作。目前,有很多初創(chuàng)公司正在這個方向探索。
我知道軟件定義網(wǎng)絡(luò)/OpenFlow的另一個關(guān)鍵好處就是能夠發(fā)展很多“如果”的方案,讓你能夠在真正實現(xiàn)之前對網(wǎng)絡(luò)進(jìn)行微調(diào)。
沒錯。我們擁有的主要優(yōu)勢之一就是一個很好的仿真和模擬環(huán)境,在這個環(huán)境中,與真實環(huán)境完全相同的控制軟件將在同時控制真實交換設(shè)備和模擬交換設(shè)備的服務(wù)器上運行。并且,我們可以模仿很多故障情況,來加快我們的測試工作。
你們會真的注入假的流量?
是的,我們注入了一些假流量。顯然,我們不一定能夠模擬完整的流量規(guī)模。如果你從數(shù)據(jù)中心可能擁有的總體流量的角度來看,可能會比整個WAN流量還要大,我們的WAN流量很大,LAN流量更多。
你們接入這個新網(wǎng)絡(luò),而同時沒有移除舊網(wǎng)絡(luò)。從總數(shù)據(jù)中心內(nèi)負(fù)載的角度來看,你們估計這種新的網(wǎng)絡(luò)會占多少比例?
在我們逐漸轉(zhuǎn)移到新網(wǎng)絡(luò)的兩年多的時間內(nèi),可以說,絕大部分流量現(xiàn)在已經(jīng)在新網(wǎng)絡(luò)中了。
在你們部署時,OpenFlow完全符合你們的要求,還是你們需要進(jìn)行很多臨時調(diào)整?
我們需要進(jìn)行很多臨時調(diào)整。OpenFlow標(biāo)準(zhǔn)化了接口,我認(rèn)為這對于整個行業(yè)都是很重要的。OpenFlow和軟件定義網(wǎng)絡(luò)能夠讓我們分隔硬件和軟件的發(fā)展路徑。換句話說,你可以獲取滿足你需要的硬件,然后將其與滿足需求的軟件相分隔以用于特定部署。硬件和軟件歷來都緊緊地綁定在一起。
所以從OpenFlow標(biāo)準(zhǔn)化的角度來看,硬件可以與各種軟件控制器進(jìn)行互操作是非常非常重要的事情。從我們的角度來看,因為我們自己制造了硬件,所以并不是那么重要。但是我們必須進(jìn)行適當(dāng)調(diào)整,當(dāng)然,隨著OpenFlow標(biāo)準(zhǔn)的演化,我們也需要靈活應(yīng)變。
你們受到什么阻礙嗎?
我認(rèn)為Urs H?lzle(技術(shù)基礎(chǔ)設(shè)施高級副總裁兼谷歌研究員)說得很好,他說OpenFlow部署工作實際上比他預(yù)期的更順利,沒有太多停機(jī)時間。從OpenFlow的角度來看,我們遇到的主要問題是第一個版本不能完全讓你以簡單的方式來利用現(xiàn)代交換機(jī)中的全部硬件功能。這并不是說這不可能,而是說不容易。所以我們需要做一些工作來繞過這些問題。但目前從OpenFlow標(biāo)準(zhǔn)角度來看,這個問題已經(jīng)得到了很大的提高。
OpenFlow完全部署還需要多久時間?
我認(rèn)為還需要幾年時間,我們想要傳達(dá)的信息是OpenFlow非常實用,能夠在各種設(shè)置中提供實實在在的好處。
鑒于OpenFlow有這么多好處,你認(rèn)為會有很多服務(wù)供應(yīng)商轉(zhuǎn)移到OpenFlow嗎?
我們當(dāng)然希望如此。我們從大型服務(wù)供應(yīng)商那里聽到的說法是,他們認(rèn)為OpenFlow很難擴(kuò)展和賺錢。我們已經(jīng)向大家展示了OpenFlow如何讓你的網(wǎng)絡(luò)變得更加更加有效。
谷歌網(wǎng)絡(luò)接下來的計劃是什么
你們已經(jīng)花了幾年時間在這上面,你們接下來的計劃是什么?
整個行業(yè)才剛剛起步。我認(rèn)為從現(xiàn)在開始的五年時間內(nèi),我們將會取得一些成就。我們現(xiàn)在可以比以前更迅速地添加新功能,例如,我們最開始為管理流量加入了優(yōu)化算法,而現(xiàn)在我們可以部署整個系列的新的更高級的優(yōu)化技術(shù)。但在技術(shù)層面,我們需要加強(qiáng)控制回路。目前,測量、反應(yīng)和重新編程的時間是軟件定義網(wǎng)絡(luò)面臨的主要挑戰(zhàn),因為很多這些軟件和硬件組件并不是為了一個嚴(yán)格控制回路而設(shè)計的。所以我們需要解決這個問題。
你們的網(wǎng)絡(luò)是從單個NOC來控制的嗎?
沒有,為了容錯目的,網(wǎng)絡(luò)控制進(jìn)行了復(fù)制和分布。從社區(qū)的角度以及我們自己的角度來看,在軟件定義網(wǎng)絡(luò)樣板中提供合適的軟件架構(gòu),復(fù)制的分布式控制是根本要素。在未來幾年內(nèi),以可重復(fù)的方式進(jìn)行網(wǎng)絡(luò)控制是一個非常重要的挑戰(zhàn)。
那么,還有什么我們沒有問道而你認(rèn)為重要的事情?
我想說的重點是互聯(lián)網(wǎng)已經(jīng)非常成功,如果沒有充分的分散控制和操作,互聯(lián)網(wǎng)無法取得今天的成功,為了發(fā)展到下一個新水平,互聯(lián)網(wǎng)需要邏輯中央控制。換句話說,邏輯中央控制將從根本上提高互聯(lián)網(wǎng)的效率。