為了給用戶提供高質(zhì)量的云服務(wù),許多大型互聯(lián)網(wǎng)企業(yè),如微軟、谷歌、亞馬遜和阿里巴巴等,在全球修建了許多數(shù)據(jù)中心。在數(shù)據(jù)中心內(nèi)部,數(shù)以萬(wàn)計(jì)的服務(wù)器通過(guò)高帶寬(10-100 Gbps)低時(shí)延(0-100 us)的數(shù)據(jù)中心網(wǎng)絡(luò)(Data Center Network,DCN)相連。數(shù)據(jù)中心內(nèi)運(yùn)行著很多對(duì)延遲敏感的實(shí)時(shí)應(yīng)用,比如電商零售、搜索、社交網(wǎng)絡(luò)等。這些實(shí)時(shí)應(yīng)用的用戶請(qǐng)求需要盡快得到響應(yīng),而較高的響應(yīng)延遲將嚴(yán)重影響用戶體驗(yàn),降低公司的運(yùn)營(yíng)收入。
數(shù)據(jù)中心網(wǎng)絡(luò)流量以其突發(fā)性著稱,當(dāng)流量瞬間爆發(fā)時(shí),極易在流量接收端產(chǎn)生擁塞(端點(diǎn)擁塞)。不恰當(dāng)?shù)穆酚梢矔?huì)導(dǎo)致網(wǎng)絡(luò)內(nèi)部流量不均衡,從而產(chǎn)生內(nèi)部擁塞(鏈路擁塞)。網(wǎng)絡(luò)擁塞般可以通過(guò)負(fù)載均衡機(jī)制來(lái)解決。一旦發(fā)生擁塞,流量的網(wǎng)絡(luò)延遲和吞吐量都會(huì)受到影響,從而造成較長(zhǎng)的應(yīng)用響應(yīng)時(shí)延和更差的用戶體驗(yàn)。傳統(tǒng)數(shù)據(jù)中心的內(nèi)部網(wǎng)絡(luò)是有損網(wǎng)絡(luò)(lossy network),網(wǎng)絡(luò)發(fā)生嚴(yán)重?fù)砣麜r(shí)交換機(jī)可以直接丟棄數(shù)據(jù)包。由于數(shù)據(jù)中心交換機(jī)的緩沖區(qū)較小,加之?dāng)?shù)據(jù)中心流量的突發(fā)性特點(diǎn),擁塞丟包在數(shù)據(jù)中心十分常見(jiàn)。丟包的后果會(huì)造成較高的重傳時(shí)延,從而影響實(shí)時(shí)應(yīng)用的性能。學(xué)術(shù)界與工業(yè)界都十分關(guān)注傳統(tǒng)有損數(shù)據(jù)中心網(wǎng)絡(luò)的擁塞問(wèn)題,采取了一系列擁塞控制機(jī)制,以降低網(wǎng)絡(luò)中的排隊(duì)和擁塞丟包問(wèn)題。即便如此,這些機(jī)制也很難完全避免擁塞丟包。著名的DCTCP協(xié)議在網(wǎng)絡(luò)擁塞并不嚴(yán)重時(shí)可以有效控制交換機(jī)隊(duì)列長(zhǎng)度,但是當(dāng)出現(xiàn)大量并發(fā)連接時(shí),DCTCP仍難以避免交換機(jī)緩沖區(qū)的溢出。為了徹底解決擁塞丟包問(wèn)題,許多公司已經(jīng)嘗試在數(shù)據(jù)中心部署無(wú)損網(wǎng)絡(luò)(lossless network)。