英特爾集中了旗下所有內(nèi)部和外部可匯合的網(wǎng)絡(luò)專業(yè)人員,打造出一款坊間人士認(rèn)為是多代互連結(jié)構(gòu),可擴(kuò)展到任何規(guī)模的數(shù)據(jù)中心或超級(jí)計(jì)算機(jī)陣列里。該結(jié)構(gòu)名為全路徑架構(gòu)(OPA),是在8月26的IEEE2015年度熱互連研討會(huì)(美國(guó)加利福尼亞州圣克拉拉市)上宣布的,OPA是一個(gè)開(kāi)放源代碼架構(gòu),專攻高性能計(jì)算(HPC )和服務(wù)器。
OPA不僅可以是使每條鏈路的速度達(dá)到每秒100千兆比特,而且設(shè)有全程內(nèi)置糾錯(cuò)碼(ECC),可提高鏈路層次上的可靠性。OPA內(nèi)置高質(zhì)量的服務(wù)質(zhì)量(QoS)機(jī)制,允許優(yōu)先級(jí)數(shù)據(jù)包搶先,以確保高級(jí)別的優(yōu)先級(jí)數(shù)據(jù)包的傳送在短時(shí)延內(nèi)完成,而同時(shí)又確保在帶寬公平性的原則下傳送正常的數(shù)據(jù)包。其主機(jī)光纖接口(HFI)每秒可以處理1.6億個(gè)消息,交換延遲低于110納秒。英特爾表示,各方面的改進(jìn)仍然保持了與現(xiàn)有軟件生態(tài)系統(tǒng)的兼容性,并且還允許應(yīng)用程序接口(API)下的用戶層次的創(chuàng)新。
市場(chǎng)營(yíng)銷和產(chǎn)業(yè)發(fā)展主任Hugo Salem告訴記者,“每一個(gè)組件(從交換到電纜)都是由英特爾設(shè)計(jì)的,整合了英特爾自己的知識(shí)產(chǎn)權(quán)或是收購(gòu)的知識(shí)產(chǎn)權(quán),我們現(xiàn)在擁有一個(gè)靈活的終端到端到端連接結(jié)構(gòu)藍(lán)圖,包括小集群和內(nèi)部部署云。”
英特爾采用的新全路徑架構(gòu)(OPA),其可擴(kuò)展性設(shè)計(jì)適用于商業(yè)數(shù)據(jù)中心和超級(jí)計(jì)算機(jī)
據(jù)Salem介紹,每個(gè)開(kāi)關(guān)可處理48個(gè)每秒100千兆比特的信道,其可行性已經(jīng)在原始設(shè)備制造商(OEM)設(shè)計(jì)中得到證明,有些OEM用到超過(guò)100000個(gè)或節(jié)點(diǎn),而且這個(gè)數(shù)字還在增大。
全方位路徑架構(gòu)首席系統(tǒng)架構(gòu)師Phil Murphy告訴記者,OPA的結(jié)構(gòu)設(shè)計(jì)“比其他HPC結(jié)構(gòu)便宜25%至40%,同時(shí)還為Infiniband提供了另一個(gè)優(yōu)勢(shì),OPA可服務(wù)于數(shù)據(jù)中心,并不需要被塞到HPC環(huán)境里”。
Murphy稱,英特爾已經(jīng)在著手研究第二代OPA,會(huì)將主機(jī)功能整合到CPU里,并將受益于專門為HPC重新設(shè)計(jì)的協(xié)議。
第二代的目標(biāo)是要在毛性能和密度方面尋取價(jià)值,無(wú)需適配卡,每塊板上的的組件更少。第一代則是將Xeon Phi與多芯片封裝主機(jī)結(jié)構(gòu)(在第二代里將被整合成單個(gè)芯片)整合到一起。
Murphy告訴記者,“OPA將利用目前Infiniband用的API支持開(kāi)放整合,無(wú)需重寫(xiě)代碼,除非你想加速。”
Intel的 OPA還支持名為開(kāi)放式光纖接口(Open Fabric Interface)的開(kāi)源項(xiàng)目,可以很容易地?cái)U(kuò)展到數(shù)千個(gè)甚至數(shù)萬(wàn)個(gè)節(jié)點(diǎn)。
Murphy表示,“最大的區(qū)別是開(kāi)源——那些與結(jié)構(gòu)相關(guān)的工具,它們可以如大海撈針般地解決性能提高方面的問(wèn)題。”
OPA結(jié)構(gòu)的架構(gòu)還引入了一個(gè)全新的1.5 I/O 傳輸層(1.5 I/O transport layer),1.5 I/O 傳輸層是英特爾收購(gòu)Cray公司獲得的技術(shù),其獲得可擴(kuò)展性和提高性能的方法是通過(guò)優(yōu)化數(shù)據(jù)包大小、但用了第二層,第二層利用16 個(gè)浮動(dòng)控制數(shù)字(FLIT)和一個(gè)附加的用于糾錯(cuò)的14比特拆開(kāi)FLIT[65位]。
Murphy表示,“另外還有一個(gè)新技術(shù),名叫雜混(Scrambling),雜混的目的是加快結(jié)構(gòu)的時(shí)鐘頻率,以精確地補(bǔ)償CRC [循環(huán)冗余校驗(yàn)] 所需的數(shù)量,保持與Infiniband相同的誤差率,即10的負(fù)12次方。”
利用將數(shù)據(jù)包拆成FLIT的方法,英特爾可以將高優(yōu)先級(jí)的數(shù)據(jù)包置于低優(yōu)先級(jí)的數(shù)據(jù)包之中,通過(guò)交織FLIT,可處理高達(dá)32個(gè)數(shù)據(jù)流,全部都可以在同一時(shí)間看到數(shù)據(jù)包。