InfiniBand明年將從100 Gbps走向200 Gbps。記者日前采訪了Mellanox營銷副總總裁Gilad Shainer。
Shainer表示,Mellanox將自下而上提供200 Gbps HDR InfiniBand規(guī)范產(chǎn)品,包括開關(guān)、芯片、網(wǎng)卡和相應(yīng)的網(wǎng)線。
即將上市的Quantum開關(guān)設(shè)備支持40端口200 Gbps HDR InfiniBand,或80端口100 Gbps,將以模塊化開關(guān)的形式提供,可以擴展到200 Gbps速度的800個端口或100 Gbps 速度的1600個端口。切換延遲為90 ns,總?cè)萘窟_(dá)16 Tbps。
200 Gbps的ConnectX適配器設(shè)備的延遲為0.6微秒,支持第三代、第四代PCIe,包括Mellanox多主機支持(如果不需要200 Gbps,則可將分適配器分割給多個主機使用)。
假如有人覺得此類速度翻倍的游戲沒有什么意思,Mellanox也一直在推動利用開關(guān)減少CPU的負(fù)載的工作,這一點興許會更有意思。
Shainer表示,現(xiàn)在業(yè)界需要“在各種地方分析數(shù)據(jù),特別是在遷移數(shù)據(jù)的時候。InfiniBand HDR設(shè)備著眼于高性能計算環(huán)境,并將擴大網(wǎng)絡(luò)計算和自適應(yīng)路由功能,二者在運行上一代100 Gbps的環(huán)境里都頗為有用。”
Shainer稱,卸載處理器方面的工作多年前以RDMA(遠(yuǎn)程直接內(nèi)存訪問)起步,即是說數(shù)據(jù)遷移用到的CPU時間不到1%。這在Quantum和ConnectX里得以擴展。
他表示,“Quantum開關(guān)的功能包括執(zhí)行數(shù)據(jù)整合和削減協(xié)議,以減少CPU的負(fù)載。”他還表示,機器學(xué)習(xí)訓(xùn)練算法用到相同的基本概念。
ConnectX適配器也提供網(wǎng)絡(luò)內(nèi)存儲、加密和其他安全方面的卸載功能。超級計算環(huán)境中的消息傳遞接口(MPI)也屬于ConnectX卸載功能的一部分,MPI利用集總和匹配減少CPU的負(fù)載。Shainer表示,ConnectX的卸載功能可以將“60%至70%的MPI工作負(fù)載卸載到網(wǎng)絡(luò)里……有朝一日,整個MPI框架將會遷移到網(wǎng)絡(luò)里”。
他表示,存儲卸載也是卸載功能的一部分,原因是檢查點的設(shè)置(將應(yīng)用程序的狀態(tài)保存為返回點以備崩潰是用)目前是CPU負(fù)載的一部分。Shainer表示,“如果運行的節(jié)點達(dá)數(shù)千個,而又不想重新啟動應(yīng)用程序,那么這一點就十分關(guān)鍵。”
檢查點的設(shè)置需要CPU時間,而HPC管理員不愿意在這些事務(wù)管理上消耗資源,因此ConnectX可以做背景檢查點的設(shè)置。
適配器加密卸載為磁盤加密添加一個有意思的功能。如果用了全盤加密,那么數(shù)據(jù)保護涉及的不是單個用戶。據(jù)Shainer介紹,“但如果是在網(wǎng)絡(luò)上,不同的用戶在網(wǎng)絡(luò)上可以使用不同的密鑰或不同的應(yīng)用程序。”
Quantum和ConnectX還添加了遙測功能,內(nèi)置的硬件傳感器可以提供實時數(shù)據(jù)收集。
200 Gbps的配件包括HDR銅電纜和拆分器(用于3米內(nèi)的機架鏈接)、主動硅光光學(xué)電纜(用于100米以內(nèi)的數(shù)據(jù)中心鏈接)和光收發(fā)器(2000米以內(nèi)的鏈接)。
新產(chǎn)品將于2017年應(yīng)市。