英偉達(dá)Tesla P100超級(jí)計(jì)算機(jī)組件全面登陸PCIe總線

責(zé)任編輯:editor007

作者:畢波

2016-06-21 19:50:02

摘自:ZD至頂網(wǎng)

每塊P100包含4個(gè)每秒40 GB英偉達(dá)NVLink端口,分部接入GPU集群。目前PCIe P100分為兩種型號(hào):其一HBM2堆棧內(nèi)存為16 GB且內(nèi)存?zhèn)鬏攷挒槊棵?20 GB;其二成本更為低廉,HBM2內(nèi)存為12 GB且內(nèi)存?zhèn)鬏攷挒槊棵?40 GB。

英偉達(dá)Tesla P100超級(jí)計(jì)算機(jī)組件全面登陸PCIe總線

  PCIe接入形式的英偉達(dá)P100

英偉達(dá)公司已經(jīng)推出了其Tesla P100加速芯片,采用PCIe卡形式且可接入標(biāo)準(zhǔn)服務(wù)器節(jié)點(diǎn)以支持人工智能與超級(jí)計(jì)算機(jī)級(jí)別的工作負(fù)載處理工作。

P100公布于今年4月在加利福尼亞州召開(kāi)的英偉達(dá)GPU技術(shù)大會(huì)上:這款16納米FinFET圖形處理器在一塊600平方毫米晶片上容納有150億個(gè)晶體管。其設(shè)計(jì)目標(biāo)在于每秒實(shí)現(xiàn)萬(wàn)億級(jí)別計(jì)算,適用軟件包括神經(jīng)網(wǎng)絡(luò)訓(xùn)練以及天氣與粒子模擬。這款GPU采用英偉達(dá)的Pascal架構(gòu),能夠?qū)崿F(xiàn)CPU與GPU之間的頁(yè)面遷移。

每塊P100包含4個(gè)每秒40 GB英偉達(dá)NVLink端口,分部接入GPU集群。NVLink為英偉達(dá)公司設(shè)計(jì)的高速互連機(jī)制。IBM公司的Power8+與Power9處理器皆支持NVLink,允許主機(jī)的Power CPU核心直接與各GPU相對(duì)接。

這些來(lái)自藍(lán)色巨人的芯片主要服務(wù)于美國(guó)政府所擁有的各超級(jí)計(jì)算機(jī)及其它高負(fù)載設(shè)備。不過(guò)在民用領(lǐng)域,我們普遍使用x86處理器支撐后端工作負(fù)載。

時(shí)至今日,數(shù)據(jù)中心內(nèi)的絕大部分計(jì)算處理器由英特爾公司提供;然而英特爾方面并不支持英偉達(dá)的NVLink,而且似乎也沒(méi)有在這方面做出努力的計(jì)劃。因此,英偉達(dá)方面拿出了自己的解決辦法,即PCIe版本的Tesla P100卡,幫助服務(wù)器構(gòu)建人員將加速處理器同其x86設(shè)備相結(jié)合。這意味著GPU能夠通過(guò)NVLink實(shí)現(xiàn)彼此間的高速通信,同時(shí)經(jīng)由PCIe總線接入主機(jī)CPU。

英偉達(dá)Tesla P100超級(jí)計(jì)算機(jī)組件全面登陸PCIe總線

目前PCIe P100分為兩種型號(hào):其一HBM2堆棧內(nèi)存為16 GB且內(nèi)存?zhèn)鬏攷挒槊棵?20 GB;其二成本更為低廉,HBM2內(nèi)存為12 GB且內(nèi)存?zhèn)鬏攷挒槊棵?40 GB。二者皆采用PCIe gen-3 x 16通道以實(shí)現(xiàn)每秒32 GB傳輸能力。

二者在處理64位雙精度運(yùn)算與32位單精度運(yùn)算時(shí)的持續(xù)性能水平分別為4.7萬(wàn)億次與9.3萬(wàn)億次;16位半精度運(yùn)算則為18.7萬(wàn)億次。這一水平略低于原始P100在雙、單與半精度運(yùn)算中的5.3萬(wàn)億次、10.6萬(wàn)億次與21萬(wàn)億次。原因在于,PCIe卡的性能由于發(fā)熱量的考慮而必須有所犧牲——畢竟我們不希望塞滿了GPU加速節(jié)點(diǎn)的機(jī)架由于全力運(yùn)轉(zhuǎn)而被融化。

另外,NVLink P100的額定功率為300瓦,而其16 GB PCIe表親的功率水平為250瓦,12 GB版本的功耗則更低。

順帶一提,如果大家希望在非NVLink服務(wù)器上使用全速、全功率Tesla P100,其實(shí)也是能夠?qū)崿F(xiàn)的:系統(tǒng)制造商能夠在主機(jī)上添加PCIe gen-3接口,從而實(shí)現(xiàn)額外的性能提升。不過(guò)如果大家只希望使用PCIe,那么目前的低功耗、低性能PCIe選項(xiàng)已經(jīng)非常理想。

“PCIe P100將成為主力系統(tǒng)——即大規(guī)模計(jì)算設(shè)備,”英偉達(dá)公司高級(jí)產(chǎn)品經(jīng)理Roy Kim在接受采訪時(shí)表示。他同時(shí)建議稱,每個(gè)服務(wù)器節(jié)點(diǎn)可以接入4到8塊該P(yáng)CIe卡。

這些PCIe設(shè)備預(yù)計(jì)將在2016年第四季度正式推出,且面向克雷、戴爾、惠普、IBM以及其它英偉達(dá)合作伙伴發(fā)布。其最終定價(jià)將取決于經(jīng)銷商,但根據(jù)我們得到的消息,其價(jià)格會(huì)與目前的英偉達(dá)K80基本持平——后者的售價(jià)約為4000美元。

而在價(jià)值層面,英偉達(dá)方面告訴我們,P100 PCIe卡將在今年晚些時(shí)候作為歐洲各頂級(jí)超級(jí)計(jì)算機(jī)的構(gòu)建組件,其中包括位于瑞士盧加諾國(guó)家超級(jí)計(jì)算中心的Piz Daint。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)