中國的超算在TOP500排行榜中已經(jīng)七連冠,今年問世的神威·太湖之光更是全球首個(gè)浮點(diǎn)性能達(dá)到10億億次的超算,峰值性能可達(dá)12.5億億次,是美國最強(qiáng)超算“泰坦”的7倍多。美國依然是世界超算技術(shù)最強(qiáng)的國家,不過美國頂著萬年老二的感覺估計(jì)也不爽,2017年他們要推出新一代超算Summit(峰會(huì)),使用了IBM Power 9及NVIDIA新一代Volta顯卡,并配備HBM內(nèi)存,浮點(diǎn)性能可達(dá)20億億次,比中國的太湖之光搶強(qiáng)了一倍,明年有望奪回TOP500第一。
美國Summit超級計(jì)算機(jī)將使用IBM處理器、NVIDIA Volta加速卡
IBM、NVIDIA聯(lián)合研發(fā)超算的合同是2年前就定下的了,美國能源部先期投資3.2億美元給IBM、NVIDIA,二者聯(lián)合研發(fā)兩套超算系統(tǒng),一套位于勞倫斯·利弗莫爾國家實(shí)驗(yàn)室,代號Sierra,浮點(diǎn)性能是100 PFLOPS(10億億次),另一套安裝于橡樹嶺國家公園,浮點(diǎn)性能高達(dá)150-300 PTFLOPS(15-30億億次),代號Summit,也就是今天新聞的主角了。
2014年立項(xiàng)時(shí)曝光的Summit超算規(guī)格及性能
Summit超算的最終規(guī)格現(xiàn)在也確認(rèn)了,NextPlatform網(wǎng)站日前曝光了Summit超算的具體配置,如下圖所示:
現(xiàn)在曝光的Summit超算規(guī)格
Summit超算的性能大約是美國目前最強(qiáng)超算Titan的5-10倍,節(jié)點(diǎn)數(shù)量將從18688個(gè)大幅減少到4600個(gè)左右,每節(jié)點(diǎn)性能從1.4 TFLOPS提升到40 TFLOPS以上,每節(jié)點(diǎn)配備512GB DDR4及HBM做內(nèi)存,遠(yuǎn)高于Titan超算的水平。
根據(jù)該網(wǎng)站的爆料,Summit超算的浮點(diǎn)性能超大200 PFLOPS,也就是20億億次,比Titan超算不知高的哪里去了,但功耗卻很低,性能暴漲5-10倍之后系統(tǒng)功耗只是從9MW增加到了13MW,相比之下中國的太湖之光超算功耗是15.4MW。
Summit超算功耗超高的一個(gè)原因就是它使用了異構(gòu)體系,主處理器是IBM的Power 9,14nm24核架構(gòu),而加速卡則是NVIDIA新一代Volta架構(gòu),它最早曝光于2013年,但本來是Maxwell之后的產(chǎn)物,但隨后NVIDIA調(diào)整了路線圖,多了Pascal架構(gòu),Volta順延到2017-2018年。
NVIDIA的Volta架構(gòu)定位于Pascal之后
目前尚無Volta的架構(gòu)細(xì)節(jié),不過Pascal支持的3D顯存——也就是HBM、NVLink、混合精度等技術(shù)肯定都會(huì)用在Volta上,制程工藝很有可能還會(huì)繼續(xù)基于16nm,畢竟TSMC的7nm工藝還要等到2018年之后,進(jìn)度沒這么快。
美國橡樹嶺國家實(shí)驗(yàn)室表示Summit超算會(huì)在2017年問世,根據(jù)進(jìn)度來看下半年的可能性更大,意味著NVIDIA的Volta顯卡最快也會(huì)在明年下半年問世。