近年來,中國超算在全球范圍內(nèi)的影響力已今非昔比。20多年前,中國技術(shù)人員操作超級計(jì)算機(jī)需要在“玻璃房子”中進(jìn)行,如今中國已經(jīng)連續(xù)多年占據(jù)全球計(jì)算速度最快超算第一位。
“超算在應(yīng)用層面的滯后是我們長期以來的一個(gè)痛點(diǎn)。”10月18日,2018年全國高性能計(jì)算學(xué)術(shù)年會(HPC 2018)在青島召開,中國工程院院士、浪潮集團(tuán)首席科學(xué)家王恩東在會上做主題演講時(shí)說,近20年來,我國的高性能計(jì)算機(jī)不斷地在“打榜”,為了能夠在性能指標(biāo)上成為世界第一做了大量的研究性工作,然而在怎么用好超算的命題上,中國還有不少短板亟待彌補(bǔ)。
今年6月,由IBM公司研制、部署在美國能源部下屬橡樹嶺國家實(shí)驗(yàn)室的“Summit”超級計(jì)算機(jī),以浮點(diǎn)運(yùn)算速度峰值超過200PFlops的性能,超過中國“神威·太湖之光”成為新晉世界第一。不過,記者觀察到,中國超算業(yè)界對此并不感到驚訝,反而是,在中國“霸榜”多年之后,越來越意識到超算終要回歸應(yīng)用這一命題。
“我想不僅僅是(依靠國家力量)做了幾臺機(jī)器,實(shí)際上在一些國內(nèi)的高性能超算中心的建設(shè)方面,我們也是在不斷地追逐新的性能指標(biāo)。”王恩東說,我國在高性能計(jì)算方面發(fā)展勢頭和氛圍都非常好,但“高性能計(jì)算發(fā)展的性能指標(biāo)跟應(yīng)用的關(guān)系”等問題“需要我們認(rèn)真思考”。
“硬件先行”該告一段落了
王恩東介紹說,一般而言,美國或歐洲的一些超算中心,都是基于應(yīng)用來建設(shè)的。而反觀我們,“很多時(shí)候是先建超算中心再找應(yīng)用。我想說這個(gè)階段是否可以告一個(gè)段落了?”
歐美國家對諸如超級計(jì)算機(jī)這種大型裝置的使用率向來十分重視。中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心總工程師閻保平告訴《中國科學(xué)報(bào)》記者,數(shù)年前她曾前往美國幾家國家級超算中心訪問,令她印象最為深刻的是,這些超算中心最大的一支隊(duì)伍不在運(yùn)維部門,而是為超算用戶提供技術(shù)的部門——那里匯集了計(jì)算專家和各領(lǐng)域的科學(xué)家。她認(rèn)為,這種“混搭型”結(jié)構(gòu)是美國超算應(yīng)用水平居世界前列的重要原因。
“超算還是要面向應(yīng)用的。”王恩東在會上說,當(dāng)下我們應(yīng)當(dāng)以應(yīng)用為引導(dǎo),以滿足應(yīng)用、引領(lǐng)應(yīng)用來發(fā)展中國的高性能計(jì)算產(chǎn)業(yè)、技術(shù)和學(xué)術(shù)。
中國國家高性能計(jì)算機(jī)工程技術(shù)研究中心副主任何鐵寧認(rèn)為,美國之所以在“軟件推動(dòng)硬件”方面做得比中國好,深層次原因在于美國在基礎(chǔ)工業(yè)軟件、基礎(chǔ)科研方面的應(yīng)用軟件比中國豐富得多,這導(dǎo)致中國不得不反過來“以硬促軟”。不過他也認(rèn)為,“軟件的事情要馬上著手做”。
中國超算須構(gòu)建應(yīng)用生態(tài)
近年來,中國超算在全球范圍內(nèi)的影響力已今非昔比。20多年前,中國技術(shù)人員操作超級計(jì)算機(jī)需要在“玻璃房子”中進(jìn)行,如今中國已經(jīng)連續(xù)多年占據(jù)全球計(jì)算速度最快超算第一位(今年6月被美國再次反超);在應(yīng)用方面,中國超算應(yīng)用團(tuán)隊(duì)也在2016年、2017年連續(xù)2年獲得超算應(yīng)用領(lǐng)域最高獎(jiǎng)“戈登貝爾獎(jiǎng)”。并且,中國也在部署下一代超算——E級超級計(jì)算機(jī),國家“十三五”高性能計(jì)算專項(xiàng)課題部署的3個(gè)E級超算的原型機(jī)系統(tǒng)——神威E級原型機(jī)、“天河三號”E級原型機(jī)、曙光E級原型機(jī),目前已全部實(shí)現(xiàn)交付。
無怪乎日本東京工業(yè)大學(xué)教授松崗聰早在2016年曾說:“中國已經(jīng)正式成為了高性能計(jì)算機(jī)領(lǐng)域的世界領(lǐng)導(dǎo)者之一。”
然而,如果我們向上看,與真正的超算強(qiáng)國美國相比,仍存在很多不盡如人意之處。比如,在HPC 2018會議上公布的中國超算性能Top100排行榜中,雖然第一次出現(xiàn)所有入圍高性能設(shè)備均為國產(chǎn),但多數(shù)核心計(jì)算架構(gòu)(主處理器和加速器)仍為“Intel CPU+NVIDIA GPU”或“Intel CPU+ Intel Phi”。
“今天中國超級計(jì)算機(jī)或多或少存在這樣的情況,就是我們在國際上的地位很高,但回頭照照鏡子,我們在應(yīng)用領(lǐng)域里還存在相當(dāng)大的短板。”中科曙光總裁歷軍在近日召開的“高性能計(jì)算應(yīng)用研討會”上說,“未來我們可能還需要再花5~10年的時(shí)間,在應(yīng)用水平、應(yīng)用廣度方面跟國際發(fā)達(dá)國家縮小差距,補(bǔ)上這個(gè)短板。”
如何補(bǔ)齊這些短板?歷軍認(rèn)為,一條必由之路是基于中國自主的核心計(jì)算架構(gòu),構(gòu)建超算研制與應(yīng)用生態(tài)。
中科曙光是國內(nèi)高性能計(jì)算領(lǐng)域領(lǐng)軍企業(yè),在上述中國超算Top100排行榜中,曙光公司以40臺系統(tǒng)入圍榜單,位列該榜單廠商份額第一位。由曙光負(fù)責(zé)研制的E級原型機(jī)系統(tǒng),探索了基于國產(chǎn)CPU和加速芯片架構(gòu)的系統(tǒng)研制。
“我們希望與大學(xué)、研究所建立更緊密的合作關(guān)系,安排經(jīng)費(fèi)、資源、人員來共同營造基于國產(chǎn)核心技術(shù)的應(yīng)用生態(tài)。”歷軍說,在曙光看來,只有用好了,高性能計(jì)算機(jī)的研制才真的好了,“彼此相輔相成”。
挖掘高性能計(jì)算新的應(yīng)用領(lǐng)域
目前,超算的應(yīng)用場所主要仍在高校、科研院所,企業(yè)所用超算極少,而應(yīng)用領(lǐng)域也多分布在傳統(tǒng)的科學(xué)大數(shù)據(jù)分析、工程計(jì)算等方面,“用好超算”在社會各界還是個(gè)新命題——這距離HPC 2018大會主題“HPC+一切皆可計(jì)算”的愿景相去甚遠(yuǎn)。
“計(jì)算發(fā)展很快,數(shù)字產(chǎn)業(yè)化,云物移大智,我們所處的信息社會、智能社會,它的支撐就是計(jì)算。”王恩東說,當(dāng)下,結(jié)合新的發(fā)展需求,業(yè)界要去思考:高性能計(jì)算新的應(yīng)用領(lǐng)域在哪?
他舉例說,當(dāng)前云計(jì)算發(fā)展態(tài)勢迅猛,但云計(jì)算不等于高性能計(jì)算;人工智能計(jì)算(AI)也在快速發(fā)展,且高性能計(jì)算能夠?yàn)锳I提供一些支撐,但AI計(jì)算也不是高性能計(jì)算。
他認(rèn)為,中國高性能計(jì)算產(chǎn)業(yè)“相比國外也是落后的”。這源于中國在發(fā)展高性能計(jì)算之初就是“研究和產(chǎn)業(yè)兩條線”。“西方國家是山峰就在山脈里面,我們的山峰是在海洋里面的。”王恩東說,“單純依靠國家財(cái)政支出去支撐一兩臺峰值計(jì)算機(jī),對中國超算持續(xù)健康發(fā)展可能是不利的。”
閻保平認(rèn)為,十幾年前我國高性能計(jì)算機(jī)硬件落后,經(jīng)國家推動(dòng)后掘起了;現(xiàn)在是應(yīng)用軟件落后,“指揮棒”應(yīng)該往應(yīng)用這邊偏了。“在部署高性能計(jì)算機(jī)研制的時(shí)候,國家對應(yīng)用軟件、算法的部署應(yīng)一并跟上,而且要側(cè)重做一些突破性的投入和研發(fā)。超算硬件、軟件是一體化的,這樣才能提高國家高性能計(jì)算的整體實(shí)力。”