去年11月,美國能源局宣布了全新超級計算機發(fā)展計劃,其中一項重要的內(nèi)容就是面向未來百億億次計算能力而進軍。在之前披露的消息中,并沒有提及這些計算機的具體信息,只是談到了將采用來自IBM和NVIDIA全新的技術(shù)加速運算。不過在近日,我們有幸采訪到了NVIDIA 解決方案工程架構(gòu)副總裁 Marc Hamilton和NVIDIA 副總裁及PSG&云計算業(yè)務(wù)總經(jīng)理 Ashok Pandey,他們將具體介紹未來超級計算機的形態(tài)和發(fā)展方向。
▲NVIDIA 解決方案工程架構(gòu)副總裁 Marc Hamilton
事實上,多年來NVIDIA一直在超級計算機領(lǐng)域處于領(lǐng)先地位,特別是它所提出的異構(gòu)計算模式已經(jīng)成為當下主流應(yīng)用,曾獲得2012年TOP500冠軍、目前美國最快的超級計算機泰坦Titan就采用了NVIDIA提供的異構(gòu)計算解決方案。這次,NVIDIA更是為美國能源局提供了最新的Tesla GPU和最先進的NVLink技術(shù),幫助能源局實現(xiàn)更快的計算速度。
據(jù)Marc Hamilton介紹,目前美國能源局正在打造兩款名為“高峰”和“峰巒”的超級計算機,它們均采用了IBM POWER9處理器和NVIDIA Volta GPU。在談到為何選擇這樣的組合模式時,Marc認為這是IBM與NVIDIA攜手合作的解決方案更能夠滿足客戶的需求,在最初提案的時候美國能源局并沒有提供具體的配置要求,只是根據(jù)實際的運行情況設(shè)計了25個微型APP程序,用以模擬不同配置情況下的方案優(yōu)劣。而提到這次中標的優(yōu)勢,Marc更是將其歸功于NVLink技術(shù)。
這個名詞許多人并不陌生,因為早在今年3月的GTC大會上,我們就曾經(jīng)詳細的報道過這種技術(shù)的優(yōu)勢。一直以來,GPU和CPU間的數(shù)據(jù)傳輸速度都是一項技術(shù)瓶頸,因為GPU的顯存能夠快速而少量的讀寫數(shù)據(jù),而CPU使用內(nèi)存讀寫則大量而慢速,因此,CPU的傳輸帶寬大于GPU。NVLink通過調(diào)整相應(yīng)架構(gòu),使得GPU和CPU間的傳輸速度獲得巨大的提升。來自NVIDIA官方數(shù)據(jù)顯示,NVLink可以讓GPU與CPU之間共享數(shù)據(jù)的速度能夠比當今速度快5-12倍。
Marc同樣提到了一個非常重要的問題——OPENPOWER基金會。這是IBM聯(lián)合NVIDIA、Google、Mellanox等公司于2013年成立的全新組織,這是一個基于POWER微處理器架構(gòu)的開放式研發(fā)群體,最新數(shù)據(jù)顯示其成員已經(jīng)達到了80家。NVLink可以看作是這一基金會成立之后的重要成果,特別是美國能源局的采用使得這項技術(shù)得以徹底“落地”。除此之外,許多客戶也對NVLink保持了濃厚的興趣,只是NVIDIA迫于商業(yè)原則不能公布他們的名字。“隨著時間的推移,2015年大家會看到有一些新的系統(tǒng)和項目的發(fā)布”,Marc如是說。
當然,NVLink的應(yīng)用領(lǐng)域不僅僅局限于POWER平臺中,Pandey作為PSG業(yè)務(wù)中國區(qū)負責人,更為我們描繪了這項技術(shù)的廣闊應(yīng)用前景。如今中國政府尤其重視自主可控的軟硬件設(shè)備,包括龍芯、神威等許多國產(chǎn)處理器也已經(jīng)應(yīng)用在高性能計算領(lǐng)域中。Pandey表示,未來NVLink將能夠?qū)崿F(xiàn)對于龍芯、神威等處理器的支持,而且在2016年我們或許可以看到對于ARM處理器的支持。
如果你使用的并不是上面我們提到的任何一款處理器,您依然能夠使用NVLink技術(shù)。除了GPU與CPU的傳輸之外,GPU之間的數(shù)據(jù)傳輸也是我們經(jīng)常需要遇到的問題。NVLink同樣可以在這些應(yīng)用中發(fā)揮作用,讓你的高性能服務(wù)器更快的運轉(zhuǎn)起來。
▲NVIDIA 副總裁及PSG&云計算業(yè)務(wù)總經(jīng)理 Ashok Pandey
作為一款軟件技術(shù),NVLink的好處還在于,你甚至不需要學習就可以免費應(yīng)用這款技術(shù);當然如果你能夠根據(jù)業(yè)務(wù)模型進行優(yōu)化的話,也將會獲得更好的性能。而對于中國市場,NVIDIA也有著自己的打算。按照Pandey的想法,NVIDIA在中國最重要的戰(zhàn)略分為三個層面:
首先是應(yīng)用及技術(shù)來帶動。高性能計算的發(fā)展越來越與實際的應(yīng)用相結(jié)合,一方面科學計算、分子動力學等傳統(tǒng)計算領(lǐng)域還是NVIDIA的應(yīng)用基礎(chǔ),而另一方面深度學習正在成為廣大互聯(lián)網(wǎng)客戶應(yīng)用的主流。從國外的谷歌大腦到中國的訊飛超腦,深度學習正在逐步影響著互聯(lián)網(wǎng)應(yīng)用,進而影響大眾的生活。因此從這個層面來說,NVIDIA除了將會宣傳NVLink技術(shù),在合作伙伴及用戶中推廣這個技術(shù)之外,更會結(jié)合OPENPOWER基金會的力量,在POWER平臺及ARM平臺上進一步發(fā)力。
其次是扎根中國,與中國的合作伙伴一起成長。在過去的今年,NVIDIA與包括浪潮、曙光、華為在內(nèi)的本地合作伙伴建立的良好的關(guān)系并一起成長。未來NVIDIA還將繼續(xù)保持這部分內(nèi)容,并且將會吸納更多的合伙伙伴加入其中,比如聯(lián)想。
第三,Pandey重新強調(diào)了“NVIDIA是一家平臺公司”的概念。他表示:“轉(zhuǎn)入到平臺公司的時候,軟件+服務(wù)是非常非常重要的,我們現(xiàn)在也是積極的把我們軟件,我們CUDA的企業(yè)服務(wù),也帶入到中國”。
記得在2014年3月的GTC大會上,聽到NVIDIA聯(lián)合創(chuàng)始人兼首席執(zhí)行官黃仁勛宣布NVLink將在2016年正式推出的時候,我還感覺這個時間很遙遠。但是現(xiàn)在看來,迫不及待的用戶需求推動了技術(shù)的不斷前進與發(fā)展,同時NVIDIA的轉(zhuǎn)型也使得它不僅能夠在HPC領(lǐng)域,包括云計算、大數(shù)據(jù)等多個新興領(lǐng)域中發(fā)揮越來越關(guān)鍵的作用。