編者按
人們?cè)絹?lái)越看好人工智能的前景及其潛在的爆發(fā)力,而能否發(fā)展出具有超高運(yùn)算能力且符合市場(chǎng)的芯片成為人工智能平臺(tái)的關(guān)鍵一役。由此,2016年成為芯片企業(yè)和互聯(lián)網(wǎng)巨頭們?cè)谛酒I(lǐng)域全面展開(kāi)部署的一年。而在這其中,英偉達(dá)保持著絕對(duì)的領(lǐng)先地位。但隨著包括谷歌、臉書(shū)、微軟、亞馬遜以及百度在內(nèi)的巨頭相繼加入決戰(zhàn),人工智能領(lǐng)域未來(lái)的格局如何,仍然待解。
在2016年,所有人都看到了人工智能的前景和其潛在的爆發(fā)力,但不管是AlphaGo還是自動(dòng)駕駛汽車,要想使得任何精妙算法得以實(shí)現(xiàn),其基礎(chǔ)是硬件的運(yùn)算能力:也就是說(shuō),能否發(fā)展出超高運(yùn)算能力又符合市場(chǎng)需求的芯片成為了人工智能平臺(tái)的關(guān)鍵一役。
因此,毫無(wú)疑問(wèn),2016年也成為了芯片企業(yè)和互聯(lián)網(wǎng)巨頭們?cè)谛酒I(lǐng)域全面展開(kāi)部署的一年:先有CPU芯片巨頭因特爾年內(nèi)三次大手筆收購(gòu)人工智能和GPU領(lǐng)域企業(yè);后有谷歌宣布開(kāi)發(fā)自己的處理系統(tǒng),而蘋(píng)果、微軟、臉書(shū)和亞馬遜也都紛紛加入。
而在這其中,領(lǐng)跑者英偉達(dá)(Nvidia)因其在人工智能領(lǐng)域的優(yōu)勢(shì)使其成為了資本市場(chǎng)的絕對(duì)寵兒:在過(guò)去的一年中,曾經(jīng)以游戲芯片見(jiàn)長(zhǎng)的Nvidia股價(jià)從十幾年的穩(wěn)居30美元迅速飆升至120美元。
就當(dāng)資本市場(chǎng)都在猶豫是否人工智能風(fēng)口使得英偉達(dá)股價(jià)虛高時(shí),2月10日,英偉達(dá)發(fā)布2016年第四季度的財(cái)報(bào)顯示,其營(yíng)收同比增長(zhǎng)55%,凈利潤(rùn)達(dá)到了6.55億美元,同比增長(zhǎng)216%。
“正當(dāng)Intel、微軟等巨頭投資人工智能為基礎(chǔ)的芯片技術(shù)時(shí),英偉達(dá)已經(jīng)以Q4財(cái)報(bào)顯示,這家已經(jīng)在人工智能領(lǐng)域投資將近12年的芯片企業(yè)已經(jīng)開(kāi)始就此收獲可觀的盈利。”資深技術(shù)評(píng)論家Therese Poletti在其財(cái)報(bào)發(fā)布后指出。
研究機(jī)構(gòu)Tractica LLC估計(jì),由于深度學(xué)習(xí)項(xiàng)目產(chǎn)生的硬件花費(fèi)將從2015年的4360萬(wàn)美元,上升到2024年的41億美元,而企業(yè)的相關(guān)軟件花費(fèi)將同期從1.09億美元上升到100億美元。
正是這一龐大的市場(chǎng)吸引著谷歌、臉書(shū)、微軟、亞馬遜以及百度在內(nèi)的巨頭相繼宣布企業(yè)向人工智能領(lǐng)域的技術(shù)轉(zhuǎn)向。“在人工智能相關(guān)技術(shù)上,目前英偉達(dá)仍然保持著絕對(duì)的領(lǐng)先,但隨著包括谷歌在內(nèi)的TPU等技術(shù)不斷推向市場(chǎng),未來(lái)的AI硬件格局仍然待解。”一位不便具名的歐洲資深從業(yè)人員向21世紀(jì)經(jīng)濟(jì)報(bào)道表示。
英偉達(dá)在GPU領(lǐng)域顯著領(lǐng)先
根據(jù)英偉達(dá)最新公布的年報(bào),其最主要的業(yè)務(wù)領(lǐng)域均出現(xiàn)了兩位數(shù)以上的增長(zhǎng)。除了其一直占有領(lǐng)先優(yōu)勢(shì)的游戲業(yè)務(wù)增長(zhǎng)之外,其更多的漲幅事實(shí)上來(lái)自于數(shù)據(jù)中心業(yè)務(wù)和自動(dòng)駕駛兩大全新業(yè)務(wù)板塊。
年報(bào)數(shù)據(jù)顯示,數(shù)據(jù)中心業(yè)務(wù)有138%的增長(zhǎng),而自動(dòng)駕駛有52%的增長(zhǎng)。
“事實(shí)上,這是整個(gè)英偉達(dá)財(cái)報(bào)里最具有說(shuō)明力的內(nèi)容,因?yàn)閿?shù)據(jù)業(yè)務(wù)和自動(dòng)駕駛的增長(zhǎng)根本上是人工智能和深度學(xué)習(xí)的發(fā)展所激發(fā)的。”一位美國(guó)計(jì)算機(jī)硬件分析師向21世紀(jì)經(jīng)濟(jì)報(bào)道表示。
在目前的深度學(xué)習(xí)領(lǐng)域,把神經(jīng)網(wǎng)絡(luò)投入實(shí)際應(yīng)用要經(jīng)歷兩個(gè)階段:首先是訓(xùn)練,其次是執(zhí)行。從目前的環(huán)境來(lái)看,訓(xùn)練階段非常需要處理大量數(shù)據(jù)的GPU(圖形處理器,下同),也就是以游戲和高度圖形化的應(yīng)用做圖像渲染起家的英偉達(dá)領(lǐng)先的領(lǐng)域;而在轉(zhuǎn)型階段則需要處理復(fù)雜程序的CPU,也就是微軟十幾年來(lái)領(lǐng)先的領(lǐng)域。
“英偉達(dá)目前的成功事實(shí)上代表了GPU的成功,它正是最早的GPU領(lǐng)先者之一。”上述行業(yè)分析師表示。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)尤其是幾百上千層的神經(jīng)網(wǎng)絡(luò),對(duì)高性能計(jì)算需求非常高,而GPU對(duì)處理復(fù)雜運(yùn)算擁有天然的優(yōu)勢(shì):它有出色的并行矩陣計(jì)算能力,對(duì)于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和分類都可以提供顯著的加速效果。
舉個(gè)例子,研究員不用一開(kāi)始就人工定義一個(gè)人臉,而是可以將幾百萬(wàn)個(gè)人臉的圖像展示出來(lái),讓計(jì)算機(jī)自己定義人臉應(yīng)該是什么樣子的。學(xué)習(xí)這樣的例子時(shí),GPU可以比傳統(tǒng)處理器更加快速,大大加快了訓(xùn)練過(guò)程。
因此,搭載GPU的超級(jí)計(jì)算機(jī)已經(jīng)成為訓(xùn)練各種深度神經(jīng)網(wǎng)絡(luò)的不二選擇,比如Google大腦早期就是使用Nvidia的GPU做深度學(xué)習(xí)。“我們正在搭建一款帶有跟蹤功能的攝像裝置,因此需要找到最適合的芯片,GPU是我們的首選。”歐盟AR初創(chuàng)企業(yè)Quine CEO Gunleik Groven在今年一月的CES(國(guó)際消費(fèi)電子展)現(xiàn)場(chǎng)向本報(bào)記者表示。
目前,谷歌、Facebook、微軟、Twitter和百度等互聯(lián)網(wǎng)巨頭,都在使用這種叫做GPU的芯片,讓服務(wù)器學(xué)習(xí)海量的照片、視頻、聲音文檔,以及社交媒體上的信息,來(lái)改善搜索和自動(dòng)化照片標(biāo)記等各種各樣的軟件功能。一些汽車制造商也在利用這項(xiàng)技術(shù),開(kāi)發(fā)可以感知周圍環(huán)境、避開(kāi)危險(xiǎn)區(qū)域的無(wú)人駕駛汽車。
除了在GPU和圖形計(jì)算領(lǐng)域長(zhǎng)期領(lǐng)先,英偉達(dá)也是最早一批在人工智能領(lǐng)域進(jìn)行投資的科技公司。2008年,當(dāng)時(shí)在斯坦福做研究的吳恩達(dá)發(fā)表了一篇用GPU上的CUDA進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練的論文。2012年“深度學(xué)習(xí)三巨頭”之一Geoff Hilton的學(xué)生Alex Krizhevsky用英偉達(dá)的GeForce顯卡在ImageNet中將圖像識(shí)別準(zhǔn)確率大幅提升,這也是英偉達(dá)CEO黃仁勛時(shí)常提到的英偉達(dá)注重深度學(xué)習(xí)的開(kāi)端。
有報(bào)告顯示,世界上目前約有3000多家AI初創(chuàng)公司,大部分都采用了Nvidia提供的硬件平臺(tái)。
“深度學(xué)習(xí)被證明是非常有效的。”黃仁勛在季報(bào)2月10日的發(fā)布會(huì)中表示。在列舉目前GPU計(jì)算平臺(tái)正在人工智能、云計(jì)算、游戲和自動(dòng)駕駛領(lǐng)域快速展開(kāi)應(yīng)用的同時(shí),黃仁勛表示,在未來(lái)數(shù)年間,深度學(xué)習(xí)將會(huì)成為計(jì)算機(jī)計(jì)算的一種基礎(chǔ)性的核心工具。
AMD和Intel巨頭的AI演變
投資者和芯片制造商關(guān)注著所有互聯(lián)網(wǎng)巨頭的一舉一動(dòng)。僅僅以英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)為例,在很長(zhǎng)一段時(shí)間以來(lái),該公司一直為谷歌提供數(shù)據(jù)服務(wù)。
英偉達(dá)并非GPU的唯一領(lǐng)先者,巨頭Intel和AMD都在這一領(lǐng)域有著不同的優(yōu)勢(shì)。
2016年11月,Intel公司發(fā)布了一個(gè)叫做Nervana的AI處理器,他們宣稱會(huì)在明年年中測(cè)試這個(gè)原型。如果一切進(jìn)展順利,Nervana芯片的最終形態(tài)會(huì)在2017年底面世。這個(gè)芯片名稱基于Intel早前購(gòu)買的一個(gè)叫做Nervana的公司。按照Intel的人所說(shuō),這家公司是世界上第一家專門(mén)為AI打造芯片的公司。
Intel公司披露了一些關(guān)于這個(gè)芯片的一些細(xì)節(jié),按照他們所說(shuō),這個(gè)項(xiàng)目代碼為“Lake Crest”,將會(huì)用到Nervana Engine和Neon DNN相關(guān)軟件。這款芯片可以加速各類神經(jīng)網(wǎng)絡(luò),例如谷歌TensorFlow框架。
芯片由所謂的“處理集群”陣列構(gòu)成,處理被稱作“活動(dòng)點(diǎn)”的簡(jiǎn)化數(shù)學(xué)運(yùn)算。相對(duì)于浮點(diǎn)運(yùn)算,這種方法所需的數(shù)據(jù)量更少,因此帶來(lái)了10倍的性能提升。
Lake Crest利用私有的數(shù)據(jù)連接創(chuàng)造了規(guī)模更大、速度更快的集群,其拓?fù)浣Y(jié)構(gòu)為圓環(huán)形或其他形式。這幫助用戶創(chuàng)造更大、更多元化的神經(jīng)網(wǎng)絡(luò)模型。這一數(shù)據(jù)連接中包含12個(gè)100Gbps的雙向連接,其物理層基于28G的串并轉(zhuǎn)換。
TPU與FPGA可能的逆襲
在上述芯片巨頭進(jìn)行GPU領(lǐng)域的提升之外,有更多的企業(yè)在試圖引發(fā)一輪全面的顛覆。其代表為谷歌在2016年宣布將獨(dú)立開(kāi)發(fā)一種名為T(mén)PU的全新的處理系統(tǒng)。
TPU是專門(mén)為機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計(jì)的專用芯片。通過(guò)降低芯片的計(jì)算精度,減少實(shí)現(xiàn)每個(gè)計(jì)算操作所需的晶體管數(shù)量,從而能讓芯片的每秒運(yùn)行的操作個(gè)數(shù)更高,這樣經(jīng)過(guò)精細(xì)調(diào)優(yōu)的機(jī)器學(xué)習(xí)模型就能在芯片上運(yùn)行得更快,進(jìn)而更快地讓用戶得到更智能的結(jié)果。Google將TPU加速器芯片嵌入電路板中,利用已有的硬盤(pán)PCI-E接口接入數(shù)據(jù)中心服務(wù)器中。
據(jù)Google資深副總裁Urs Holzle 透露,當(dāng)前Google TPU、GPU 并用,這種情況仍會(huì)維持一段時(shí)間,但他表示,GPU 可執(zhí)行繪圖運(yùn)算工作,用途多元;TPU 屬于ASIC,也就是專為特定用途設(shè)計(jì)的特殊規(guī)格邏輯IC,由于只執(zhí)行單一工作,速度更快,但缺點(diǎn)是成本較高。
除了上述提到的谷歌,微軟也在使用一種叫做現(xiàn)場(chǎng)可變編程門(mén)陣列(FPGA)的新型處理器。
據(jù)介紹,這個(gè)FPGA 目前已支持微軟Bing,未來(lái)它們將會(huì)驅(qū)動(dòng)基于深度神經(jīng)網(wǎng)絡(luò)——以人類大腦結(jié)構(gòu)為基礎(chǔ)建模的人工智能——的新搜索算法,在執(zhí)行這個(gè)人工智能的幾個(gè)命令時(shí),速度比普通芯片快上幾個(gè)數(shù)量級(jí)。有了它,你的計(jì)算機(jī)屏幕只會(huì)空屏23毫秒而不是4秒。
在第三代原型中,芯片位于每個(gè)服務(wù)器的邊緣,直接插入到網(wǎng)絡(luò),但仍舊創(chuàng)造任何機(jī)器都可接入的FPGA池。這開(kāi)始看起來(lái)是Office 365可用的東西了。最終,Project Catapult準(zhǔn)備好上線了。另外,Catapult硬件的成本只占了服務(wù)器中所有其它的配件總成本的30%,需要的運(yùn)轉(zhuǎn)能量也只有不到10%,但其處理速度卻是原來(lái)的2倍。
此外,有一些公司,例如Nervada和Movidius,模擬GPU的平行模式,但是專注于更快速地移動(dòng)數(shù)據(jù),省略圖像所需要的功能。其他公司,包括使用了被稱為“True North”的芯片的IBM公司,開(kāi)發(fā)了由神經(jīng)元、突觸等其他大腦特征所啟發(fā)的芯片設(shè)計(jì)。
由于深度學(xué)習(xí)和人工智能未來(lái)的巨大前景,各大巨頭都在盡量爭(zhēng)取技術(shù)上的優(yōu)勢(shì)。如果這其中的某家公司,如谷歌,用一種新型芯片替換掉現(xiàn)有芯片,這基本上就相當(dāng)于顛覆了整個(gè)芯片行業(yè)。
“不管是英偉達(dá)、Intel還是谷歌或是百度,都在尋找一種未來(lái)人工智能能夠廣泛應(yīng)用的基礎(chǔ)。”Therese Poletti表示。
而也有很多人持有與谷歌副總裁Urs Holzle 同樣的觀點(diǎn),認(rèn)為在人工智能的遙遠(yuǎn)未來(lái),GPU沒(méi)有代替CPU,而TPU也不會(huì)取代GPU,芯片市場(chǎng)將出現(xiàn)更大的需求和繁榮。