AMD:將在機器學習GPU領(lǐng)域“引發(fā)從來沒有過的競爭”

責任編輯:editor007

作者:孫博

2016-12-13 20:43:31

摘自:ZD至頂網(wǎng)

AMD宣布計劃推出一系列人工智能產(chǎn)品,包括3款圖形加速卡,4款OEM機箱和一系列開源軟件。這些卡將運行在4月新推出的MIOpen開源GPU加速庫,支持像卷積、池化、激活功能、歸一化和張量格式。

AMD宣布計劃推出一系列人工智能產(chǎn)品,包括3款圖形加速卡,4款OEM機箱和一系列開源軟件。在這個新興市場中,Nvidia已經(jīng)發(fā)展了一段時間,英特爾和幾個初創(chuàng)公司也都在開發(fā)替代產(chǎn)品。

AMD重拳出擊人工智能

AMD將在面向機器學習的GPU領(lǐng)域“引發(fā)以前從來沒有過的競爭”,Tirias Research高級分析師Kevin Krewell這樣表示。

“關(guān)鍵是沒有那么多卡,但是有很多軟件,”Krewell表示。“Nvidia提供Cuda軟件來幫助人們立即開始進行編碼。AMD支持OpenCL,但是現(xiàn)在他們有更有吸引力的解決方案。”

AMD公布了3款在Radeon Instinct新品牌下的圖形卡,支持16位打包浮點運算操作,其中2款卡預計將在明年年初出貨,采用現(xiàn)有的GPU,針對推斷類的任務。

150W MI6采用Polaris GPU和16Bytes內(nèi)存,通過224 Gbit/s鏈路提供最高5.7 TFlops的FP16峰值性能。175W MI8加速卡在2.5-D堆棧上采用Fiji Nano GPU,有4GB High-Bandwidth Memory運行在512 Gbit/s鏈路上,性能最高可達到8.2 TFlops。高端300W MI25卡針對培訓任務,采用AMD的下一代Vega GPU,將在7月前出貨。

這些卡將運行在4月新推出的MIOpen開源GPU加速庫,支持像卷積、池化、激活功能、歸一化和張量格式。

新的加速庫是基于AMD現(xiàn)有的Randeon Open Compute軟件,其中包括域?qū)S械木庉嬈?,針對線性代數(shù)和張量以及語言運行時間。該軟件支持7種機器學習框架,包括Caffe、Torch 7以及Tensorflow,還有4種編程語言——Python、OIpenCL、高性能版C以及針對Nvidia的編譯層。

AMD重拳出擊人工智能

  AMD MIOpen堆棧的定位是作為Nvidia Cuda的一個更開放的替代選擇(來源:AMD)

AMD重拳出擊人工智能

  AMD稱,新的GPU卡將打敗來自Nvidia的、針對AI的競爭產(chǎn)品(來源:AMD)

超微宣布推出了支持AMD這三款新卡的機架式系統(tǒng)。Inventec也宣布兩款系統(tǒng)支持一個機架節(jié)點最多有4個或者16個帶有PCIe插槽、FPGA或者固態(tài)盤的M125 Vega卡。Inventec還展示了一款將會包含120個Vega卡、GPU計算性能最高達到3 Petaflops的機架系統(tǒng)。

在機器學習方面,AMD正在迎頭趕上。4月,Nvidia開始出貨針對高端GPU四路集群的設(shè)計,采用Nvidia獨有的NV-Link技術(shù),支持更高吞吐量、更低延遲的PCIe。并且Nvidia針對GPU計算的Cuda多年來已經(jīng)被廣泛采用。

上個月,英特爾詳細闡述了采用至強和至強Phi處理器的計劃,以及收購通過收購Nervana和Movidius以覆蓋廣泛的推斷和培訓類任務。此外像Cornami、Graphcore以及Wave Computing的初創(chuàng)公司已經(jīng)公布了新芯片計劃,據(jù)他們稱,它在培訓類任務方面的表現(xiàn)將擊敗GPU。

在過去兩年中,機器學習已經(jīng)成為Amazon、百度和Facebook等數(shù)據(jù)中心巨頭的一種戰(zhàn)略性工作負載。5月,Google宣布設(shè)計出了他們自己的AI推理加速器。

AMD計劃公布一項基于采用更開放的組件的獨特計劃。除了新的開源加速庫之外,AMD還將開放GPU指令集,針對那些希望做低等級優(yōu)化的工程師們。

此外,AMD還計劃支持像CCIX、GenZ連接到FPGA加速器以及存儲存儲這樣的開放互連。與此同時,AMD也支持PCIe和單根虛擬化標準。

今年年底,AMD計劃推出名為Naples的新服務器處理器,采用Zen x86核心。AMD表示,將把最低延遲的鏈路帶入x86主機,能夠在單一服務器節(jié)點中打包4-16個GPU。AMD目前已經(jīng)支持GPU之間的直接內(nèi)存訪問(DMA),以及機架間的遠程DMA。

AMD表示,與使用通用矩陣乘法(GEMM)的卷積相比,MIOpen代碼將加速AI任務近3倍之多。此外AMD還分別展示了在Nvidia TitanX-Maxwell以及Pascal的DeepBench DEMM之上MI8和MI25卡顯著提升的性能。

AMD重拳出擊人工智能

AMD正在快速向前發(fā)展。它展示了兩周時間內(nèi)Vega采用Cuda和Caffe處理MIOpen軟件中的培訓任務。Vega芯片仍然供不應求,因為開發(fā)者正在致力于將傳統(tǒng)圖形軟件和游戲放到Vega芯片上。

AMD Radeon部門首席架構(gòu)師Raja Koduri表示,AMD的MxGPU虛擬化將提供給機器學習和游戲。

“我們的競爭對手是把游戲和人工智能分成兩個部分,而我們希望把兩者結(jié)合到一起,”他說。

此前,AMD公布了與數(shù)據(jù)中心巨頭阿里巴巴以及Google在GPU方面的合作。

多倫多大學的研究人員稱贊了MIOpen軟件,他使用該軟件做4位數(shù)據(jù)和匯編語言支持天文學應用程序。“我們發(fā)現(xiàn)人們還在談論1位和2位數(shù)學,這說明我們在機器學習方面還處于很早起的階段,”Xilinx副總裁Liam Madden這樣表示。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號