国产免费av片在线观看不卡,亚洲av不卡无码国产,麻豆蜜桃91无码专区在线袁

AMD：將在機器學習GPU領(lǐng)域“引發(fā)從來沒有過的競爭”

責任編輯：editor007

作者：孫博

2016-12-13 20:43:31

摘自：ZD至頂網(wǎng)

AMD宣布計劃推出一系列人工智能產(chǎn)品，包括3款圖形加速卡，4款OEM機箱和一系列開源軟件。這些卡將運行在4月新推出的MIOpen開源GPU加速庫，支持像卷積、池化、激活功能、歸一化和張量格式。

AMD宣布計劃推出一系列人工智能產(chǎn)品，包括3款圖形加速卡，4款OEM機箱和一系列開源軟件。在這個新興市場中，Nvidia已經(jīng)發(fā)展了一段時間，英特爾和幾個初創(chuàng)公司也都在開發(fā)替代產(chǎn)品。

AMD重拳出擊人工智能

AMD將在面向機器學習的GPU領(lǐng)域“引發(fā)以前從來沒有過的競爭”，Tirias Research高級分析師Kevin Krewell這樣表示。

“關(guān)鍵是沒有那么多卡，但是有很多軟件，”Krewell表示。“Nvidia提供Cuda軟件來幫助人們立即開始進行編碼。AMD支持OpenCL，但是現(xiàn)在他們有更有吸引力的解決方案。”

AMD公布了3款在Radeon Instinct新品牌下的圖形卡，支持16位打包浮點運算操作，其中2款卡預計將在明年年初出貨，采用現(xiàn)有的GPU，針對推斷類的任務。

150W MI6采用Polaris GPU和16Bytes內(nèi)存，通過224 Gbit/s鏈路提供最高5.7 TFlops的FP16峰值性能。175W MI8加速卡在2.5-D堆棧上采用Fiji Nano GPU，有4GB High-Bandwidth Memory運行在512 Gbit/s鏈路上，性能最高可達到8.2 TFlops。高端300W MI25卡針對培訓任務，采用AMD的下一代Vega GPU，將在7月前出貨。

這些卡將運行在4月新推出的MIOpen開源GPU加速庫，支持像卷積、池化、激活功能、歸一化和張量格式。

新的加速庫是基于AMD現(xiàn)有的Randeon Open Compute軟件，其中包括域?qū)Ｓ械木庉嬈?，針對線性代數(shù)和張量以及語言運行時間。該軟件支持7種機器學習框架，包括Caffe、Torch 7以及Tensorflow，還有4種編程語言——Python、OIpenCL、高性能版C以及針對Nvidia的編譯層。

AMD重拳出擊人工智能

　　AMD MIOpen堆棧的定位是作為Nvidia Cuda的一個更開放的替代選擇（來源：AMD）

AMD重拳出擊人工智能

　　AMD稱，新的GPU卡將打敗來自Nvidia的、針對AI的競爭產(chǎn)品（來源：AMD）

超微宣布推出了支持AMD這三款新卡的機架式系統(tǒng)。Inventec也宣布兩款系統(tǒng)支持一個機架節(jié)點最多有4個或者16個帶有PCIe插槽、FPGA或者固態(tài)盤的M125 Vega卡。Inventec還展示了一款將會包含120個Vega卡、GPU計算性能最高達到3 Petaflops的機架系統(tǒng)。

在機器學習方面，AMD正在迎頭趕上。4月，Nvidia開始出貨針對高端GPU四路集群的設(shè)計，采用Nvidia獨有的NV-Link技術(shù)，支持更高吞吐量、更低延遲的PCIe。并且Nvidia針對GPU計算的Cuda多年來已經(jīng)被廣泛采用。

上個月，英特爾詳細闡述了采用至強和至強Phi處理器的計劃，以及收購通過收購Nervana和Movidius以覆蓋廣泛的推斷和培訓類任務。此外像Cornami、Graphcore以及Wave Computing的初創(chuàng)公司已經(jīng)公布了新芯片計劃，據(jù)他們稱，它在培訓類任務方面的表現(xiàn)將擊敗GPU。

在過去兩年中，機器學習已經(jīng)成為Amazon、百度和Facebook等數(shù)據(jù)中心巨頭的一種戰(zhàn)略性工作負載。5月，Google宣布設(shè)計出了他們自己的AI推理加速器。

AMD計劃公布一項基于采用更開放的組件的獨特計劃。除了新的開源加速庫之外，AMD還將開放GPU指令集，針對那些希望做低等級優(yōu)化的工程師們。

此外，AMD還計劃支持像CCIX、GenZ連接到FPGA加速器以及存儲存儲這樣的開放互連。與此同時，AMD也支持PCIe和單根虛擬化標準。

今年年底，AMD計劃推出名為Naples的新服務器處理器，采用Zen x86核心。AMD表示，將把最低延遲的鏈路帶入x86主機，能夠在單一服務器節(jié)點中打包4-16個GPU。AMD目前已經(jīng)支持GPU之間的直接內(nèi)存訪問（DMA），以及機架間的遠程DMA。

AMD表示，與使用通用矩陣乘法（GEMM）的卷積相比，MIOpen代碼將加速AI任務近3倍之多。此外AMD還分別展示了在Nvidia TitanX-Maxwell以及Pascal的DeepBench DEMM之上MI8和MI25卡顯著提升的性能。

AMD重拳出擊人工智能