其中,昇騰910是目前單芯片計算密度最大的芯片,計算力遠超谷歌和英偉達。昇騰910半精度(FP16)運算能力為256TFLOPS,比NVIDIA的Tesla V100要高一倍,整數(shù)精度(INT8)512TOPS,支持128通道全高清視頻解碼(H.264/265),最大功耗350W。
昇騰310芯片的最大功耗僅為8W,主打極致高效計算低功耗AI芯片。半精度(FP16)運算能力8TFLOPS,整數(shù)精度(INT8)16TOPS,支持16通道全高清視頻解碼(H.264/265)。這兩款A(yù)I芯片和大規(guī)模分布式訓(xùn)練系統(tǒng)都將在明年第二季度推出。
日前,華為終端手機產(chǎn)品線總裁何剛發(fā)布長圖,詳細介紹了昇騰310的用途以及設(shè)計細節(jié)。
何剛表示,昇騰310作為華為全棧全場景AI解決方案的關(guān)鍵部分, 是華為全面AI戰(zhàn)略的重要支撐。在設(shè)計方面,突破了人工智能芯片設(shè)計的功耗、算力等約束,實現(xiàn)了能效比的大幅提升。未來將為平安城市、自動駕駛、云業(yè)務(wù)和IT智能、智能制造、機器人、便攜機、智能手機、智能手表等應(yīng)用場景提供全新的解決方案。
昇騰310采用華為自研達芬奇架構(gòu),使用了華為自研的高效靈活CISC指令集,每個AI核心可以在1個周期內(nèi)完成4096次MAC計算,集成了張量、矢量、標量等多種運算單元,支持多種混合精度計算,支持訓(xùn)練及推理兩種場景的數(shù)據(jù)精度運算。
統(tǒng)一架構(gòu)可以適配多種場景,功耗范圍從幾十毫瓦到幾百瓦,彈性多核堆疊,可在多種場景下提供最優(yōu)能耗比。