從云到端,邊緣計(jì)算芯片格局分析

責(zé)任編輯:zsheng

2018-11-01 11:43:28

摘自:半導(dǎo)體行業(yè)觀察

近日,華為和比特大陸紛紛發(fā)布了針對邊緣計(jì)算的新芯片產(chǎn)品。華為的Ascend系列采用達(dá)芬奇架構(gòu),其中Ascend 310功耗8W算力8TOPS正是針對邊緣計(jì)算市場。

近日,華為和比特大陸紛紛發(fā)布了針對邊緣計(jì)算的新芯片產(chǎn)品。華為的Ascend系列采用達(dá)芬奇架構(gòu),其中Ascend 310功耗8W算力8TOPS正是針對邊緣計(jì)算市場。而之后比特大陸發(fā)布的BM1682和BM1880也是針對邊緣計(jì)算市場,其中BM1682功耗30W算力3TFlops針對邊緣服務(wù)器市場,而BM1880功耗3W整數(shù)算力2TOPS則是針對邊緣終端市場。人工智能結(jié)合邊緣計(jì)算已經(jīng)成為最熱門的市場之一,我們今天就來分析并展望這個(gè)市場。

邊緣計(jì)算新興市場

人工智能芯片市場第一個(gè)得到關(guān)注的是云端服務(wù)器市場,Nvidia的GPU以其強(qiáng)勁的算力掌握了大部分市場。隨著人工智能的鋪開,邊緣計(jì)算(edge computing)的概念也得到了越來越多的認(rèn)可。

邊緣計(jì)算相對于云計(jì)算有幾點(diǎn)優(yōu)勢,首先是延遲較小,在云端和終端通常有幾十毫秒到幾百毫秒不等的網(wǎng)絡(luò)延遲,對于工業(yè)應(yīng)用等對延遲有高要求的應(yīng)用來說云端部署人工智能無法滿足其對于延遲的需求;其次是數(shù)據(jù)隱私,有些應(yīng)用不希望把數(shù)據(jù)傳輸?shù)皆贫?,一方面?dān)心云端數(shù)據(jù)被云運(yùn)營商看到,另一方面擔(dān)心數(shù)據(jù)傳輸過程中被黑客劫持;最后是可靠性,如果把人工智能部署在云端那么一旦網(wǎng)絡(luò)斷了在終端的人工智能程序就無法工作了,這對于要求高可靠性的應(yīng)用來說難以滿足要求,但是如果把人工智能部署在邊緣就沒有這個(gè)問題。

邊緣人工智能計(jì)算中其實(shí)還包含了多個(gè)層次,一種是終端設(shè)備(如手機(jī))上的人工智能計(jì)算,這樣的規(guī)劃把人工智能計(jì)算直接放到終端設(shè)備上,可以實(shí)現(xiàn)最低的延遲。然而,由于終端設(shè)備的電池容量有限或者對于散熱容忍度較低,因此在終端設(shè)備上做人工智能計(jì)算對于AI芯片的能效比提出了極高的要求,同時(shí)這樣也并非唯一的邊緣計(jì)算形態(tài)。

除了終端設(shè)備上的直接做計(jì)算之外,還可以把終端的數(shù)據(jù)放到離終端比較近的本地服務(wù)器去計(jì)算。例如,對于工業(yè)應(yīng)用這樣的對于穩(wěn)定性和延遲有要求但是又可以做集群化計(jì)算的應(yīng)用,除了把計(jì)算直接放到終端設(shè)備之外另一種方法就是就近設(shè)立邊緣服務(wù)器讓計(jì)算放到邊緣服務(wù)器上去做然后快速返回給終端設(shè)備。邊緣服務(wù)器對于芯片功耗的要求相比在終端設(shè)備上直接計(jì)算就會(huì)寬松許多,因此非常適合于這種可以集群化計(jì)算的應(yīng)用。

邊緣計(jì)算的兩種市場目前都已經(jīng)在起飛。而相關(guān)AI芯片也得到了許多關(guān)注。標(biāo)志性事件是華為的兩次芯片發(fā)布會(huì)。去年秋天發(fā)布的麒麟970芯片附帶NPU,可以說是人工智能部署在手機(jī)的一次重要嘗試。今年秋天又發(fā)布了Ascend系列芯片,其中Ascend 310芯片也是針對邊緣服務(wù)器市場并且華為已經(jīng)開發(fā)了基于Ascend 310的邊緣計(jì)算服務(wù)器準(zhǔn)備部署在自動(dòng)駕駛領(lǐng)域。因此我們可以預(yù)計(jì)在未來無論是相關(guān)應(yīng)用還是相關(guān)芯片都將有更多公司大手筆投入,從而推動(dòng)AI進(jìn)一步發(fā)展。

邊緣服務(wù)器的芯片形態(tài)與競爭格局

邊緣服務(wù)器的市場現(xiàn)在來看將是人工智能最早落地的應(yīng)用之一,因?yàn)槟壳爸袊闹悄軘z像頭產(chǎn)品已經(jīng)在安防、人臉識(shí)別等領(lǐng)域真正落地,而邊緣服務(wù)器是很適合智能攝像頭的產(chǎn)品形態(tài),一方面在不少此類應(yīng)用中對于可靠性有很強(qiáng)的需求,因此部署在邊緣端的人工智能更適合;另一方面智能攝像頭的計(jì)算可以集群化操作,因此一個(gè)邊緣服務(wù)器處理多路智能攝像頭的形式是非常經(jīng)濟(jì)的方式。除了智能攝像頭之外,無人駕駛也是邊緣服務(wù)器的一個(gè)例子,因?yàn)樵跓o人車?yán)锩嫘枰鰝鞲衅魅诤献龃罅坑?jì)算,相當(dāng)于在無人車上部署了一個(gè)邊緣服務(wù)器。

邊緣服務(wù)器市場通常對于通用性有一定需求,因此比較合適的方案是處理器加上通用型深度學(xué)習(xí)加速芯片,而深度學(xué)習(xí)加速芯片最常見的形式是以PCIe加速卡的形式插到主板上,并與主處理器協(xié)同工作。值得注意的是,由于邊緣服務(wù)器對于人工智能算法精度有一定要求,因此往往使用的是類似半精度浮點(diǎn)數(shù)的運(yùn)算方式,很多邊緣終端芯片上常見的INT-4甚至INT-2等激進(jìn)的低精度整數(shù)運(yùn)算由于損失精度過多因此在邊緣服務(wù)器不太適合。

邊緣服務(wù)器市場尚屬于新興市場,加入戰(zhàn)場的公司并不多,目前僅有Nvidia,華為,比特大陸等, 而且不同的公司可以主打不同的細(xì)分市場,因此市場競爭遠(yuǎn)未飽和。我們不妨來分析一下Nvidia,華為和比特大陸三家公司的競爭格局。Nvidia的產(chǎn)品是Xavier芯片,峰值算力30TOPS,功耗30W,主要針對的是自動(dòng)駕駛市場,因此芯片上還集成了雙目視覺、光流等,模組售價(jià)2499美元,顯然是針對高端自動(dòng)駕駛市場,而對于智能攝像頭等對于部署成本有要求的場合并不合適。

邊緣終端市場的芯片形態(tài)與競爭格局

邊緣終端市場是指直接在終端設(shè)備上做計(jì)算的AI芯片,對于功耗和能效比有很強(qiáng)的要求。目前來看,邊緣終端市場有兩種形態(tài)的芯片產(chǎn)品,一種是針對特定應(yīng)用的SoC,一種是通用加速器做獨(dú)立芯片。SoC面向?qū)S檬袌觯谛酒猩疃葘W(xué)習(xí)加速計(jì)算事實(shí)上只是一小部分,而其他大部分芯片面積則交給了主控處理器、視頻解碼等等模塊。SoC集成度高,一般的技術(shù)路線是用新的SoC代替原有的不支持深度學(xué)習(xí)加速的SoC做更新?lián)Q代。

一個(gè)典型的例子就是華為麒麟系列SoC加入寒武紀(jì)的NPU,就屬于SoC自己的更新?lián)Q代。專注于AI芯片的廠商進(jìn)入SoC市場的策略往往是提供IP授權(quán),以發(fā)揮自己的強(qiáng)項(xiàng)(如寒武紀(jì)給華為提供NPU IP)。對于SoC往往針對的是一個(gè)特定市場,因?yàn)槠渲械哪K都是針對該應(yīng)用而設(shè)計(jì),如果用在其他應(yīng)用中則顯得浪費(fèi),例如麒麟SoC最適合的場景是手機(jī),其中包含的GPU、ISP、Modem等都是為了手機(jī)場景打造,如果是用在工業(yè)場景則這些模組都閑置了,因此也就引出了另一個(gè)終端通用型深度學(xué)習(xí)加速器芯片市場。該市場相對于SoC市場來說允許較低的集成度,即可以在主控芯片之外再搭配額外的芯片以支持相應(yīng)功能。

在終端SoC市場,事實(shí)上競爭已經(jīng)白熱化,華為、高通等公司都紛紛推出專屬的SoC搭載 AI加速模組,而AI加速模組IP的提供商也有ARM,Cadence,CEVA等傳統(tǒng)IP提供商以及寒武紀(jì)這樣的初創(chuàng)公司。不少傳統(tǒng)SoC芯片公司都紛紛在自家SoC中加入自研或授權(quán)的人工智能模塊。對于人工智能終端SoC市場,我們的分析是該市場雖然最早得到關(guān)注但是很可能近幾年還是被原來的SoC公司占領(lǐng)市場,因?yàn)槟壳敖K端人工智能市場尚未真正落地收獲真金白銀,因此SoC中加入人工智能還只是錦上添花之舉。

在IP授權(quán)方面,Cadence和ARM入局意味著小公司面臨巨大壓力,因?yàn)镮P市場存在一定的頭部效應(yīng),且Cadence和ARM可以通過與其他的優(yōu)勢IP做捆綁銷售來推銷其人工智能IP,在人工智能并非最關(guān)鍵SoC模組的市場現(xiàn)狀下,小公司想要與Cadence和ARM等巨頭競爭只能走差異化,例如超低功耗或模擬計(jì)算等路線。

終端通用深度學(xué)習(xí)加速器芯片市場的應(yīng)用則剛起步,之前Movidius推出的神經(jīng)計(jì)算加速棒并未引起巨大反響。但是這并不代表這個(gè)市場不存在,而是還處于幼年期,需要培養(yǎng),因此許多公司在這個(gè)市場布局主要一是培養(yǎng)開發(fā)者生態(tài),另一方面也探索研究哪個(gè)市場最有潛力,預(yù)計(jì)在市場成熟之后再收縮戰(zhàn)線,針對幾個(gè)重要的應(yīng)用推出相應(yīng)的優(yōu)化芯片,從而占領(lǐng)最合適的市場。因此,目前對于這個(gè)市場最合適的策略是推出開發(fā)板和插件式加速硬件(如USB加速棒)這樣簡單易用的產(chǎn)品,這樣廠商和客戶可以一起探索市場需求,決定最佳產(chǎn)品形態(tài)。 我們看到比特大陸就是在這個(gè)市場跟隨Movidius推出了BM1880芯片,并配套推出了開發(fā)板、芯片模組以及USB加速棒等多種硬件形態(tài)供客戶挑選,我們相信在近期將會(huì)看到通用型終端人工智能加速器的更多應(yīng)用。

未來發(fā)展預(yù)期

如之前的分析,我們預(yù)計(jì)在人工智能邊緣計(jì)算會(huì)成為未來最重要的人工智能硬件市場之一。在邊緣計(jì)算領(lǐng)域,邊緣服務(wù)器芯片市場非常重要但是目前廠商不多,我們預(yù)期會(huì)有不少公司入局,包括從芯片領(lǐng)域提出超高性能的初創(chuàng)公司,以及??低曔@樣的系統(tǒng)廠商開始自研芯片,而如華為、比特大陸等已經(jīng)提前入場的公司也會(huì)繼續(xù)加大投入。

在終端邊緣計(jì)算市場,SoC芯片(AI加速器IP)領(lǐng)域競爭已經(jīng)非常激烈,未來恐怕會(huì)有一波洗牌的過程,最后只會(huì)剩下幾家能在不同細(xì)分市場牢牢把握住客戶的公司。在通用終端加速器芯片領(lǐng)域我們則可望看到更多應(yīng)用出現(xiàn),在未來幾年內(nèi)我們能看到的邊緣終端加速器應(yīng)用實(shí)際上將會(huì)很大程度上決定這個(gè)市場的具體規(guī)模。

最后,我們必須看到邊緣計(jì)算等人工智能芯片應(yīng)用目前最大的市場其實(shí)在中國。這是因?yàn)橹袊娜斯ぶ悄苈涞厍闆r遠(yuǎn)好于美國。在政府的支持下,曠視、商湯、依圖等初創(chuàng)企業(yè)紛紛推出優(yōu)秀的產(chǎn)品并在市場上站住了腳跟,這一方面加速了基于人工智能的應(yīng)用成熟,另一方面也給人工智能芯片帶來了市場,從而為人工智能的完整產(chǎn)業(yè)鏈的成熟帶來了機(jī)會(huì)。我們可以肯定地說,人工智能芯片的未來還得要看中國!

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)