而根據(jù)百度在發(fā)布會上公開的信息,昆侖芯片最高算力可達(dá)到260 TOPS,已經(jīng)是 NVIDIA 的最新算卡 V100 的兩倍以上,但是這個(gè)算力指標(biāo)靠不靠譜?對百度云計(jì)算的規(guī)劃是否真能發(fā)揮作用?其實(shí) DT 君抱以存疑的態(tài)度。
首先,算力的計(jì)算有很多層次,就以 TOPS 這種每秒整數(shù)操作次數(shù),還可分為不同精度,以及稀疏計(jì)算模式的啟用與否,以寒武紀(jì)為例,其在 5 月發(fā)布的專業(yè)算卡架構(gòu)在性能指標(biāo)方面就可分為多種模式,且該架構(gòu)不用 TOPS 作為性能指標(biāo),而是采用基于浮點(diǎn)計(jì)算的 TFLOPS,性能從倍精度、單精度到半精度,算力跨度從 16 TFLOPS 到 166 TFLOPS,昆侖僅提供單一數(shù)據(jù),且只有公開最大整數(shù)計(jì)算能力,其實(shí)背后隱含著該架構(gòu)可能在均衡性有所欠缺,只能少數(shù)狀況下?lián)碛休^高性能表現(xiàn)的可能。
另外,若以昆侖芯片的 TOPS 參數(shù)和 NVIDIA 的 V100 比較,表面數(shù)字上的確贏了不少,但是昆侖芯片并沒有公布芯片的規(guī)模,只有宣布其整合了數(shù)萬個(gè)小核心,那么從這些簡短信息來判讀,昆侖芯片采用的是一般乘加法器的大量疊加來增加其算力,但 NVIDIA 的 CUDA 單元或寒武紀(jì)等計(jì)算架構(gòu)都具備可編程的彈性應(yīng)用能力,NVIDIA 更是擁有業(yè)界最成熟的 CUDA 工具套件,可以讓硬件架構(gòu)更好的發(fā)揮,而昆侖芯片在開發(fā)環(huán)境上能否讓昆侖芯片百分之百地發(fā)揮亦是令人存疑。
近幾年 AI 議題火熱,似乎只要各種行業(yè)沾上了 AI,無窮的“錢景”就會隨之而來。一向反應(yīng)最快的中國市場,更帶領(lǐng)了一波芯片與產(chǎn)業(yè)服務(wù)的 AI 創(chuàng)新。
在產(chǎn)業(yè)、官方以及學(xué)術(shù)界的通力合作之下,中國 AI 技術(shù)的發(fā)展似乎已經(jīng)領(lǐng)銜全球,我們可以看到各種先進(jìn)的方案、算法,以及應(yīng)用不斷冒出頭,與之搭配的各種芯片方案也紛紛被創(chuàng)造出來,不論從視覺識別,自然語言、終端、邊緣、云計(jì)算的 AI 方案也一應(yīng)俱全,但其中的一個(gè)大問題是,各家廠商并沒有形成共通生態(tài),而是走向各自為政。
雖然,從理論上講,光是現(xiàn)有產(chǎn)業(yè)的 AI 化就已經(jīng)具備可以支撐整個(gè)產(chǎn)業(yè)的需求規(guī)模,即便芯片生態(tài)分散,仍應(yīng)能找到自己的生存空間。但自有芯片對應(yīng)用或者是云計(jì)算廠商是一種必要投資,還是“”自有“”這兩個(gè)字已經(jīng)被過度強(qiáng)調(diào)之下的產(chǎn)物?或許值得我們再三思考。
就好比為了喝牛奶而養(yǎng)牛,我們要有專門環(huán)境,專人照顧,食料、疾病防治,加上擠牛奶的設(shè)備、牛奶的保存,這些不只要資金維持,也要很多的時(shí)間成本。AI 芯片亦不外如是。芯片設(shè)計(jì)出來除了芯片架構(gòu)本身,開發(fā)環(huán)境、各種框架的整合,以及與現(xiàn)有架構(gòu)的互換性,若沒有互換性,那又需要重頭設(shè)計(jì)整套生態(tài),因此,看芯片不只是看芯片本身,更要看周邊生態(tài)的搭配,這些都是人和錢堆出來的產(chǎn)物。
當(dāng)然,政府為了推動半導(dǎo)體產(chǎn)業(yè)發(fā)展,其實(shí)通過很多種補(bǔ)貼方式來鼓勵(lì)芯片設(shè)計(jì)行業(yè)開發(fā)自己的方案,就好比為了喝牛奶想養(yǎng)牛,政府就會真的補(bǔ)助一條牛,但怎么養(yǎng),怎么生產(chǎn)牛奶就要自己想辦法。
很多企業(yè)因此在真正考慮營收獲利模式之前就先開個(gè)芯片再說,其出發(fā)點(diǎn)可能是為了配合政策,也可能是有了補(bǔ)貼不開白不開,但開了芯片之后能有什么作用?單純仿照其他人的作法做出架構(gòu)類似的 AI 計(jì)算架構(gòu),又是否真能幫助自己的計(jì)算事業(yè)更上層樓?這會不會甚至模糊了自己的固有優(yōu)勢?
除了開發(fā)芯片的成本低以外,還有另外一個(gè)原因,那就是要根據(jù)行業(yè)別不同而進(jìn)行定制化的需求。
其實(shí),不少企業(yè)開發(fā)芯片的理由,都是“找不到適合的芯片”,比如說語音芯片或者是視覺識別芯片可能需要不同前后端設(shè)計(jì),通用方案可能無法完全滿足這些廠商的需求,這種設(shè)計(jì)可能就有其價(jià)值,但以昆侖這種通用 AI 芯片,似乎就沒有太大的必要。
前面也提到,由于現(xiàn)在推出“自有”AI 芯片的廠商已經(jīng)多如牛毛,且因?yàn)楦餍衅涫牵y以形成足夠強(qiáng)大的聚落,當(dāng)然,目前業(yè)界其實(shí)也有像寒武紀(jì)或 Arm 這種可提供授權(quán),具有一定生態(tài)基礎(chǔ)的架構(gòu)可使用,但自古“文人相輕”,況且 AI 芯片基礎(chǔ)架構(gòu)大同小異,差別只在算法軟件和平臺的配合,若能關(guān)起門來能自己賺那又何樂而不為?畢竟采用別人方案肯定會削薄利潤。
但事實(shí)真是如此嗎?
我們可以回頭看看過去 NVIDIA 在發(fā)展 AI 計(jì)算以及相關(guān)環(huán)境時(shí),在芯片以外的東西投注了多少心力,光是 CUDA 這個(gè)開發(fā)環(huán)境,就已經(jīng)花費(fèi)了十年以上的心力,不僅是完善本身的架構(gòu),也積極與業(yè)界、學(xué)界合作,從底層穩(wěn)扎穩(wěn)打做起。
雖然現(xiàn)在的 AI 計(jì)算環(huán)境早就已經(jīng)不是過去極度貧乏的狀況,各種開發(fā)環(huán)境都擺在那邊,框架也都幫你設(shè)計(jì)好,只要在程序中直接引用即可,但這種“自有”又是“”真的自有“”?
而廠商的各行其是,等于是各家廠商都花費(fèi)了許多時(shí)間在做類似的工作,推出類似的方案,對全國研發(fā)資源而言,更可說是一種浪費(fèi),如果能夠集中這些資源,讓廠商不用重復(fù)發(fā)明輪子,而是集中精力,想辦法讓現(xiàn)有、已經(jīng)夠好的輪子有更好的應(yīng)用方向,那是否會對整個(gè)中國 AI 產(chǎn)業(yè)能有更正面影響和幫助?
DT 君認(rèn)為是有這個(gè)可能的。只可惜國內(nèi)廠商們在“自有”這條路上走的太遠(yuǎn),像昆侖這樣的通用 AI 芯片方案此起彼落,是真正對個(gè)別廠商,或?qū)φw中國 AI 產(chǎn)業(yè)能產(chǎn)生幫助,還是造成研發(fā)資源的浪費(fèi),恐怕還需要時(shí)間證明。