人工智能正邁入技術(shù)突破和產(chǎn)業(yè)發(fā)展前沿
在新一代信息技術(shù)接力式創(chuàng)新的驅(qū)動(dòng)下,萬物互聯(lián)和智能化趨勢越發(fā)明顯,預(yù)計(jì)到2030年全球聯(lián)網(wǎng)設(shè)備數(shù)量將突破1250億件,由此帶動(dòng)數(shù)據(jù)資源的指數(shù)增長,再加上機(jī)器學(xué)習(xí)算法的突破、高性能計(jì)算能力的大幅提升,共同推動(dòng)著人工智能步入發(fā)展“快車道”。
1.算法突破、數(shù)據(jù)積累和算力提升催生人工智能。自1956年首次提出以來,人工智能主要依靠邏輯推理、專家系統(tǒng)來解決問題,智能程度低,但近年來在算法、數(shù)據(jù)和算力三方面的突破下,新一代人工智能開始成為新的競爭焦點(diǎn)。在算法突破方面,2006年加拿大多倫多大學(xué)提出的深度學(xué)習(xí)算法(DNN),較好地模擬了人腦神經(jīng)元多層深度傳遞的過程,該算法及衍生算法已在圖像識(shí)別、語音識(shí)別、機(jī)器翻譯等領(lǐng)域取得驚人效果。在數(shù)據(jù)資源方面,隨著數(shù)字化進(jìn)程日益深化,到2020年全球數(shù)據(jù)總量將超過40澤字節(jié)(ZB),是2011年的22倍。在高性能計(jì)算方面,傳統(tǒng)中央處理器(CPU)在性能和功耗上難以支撐海量數(shù)據(jù)運(yùn)算,而圖形處理器(GPU)、現(xiàn)場可編程門陳列(FPGA)、張量處理器(TPU)芯片具有并行計(jì)算、高吞吐量等特性,計(jì)算能力可達(dá)每秒10萬億次浮點(diǎn)運(yùn)算,正替代CPU成為人工智能的計(jì)算單元。
2.機(jī)器識(shí)別圖像、語音和自然語言等開始廣泛應(yīng)用。人工智能在看、聽、理解等關(guān)鍵指標(biāo)上已經(jīng)媲美甚至趕超人類。在看的方面,以國際ImageNet大賽(ILSVR競賽)為例,自2012年引入深度學(xué)習(xí)算法后,機(jī)器識(shí)別海量圖片中物體種類的錯(cuò)誤率逐年下降,2015年已降至3.57%,優(yōu)于人眼5.1%的識(shí)別錯(cuò)誤率。目前廣泛應(yīng)用于安防監(jiān)控、人臉識(shí)別、影像診斷、質(zhì)量檢測、無人駕駛等場景。在聽的方面,近場語音識(shí)別技術(shù)已可進(jìn)入日常生活,如微軟語音識(shí)別系統(tǒng)的錯(cuò)詞率在2016年已經(jīng)降到5.9%,等同于專業(yè)速錄員。目前廣泛應(yīng)用于智能手機(jī)(蘋果手機(jī)Siri)、智能音箱、智能家電、探傷檢測等場景。在理解方面,機(jī)器翻譯、文本分析等也逼近專業(yè)水平,如谷歌推出的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯GNMT相對(duì)于傳統(tǒng)機(jī)器翻譯,在從英語到中文的翻譯方面錯(cuò)誤率下降了58%。目前,類似技術(shù)已廣泛嵌入呼叫中心、客服系統(tǒng)、智能助手、聊天機(jī)器人等產(chǎn)品中。
我國處于較好位置且部分應(yīng)用已進(jìn)入全球前列
依托用戶規(guī)模、應(yīng)用場景、風(fēng)險(xiǎn)資金和科技論文等優(yōu)勢,我國在視覺識(shí)別、語音識(shí)別等應(yīng)用方面進(jìn)入全球前列,涌現(xiàn)出一批骨干企業(yè),擁有進(jìn)一步發(fā)展的有利條件。
1.我國擁有人口基數(shù)龐大、應(yīng)用場景豐富、風(fēng)投資金充裕、論文專利眾多等綜合優(yōu)勢。一是用戶數(shù)和數(shù)據(jù)優(yōu)勢。數(shù)據(jù)資源是發(fā)展人工智能的關(guān)鍵要素,主要來自用戶和聯(lián)網(wǎng)設(shè)備。從用戶數(shù)看,到2017年底,我國有3.49億固定寬帶用戶,是美國的3.5倍,占全球38%;有11.3億移動(dòng)寬帶用戶,是美國的2.7倍,其中4G用戶占全球40%;還有2.9億機(jī)器聯(lián)網(wǎng)(M2M)用戶,是美國的3.5倍。從數(shù)據(jù)量來看,我國已占全球13%,據(jù)高盛報(bào)告預(yù)測,隨著用戶數(shù)和在線時(shí)長增長,這一指標(biāo)到2020年預(yù)計(jì)提升至20%—25%。我國有用戶規(guī)模的先天優(yōu)勢。
二是應(yīng)用場景豐富。我國是全球唯一擁有聯(lián)合國產(chǎn)業(yè)分類目錄中所有工業(yè)門類的國家,數(shù)字化、網(wǎng)絡(luò)化、智能化應(yīng)用潛力巨大。目前智能產(chǎn)品應(yīng)用正由媒體、搜索、家居等消費(fèi)領(lǐng)域向交通、汽車、機(jī)械、石化等工業(yè)領(lǐng)域并重拓展。而且,我國有近4億的80后、90后用戶,他們對(duì)新科技、新產(chǎn)品的接受度比較高。廣泛的行業(yè)分布、多樣的用戶需求為拓展人工智能應(yīng)用提供了廣闊市場。
三是風(fēng)投資金充裕。據(jù)知名市場研究機(jī)構(gòu)CB Insights監(jiān)測數(shù)據(jù),在全球人工智能領(lǐng)域融資方面,2017年我國企業(yè)的融資額占到48%,首次超越美國(38%)。從跨境雙向投資看,我國背景的資金投資美國初創(chuàng)企業(yè)筆數(shù)從2014年的6筆,快速增長到2017年的31筆,超過美國資金對(duì)我國初創(chuàng)企業(yè)投資的20筆。從資金投資領(lǐng)域看,集中在人臉識(shí)別、影像診斷、人工智能芯片等熱點(diǎn)方向。
四是科研論文和專利優(yōu)勢。據(jù)美國國家科學(xué)技術(shù)委員會(huì)數(shù)據(jù),2014年我國在“深度學(xué)習(xí)”“深度神經(jīng)網(wǎng)絡(luò)”等領(lǐng)域的科學(xué)論文數(shù)量已超過美國。美國《科學(xué)引文索引》(SCImago)數(shù)據(jù)也顯示,我國“人工智能”論文達(dá)10.3萬篇,超過美國的8.4萬篇,論文影響力則位居第二。從專利看,按照美國專利與商標(biāo)辦公室數(shù)據(jù),以深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、人工智能等為關(guān)鍵詞檢索專利,我國在2016、2017年均超越美國。
2.我國在計(jì)算機(jī)視覺、語音識(shí)別、無人駕駛等應(yīng)用領(lǐng)域已進(jìn)入全球前列。隨著科研論文的公開、開源算法框架的推出及計(jì)算芯片性能的提升,我國企業(yè)在部分應(yīng)用上已進(jìn)入全球前沿。
一是計(jì)算機(jī)視覺應(yīng)用全球領(lǐng)先。在2011-2012年這一輪人工智能剛興起時(shí),國內(nèi)一批公司深耕計(jì)算機(jī)視覺技術(shù),目前從算法水準(zhǔn)和應(yīng)用情況看,人臉識(shí)別、安防監(jiān)控等領(lǐng)域已獲得全球認(rèn)可。如商湯科技在人臉識(shí)別和物體識(shí)別精度方面超過臉譜和谷歌;曠視科技的face++人臉識(shí)別平臺(tái),2017年被《麻省理工科技評(píng)論》評(píng)為十大前沿科技。騰訊覓影、推想科技、零氪科技等對(duì)食管癌、肺結(jié)節(jié)、乳腺癌等影像識(shí)別的準(zhǔn)確率堪比專業(yè)醫(yī)生,廣泛應(yīng)用于百家以上醫(yī)院。
二是中文語音識(shí)別具有獨(dú)特優(yōu)勢。語音識(shí)別是萬物互聯(lián)和人工智能應(yīng)用的關(guān)鍵入口。長期以來被國外企業(yè)壟斷市場,原因在于有很高的技術(shù)壁壘、語音資源壁壘和行業(yè)應(yīng)用壁壘,但隨著互聯(lián)網(wǎng)語音資料的豐富以及深度學(xué)習(xí)算法的引入,國內(nèi)已形成科大訊飛、百度兩家主導(dǎo),思必馳、云之聲、出門問問等企業(yè)跟隨的發(fā)展格局,在中文語音合成、語音識(shí)別、自然語言處理等領(lǐng)域擁有大量專利,產(chǎn)品廣泛應(yīng)用于語音輸入、智能家居、實(shí)時(shí)字幕、語音搜索、智能客服等場景。
三是無人駕駛、無人機(jī)、智能交通等緊追領(lǐng)軍企業(yè)。無人駕駛方面,百度2018年推出的阿波羅自動(dòng)駕駛平臺(tái)3.0,具備變道、等紅燈、避讓、泊車等能力,全球合作伙伴過百家,技術(shù)上與國外大體同步;無人機(jī)領(lǐng)域,大疆成為全球最大無人機(jī)企業(yè),廣泛用于農(nóng)業(yè)、應(yīng)急、消防、測繪與城市管理等領(lǐng)域;智能交通領(lǐng)域,阿里巴巴、滴滴等賦予交通信號(hào)燈以智能,助力城市交通整體優(yōu)化。總體上,智能應(yīng)用開始進(jìn)入快速擴(kuò)展期,我國有望在更多領(lǐng)域形成自身優(yōu)勢。
在關(guān)鍵技術(shù)、生態(tài)塑造與制度供給方面還存在明顯短板
在行業(yè)快速發(fā)展的同時(shí),我國在高端芯片、算法框架、人才儲(chǔ)備、法規(guī)制度等方面存在短板,亟需統(tǒng)籌解決。
1.高端芯片等關(guān)鍵技術(shù)領(lǐng)域受制于人。高性能計(jì)算芯片是人工智能發(fā)展的前提。目前在四條技術(shù)路線上美國占主導(dǎo)地位:一在圖形處理芯片(GPU)方面,英偉達(dá)、超威和英特爾三強(qiáng)主導(dǎo)GPU市場。二在現(xiàn)場可編程邏輯陣列(FPGA)芯片方面,賽靈思和英特爾兩強(qiáng)主導(dǎo)市場。三在模仿人腦神經(jīng)元芯片方面,以IBM TrueNorth芯片為代表,已應(yīng)用在Watson醫(yī)療產(chǎn)品上。四在專用集成電路(ASIC)芯片方面,谷歌的張量處理芯片(TPU)性能優(yōu)勢明顯,各類創(chuàng)業(yè)公司主要集中在這一賽道上。而我國目前仍以進(jìn)口芯片為主,雖然近年也涌現(xiàn)出一些初創(chuàng)企業(yè)如寒武紀(jì)、地平線等,但實(shí)力仍然非常弱。
2.算法框架依附于國外巨頭開源生態(tài)體系。人工智能的智能程度關(guān)鍵在于算法。國外巨頭通過開放算法框架(內(nèi)嵌視頻處理、文本分析、語言理解等算法模塊),降低人工智能產(chǎn)品或應(yīng)用開發(fā)成本,進(jìn)而吸引世界各地開發(fā)者入駐生態(tài)。這一策略集聚了全球智力,壯大了生態(tài)。從高盛報(bào)告看,谷歌Tensorflow算法框架聚集了6.8萬名明星開發(fā)者;而百度PaddlePaddle平臺(tái)僅有5330位,不到前者的十分之一。我們在調(diào)研中了解到,國內(nèi)初創(chuàng)企業(yè)大都基于谷歌Tensorflow進(jìn)行開發(fā)。
3.人才總量和領(lǐng)軍人才短板突出。創(chuàng)新的根本在于人才,從不同機(jī)構(gòu)數(shù)據(jù)來看,我國人才總量和結(jié)構(gòu)雙短缺。全球最大招聘網(wǎng)站領(lǐng)英2017年《全球AI領(lǐng)域人才報(bào)告》顯示,全球人工智能人才數(shù)量190萬,其中美國85萬,我國5萬,位列印度、英國、加拿大、澳大利亞、法國之后,排第7位。從工作經(jīng)驗(yàn)看,美國人才中具有10年以上經(jīng)驗(yàn)的占71.5%,我國僅為38.7%;國內(nèi)企業(yè)領(lǐng)軍人才主要來自海外引進(jìn)。
4.監(jiān)管制度滯后于人工智能創(chuàng)新需要。數(shù)據(jù)開放、隱私管理、算法歧視、網(wǎng)絡(luò)攻擊等諸多新問題亟待加強(qiáng)監(jiān)管。以無人駕駛為例,現(xiàn)有的車輛標(biāo)準(zhǔn)、準(zhǔn)入制度、車輛安全、駕駛責(zé)任、保險(xiǎn)制度等都需要重新審視。
進(jìn)一步推進(jìn)人工智能發(fā)展的建議
人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),美英法印日等國均已出臺(tái)國家戰(zhàn)略,支持技術(shù)研發(fā),完善制度環(huán)境,提升產(chǎn)業(yè)競爭力。從目前我國的實(shí)際看,建議以創(chuàng)新制度供給、優(yōu)化發(fā)展環(huán)境為主線,支持新產(chǎn)品新業(yè)務(wù)推廣使用,帶動(dòng)關(guān)鍵技術(shù)、算法框架突破,促進(jìn)上下游協(xié)同發(fā)展,夯實(shí)產(chǎn)業(yè)發(fā)展根基。
1.加大關(guān)鍵核心技術(shù)和共性標(biāo)準(zhǔn)支持。我國芯片產(chǎn)業(yè)根基薄弱,人工智能技術(shù)為我們追趕提供了契機(jī),但要做好打持久戰(zhàn)準(zhǔn)備。建議一方面依托我國市場需求優(yōu)勢,支持與國外領(lǐng)先企業(yè)開放合作,縮短跟跑學(xué)習(xí)周期;要避免資金、人才等資源攤薄,推進(jìn)強(qiáng)強(qiáng)聯(lián)合,鼓勵(lì)走差異化技術(shù)路線。另一方面,強(qiáng)化產(chǎn)業(yè)鏈上下游相互支持,發(fā)揮國內(nèi)應(yīng)用場景優(yōu)勢,給予國內(nèi)芯片企業(yè)商業(yè)化應(yīng)用和迭代完善的機(jī)會(huì)。此外,要及時(shí)響應(yīng)企業(yè)訴求,在設(shè)備規(guī)范、認(rèn)證認(rèn)可、安全要求等方面推出共性標(biāo)準(zhǔn),規(guī)范產(chǎn)品開發(fā)要求。
2.統(tǒng)籌產(chǎn)業(yè)鏈打造算法框架平臺(tái)。在算法方面,我國發(fā)表了足夠數(shù)量的論文,在機(jī)器視覺算法方面也走在全球前列,但缺乏生態(tài)優(yōu)勢,必須從戰(zhàn)略上重視算法框架和平臺(tái)的重要性。要借鑒PC互聯(lián)網(wǎng)時(shí)代windows操作系統(tǒng)主導(dǎo)生態(tài)、移動(dòng)互聯(lián)網(wǎng)時(shí)代安卓主導(dǎo)生態(tài)的經(jīng)驗(yàn)做法,支持組建產(chǎn)業(yè)聯(lián)盟,構(gòu)筑生態(tài)搭建算法框架。
3.優(yōu)化環(huán)境培育和吸引高端人才。隨著全球?qū)θ斯ぶ悄苋瞬诺臓帄Z趨于激烈,我國人才薪酬已與國外不相上下,下一步關(guān)鍵還是要優(yōu)化人才環(huán)境。要完善人才引進(jìn)配套政策,防止人才得而復(fù)失,同時(shí)在海外設(shè)立研發(fā)中心,就地招攬高端人才。要加快人工智能學(xué)科建設(shè)和人才培養(yǎng);面向制造、金融、醫(yī)療等重點(diǎn)行業(yè)開展應(yīng)用型人才培育。
4.適應(yīng)智能化變革趨勢,同步加強(qiáng)監(jiān)管制度建設(shè)。人工智能與各行業(yè)結(jié)合必然會(huì)孕育出新業(yè)態(tài),比如無人駕駛、智能投資顧問、醫(yī)療影像識(shí)別等。對(duì)此,既不能簡單按照傳統(tǒng)業(yè)務(wù)監(jiān)管,也不能任其發(fā)展,而應(yīng)把握技術(shù)和產(chǎn)業(yè)趨勢,在準(zhǔn)入方面給技術(shù)業(yè)務(wù)創(chuàng)新留下一個(gè)觀察期。同時(shí)要參考國際經(jīng)驗(yàn),結(jié)合業(yè)界合理訴求,圍繞監(jiān)管關(guān)鍵要素如監(jiān)管根基、監(jiān)管職責(zé)、監(jiān)管機(jī)制、監(jiān)管手段、監(jiān)管成本等,重新梳理相關(guān)制度,以便為創(chuàng)新提供保障。
5.加快相關(guān)法律、倫理和責(zé)任制度研究。在法律法規(guī)方面,重點(diǎn)是研究個(gè)人隱私保護(hù)和數(shù)據(jù)權(quán)屬制度、政府?dāng)?shù)據(jù)開放、合法開發(fā)利用等法律問題,明確各方的權(quán)利、義務(wù)和責(zé)任等。在網(wǎng)絡(luò)安全方面,既要加強(qiáng)硬件系統(tǒng)防護(hù)能力和等級(jí)評(píng)測,又要提前從制度上明確網(wǎng)絡(luò)安全責(zé)任和義務(wù)。在倫理方面,對(duì)于可能涉及人類生命的倫理選擇,如無人駕駛事故應(yīng)急選擇、機(jī)器人傷害人類等極端事件,給出基本規(guī)范,消除公眾疑慮,助力創(chuàng)新產(chǎn)品商用化。