百度王海峰:直面人工智能的機(jī)遇和挑戰(zhàn)

責(zé)任編輯:zsheng

2018-08-28 15:00:24

摘自:中國(guó)網(wǎng)

8月25日,為期兩天的首屆中國(guó)認(rèn)知計(jì)算和混合智能學(xué)術(shù)大會(huì)(CCHI2018)在西安舉辦,百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰與中國(guó)科學(xué)院院士陳霖、蒲慕明等學(xué)界知名專家共同研討與交流認(rèn)知科學(xué)、神經(jīng)科學(xué)與人工智能學(xué)科領(lǐng)域交叉融合的最新進(jìn)展和前沿技術(shù)。

8月25日,為期兩天的首屆中國(guó)認(rèn)知計(jì)算和混合智能學(xué)術(shù)大會(huì)(CCHI2018)在西安舉辦,百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰與中國(guó)科學(xué)院院士陳霖、蒲慕明等學(xué)界知名專家共同研討與交流認(rèn)知科學(xué)、神經(jīng)科學(xué)與人工智能學(xué)科領(lǐng)域交叉融合的最新進(jìn)展和前沿技術(shù)。

中國(guó)認(rèn)知計(jì)算和混合智能學(xué)術(shù)大會(huì)(CCHI2018)由國(guó)家自然科學(xué)基金委員會(huì)信息科學(xué)部、中國(guó)自動(dòng)化學(xué)會(huì)與中國(guó)認(rèn)知科學(xué)學(xué)會(huì)聯(lián)合主辦,是國(guó)內(nèi)首個(gè)關(guān)注認(rèn)知科學(xué)、神經(jīng)科學(xué)與AI交叉融合的高端學(xué)術(shù)會(huì)議。本屆大會(huì)邀請(qǐng)了認(rèn)知建模與計(jì)算、混合智能、智能機(jī)器人、智能駕駛等領(lǐng)域海內(nèi)外知名專家作學(xué)術(shù)報(bào)告,交流相關(guān)研究領(lǐng)域的最新成果和發(fā)展趨勢(shì)。

王海峰是人工智能的領(lǐng)軍人物之一,在國(guó)內(nèi)外有廣泛的影響力。他是自然語(yǔ)言處理領(lǐng)域最權(quán)威的國(guó)際學(xué)術(shù)組織ACL 50多年歷史上唯一出任主席(President)的華人,也是ACL亞太分會(huì)(AACL)創(chuàng)始主席。同時(shí),王海峰是百度人工智能的奠基者和領(lǐng)導(dǎo)者,為百度創(chuàng)建和發(fā)展了自然語(yǔ)言處理、知識(shí)圖譜、語(yǔ)音、視覺(jué)、深度學(xué)習(xí)等AI核心技術(shù),并成立AI技術(shù)平臺(tái)體系(AIG)擔(dān)任總負(fù)責(zé)人,致力于AI相關(guān)技術(shù)的研究及其應(yīng)用落地。

百度大腦迭代更新 逐步加深對(duì)客觀世界的認(rèn)知

在大會(huì)報(bào)告中,王海峰分享了百度大腦的最新進(jìn)展。百度大腦是百度AI技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成,包括視覺(jué)、語(yǔ)音、自然語(yǔ)言處理、知識(shí)圖譜、深度學(xué)習(xí)等AI核心技術(shù)和AI開(kāi)放平臺(tái),對(duì)內(nèi)支持百度所有業(yè)務(wù),對(duì)外全方位開(kāi)放,助力合作伙伴和開(kāi)發(fā)者,加速AI技術(shù)落地應(yīng)用,賦能各行各業(yè)轉(zhuǎn)型升級(jí)。

百度大腦的演進(jìn),從基礎(chǔ)技術(shù)積累,到建立完整的技術(shù)體系,再到核心技術(shù)進(jìn)入多模態(tài)深度語(yǔ)義理解階段,同時(shí)伴隨著百度多年的業(yè)務(wù)實(shí)踐和AI能力的全面開(kāi)放。

王海峰指出,AI技術(shù)與產(chǎn)業(yè)的結(jié)合愈發(fā)多元化,單一技術(shù)已無(wú)法滿足應(yīng)用需求,具備“多模態(tài)深度語(yǔ)義理解”能力的百度大腦通過(guò)多技術(shù)融合,能讓機(jī)器對(duì)客觀世界有更深層認(rèn)知,從而更好的支撐應(yīng)用。

百度大腦新階段:多模態(tài)深度語(yǔ)義理解

“多模態(tài)深度語(yǔ)義理解”是指對(duì)文字、聲音、圖片、視頻等多模態(tài)的數(shù)據(jù)和信息進(jìn)行深層次多維度的語(yǔ)義理解,包括數(shù)據(jù)語(yǔ)義、知識(shí)語(yǔ)義、視覺(jué)語(yǔ)義、語(yǔ)音語(yǔ)義一體化和自然語(yǔ)言理解等多方面的語(yǔ)義理解技術(shù)。“多模態(tài)深度語(yǔ)義理解不僅能讓機(jī)器聽(tīng)清、看清,更能深入理解它背后的含義,深度地理解真實(shí)世界,進(jìn)而更好地支撐各種應(yīng)用。”王海峰解釋。

在AI領(lǐng)域,數(shù)據(jù)的重要性不言而喻。無(wú)論是物理世界、人類社會(huì)還是網(wǎng)絡(luò)空間,都匯聚了海量的多元、異構(gòu)、多模態(tài)數(shù)據(jù)。數(shù)據(jù)語(yǔ)義化技術(shù)可以將這些數(shù)據(jù)形成包含千億節(jié)點(diǎn)、萬(wàn)億關(guān)系的龐大數(shù)據(jù)語(yǔ)義網(wǎng)絡(luò),從中總結(jié)規(guī)律、提煉知識(shí)、發(fā)現(xiàn)價(jià)值,助力經(jīng)濟(jì)和社會(huì)發(fā)展。王海峰介紹,數(shù)據(jù)語(yǔ)義化技術(shù)已經(jīng)在生產(chǎn)生活中發(fā)揮作用,比如在新能源充電樁運(yùn)維中,利用百度的數(shù)據(jù)語(yǔ)義化技術(shù)進(jìn)行設(shè)備監(jiān)測(cè)、故障診斷等,可以顯著提升效率,節(jié)約成本。

除了數(shù)據(jù),理解并運(yùn)用大千世界中的多元知識(shí)也是AI技術(shù)進(jìn)一步突破、深層次理解客觀世界的重要基礎(chǔ)。百度已經(jīng)構(gòu)建了包含數(shù)億實(shí)體、數(shù)千億事實(shí)的龐大知識(shí)圖譜。除了基礎(chǔ)的由實(shí)體、屬性、關(guān)系構(gòu)成的實(shí)體圖譜,百度還針對(duì)不同的應(yīng)用場(chǎng)景和知識(shí)形態(tài),構(gòu)建了關(guān)注點(diǎn)圖譜、事件圖譜、多媒體圖譜、行業(yè)圖譜等多種知識(shí)圖譜。

視覺(jué)語(yǔ)義化可以讓機(jī)器從看清到看懂視頻,并提煉出結(jié)構(gòu)化語(yǔ)義知識(shí)。王海峰通過(guò)體育比賽視頻的案例,展示了視覺(jué)語(yǔ)義化技術(shù)的價(jià)值。他介紹,2016年,百度AI實(shí)現(xiàn)了奧運(yùn)會(huì)籃球比賽的自動(dòng)解說(shuō),背后是自然語(yǔ)言處理和搜索技術(shù)。如今,應(yīng)用視覺(jué)語(yǔ)義化技術(shù)對(duì)世界杯比賽視頻進(jìn)行解析,AI能夠全面識(shí)別視頻中的球員、裁判、球、以及球門、球場(chǎng)線等人、物和場(chǎng)景,可以捕捉射門、進(jìn)球、角球、任意球、換人等事件,形成比賽的語(yǔ)義化知識(shí),既可以實(shí)現(xiàn)機(jī)器人解說(shuō)比賽,也可以進(jìn)行精彩片段集錦、以及各種數(shù)據(jù)統(tǒng)計(jì)分析等更深層的應(yīng)用。

語(yǔ)音語(yǔ)義一體化技術(shù)讓機(jī)器聽(tīng)得更清楚準(zhǔn)確,實(shí)現(xiàn)更自然的人機(jī)對(duì)話。王海峰介紹,百度采用多語(yǔ)種聲學(xué)混合建模,中文的Deep Peak 2模型效果比業(yè)界最好競(jìng)品錯(cuò)誤率相對(duì)降低20%; WaveNet+拼接的情感語(yǔ)音合成技術(shù),既可以使機(jī)器發(fā)聲的自然度大幅提升,又避免了計(jì)算量過(guò)大的問(wèn)題。

自然語(yǔ)言理解是人工智能最具挑戰(zhàn)的技術(shù)領(lǐng)域之一,近年來(lái)取得的進(jìn)展已經(jīng)釋放出巨大的應(yīng)用價(jià)值。王海峰介紹,在對(duì)話理解上,百度研發(fā)的深層注意力匹配模型,比已知的最好結(jié)果提升了4.1%,人機(jī)對(duì)話交互更加流暢自然。而在閱讀理解上,百度大腦已經(jīng)閱讀了千億量級(jí)的文章,相當(dāng)于6萬(wàn)個(gè)中國(guó)國(guó)家圖書館的藏書,積累了億級(jí)實(shí)體、千億事實(shí)的知識(shí),從而深入地理解內(nèi)容、獲取知識(shí),支持更廣泛的應(yīng)用。

百度大腦的技術(shù)能力在不斷進(jìn)步,對(duì)外開(kāi)放也更加全面和豐富。截至目前,百度已對(duì)外開(kāi)放120多項(xiàng)領(lǐng)先的AI場(chǎng)景化能力與解決方案,并通過(guò)開(kāi)源開(kāi)放深度學(xué)習(xí)框架PaddlePaddle、定制化平臺(tái)EasyDL等、實(shí)訓(xùn)平臺(tái)AI Studio、軟硬一體的AI能力,持續(xù)降低AI應(yīng)用門檻,幫助開(kāi)發(fā)者和企業(yè)應(yīng)用AI實(shí)現(xiàn)業(yè)務(wù)創(chuàng)新與升級(jí)。

直面人工智能的機(jī)遇和挑戰(zhàn) 為發(fā)展加速

人工智能技術(shù)發(fā)展迅速,在各行各業(yè)的應(yīng)用落地正在變得更加廣泛并開(kāi)始走向深入。面對(duì)全社會(huì)掀起的人工智能熱潮,我們更要清醒地認(rèn)識(shí)AI發(fā)展的機(jī)遇和挑戰(zhàn)。

在基礎(chǔ)理論層面,小樣本學(xué)習(xí)、低能耗的智能機(jī)制或許是人工智能面臨的最大挑戰(zhàn)。目前的深度學(xué)習(xí)技術(shù)都是建立在大規(guī)模樣本、高能耗計(jì)算的基礎(chǔ)之上,同時(shí),深度神經(jīng)網(wǎng)絡(luò)的結(jié)果很難解釋。因此,未來(lái)的人工智能理論研究,要探索如何讓人工智能像人類一樣,能夠做到小樣本學(xué)習(xí),能耗低,且真正地被理解。

在應(yīng)用技術(shù)層面,視覺(jué)、語(yǔ)音等感知技術(shù)在這一輪深度學(xué)習(xí)的浪潮中得到很大提升,甚至某些方面的能力已經(jīng)超越人類。但在認(rèn)知技術(shù)方面,無(wú)論是對(duì)語(yǔ)言的理解,還是對(duì)知識(shí)的掌握和應(yīng)用,依然有很大的進(jìn)步空間。因此,自然語(yǔ)言處理、知識(shí)圖譜等認(rèn)知技術(shù),將是未來(lái)非常重要的研究方向。

從產(chǎn)業(yè)層面,一方面呈現(xiàn)出軟硬結(jié)合的趨勢(shì),另一方面,深度學(xué)習(xí)框架和AI芯片也將是新的產(chǎn)業(yè)機(jī)會(huì)。“AI芯片能否在產(chǎn)業(yè)上成功,取決于圍繞AI芯片建立起來(lái)的應(yīng)用生態(tài)。其中,深度學(xué)習(xí)框架起到至關(guān)重要的作用,其意義相當(dāng)于指令集和操作系統(tǒng)。”因此,王海峰認(rèn)為,類似百度PaddlePaddle這樣的深度學(xué)習(xí)框架,將會(huì)成為AI時(shí)代的重要基礎(chǔ)設(shè)施。

在應(yīng)用系統(tǒng)層面,多技術(shù)綜合應(yīng)用、結(jié)合場(chǎng)景的系統(tǒng)性創(chuàng)新至關(guān)重要。王海峰建議,研究者可以術(shù)業(yè)有專攻,但產(chǎn)業(yè)界,應(yīng)關(guān)注公司的綜合技術(shù)實(shí)力,特別是其工程落地能力。此外,結(jié)合特定場(chǎng)景和數(shù)據(jù)等特性的系統(tǒng)性創(chuàng)新,也是AI技術(shù)應(yīng)用落地的必要條件。

人工智能經(jīng)過(guò)60余年的發(fā)展,在互聯(lián)網(wǎng)、大數(shù)據(jù)、大計(jì)算、腦科學(xué)等新理論新技術(shù),以及經(jīng)濟(jì)社會(huì)發(fā)展需求的共同驅(qū)使下,正在進(jìn)入一個(gè)嶄新的時(shí)代。如今,它需要與更多不同領(lǐng)域的知識(shí)產(chǎn)生新碰撞,打造競(jìng)爭(zhēng)新優(yōu)勢(shì)、開(kāi)拓發(fā)展新空間。中國(guó)的AI之路也將不斷注入新活力,走得長(zhǎng)且遠(yuǎn)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)