Debater是人類(lèi)歷史上首次出現(xiàn)的可以與人類(lèi)對(duì)手進(jìn)行復(fù)雜辯論的AI人工智能系統(tǒng),舊金山辯論賽的人類(lèi)對(duì)手為曾在2016年獲得以色列國(guó)家辯論冠軍以色列大四女生Noa Ovadia和以色列國(guó)際辯論協(xié)會(huì)主席Dan Zafrir。Debater與兩位人類(lèi)辯手在兩場(chǎng)辯賽中,成功在“是否應(yīng)該增加使用遠(yuǎn)程醫(yī)療”辯論中扭轉(zhuǎn)了更多現(xiàn)場(chǎng)觀眾的最初觀點(diǎn)。
無(wú)論是人類(lèi)辯手還是Debater,都是現(xiàn)場(chǎng)拿到辯題并臨時(shí)準(zhǔn)備?,F(xiàn)場(chǎng)觀眾的評(píng)價(jià)是:整體來(lái)看,人類(lèi)辯手的表達(dá)更好,但AI辯手傳遞信息量的豐富度則優(yōu)于人類(lèi)。Debater歷時(shí)逾六年研發(fā),是IBM繼1997年打敗人類(lèi)國(guó)際象棋大師的“Deep Blue”(深藍(lán))和2011年在益智游戲節(jié)目《危險(xiǎn)邊緣》國(guó)戰(zhàn)勝人類(lèi)冠軍的“Watson”(中文音譯:沃森)之后的又一里程碑。
顯然,人工智能在國(guó)際象棋中要學(xué)習(xí)的是高度程序化的游戲規(guī)則、在益智游戲節(jié)目中要學(xué)習(xí)的是冷冰冰的百科知識(shí),而與人類(lèi)辯論則要理解和掌握人類(lèi)的政治、文化、法律、宗教、經(jīng)濟(jì)甚至是情感和藝術(shù)等非理性內(nèi)容,同時(shí)還要在短時(shí)間內(nèi)完成廣泛而深度的閱讀理解以及長(zhǎng)篇陳述表達(dá),表達(dá)除要有復(fù)雜的邏輯外,還要融入適當(dāng)?shù)挠哪颓榫w以感染現(xiàn)場(chǎng)觀眾。種種挑戰(zhàn),如果成功,亦如Debater的闡述:如果我有血液,我的血液將沸騰。
就在2018上海人工智能大會(huì)前夕, 筆者采訪了IBM海法研究院的三位科學(xué)家,深挖了Project Debater背后的AI技術(shù)、科研價(jià)值,及其在AI發(fā)展歷程中的地位。
36篇頂級(jí)學(xué)術(shù)論文
【上圖為IBM 海法研究院Project Debater首席研究員Noam Slonim博士(右)、Project Debater全球經(jīng)理Ranit Aharonov博士(左)接受視頻采訪】
Debater是由IBM Research開(kāi)發(fā)的AI技術(shù)集成項(xiàng)目,該項(xiàng)目由IBM研究院以色列海法實(shí)驗(yàn)室于2011年提出。與傳統(tǒng)辯論相同,Debater與人類(lèi)辯手各有4分鐘陳述自己論點(diǎn),4分鐘反駁對(duì)方論點(diǎn),2分鐘總結(jié)陳詞。
對(duì)于給定的主題,Debater系統(tǒng)會(huì)在巨大的知識(shí)庫(kù)內(nèi)進(jìn)行搜索,尋找最相關(guān)的觀點(diǎn)和證據(jù),然后在其中選擇最吸引人、最多樣化、支持度最高的論點(diǎn),把這些構(gòu)建成一個(gè)完整的觀點(diǎn)加以敘述。與人類(lèi)辯手一樣,Debater事先并不知道辯題,在現(xiàn)場(chǎng)只有30分鐘左右的準(zhǔn)備時(shí)間。當(dāng)Debater知道了辯題后的30分鐘之內(nèi),就會(huì)通過(guò)自己的算法在知識(shí)庫(kù)和語(yǔ)料庫(kù)中搜索,形成有利于自己論點(diǎn)的論證。
六年來(lái),IBM研究院團(tuán)隊(duì)為Debater系統(tǒng)賦予了三種能力,每種能力都可開(kāi)創(chuàng)新的人工智能領(lǐng)域:數(shù)據(jù)驅(qū)動(dòng)的演講稿撰寫(xiě)和表達(dá)——Debater第一次證實(shí)了計(jì)算機(jī)能夠消化海量語(yǔ)料庫(kù),針對(duì)給定的有爭(zhēng)議的簡(jiǎn)短主題描述,能夠撰寫(xiě)結(jié)構(gòu)良好的演講內(nèi)容,并清晰且有針對(duì)性地表達(dá)出來(lái),甚至還會(huì)適時(shí)地展現(xiàn)幽默感;聽(tīng)力理解——能夠識(shí)別長(zhǎng)段連續(xù)口語(yǔ)中隱含的重要概念和觀點(diǎn);模擬人類(lèi)困境——通過(guò)獨(dú)特的知識(shí)表達(dá)方式來(lái)模擬人類(lèi)爭(zhēng)議和困境,使系統(tǒng)能夠根據(jù)需要提出有原則的論點(diǎn)。
截止到2018年9月,Debater項(xiàng)目一共在6大研究領(lǐng)域誕生了36篇國(guó)際性學(xué)術(shù)論文以及相關(guān)的數(shù)據(jù)集。
其中,在海量語(yǔ)料庫(kù)挖掘辯論內(nèi)容領(lǐng)域(Argument Mining),涉及:在語(yǔ)料庫(kù)中偵測(cè)論點(diǎn)、在語(yǔ)料庫(kù)中自動(dòng)偵測(cè)證據(jù)、自動(dòng)否認(rèn)論點(diǎn)、通過(guò)循環(huán)預(yù)測(cè)進(jìn)行論點(diǎn)綜合分析、整個(gè)語(yǔ)料庫(kù)中無(wú)監(jiān)督式論點(diǎn)偵測(cè)、弱監(jiān)督式論點(diǎn)內(nèi)容搜索引擎、用自然語(yǔ)言計(jì)算辯論質(zhì)量、辯論質(zhì)量評(píng)估、用聯(lián)合推理模型進(jìn)行辯論關(guān)系分類(lèi)等9篇學(xué)術(shù)論文。
在深度神經(jīng)網(wǎng)絡(luò)和弱監(jiān)督領(lǐng)域,涉及:用弱監(jiān)督學(xué)習(xí)抽象概念、用弱監(jiān)督學(xué)習(xí)訓(xùn)練辯論內(nèi)容搜索引擎、用于提高辯論內(nèi)容挖掘神經(jīng)網(wǎng)絡(luò)的高質(zhì)量人工標(biāo)注數(shù)據(jù)與低質(zhì)量自動(dòng)產(chǎn)生數(shù)據(jù)的混合、近似句偵測(cè)、語(yǔ)音輸出時(shí)的強(qiáng)調(diào)詞預(yù)測(cè)和強(qiáng)調(diào)句預(yù)測(cè)、辯論表達(dá)時(shí)的停頓預(yù)測(cè)、自動(dòng)辯論內(nèi)容識(shí)別、辯論打分等9篇國(guó)際學(xué)術(shù)論文。
在自然語(yǔ)言處理領(lǐng)域,涉及:用概念圖譜表達(dá)文本語(yǔ)義的相關(guān)性、偵測(cè)辯論結(jié)構(gòu)和框架等4篇國(guó)際學(xué)術(shù)論文。在文本到語(yǔ)音轉(zhuǎn)換領(lǐng)域,涉及:改進(jìn)演講稿模型等3篇國(guó)際學(xué)術(shù)論文。此外,還產(chǎn)生了7篇數(shù)據(jù)集相關(guān)的國(guó)際學(xué)術(shù)論文。
IBM海法研究院Project Debater首席研究員Noam Slonim博士表示,盡管是六年之前開(kāi)始Debater的研究,但時(shí)值今日依然認(rèn)為一切工作才剛剛起步,就計(jì)算辯論本身而言就有太多有趣的問(wèn)題等待被發(fā)掘。
找到用于決策的有效信息
(上圖為IBM 海法研究院AI Tech副總裁Aya Soffer博士接受視頻采訪)
AI領(lǐng)域的重大挑戰(zhàn)是什么?在AI領(lǐng)域應(yīng)該關(guān)注什么樣的人類(lèi)難題,從而以關(guān)注的難題去推動(dòng)AI領(lǐng)域的下一步發(fā)展?
IBM海法研究院AI Tech副總裁Aya Soffer博士表示,在真實(shí)的世界中并不需要回答很多瑣碎的問(wèn)題,而是要回答真正重要的問(wèn)題,從而做出真正重要的決策。從海量信息中找到有助于正確決策的信息,是非常困難的:首先,能幫助人們做出正確決策的信息量本來(lái)就少;其次,如何找到這些信息就更加困難。因此,從對(duì)于決策的重要性出發(fā),IBM研究院六年前確定要把辯論作為AI的下一個(gè)重大挑戰(zhàn)做研究,并且使得AI擁有辯論的功能和用途。
辯論是一個(gè)開(kāi)放式的挑戰(zhàn),這與之前AI所解決的挑戰(zhàn)完全不同。之前的AI挑戰(zhàn)總是有具體的衡量指標(biāo)用于判斷輸贏,而在辯論中則沒(méi)有明確的辦法進(jìn)行打分。辯論中就像實(shí)際的商業(yè)決策一樣,沒(méi)有清晰而簡(jiǎn)單標(biāo)準(zhǔn),可以用分?jǐn)?shù)高低衡量輸贏。Debater項(xiàng)目的本身目標(biāo)就是建立一個(gè)系統(tǒng),幫助人們?cè)诖鸢覆皇欠呛诩窗讜r(shí),作出基于證據(jù)的決定。
辯論在算法方面的重大挑戰(zhàn)包括Debater要能聽(tīng)長(zhǎng)達(dá)4分鐘的內(nèi)容,對(duì)方人類(lèi)辯手在講的過(guò)程中可能是很快的語(yǔ)速,充滿激情的演說(shuō),同時(shí)還帶有道德性、倫理性陳述,Debater要在聽(tīng)力理解中做到能夠理解對(duì)方所表達(dá)的主旨。這與業(yè)界所熟悉的個(gè)人智能助手完全不同,因?yàn)橄駛€(gè)人智能助手類(lèi)AI只需要聽(tīng)懂一句話就可以,比如開(kāi)燈、關(guān)燈,而Debater要在很長(zhǎng)的語(yǔ)句中聽(tīng)懂對(duì)方的主旨。
此外,在辯論開(kāi)始時(shí)要做一個(gè)本方觀點(diǎn)開(kāi)場(chǎng)白,即觀點(diǎn)陳述文章,要求Debater具有自動(dòng)寫(xiě)成功能,可以具有說(shuō)服力的清晰地闡述。Debater還總結(jié)了人類(lèi)專家辯手的一些共性,進(jìn)行模擬、建模后注入到系統(tǒng)中,就形成了一個(gè)知識(shí)圖譜。一旦開(kāi)始辯論,Debater就可以在已經(jīng)形成的知識(shí)圖譜中進(jìn)行索引和導(dǎo)航,找到可以支撐觀點(diǎn)的證據(jù)。
走近人類(lèi)的智慧
“關(guān)于AI的下一步,就是智慧上越來(lái)越接近人類(lèi)。我覺(jué)得Debater是一個(gè)很好的例子,它展示了我們?nèi)绾谓淌跈C(jī)器,只要有充足的時(shí)間、充分的數(shù)據(jù)和算法就可以充分前進(jìn)。”Aya Soffer表示。
就Debater本身的下一步發(fā)展,Noam Slonim表示,人類(lèi)的辯論能力包括三個(gè)部分,也就是幾千年前亞里士多德提出的辯論三原則:邏輯(logos)、表達(dá)(ethos)、情感(pathos)。亞里士多德曾經(jīng)指出辯論術(shù)是對(duì)話中辯駁的技術(shù),而修辭學(xué)則是演講中說(shuō)服的技術(shù),兩者在表現(xiàn)形式上不同,但卻有著內(nèi)在的一致性。現(xiàn)在的AI還只能關(guān)注到邏輯本身,而對(duì)于自己的立場(chǎng)、向?qū)Ψ絺鬟_(dá)信息時(shí)所帶有的色彩、傳遞方式和修辭表達(dá)方式的研究還很少。
今天的Debater仍然是一個(gè)初級(jí)階段,但已經(jīng)能夠向世界展示它的可行性和可達(dá)到性。那么,Debater之后的下一個(gè)挑戰(zhàn)是什么?
Aya Soffer認(rèn)為,下一個(gè)挑戰(zhàn)就是要讓人工智能更像人類(lèi)。就好像一個(gè)小孩子去上學(xué),看了兩三張大象的圖片后,學(xué)會(huì)了從不同的角度看大象,那么再下一次再看到大象的圖片,即使是其它的角度也能知道這是大象,也就是人可以理解概念,并且在概念的基礎(chǔ)上學(xué)以致用到新的領(lǐng)域,這種開(kāi)放域的強(qiáng)應(yīng)用能力是目前機(jī)器不具備的。
目前AI再發(fā)達(dá),尚不能把概念進(jìn)行學(xué)以致用的應(yīng)用。IBM研究員們希望AI下一步的發(fā)展是從比較窄的例子上學(xué)習(xí),而后擴(kuò)展到比較寬泛的領(lǐng)域、跨不同領(lǐng)域的應(yīng)用,以及能夠從概念上學(xué)習(xí)。這不是再學(xué)習(xí)的能力,而是具備能夠自行推理的能力。
對(duì)于Debater的商業(yè)應(yīng)用,將有助于各類(lèi)決策。辯論本身不是源于沖突和競(jìng)爭(zhēng),而是源于更有建設(shè)性的討論。辯論豐富了決策制定的過(guò)程,幫助人們權(quán)衡新想法、新理念的利弊。辯論不只是為了說(shuō)服他人,也是為了理解和學(xué)習(xí)彼此的觀點(diǎn),做出更加無(wú)偏見(jiàn)的決策。
IBM海法研究院Project Debater全球經(jīng)理Ranit Aharonov博士表示,Debater的可能商業(yè)應(yīng)用范圍包括:金融顧問(wèn),通過(guò)Debater找出金融事實(shí),用以支持或反對(duì)金融分析師所思考的金融投資選擇;律師,借助Debater來(lái)尋找相關(guān)案件和主張,或借助Debater模擬法庭辯論來(lái)分析優(yōu)勢(shì)和劣勢(shì);公共事務(wù)決策,通過(guò)Debater公正的優(yōu)/缺點(diǎn)分析和對(duì)人類(lèi)困境的模擬,為決策提供基于事實(shí)、沒(méi)有人為偏見(jiàn)的觀點(diǎn);企業(yè)決策,通過(guò)Debater拓寬思路,在關(guān)鍵決策中納入可能沒(méi)有考慮到的新觀點(diǎn)等。
展望未來(lái),雖然計(jì)算辯論是一個(gè)嶄新的科學(xué)領(lǐng)域,但是所支持的是人類(lèi)非常古老和傳統(tǒng)的辯論文化。對(duì)于計(jì)算辯論的研究,無(wú)論是人工智能本身,還是研究學(xué)者,都是“熱血沸騰”式里程碑式,將對(duì)人類(lèi)的前途有著深遠(yuǎn)的意義和影響。