外媒本周刊文,介紹了Facebook虛擬助手M過(guò)去兩年的發(fā)展。Facebook試圖開發(fā)最完美的的聊天機(jī)器人,不過(guò)M取得的進(jìn)展也反映了當(dāng)前人工智能面臨的局限。
以下為AI世代(微信號(hào):tencentai)編譯整理的文章原文:
亞馬遜Alexa可以叫來(lái)Uber的車輛,Siri可以控制你家中的智能恒溫器。目前,這些服務(wù)每天吸引了數(shù)百萬(wàn)用戶。不過(guò),有大約1萬(wàn)人知道,F(xiàn)acebook M才是最聰明的智能助手。這些人大多來(lái)自美國(guó)加州。
推薦并預(yù)訂摩洛哥一家浪漫的酒店,同時(shí)還要適合孩子?沒(méi)問(wèn)題。查詢本地服務(wù)商修剪門前草坪的價(jià)格?也能做到。Facebook這一試驗(yàn)性的智能助手被集成在Messenger應(yīng)用中。M所做的并不是從數(shù)據(jù)庫(kù)中簡(jiǎn)單地提取信息,而是理解復(fù)雜指令并采取行動(dòng),例如預(yù)訂電影票,或是聯(lián)系某家公司獲取信息。
M看起來(lái)如此智能,但實(shí)際上卻借助了作弊行為。M與Siri有類似之處。當(dāng)你向M發(fā)送一條消息時(shí),算法會(huì)試圖判斷你的需求是什么。如果算法未能成功,那么M并不會(huì)簡(jiǎn)單地返回網(wǎng)頁(yè)搜索結(jié)果,或是說(shuō)“對(duì)不起,我不理解這個(gè)問(wèn)題”。相反,人工客服將會(huì)在你不知情的情況下悄悄介入,對(duì)需求做出回復(fù),就像是計(jì)算機(jī)仍在繼續(xù)為你服務(wù)一樣。(Facebook拒絕透露,這些人工客服的總數(shù)。)
這樣的設(shè)計(jì)導(dǎo)致Facebook很難將M推廣至全部12億Messenger用戶。因此2015年,F(xiàn)acebook只向數(shù)千名用戶提供了M,并將M定位為半公開的研發(fā)項(xiàng)目。將人工服務(wù)和算法結(jié)合在一起將幫助Facebook觀察,用戶對(duì)無(wú)所不能的虛擬助手將會(huì)有何反應(yīng),此外算法也可以不斷向人類“訓(xùn)練師”學(xué)習(xí)。
埃里克斯·勒布倫(Alex LeBrun)是這一項(xiàng)目的啟動(dòng)者。他表示:“這個(gè)領(lǐng)域的所有人都?jí)粝腴_發(fā)出非常、非常智能的虛擬助手。”M為實(shí)現(xiàn)這個(gè)目標(biāo)打開了一條路。
目前,在兩年之后,F(xiàn)acebook的這一研究項(xiàng)目可以算得上很成功。用戶喜歡M,而軟件也被證明可以向人類訓(xùn)練師學(xué)習(xí)。不過(guò),F(xiàn)acebook仍然無(wú)法面向Messenger的其余99.9%用戶提供M,這方面的進(jìn)展要遠(yuǎn)遠(yuǎn)比預(yù)期中更慢。
勒布倫表示:“我們知道這是艱巨的挑戰(zhàn),但最終比我想象中更艱巨。無(wú)論是學(xué)習(xí)速度,還是自動(dòng)化的發(fā)展,這些都要比我們期望中更慢。”M的故事再次表明,近年來(lái)人工智能取得了多大的進(jìn)展,以及未來(lái)還有多長(zhǎng)的路要走。
M:“登月”的縮寫
人類似乎非常喜歡與機(jī)器交談。全球首個(gè)聊天機(jī)器人Eliza誕生于1964年,開發(fā)者是麻省理工學(xué)院教授約瑟夫·魏岑鮑姆(Joseph Weizenbaum)。這個(gè)聊天機(jī)器人能掃描一行行文字,并對(duì)特別的關(guān)鍵詞做出回應(yīng),非常適合承擔(dān)臨床醫(yī)生的工作。不過(guò)令魏岑鮑姆感到困擾的是,包括他的秘書在內(nèi),許多試用過(guò)的用戶都會(huì)被其折服,即使他們知道Eliza實(shí)際上一無(wú)所知。他隨后表示:“我沒(méi)有意識(shí)到,對(duì)普通人來(lái)說(shuō),短時(shí)間接觸到簡(jiǎn)單的計(jì)算機(jī)程序也會(huì)引起明顯的妄想癥。”
相對(duì)于讓聊天機(jī)器人喋喋不休地說(shuō)話,讓它們幫你完成工作要更困難。當(dāng)虛擬助手被要求完成某項(xiàng)工作時(shí),模棱兩可或雞同鴨講的回復(fù)沒(méi)有意義。當(dāng)前的軟件不善于理解人類語(yǔ)言和世界,因此類似Siri和Alex的虛擬助手只能通過(guò)編程去掌握特定的技能。
因此,市面上的虛擬助手所能完成的工作很有限。去年底,有觀點(diǎn)認(rèn)為,聊天機(jī)器人將會(huì)像移動(dòng)應(yīng)用一樣改變?nèi)祟惻c計(jì)算機(jī)的交互方式,而這樣的概念吸引了微軟、Facebook和某些科技行業(yè)投資者的興趣。但實(shí)際上,基于以上原因,實(shí)現(xiàn)這一目標(biāo)還非常困難。移動(dòng)服務(wù)Burner CEO格雷格·科恩(Greg Cohen)表示:“當(dāng)前的聊天機(jī)器人令人絕望。對(duì)行業(yè)觀察家來(lái)說(shuō),聊天機(jī)器人被過(guò)分炒作,但發(fā)展情況不佳。”Burner幫助Airbnb平臺(tái)的房主創(chuàng)建簡(jiǎn)單的聊天機(jī)器人,回答顧客的常見問(wèn)題。
在開發(fā)M之前,勒布倫曾花了10年多的時(shí)間開發(fā)傳統(tǒng)上狹義的聊天機(jī)器人。不過(guò),他希望聊天機(jī)器人還能做到更多。他于2015年初加入Facebook,當(dāng)時(shí)Facebook收購(gòu)了他與其他人共同創(chuàng)立的Wit.ai。Wit.ai幫助企業(yè)開發(fā)聊天機(jī)器人,提供客戶支持等服務(wù)。在此之前,勒布倫曾將自己的聊天機(jī)器人公司出售給語(yǔ)音識(shí)別巨頭Nuance。
勒布倫表示:“市面上的每一款聊天機(jī)器人,包括我開發(fā)的這個(gè),都以規(guī)則為基礎(chǔ)。你會(huì)知道,未來(lái)某天,你將觸及天花板,無(wú)法再繼續(xù)前進(jìn)。我們的孩子并不使用規(guī)則或腳本,未來(lái)他們會(huì)比你更聰明。”
M最初只被提供給Facebook員工,隨后開放給了加州部分Messenger的重度用戶。很快,算法就被證明可以學(xué)會(huì)人工的某些操作。
Facebook的人工智能研究部門使用M去測(cè)試被稱作記憶網(wǎng)絡(luò)的新學(xué)習(xí)軟件。這一新軟件擅長(zhǎng)回答關(guān)于簡(jiǎn)單故事的問(wèn)題。軟件能利用存儲(chǔ)模塊摘取關(guān)鍵信息供隨后使用。而谷歌(微博)也在測(cè)試這樣的設(shè)計(jì),優(yōu)化軟件的推導(dǎo)能力。
1964年時(shí),魏岑鮑姆曾提出,這樣的設(shè)計(jì)能令Eliza更智能。在幾周時(shí)間里,M就出現(xiàn)了明顯的變化。勒布倫還記得,他在感謝M為自己訂電影票之后,M的反應(yīng)令他非常驚訝。當(dāng)時(shí)M自動(dòng)回復(fù):“不客氣,享受這場(chǎng)電影吧。”M學(xué)會(huì)了記憶曾經(jīng)協(xié)助過(guò)的任務(wù)及當(dāng)時(shí)的環(huán)境。勒布倫表示:“我們大吃一驚,沒(méi)有人寫程序去實(shí)現(xiàn)這樣的功能。”
記憶網(wǎng)絡(luò)隨后還幫助M獲得了更大的進(jìn)步。例如,如果某人要求M去訂花并配送,那么M會(huì)自動(dòng)利用請(qǐng)求中的關(guān)鍵信息,包括金額和地址,根據(jù)在線花店的信息去生成推薦。人工訓(xùn)練師隨后決定,將哪一選擇推薦給用戶。
此外,M高效的表現(xiàn)也吸引了用戶更大的興趣。對(duì)于Siri和Alexa等完全自動(dòng)化、功能有限的虛擬助手,用戶通常只會(huì)使用其中最可靠的功能。而對(duì)于M,情況并不是這樣。
勒布倫表示:“最開始,人們嘗試去問(wèn)明天的天氣,隨后他們會(huì)問(wèn):‘是否有意大利餐廳有位子?’再然后,他們會(huì)咨詢關(guān)于移民和婚禮籌備的問(wèn)題。我們知道這樣做可能很危險(xiǎn),這要比我們預(yù)期中問(wèn)題的范圍更廣。”
對(duì)于困難的問(wèn)題,人工訓(xùn)練師會(huì)盡最大可能為用戶服務(wù)。不過(guò)有時(shí),他們也會(huì)直接拒絕用戶的問(wèn)題。M會(huì)自動(dòng)拒絕大部分復(fù)雜的用戶問(wèn)題,而用戶問(wèn)題的多樣化也導(dǎo)致算法很難完全承擔(dān)起人工訓(xùn)練師的工作。近期,深度學(xué)習(xí)技術(shù)正推動(dòng)機(jī)器學(xué)習(xí)變得更強(qiáng)大(記憶網(wǎng)絡(luò)就是這樣的應(yīng)用案例)。然而,學(xué)會(huì)在數(shù)據(jù)量很少的情況下處理多種復(fù)雜的場(chǎng)景也并非深度學(xué)習(xí)擅長(zhǎng)的領(lǐng)域。勒布倫表示:“這非常聰明,能學(xué)會(huì)執(zhí)行復(fù)雜的任務(wù),但也需要大量數(shù)據(jù)。”
漫長(zhǎng)的征途
由于進(jìn)展比預(yù)期中更慢,F(xiàn)acebook正在重新考慮這一項(xiàng)目。上周,一個(gè)名為M Suggestion的功能出現(xiàn)在Messenger中。這類似于某些功能簡(jiǎn)單的聊天機(jī)器人,而這正是M試圖取代的目標(biāo)。M Suggesttion會(huì)關(guān)注你和好友的聊天,從中發(fā)現(xiàn)線索,判斷你是否想要做某些操作,例如從Uber叫車或是向他人轉(zhuǎn)賬。M Suggestion提供了一個(gè)按鈕,只需一次點(diǎn)擊即可實(shí)現(xiàn)這些操作。
Wit.ai的另一名聯(lián)合創(chuàng)始人、目前供職于Facebook并負(fù)責(zé)M項(xiàng)目的勞倫特·蘭多斯基(Laurent Landowski)表示:“我決定找到一種應(yīng)用場(chǎng)景,加速向用戶輸出價(jià)值。”(勒布倫今年1月返回了老家法國(guó),加入了Facebook在巴黎的人工智能研究實(shí)驗(yàn)室。)
最初依賴人工的M依然存在,并繼續(xù)向那些幸運(yùn)的用戶提供豐富的服務(wù)。Facebook表示,將致力于這一項(xiàng)目,而當(dāng)前人工智能的發(fā)展?fàn)顩r很不錯(cuò),值得長(zhǎng)期投資??突仿〈髮W(xué)教授賈斯汀·卡塞爾(Justine Cassell)表示,過(guò)去幾年,深度學(xué)習(xí)顛覆了以往的語(yǔ)言處理技術(shù),以及對(duì)相關(guān)軟件的期望。她表示:“我們正處于這些新機(jī)器學(xué)習(xí)算法的黃金時(shí)代。”實(shí)際上,谷歌翻譯的準(zhǔn)確率近期已接近人類水平。
不過(guò)這并不意味著,僅僅通過(guò)觀察人類的活動(dòng),軟件就能學(xué)會(huì)執(zhí)行復(fù)雜的任務(wù)。卡塞爾表示:“我并不認(rèn)為我們已經(jīng)有充分了解。”不過(guò)Facebook的研究員表示,有許多概念有待探索。
其中之一是讓M的自動(dòng)化部分學(xué)會(huì)判斷用戶返回的消息是正面還是負(fù)面。這種機(jī)制與人類訓(xùn)練寵物類似。如果不僅僅是模仿人類訓(xùn)練師的做法,那么M的發(fā)展速度可能會(huì)更快。為了促進(jìn)更廣泛的研究,F(xiàn)acebook團(tuán)隊(duì)發(fā)布了工具,幫助其他人測(cè)試并比較無(wú)預(yù)定腳本的助理機(jī)器人。通過(guò)M Suggestion,新技術(shù)目前也可以在更大范圍內(nèi)得到測(cè)試。
勒布倫和蘭多斯基認(rèn)為,在將M推廣至大眾用戶的過(guò)程中,他們?nèi)蕴幱谡墶Lm多斯基表示:“某些時(shí)候我們說(shuō),這需要3年或5年,但或許會(huì)是10年或更長(zhǎng)時(shí)間。”
勒布倫表示:“這非常難,我們逐步取得進(jìn)展,但我認(rèn)為,我們擁有需要的一切。”他可能是對(duì)的。不過(guò)可以想象,在1964年看到Eliza時(shí),很多人也有類似的期待。