人工智能悄然成為最受期待的新一代數(shù)字技術(shù),創(chuàng)新工場(chǎng)創(chuàng)始人李開復(fù)就曾公開表示過,在這個(gè)時(shí)代,最要緊的便是執(zhí)行力、產(chǎn)品質(zhì)量、速度和數(shù)據(jù)。目前,中國市場(chǎng)正在迅速向新產(chǎn)品和新范式展開懷抱,巨大市場(chǎng)體量產(chǎn)生的海量數(shù)據(jù)成為了人工智能發(fā)展的溫床。隨著AI的迅猛發(fā)展,必將革新現(xiàn)有的交互方式,不在局限于屏幕之中,GUI圖形用戶界面將會(huì)演化為VUI語音用戶界面,人機(jī)對(duì)話將成為AI中一個(gè)重要領(lǐng)域。Gartner稱,2020年85%的客服將被人工智能取代,事實(shí)上,已經(jīng)有很多AI客服走上工作崗位。
早前,谷歌相關(guān)領(lǐng)域?qū)W者總結(jié)出VUI的六大基本原則,確保用戶語音交互能夠連貫持續(xù),協(xié)助實(shí)現(xiàn)以用戶為核心的人機(jī)交流對(duì)話。而近日,竹間智能工程師張程也在某次峰會(huì)中公開表示,人機(jī)交互,不是僅限于語音識(shí)別。單純的語音識(shí)別不是交互,它僅僅是將語言變成文字而已。要做一個(gè)傳統(tǒng)意義上的人工智能,要求能讀懂、看懂和聽懂,還需要具備情感記憶的機(jī)器人并不是一件簡單的事情。對(duì)于用戶而言,人機(jī)交互是獲取體驗(yàn)的最直接的途徑。對(duì)此,如何選擇AI機(jī)器人做好人機(jī)交互,需要從以下4個(gè)維度考慮:
1. 是否具備溝通能力。智能的機(jī)器人員工需要具備識(shí)別用戶情感、情緒能力,將機(jī)器人當(dāng)做人來理解,建立顆粒度更細(xì)致的體系,能夠?qū)崿F(xiàn)文字、表情、聲音等綜合性的多模態(tài)情感情緒識(shí)別;
2. 是否理解用戶用途——自然語言理解。顆粒度越細(xì)致,越能完成更多功能。其次,對(duì)話更加關(guān)注口語處理,如某些特定場(chǎng)景的應(yīng)用等,嵌入上下文對(duì)話,實(shí)現(xiàn)自然語言理解;
3. 是否理解用戶用途——自然語言交互。能夠與用戶實(shí)現(xiàn)交互,并實(shí)現(xiàn)定制行命名實(shí)體,滿足某種特定需求;
4. 是否具備多輪對(duì)話能力。結(jié)合語音作外呼和內(nèi)呼使用,靈活配置各種場(chǎng)景的多輪對(duì)話。
有人曾質(zhì)疑,人機(jī)對(duì)話更像是機(jī)器在做選擇題,由于預(yù)先在其語言庫中內(nèi)置特定問題的多項(xiàng)答案,提問者的問題包含在已有的問題庫中方能實(shí)現(xiàn)。誠然,大部分人機(jī)對(duì)話止步如此,但是對(duì)于開發(fā)者而言,人機(jī)對(duì)話系統(tǒng)已然很復(fù)雜,在每一步都可能出錯(cuò)的情況下,完成用戶任務(wù),對(duì)此,目前大部分的語音識(shí)別,都會(huì)根據(jù)用戶問題在其語言庫中查找提供現(xiàn)有結(jié)果中最好的回答。相信不久之后,更加精進(jìn)的人工智能能夠效仿和人類一樣古老的對(duì)話法則,從更深層次的技術(shù)角度實(shí)現(xiàn)人機(jī)交互。
結(jié)語
人機(jī)交互的概念日久彌新,大數(shù)據(jù)、算法和算力三方面的迅猛發(fā)展,語音機(jī)器人層出不窮,不難察覺,人機(jī)交互將會(huì)掌控大部分市場(chǎng),對(duì)話才是用戶體驗(yàn)的關(guān)鍵,而用戶是未來市場(chǎng)的核心!