然而很多年過(guò)去了,人機(jī)自然語(yǔ)言交互依然不是主流的交互方式。
盡管投資人、用戶(hù)以及政府都對(duì)人工智能充滿(mǎn)了期望,應(yīng)該看到目前的進(jìn)步都還只是量變,并沒(méi)有達(dá)到質(zhì)變。
于是我們看到很多拿到投資的企業(yè)很快就變得平庸了,不再能讓我們眼前一亮。
但最初的操作系統(tǒng)是命令化操作,只有專(zhuān)業(yè)人士才能記住那些復(fù)雜的命令,于是電腦成了“奢侈品”,普及困難。
觸摸屏交互和鼠標(biāo)鍵盤(pán)交互存在的問(wèn)題主要有以下幾點(diǎn):
第一、菜單式操作,能容納的功能有限。大多數(shù)人在手機(jī)上安裝的APP不會(huì)多于100個(gè),大多數(shù)人即便在電腦上安裝的軟件數(shù)量也不會(huì)多于100個(gè)。因?yàn)樘嗔瞬檎移饋?lái)就很困難。我們大多數(shù)人手機(jī)里的電話(huà)號(hào)碼不會(huì)多于1000個(gè),微信里的好友很多人連5000個(gè)都沒(méi)有加滿(mǎn)。這都是受限于操作系統(tǒng)需要通過(guò)菜單展示信息。
第二、需要人理解機(jī)器。過(guò)去計(jì)算機(jī)要輸入漢字是件很困難的事情。我們上學(xué)時(shí)最流行的是五筆字型輸入。需要參加培訓(xùn)才能學(xué)會(huì)這種輸入法?,F(xiàn)在也需要通過(guò)各種輸入法去解決漢字輸入的問(wèn)題。這就需要我們理解輸入法的規(guī)則。過(guò)去很多軟件操作都很復(fù)雜,需要經(jīng)過(guò)培訓(xùn)成為專(zhuān)業(yè)人士用戶(hù)才能使用?,F(xiàn)在盡管軟件都智能了很多,但一些軟件還是需要人們?nèi)W(xué)習(xí)才能掌握它的使用方法。
第三、需要近距離操作,占用手和眼。無(wú)論鍵盤(pán)鼠標(biāo)還是觸摸屏,都需要近距離操作,需要手眼配合。因此在用計(jì)算機(jī)和電腦的時(shí)候,我們就不能干別的事情。另外,也因?yàn)榻嚯x操作,限制了人們的使用場(chǎng)景。例如,必須有電源,有辦工作安防電腦等等。
為什么SIRI不能實(shí)現(xiàn)以上功能呢?很多時(shí)候,那些SIRI一類(lèi)機(jī)器人更像個(gè)智障。
其實(shí)人機(jī)自然語(yǔ)言交互需要的不僅僅是自然語(yǔ)言處理,而是一個(gè)系統(tǒng),一個(gè)大腦。語(yǔ)言處理的過(guò)程就是思辨的過(guò)程。我說(shuō)“吃”,你不知道我說(shuō)的啥意思,但我說(shuō)話(huà)的對(duì)象就能聽(tīng)得懂。因?yàn)樗麖奈疫@里獲得的信息比你多,他能綜合各個(gè)信息通過(guò)思辨來(lái)理解我的意圖。語(yǔ)言本身是模糊的,甚至矛盾的。說(shuō)“是”也許表達(dá)的是否定,說(shuō)“快樂(lè)”也許表達(dá)的是傷心。只有通過(guò)思辨才能理解一句話(huà)。機(jī)器要理解人就需要機(jī)器具備思辨能力,思辨能力就是智慧。如果像寫(xiě)普通程序那樣寫(xiě)人工智能程序,不會(huì)讓機(jī)器擁有思辨能力。
其次,只有機(jī)器擁有了相應(yīng)的知識(shí)才能解決相應(yīng)問(wèn)題。但人類(lèi)的知識(shí)是個(gè)無(wú)限集,是非常非常龐大的。只有通過(guò)UGC的模式,讓每個(gè)參與者都為機(jī)器人提供知識(shí),才能保證機(jī)器人擁有無(wú)限多的知識(shí)。如果需要通過(guò)訓(xùn)練來(lái)讓機(jī)器人擁有知識(shí),那普通用戶(hù)是無(wú)法參與的。
另外,語(yǔ)言是流動(dòng)的是模糊的。一個(gè)詞在現(xiàn)代包含的意思和在古代不一定完全相同。一句話(huà)在不同的場(chǎng)合含義都不一樣。要理解語(yǔ)言,不是理解字面,而應(yīng)當(dāng)去理解文字背后的語(yǔ)義。如果把語(yǔ)言當(dāng)成處理對(duì)象,那就錯(cuò)了。