科大訊飛語音助手:實現(xiàn)智能家居量身定做

責任編輯:editor04

2014-08-25 19:45:56

摘自:鈦媒體

科大訊飛的靈犀3.0語音助手,可謂為智能家居量身定做。用語音實現(xiàn)對智能家居的操控,聽起來很酷;不過,這樣的交互場景距離我們依然很遠,我們還未習慣于通過語音交互來完成指令和任務,這將是未來智能語音技術(shù)必須解決的問題:同時實現(xiàn)自然語言交互和完成有用任務。

2011年,蘋果在iPhone 4S上首次內(nèi)置了Siri,此后的幾年間,幾乎所有的手機都開始內(nèi)置語音助手類的應用。當下比較為大家所知的國際上有Google Now、微軟小娜(準確的說,是“個人智能助理”Cortana),國內(nèi)公認語音搜索技術(shù)較為成熟的科大訊飛、以及百度、搜狐等公司都推出了語音助手類應用。而今年以來,在各大科技巨頭紛紛布局智能家庭領(lǐng)域之時,語音交互技術(shù)再次成為他們搶占入口的籌碼。

設想一下,在人工智能時代,智能入口將會是什么樣子?或者說決定智能家庭入口的關(guān)鍵因素是什么?

“在智能家居行業(yè)這個萬億級的市場機會中,自然人機接口和人工智能是關(guān)鍵的通用技術(shù)。”

科大訊飛董事長劉慶峰在接受鈦媒體采訪時說道。尤其在場景化的環(huán)境下,如遇到不方便手或眼操作的情況,語音將是首選方式。

確實,語音作為人類溝通和信息獲取最自然、最便捷的交互技術(shù),使得人與機器之間的交互能夠像人與人之間交流,對提升人機交互的友好性和信息系統(tǒng)的應用普及有著舉足輕重的作用。

問題是,既然智能家居市場的語音交互有著巨大的潛力,為什么一直沒能迅速火起來甚至普及?根據(jù)鈦媒體的觀察,原因主要有三點:

1、沒有建立統(tǒng)一的行業(yè)標準,硬件適配很復雜,導致硬件廠商不敢貿(mào)然投入大規(guī)模的研發(fā),現(xiàn)階段仍處于試水期。

2、教育用戶市場問題:用戶對語音的使用習慣需要一個培育過程,目前智能家居產(chǎn)品仍然是小眾人群才接觸的到,智能家居的理念需要時間推廣和普及。

3、語音操控對網(wǎng)絡依賴性較大,而智能家居的控制多是基于WiFi網(wǎng)絡的,如果網(wǎng)絡不穩(wěn)定或者斷掉,智能家居的語音交互馬上就變成了完全失靈的狀態(tài)。

針對這三個問題,科大訊飛董事長劉慶峰并沒有顯示出過多的擔心,并且還向鈦媒體透露,“工信部已表態(tài),將在今年第四季度制定相應的行業(yè)標準,來推動智能家居市場的發(fā)展”,這意味著,智能家居行業(yè)發(fā)展過程中的最大絆腳石將被推開。

但是如今的語音助手類應用存在著功能的同質(zhì)化、語音識別準確率低,尤其在復雜的環(huán)境條件下體驗不佳的問題,這也是科大訊飛的技術(shù)團隊一直在著力解決的一個技術(shù)難點。

近期,科大訊飛對其靈犀語音產(chǎn)品助手進行了升級,推出了最新的語音助手“靈犀3.0”。據(jù)悉,3.0版本基本能夠應對嘈雜環(huán)境糟糕的語音環(huán)境以及麥克風帶來的干擾,而且語音助手靈犀3.0與硬件廠商進行了深度合作,包括對電視、電視、電燈、空調(diào)、熱水器等家電的語音操控。

此外,新版本另一個最大亮點是實現(xiàn)了“預設任務”功能。比如,你可以預設好回家時需要空調(diào)打開調(diào)為26攝氏度并關(guān)上窗簾,當你遠程對著手機說“我要回家了”的時候,你預設好的這些任務就可以全部執(zhí)行,這雖然只是把文字任務轉(zhuǎn)變?yōu)檎Z音任務,還是會更智能家居帶來更多智能的感覺。

據(jù)劉慶峰介紹,目前主流的電視廠商和科大訊飛基本都有合作,包括TCL、長虹、海爾、海信、康佳、創(chuàng)維等,有的是個別品牌,有的則是全線產(chǎn)品??拼笥嶏w進入智能家居領(lǐng)域是要推動“從手控到聲控”的變革。從中也不難看出,科大訊飛以智能語音技術(shù)切入智能家庭市場的決心。

不過,在實際測試中鈦媒體編輯發(fā)現(xiàn),靈犀語音助手3.0對語義的識別并不是很理想,如果靈犀沒能正確識別,還會提示你可以如何如何來下命令,這就給交互造成了較大的局限。也就是說,單獨的語音識別在設備中的應用依然不夠“聽話”。

不過至少,科大訊飛做出了可以讓用戶“擺脫手機”的語音交互方式。

用語音實現(xiàn)對智能家居的操控,聽起來很高大上,不過這樣的交互場景,距離我們依然很遠。根據(jù)鈦媒編輯的調(diào)查,絕大部分人利用語音助手只是簡單的聊天和打發(fā)時間,而不是用來完成任務。加上目前智能家居中的語音交互還比較依賴于手機。也就是說未來智能語音技術(shù)的發(fā)展,必須同時解決自然語言交互和完成有用任務的問題。

如果某一天可以讓機器像人腦一樣做到學習和思考,進而實現(xiàn)機器從“能聽會說”到能理解會思考的跨越,智能家居的語音交互時代也就真的來了。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號