智能家居市場 語音識別這一密鑰何時才能被激活?
說到智能語音就不能不提智能家居。在當(dāng)下的智能家居行業(yè),語音基于其交互的自然性,被認(rèn)為是未來人與家居交互的主要入口路徑,以致業(yè)內(nèi)普遍認(rèn)為,“以語音為入口連接各種服務(wù),構(gòu)建智家生態(tài)”。
作為人工智能應(yīng)用最成熟的技術(shù)之一,目前語音交互的核心環(huán)節(jié)也取得重大突破,語音識別環(huán)節(jié)突破了單點(diǎn)能力,從遠(yuǎn)場識別,到語音分析和語義理解有了重大突破,呈現(xiàn)一種整體的交互方案。自動語音識別(ASR)和前端語音處理的最新發(fā)展已使得語音控制相當(dāng)成熟和有效。ASR引擎可以理解多種語言和口音,而語音生物辨識可用于辨識系統(tǒng)中預(yù)先登錄的特定用戶,以在智能家居環(huán)境中提供不同的權(quán)限。
不過,雖然大多數(shù)家居可以用語音開啟導(dǎo)航,進(jìn)行信息查詢,實(shí)現(xiàn)一些諸如空調(diào)、開燈等功能控制,但距離“以語音為入口連接各種服務(wù),構(gòu)建智家生態(tài)”的理想仍然較遠(yuǎn)。目前的技術(shù)仍然限制在5公尺的范圍內(nèi),并且難以在多人同時交談或吵雜的環(huán)境中操作。
影響語音控制技術(shù)進(jìn)入到智能家居或其他應(yīng)用領(lǐng)域的原因很多,包括使用者的習(xí)慣是否被建立、是否提供更多“控制”功能以外的附加價值、是否有更“特別”的應(yīng)用出現(xiàn),以及安全性的問題。其中,安全性可說是消費(fèi)者最為關(guān)注的部分。
就像著名電影《蜘蛛俠》中的那句臺詞:“力量越大,責(zé)任越重。”語音識別能量越大,就越需要安全閥門。首先是聲紋的采集。不管是人工識別,還是依靠深度學(xué)習(xí)算法進(jìn)行自動化識別,聲紋庫的建立都是進(jìn)行一切行動的前提。當(dāng)前,公安的聲紋鑒別庫最全,但如果是企業(yè)要想研究聲紋識別,從公安處入手顯然不可能,因而,企業(yè)智能自行收集聲紋并建立聲紋庫,這是一項(xiàng)十分艱巨的任務(wù)。更重要的是,企業(yè)還要注意如何保障聲紋不被非法利用。
其次,我們都聽說過“無用輸入,無用輸出”的說法,但你想過這句話同樣適用于負(fù)責(zé)業(yè)務(wù)的語音識別嗎?企業(yè)是否有建立污染數(shù)據(jù)安全策略(它能確保攻擊者不會利用篡改過的數(shù)據(jù)欺騙人工智能并讓它推薦錯誤的決策)嗎? 如果設(shè)備根據(jù)錯誤的數(shù)據(jù)做出了錯誤的決策,那么,企業(yè)需要多長時間才能發(fā)現(xiàn)?數(shù)據(jù)污染已經(jīng)是網(wǎng)絡(luò)安全世界中的一個關(guān)注點(diǎn)。 例如,反惡意軟件根據(jù)多重來源提交的標(biāo)記和樣本進(jìn)行工作,而反惡意軟件供應(yīng)商必須保持警惕,防止攻擊者愚弄這一系統(tǒng)。
盡管如此,與其他生物特征相比,聲紋識別的應(yīng)用仍然具有特殊優(yōu)勢,比如聲紋提取可在不知不覺中完成,因此使用者的接受程度也相對較高目前,聲紋識別在全球市場中的占有率達(dá)到15.8%,僅次于指紋和掌紋識別,并呈現(xiàn)出不斷上升的趨勢,因此,我們有理由相信,聲紋識別或?qū)⒊蔀檎Z音交互的下一個風(fēng)口。
結(jié)語:在今天這個快節(jié)奏的社會中,語音識別技術(shù)的誕生,可以說是一次偉大的技術(shù)變革。隨著高質(zhì)量數(shù)據(jù)的不斷積累、技術(shù)的不斷突破及硬件平臺算力的提升,語音識別正在向我們期待的方向快速發(fā)展。