隨著科技的進(jìn)步,我國(guó)已經(jīng)邁入發(fā)展的新時(shí)代。大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新,在這個(gè)鼓勵(lì)創(chuàng)新和進(jìn)步的時(shí)代,人工智能受到了前所未有的關(guān)注、得到了廣泛的應(yīng)用,產(chǎn)生的影響也越來(lái)越大。
人工智能因何成名?
阿爾法狗與李世石的人機(jī)大戰(zhàn)引起了廣泛的爭(zhēng)議和討論,使得很多人開(kāi)始關(guān)注人工智能。這類(lèi)充滿(mǎn)了噱頭和趣味性的事件,滿(mǎn)足了人們的獵奇心理,也掀開(kāi)了人工智能的神秘面紗。
在傳統(tǒng)的認(rèn)知觀念中,人們仿佛認(rèn)定人工智能指的就是機(jī)器人。實(shí)際上,機(jī)器人只是人工智能所有應(yīng)用中的一小部分。除了機(jī)器人之外,人工智能還包括機(jī)器視覺(jué),指紋識(shí)別,人臉識(shí)別,視網(wǎng)膜識(shí)別,虹膜識(shí)別,掌紋識(shí)別,專(zhuān)家系統(tǒng),自動(dòng)規(guī)劃,智能搜索,定理證明,博弈,自動(dòng)程序設(shè)計(jì),智能控制,機(jī)器人學(xué),語(yǔ)言和圖像理解,遺傳編程等。由此可見(jiàn),人工智能的實(shí)際應(yīng)用領(lǐng)域是多么廣泛。
語(yǔ)音識(shí)別大放光彩
就像世界上沒(méi)有兩片完全相同的樹(shù)葉一樣,每個(gè)人都有不同于他人的特點(diǎn)和個(gè)性,比如血型、骨骼、膚色等這些在生理上的表現(xiàn) 。其中較為明顯的就是聲音,任何兩個(gè)人的聲紋信息都是不同的。
還記得前段時(shí)間曾經(jīng)引起熱議和追捧的綜藝《聲臨其境》,眾多大咖如:韓雪、朱亞文、梅婷等,都以自己獨(dú)特的聲音塑造角色,用自己的聲音魅力再現(xiàn)經(jīng)典,引發(fā)了觀眾的共鳴。每個(gè)人的聲音都各具特色,這也就展現(xiàn)出個(gè)體的差異性和聲音的獨(dú)特性。隨著這檔綜藝節(jié)目的收視長(zhǎng)虹,語(yǔ)音識(shí)別技術(shù)也悄然進(jìn)入人們的視野。語(yǔ)音識(shí)別作為人工智能領(lǐng)域極具代表性的技術(shù)之一,在人們的智能生活中發(fā)揮的作用也越來(lái)越重要。這種智能科技能夠提高我們的生活質(zhì)量,為我們的生活提供有效的智能輔助,讓我們的生活更加便利。
在智能家居生活中,語(yǔ)音識(shí)別技術(shù)可以應(yīng)用于多個(gè)場(chǎng)景。包括聲控?zé)?、聲控家具、聲控多媒體、車(chē)載聲紋系統(tǒng)等等。只要下達(dá)一句簡(jiǎn)單的口令,利用我們的聲音就可以喚醒智能家居設(shè)備。例如:聲控?zé)?。以前家里客廳的燈總是要用手指觸摸開(kāi)關(guān)才能打開(kāi)或者是關(guān)閉,而現(xiàn)在呢?只需要對(duì)著聲控?zé)粽f(shuō)出指令詞,就可以開(kāi)關(guān)燈,比起以前的確是方便了許多。
廣泛應(yīng)用語(yǔ)音識(shí)別
目前,多家手機(jī)產(chǎn)商加緊了在語(yǔ)音識(shí)別技術(shù)方面的布局速度。例如:LG設(shè)計(jì)的G7 ThinQ智能手機(jī)就應(yīng)用了遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別技術(shù)。5月4日,阿里確認(rèn)全資收購(gòu)北京先聲互聯(lián)科技有限公司(以下簡(jiǎn)稱(chēng)“先聲互聯(lián)”),后者是國(guó)內(nèi)最早從事語(yǔ)音增強(qiáng)、遠(yuǎn)講語(yǔ)音交互接口技術(shù)的團(tuán)隊(duì),曾為阿里、百度、小米等多家公司提供遠(yuǎn)講語(yǔ)音交互軟硬件的解決方案??梢?jiàn),國(guó)內(nèi)高新科技企業(yè)對(duì)于語(yǔ)音識(shí)別布局的重視。
語(yǔ)音識(shí)別當(dāng)中有一項(xiàng)重要的內(nèi)容叫“遠(yuǎn)程識(shí)別”,意思是無(wú)論我們走到何地,通過(guò)聲紋信息,都可以方便、快捷地實(shí)現(xiàn)身份識(shí)別。這種技術(shù)為金融、社保等領(lǐng)域的大規(guī)模身份識(shí)別活動(dòng)創(chuàng)造了便利的條件。以前這些大規(guī)模的身份認(rèn)證活動(dòng)存在流動(dòng)性大、審核困難的問(wèn)題,代領(lǐng)、代簽、冒認(rèn)等行為難以杜絕。而語(yǔ)音識(shí)別技術(shù)有效地解決了這些問(wèn)題,用戶(hù)完全可以通過(guò)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行身份認(rèn)證和遠(yuǎn)程識(shí)別。這就為我國(guó)全面推行實(shí)名制奠定了基礎(chǔ)。
語(yǔ)音識(shí)別面臨難題
隨著語(yǔ)音識(shí)別技術(shù)的應(yīng)用和推廣,一些難題也逐漸顯現(xiàn)出來(lái)。
識(shí)別率是衡量語(yǔ)音識(shí)別系統(tǒng)性能好壞的一個(gè)重要指標(biāo),在實(shí)際應(yīng)用中,識(shí)別率主要受到以下幾個(gè)因素的影響:
第一、背景噪音。如果所處的環(huán)境比較嘈雜,那么語(yǔ)音便會(huì)混沌不清,語(yǔ)音識(shí)別會(huì)受到周?chē)車(chē)h(huán)境的干擾。
第二、口語(yǔ)問(wèn)題。人們?cè)跍贤ń涣鲿r(shí)往往具有很大的隨意性,并不完全符合語(yǔ)法和詞匯使用的規(guī)范,有時(shí)也會(huì)隨意顛倒語(yǔ)序,這對(duì)語(yǔ)義的分析和理解造成了重大的影響。而語(yǔ)音識(shí)別終究還是人和機(jī)器之間能夠?qū)崿F(xiàn)“人機(jī)對(duì)話”,就像是“人與人對(duì)話”一樣自然和通暢。
此外,識(shí)別率還與說(shuō)話人的性別、發(fā)音習(xí)慣、說(shuō)話時(shí)間的長(zhǎng)短等有關(guān)。
實(shí)時(shí)性是衡量語(yǔ)音識(shí)別系統(tǒng)性能好壞的另一個(gè)指標(biāo)。對(duì)于具有高速運(yùn)算能力的CPU和大容量存儲(chǔ)器的PC而言,基本上能夠滿(mǎn)足實(shí)時(shí)性的要求;而對(duì)于資源有限的嵌入式系統(tǒng)來(lái)說(shuō),實(shí)時(shí)性幾乎得不到保證。
語(yǔ)音識(shí)別之路漫漫,在發(fā)展的過(guò)程中還面臨諸多難題,愿未來(lái)的人機(jī)互動(dòng)能更加暢通,語(yǔ)音識(shí)別能夠?yàn)槿藗兊纳顜?lái)更多的便利!