智能語音,只是一個美麗的概念

責(zé)任編輯:editor014

2014-11-24 22:18:43

摘自: 速途網(wǎng)

這種現(xiàn)象的背后,是中國科技、經(jīng)濟(jì)、商務(wù)日新月異的良好發(fā)展,也是媒體人、公關(guān)公司們滿嘴跑出來的火車。

科技互聯(lián)網(wǎng)行業(yè)的2014年被成為很多領(lǐng)域的“元年”,比如說今年是4G商用的元年、也是虛擬運營商的元年;春天的時候,專家都說這是打車軟件的元年,六月的時候,這是一個移動互聯(lián)世界杯的元年,到了雙十一購物節(jié),這個元年的稱號又給了“跨境電商”,總之,元年是年年有,2014年特別多。這種現(xiàn)象的背后,是中國科技、經(jīng)濟(jì)、商務(wù)日新月異的良好發(fā)展,也是媒體人、公關(guān)公司們滿嘴跑出來的火車。畢竟,大量的科技元年在短暫地刺激投資者的腎上腺之后,能真正進(jìn)入正規(guī)發(fā)展的寥寥無幾,大概有90%的新技術(shù)成了那種“只有一個元年”甚至“一個元月”的短命鬼。

別說我講話刻薄,連著名思想家、教育家、電商老板馬云也表達(dá)過類似的說法:今天很殘酷、明天更殘酷,后天很美好,但是絕大多數(shù)人死在明天晚上,看不到后天的太陽!事實上,新興的科技行業(yè),最大的較量正在于能否熬過冰冷的夜晚,等到明天的太陽。

除了開篇所講的一些元年之外,2014年還號稱“智能家居”的元年,相關(guān)概念正受到資本和企業(yè)熱烈追捧,而智能家居衍生出的一些技術(shù)也被越來越多地專家解構(gòu)、分析和運用。大概在兩個月前,國內(nèi)語音巨頭科大訊飛宣布,以語音識別切入智能家居領(lǐng)域,連續(xù)發(fā)布了多款軟硬家產(chǎn)品,其中包括新版靈犀語音助手,以及與第三方合作的智能音響和未來遙控,同時,啟動了一個叫做“訊飛大腦”的人工智能計劃,總之,以語音識別為主要產(chǎn)品的科大訊飛堅定地認(rèn)為,智能家居交互模式,一定是建立語言控制之上,而且也在孜孜不倦地推動著相關(guān)語音技術(shù)的發(fā)展,所以,他們宣布切入智能家居領(lǐng)域的時候,聲音非常大,比他們語音助手的音量要大10倍,但遺憾的是,語音技術(shù)之于智能家居只能算是一種依附技術(shù),他的前進(jìn)必須要以智能家居大行業(yè)的發(fā)展為基礎(chǔ)。

簡單來說,單純的語音技術(shù)無法推動智能家居大踏步前進(jìn),就好像,一款精美的手機(jī)保護(hù)膜是沒有辦法幫助諾基亞提高Lumia銷量的。基于此背景,諸如科大訊飛之類的偏技術(shù)型企業(yè),押寶智能家居前,首先要思考的就是:自己能熬幾個冰冷的寒夜。

語音助手,如何變成貼心秘書?

目前,訊飛的主要產(chǎn)品中體現(xiàn)了兩種重要的語音技術(shù),一是語音合成技術(shù),一是語音識別技術(shù);前者已經(jīng)有非常成熟的技術(shù),現(xiàn)如今想要讓機(jī)器人講一口流利的鳥語,或者發(fā)出林志玲式的“加油”嗲聲已經(jīng)非常容易了,但語音識別技術(shù)發(fā)展則相對緩慢,而正是在這項技術(shù)上的突破和創(chuàng)新,才成就了訊飛中文語音領(lǐng)導(dǎo)者的地位,他們推出的訊飛輸入法雖然比不上搜狗輸入法流行,但其中采用的語音識別技術(shù)卻深受用戶好評,支持普通話、英語、四川話、河南話、東北話、天津話、山東話…..行話、黑話等等,目前用戶達(dá)到1億,不僅成為Android手機(jī)的標(biāo)配,而且成功登陸App store,獨享支持語音輸入法第三方軟件的榮耀,而且是那種無需越獄即可安裝的正式編制。

或許,正是自信于自己在語音識別技術(shù)上的優(yōu)勢,訊飛才敢押寶于智能家居,也適當(dāng)?shù)啬芙o巨頭們灌輸了一些利己思想:“語音才是未來智能家居的交互模式”,但如前文所述,智能語音作為整個智能家居中的一種配套技術(shù),沒有辦法,也沒有能力推動整個行業(yè)大踏步前進(jìn),所以,訊飛選擇以“語音”切入智能家居領(lǐng)域并不是一個非常明智的選擇。

不可否認(rèn),訊飛輸入法能支持各地方言證明了語音識別技術(shù)還有著非常大的發(fā)展?jié)摿?,但這也僅僅是“輸入法”的一個應(yīng)用。事實上,任何的機(jī)器識別技術(shù)無不是建立在海量的數(shù)據(jù)、高速的運算基礎(chǔ)上的,語音識別的體驗同樣要取決于語音數(shù)據(jù)存儲的規(guī)模、以及后臺處理的運行能力。不巧的是,智能家居領(lǐng)域需要的數(shù)據(jù)量遠(yuǎn)非一個輸入法所能相比的,這種龐大的數(shù)據(jù)也不是工程師能在實驗室里編碼出來的,而是要把收集工具嵌入到消費者的日常生活中,這也就注定了語音識別技術(shù)不可能獨立發(fā)展,而是要背靠類似蘋果、Google、三星這樣的平臺企業(yè),只有這些巨頭有機(jī)會無時無刻地收集用戶數(shù)據(jù),從而建立起巨大而完善的數(shù)據(jù)庫。遺憾的是,即便有數(shù)億只iPhone滲透于全球消費者、Google的衛(wèi)星也每天在太空中照照片、瞎轉(zhuǎn)悠,但蘋果siri和Google now等語音助手依舊不能成為消費者的貼心秘書,一位美國朋友曾分別問過Siri和Google now,哪里有便宜的雞蛋?蘋果的回答是街區(qū)盡頭的飯館里,而Google則把箭頭指向了跨州的一個著名養(yǎng)雞場,但家里的保姆卻能告訴他:最近的沃爾瑪超市,雞蛋正在搞促銷!

沒有海量的數(shù)據(jù)存儲,語音識別是不可能實現(xiàn)精準(zhǔn)判斷的,事實上,在一些流傳出的智能家居產(chǎn)品測試中,消費者的體驗也非常糟糕,如果貿(mào)然采用不成熟的家居系統(tǒng),可能會出現(xiàn)如下情況: 河北的丈夫回家之后,能順利地通過語言開燈,而來自內(nèi)蒙的妻子,操著一口東北方言,嗓子喊啞了才能把燈打開,而來自廣東的情人,則沒能把燈打開,當(dāng)然,鑒于她和男主人的主要業(yè)務(wù),可能也不需要開燈了。

轉(zhuǎn)型陣痛,訊飛玩不轉(zhuǎn)B2C?

訊飛如今切入智能家居領(lǐng)域,勢必要做好長期沉淀的準(zhǔn)備,只是在可預(yù)見的未來,他們真能比蘋果、谷歌、百度們搜集到更多的數(shù)據(jù)嗎?我看比較懸了,現(xiàn)在連我媽都知道前面三個平臺的巨大影響力,而這也僅僅是筆者不看好訊飛智能家居原因中的一個,更加棘手的問題來自于,作為一家B2B公司,訊飛能否順利過渡到B2C模式。雖說只是一個字母之差,而且在字母表中鄰居,但世界上,卻鮮有企業(yè)能華麗轉(zhuǎn)身。

從面向企業(yè),到直接面對最終消費者,不僅要在產(chǎn)品的研發(fā)管理上進(jìn)行變革,更大的挑戰(zhàn)則來自于用戶需求的把握,從企業(yè)到用戶,需求的變化呈幾何式增長。此前、訊飛可能只需要搞定合作的企業(yè)就萬事大吉了,但如今卻要聆聽每一位客戶需求,還要迅速反應(yīng)、精準(zhǔn)把握住市場的脈絡(luò),甚至需要承擔(dān)起培養(yǎng)用戶習(xí)慣的任務(wù),就好像,為了培養(yǎng)消費者移動支付的習(xí)慣,騰訊和阿里聯(lián)手燒了10億元,剛剛賺了點錢的訊飛,應(yīng)該沒有這種魄力。此外,訊飛B2C最大的瓶頸來自于其根深蒂固的工程師文化,他們員工總數(shù)大概是2500人,其中有1800人都是技術(shù)型團(tuán)隊,面對代碼、機(jī)器和界面時,都是一個個的天才,但卻不一定是一個好銷售,這種艱難可以參考代工大王富士康,他們有著全宇宙最優(yōu)秀的制造能力,能滿足包括蘋果在內(nèi)的全部企業(yè)要求,但這些年來,他們在轉(zhuǎn)型電商、自有品牌手機(jī)、平板等方面卻舉步維艱,其中一個重要的原因就是其濃重的工程師文化作祟,更何況,與訊飛相比,富士康還有一個非常重要的優(yōu)勢:有錢、任性??拼笥嶏w能做到嗎?

科技是第一生產(chǎn)力,我們自然要尊重技術(shù)發(fā)燒友,這也是目前中國社會中最缺少的東西,但我們又不得不承認(rèn),很多大公司的興起,很多行業(yè)的爆發(fā),真不是靠技術(shù),而是靠商業(yè)模式的探索與轉(zhuǎn)變,而在這中轉(zhuǎn)變過程中,平臺型的企業(yè)有著非常巨大的先天優(yōu)勢,留給科大訊飛的轉(zhuǎn)型時間真不多,簡直,沒有!

智能語音,只是一個美麗的概念

數(shù)據(jù)積累、技術(shù)沉淀和商業(yè)模式的轉(zhuǎn)型,尚可以通過艱苦卓絕的奮斗來解決,只是要考慮周期的問題,但語音企業(yè)對于人類天性研究的缺失,則注定了智能語音只是一些美麗的概念,他們可能永遠(yuǎn)無法大規(guī)模商用,況且高級的語音識別技術(shù)和大數(shù)據(jù)技術(shù)會帶來災(zāi)難性的隱私問題和成本問題。為了增添一些能用雙手、或者遙控器就能實現(xiàn)的控制功能,消費者可能要為每平方米的房子多付出1000元…而這也是筆者看好智能家居未來,但不看訊飛智能語音最重要的原因,更何況,他們遠(yuǎn)沒有解碾壓性的便利優(yōu)勢!

智能家居是大勢所趨,每一個消費者都希望能跟家里的電器有著更高效、更便利的溝通,正是基于此人性的分析,各路巨頭才扎堆智能家居:今年10月,在2014年開發(fā)者大會上,海爾推出了一系列智能家電領(lǐng)域產(chǎn)品,同一個月中,監(jiān)控巨頭大華股份和手機(jī)新銳小米都在智能家居領(lǐng)域推出了自己的產(chǎn)品;而海外方面,Google以32億美元收購了一家叫NESTLAB的公司,目的也是進(jìn)軍智能家居領(lǐng)域;三星在Galaxy Note徹底賣不出去之后,也想利用智能家居反擊蘋果…但這些美麗的未來并不屬于語音助手、不屬于科大訊飛,而且筆者認(rèn)為,智能家居大規(guī)模商用的路遙遙無期,但即便大規(guī)模商用之后,人機(jī)主流的交互方式肯定也不是語音:

首先,高級的語音識別技術(shù)就是一個完美的竊聽器,事實上,現(xiàn)在語音技術(shù)最重要的應(yīng)用之一就是監(jiān)控領(lǐng)域。試想一下,當(dāng)整間屋子都裝上智能語音識別產(chǎn)品之后,我們說的每一句話,每一種活動發(fā)出的聲音都有可能被記錄、被分析,后臺的服務(wù)器可能針對音頻的分析知道消費者幾點下班、屋子里有幾個人,甚至能推算出他們的腎功能怎么樣?這簡直是對隱私權(quán)最無情的踐踏。其次,在眾多專家吹噓siri會帶來人家交互革命的時候,筆者就曾撰文反駁。語音助手確實在特定環(huán)境中會提供一定的便利性,例如開車時,或者在陌生的樓道里,但這種便利性并不是無處不在,更沒有必要一直都用,這就涉及到人類交互過程中的分配問題,對于很多情景、很多特殊人群,語音真不是最好的溝通方式,例如一位播音員回到家里后,肯定不想對著電視說:開機(jī),他更愿意打開遙控器,更何況,語音助手在打開電視方面并沒有絕對的優(yōu)勢,就更不要提那些聾啞人了。

總之,語音助手更適合于一些粗獷的領(lǐng)域,而不是精準(zhǔn)定位,筆者建議,科大訊飛可以繼續(xù)完善輸入法、語音監(jiān)控等基礎(chǔ)產(chǎn)品,至于說,智能家居就權(quán)當(dāng)玩票吧,莫說他們可能真等不到智能家居的黎明,即便智能家居普及了,可能也沒有語音助理什么事兒!

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號