3月20日,思必馳在2018中國(guó)人工智能應(yīng)用與生態(tài)峰會(huì)上榮獲中國(guó)領(lǐng)先語(yǔ)音智能廠商的殊榮后,中國(guó)軟件網(wǎng)獨(dú)家專訪到了思必馳CMO龍夢(mèng)竹,就智能語(yǔ)音的發(fā)展、思必馳的應(yīng)對(duì)策略以及備受關(guān)注的DUI開放平臺(tái)等內(nèi)容展開了對(duì)話。
語(yǔ)音是IOT時(shí)代的人機(jī)交互方式,發(fā)展?jié)摿薮?/strong>
火爆的人工智能市場(chǎng)中,機(jī)器視覺和智能語(yǔ)音一直是最受關(guān)注的發(fā)展方向之一。機(jī)器視覺的廠商無(wú)論從融資額還是市場(chǎng)估值普遍都高于智能語(yǔ)音廠商。最直接的原因就是機(jī)器視覺已經(jīng)找到了相對(duì)成熟的商業(yè)落地模式,在安防、醫(yī)療等領(lǐng)域能更為明顯而直接的帶來(lái)效率的提升。
語(yǔ)音與視覺不同,語(yǔ)音是富信息,語(yǔ)音交互中帶有音色、音量、速度、節(jié)奏等信息,不同的語(yǔ)境與語(yǔ)調(diào)會(huì)帶來(lái)無(wú)限的可能。人類經(jīng)歷著從PC互聯(lián)時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代到現(xiàn)在IoT時(shí)代的發(fā)展,交互方式也從傳統(tǒng)的按鍵、觸摸等交互方式向語(yǔ)音交互方向發(fā)展。產(chǎn)業(yè)鏈正在迎來(lái)變革,AI及AI+的專業(yè)分化進(jìn)程加速。龍夢(mèng)竹表示,語(yǔ)音交互成為IoT時(shí)代最重要的交互方式之一,將會(huì)迎來(lái)更廣闊的發(fā)展前景。
由于語(yǔ)言本身的多樣性,智能語(yǔ)音技術(shù)難度和壁壘較高
隨著阿里天貓精靈、聯(lián)想智能音箱、小米互聯(lián)網(wǎng)音箱的火爆,在背后提供語(yǔ)音交互技術(shù)支持的思必馳也逐漸在公眾面前露出。不知從何時(shí)起,“人工智障”這個(gè)詞成為了大家戲謔和調(diào)侃的口頭禪。談到語(yǔ)音交互的現(xiàn)狀,與大家將“人工智障”歸結(jié)于技術(shù)問題的認(rèn)知不同,龍夢(mèng)竹認(rèn)為目前語(yǔ)音智能的技術(shù)水平已經(jīng)比較成熟,但也存在幾個(gè)方面的問題與瓶頸有待突破,其中語(yǔ)音交互場(chǎng)景中不確定因素多、單點(diǎn)智能到整體智能路徑的瓶頸、性價(jià)比和內(nèi)容知識(shí)圖譜建立不完善等問題,都對(duì)語(yǔ)音交互體驗(yàn)有所影響。
首先,語(yǔ)言本身包含的內(nèi)容非常豐富。比如:“嘿,等著我”既可能是夕陽(yáng)下少男少女口中的呢喃,也可能是打架斗毆后撂下的狠話。另一方面,大家對(duì)語(yǔ)音交互的測(cè)試挑戰(zhàn)早已超出了正常對(duì)話狀況,畢竟沒有人在對(duì)話的時(shí)候突然冒出一句“**放個(gè)屁”“***,天王蓋地虎”,但這種挑戰(zhàn)人工智能的對(duì)話,對(duì)智能硬件來(lái)說(shuō)早已習(xí)以為常了。其次,人們已經(jīng)習(xí)慣了在場(chǎng)景下的不同反應(yīng),但對(duì)于人工智能而言,交互是一個(gè)全鏈路的過(guò)程,不僅僅是語(yǔ)音識(shí)別,還有語(yǔ)義理解、語(yǔ)音合成等一系列環(huán)節(jié),單點(diǎn)智能到整體智能的路徑依然沒有打通。知識(shí)圖譜作為人工智能的底層技術(shù)之一,其技術(shù)成熟度也在制約著人性化的交互方式的進(jìn)展。
專注語(yǔ)音技術(shù)的場(chǎng)景化落地,以DUI開放平臺(tái)構(gòu)建AI生態(tài)
那么,專注于人性化智能語(yǔ)音交互技術(shù)的思必馳,在智能語(yǔ)音的瓶頸突破方面又將如何破局呢?
龍夢(mèng)竹介紹到,思必馳專注于打造人性化的語(yǔ)音交互技術(shù),對(duì)于立足于技術(shù)的思必馳來(lái)說(shuō),技術(shù)是根本,但并不是瓶頸,如何將技術(shù)應(yīng)用到現(xiàn)實(shí)的場(chǎng)景中,用戶體驗(yàn)和技術(shù)同等重要:一方面,思必馳與內(nèi)容資源方合作積極擴(kuò)展第三方內(nèi)容資源,為用戶提供更多的內(nèi)容服務(wù);另一方面,思必馳將繼續(xù)在專注細(xì)分領(lǐng)域的同時(shí)著力構(gòu)建開放平臺(tái),賦能更多智能硬件,助力傳統(tǒng)企業(yè)轉(zhuǎn)型。在生態(tài)方面,思必馳于2016年成立馳星創(chuàng)投,得到了元禾資本、富士康、清華控股等LP的支持,旗下?lián)碛袃芍Щ穑謩e為2億元天使基金和10億元成長(zhǎng)基金,專注投資人工智能和智能交互產(chǎn)業(yè)早期項(xiàng)目。思必馳在AI領(lǐng)域全面布局,加速在物聯(lián)網(wǎng)領(lǐng)域的深入和拓展,打造AI生態(tài),賦能萬(wàn)物。
硬件廠商與語(yǔ)音交互技術(shù)公司的傳統(tǒng)合作模式中雙方的溝通成本較高,,在自定義產(chǎn)品功能、系統(tǒng)迭代、內(nèi)容升級(jí)等方面往往會(huì)存在延遲,造成了開發(fā)周期長(zhǎng)、更新迭代慢等問題。此外,智能語(yǔ)音交互技術(shù)的整個(gè)鏈條較長(zhǎng),涉及到前端信號(hào)處理、喚醒、識(shí)別、語(yǔ)義、對(duì)話、問答等諸多核心技術(shù),對(duì)于開發(fā)者來(lái)說(shuō)比較復(fù)雜,有一定的技術(shù)門檻。因此,向開發(fā)者開放語(yǔ)音交互技術(shù)、讓用戶自定義產(chǎn)品、大規(guī)模定制開發(fā)成為必然方向,思必馳DUI開放平臺(tái)也應(yīng)運(yùn)而生。
出于好奇,筆者也注冊(cè)了一個(gè)DUI平臺(tái)賬號(hào),快速體驗(yàn)了一把平臺(tái)上的“技能包”。只要在左側(cè)輸入內(nèi)容,右側(cè)同步輸出代碼。作為“代碼盲”,從未感覺到原來(lái)技術(shù)可以離我們?nèi)绱酥.?dāng)技術(shù)做到如此貼近開發(fā)者的時(shí)候,技術(shù)與行業(yè)場(chǎng)景、整體智能的融合還會(huì)遠(yuǎn)么?
與龍夢(mèng)竹的交談中,總是能深深的感覺到她對(duì)DUI平臺(tái)的篤信與自豪,或許這種自信源于專注領(lǐng)域的成功和對(duì)技術(shù)的信仰吧。伴隨著人工智能與物聯(lián)網(wǎng)的融合, DUI+IOT的智能產(chǎn)業(yè)生態(tài)構(gòu)建。思必馳還將帶來(lái)哪些驚喜,我們拭目以待。