7 月 31 日晚上8點半,“騰訊創(chuàng)業(yè)01CLUB”推出了第一期的社群內容分享活動。明勢資本創(chuàng)始合伙人黃明明、小米生態(tài)鏈副總裁唐沐擔任了本期的對話嘉賓,就智能音箱行業(yè)聊聊對產業(yè)的幾大洞見,進行了一場資本市場和頭部科技公司之間關于下一個“風口”的對話,騰訊創(chuàng)業(yè)01CLUB為此整理出此次對話中的幾大精華觀點:
1,智能家居發(fā)展的基礎是解決用戶剛需。
2,智能音箱技術突破難點為NLP(自然語言處理技術)。
3,面對巨頭競爭,通過合作才能獲得突破。
4,如果智能音箱要加屏幕,目前還需解決在設備交互方面的互斥矛盾點。
5,掃地機器人可能是智能家居的下一個風口。
針對這幾大觀點,兩位對話嘉賓進行了精彩的具體的分析講解和分享,以下為此次對話內容的整理:
智能家居發(fā)展的基礎是解決用戶剛需
黃明明:我先簡單介紹明勢資本在AI領域的投資邏輯和案例。
在AI領域,我們的重點是找到核心技術的落地場景,或者能夠提升行業(yè)效率的領域進行投資。我們投資的案例場景覆蓋出行、法律、醫(yī)療、工業(yè)等領域。
比如,在AI 出行領域,我們投資了易航智能和知行科技;在AI 法律方面,我們投資了思滿科技和秘塔科技;在AI 醫(yī)療方面,投了智能醫(yī)療外科手術機器人研發(fā)商術康醫(yī)療;在AI 工業(yè)領域,則投了智能工廠解決方案供應商玄羽科技。
今天我主要和小米生態(tài)鏈副總裁唐沐聊些智能音箱在技術和商業(yè)模式方面的探討。
首先是技術方面,唐總(唐沐)認為哪些底層技術的突破,推動了智能音箱這一波高速發(fā)展?目前還有哪些突出的問題是嚴重影響到用戶體驗的?比如遠場的定位,本地軟硬件計算的能力,多人的聲場還有誤喚醒,包括多輪對話的能力,哪些是核心的制約瓶頸?你認同未來智能家居的流量入口可能是智能音箱嗎?
唐沐:先說智能家居入口的問題。從2012年、2013年很多公司都在對此做嘗試、設想、去做相關的產品。當時對于公司的自家產品,對外都會有這樣的一個說法:在做爭奪智能家居入口。兄弟不才,我當時是做了路由器,所以對外喊“路由器是未來智能家居的入口”。
做了幾年之后,我發(fā)現(xiàn)當時喊的兇的說自己是智能家居入口,到最后都沒留下來,反而那些真的踏踏實實的,把一個產品做到滿足用戶的高頻剛需,這樣的產品才能留下來。
你要問我路由器是不是入口,其實路由器也不是,我相信路由器只是智能家居其中一個的中心節(jié)點。
智能家居的中心未必是一個設備,很有可能是幾個設備,我回想起雷總邀請我加入小米的核心訴求是希望我能探索智能家居,路由器只是其中一個重心節(jié)點,后面再做的智能音箱。
參與到智能音箱的項目后,我發(fā)現(xiàn)智能音箱是另外一個維度的智能家居中心。但現(xiàn)在我不太想強調它是一個中心,目前我們做產品的思路轉化成為:我們可以把一個產品設想的很宏大,我們可以想象很多東西給它留很多未來的發(fā)展空間的設想,但最根本的你要先把它的高頻剛需滿足掉。
智能音箱技術突破難點為NLP
唐沐:再說技術的問題。當我們開始做智能音箱的時候,我發(fā)現(xiàn)主要有3個核心技術要準備好:一個是ASR、一個是NLP、一個是TTS。ASR是語音轉文字的技術,語音識別技術;NLP是自然語言理解技術;TTS是文字轉語音,文字合成語音的技術,這三個技術基本上是智能音箱存在的一個基石,當這三個技術準備好了,智能音箱已經具備了橫空出世的前提了。
關于核心制約瓶頸,黃明明說的幾個都是,有很多可以通過數(shù)據(jù)的積累,人工智能自我學習、自我進步去改善的。但我認為到目前為止,可能基本上目前我還沒有看到有解決的很明確的路徑,其實是NLP(自然語言理解)。很多時候目前我們在智能音箱里面呈現(xiàn)出來的人工智能,它有點像是一個簡單的問答機,你提一個問題他給你一個回答,很多時候這種回答還是偏機械,離真正的人工智能還是有點距離。
黃明明:看來大家的認知至少目前都是比較一致,最核心的目前難突破的還是在NLP這個領域,可能這一波我們所謂講的深度神經網絡基本上在NLP這個領域,我問了很多大牛,短期之內想要有突破是比較難。
拋開大家都短期之內難以突破的NLP領域,我們以小米的小愛音箱為例,聊聊在技術方案的選擇(包括軟件、硬件,麥克風的陣列,遠近場的定位、輸入降噪,誤喚醒等等)你認為做哪些選擇,才能讓產品有哪些特點和優(yōu)勢?
唐沐:我們做智能音箱最棒的心得是廣泛尋求合作。比如說我們在ASR領域有七八家合作伙伴,我們會把用戶的query同時發(fā)給七八家合作伙伴,等他們全部都反饋給我們結果,我們再經過一個簡單的判斷算法,來決定選取誰的結果。我們自己在技術上花費精力最大的還是NLP,這是智能音箱的核心,也人工智能語音助手的核心。
以小愛音箱為例,我們目前有兩大看家本領,一個是對用戶點歌query的理解,一個是對用戶IoT控制的理解。我們發(fā)布音箱的時間比較久,收集到的query比較多,這會極大幫助我們更深入理解用戶的訴求到底是什么。