乘客上車后要是改變路線,他更習慣打開地圖后直接用語音輸入指令,而且在周圍認識的同行里,大家現(xiàn)在也都很習慣用這種操作方式。
這僅僅是語音交互場景的普通一種。
“中國對話式人工智能市場已經(jīng)開始爆發(fā),速度比我們想象的快很多。”百度智能生活事業(yè)群組(SLG)總經(jīng)理景鯤在第二屆AI開發(fā)者大會上說,“拿一個數(shù)字舉例,今年1 月份DuerOS(對話式人工智能操作系統(tǒng))的智能設備激活量超過5000萬個,截止到6月,后臺激活量已經(jīng)超過9000萬了,月活設備超過2500萬,無論是合作伙伴數(shù)量、落地主控設備、還是開發(fā)者數(shù)量均為國內(nèi)市場第一。”
景鯤,曾任微軟首席研發(fā)總監(jiān)負責微軟必應搜索業(yè)務,他是微軟小冰的創(chuàng)造者。
2014年他加入百度主要負責搜索,包括語音、圖像以及對話式搜索。兩年后,他接手了度秘(語音助手app)團隊,負責度秘和DuerOS業(yè)務。
百度對該部門的重視程度非同一般,坊間傳聞景鯤是當年陸奇最喜歡的員工之一。
2017年2月度秘團隊升級為度秘事業(yè)部,并迅速被公司推到一線位置,成為和另一大自動駕駛開放平臺 Apollo(阿波羅)并行的重要業(yè)務線。
百度智能生活事業(yè)群組(SLG)總經(jīng)理景鯤
DuerOS是一種對話式人工智能操作系統(tǒng),依托百度算法、計算、數(shù)據(jù)上,用戶可以在搭載該系統(tǒng)的設備體驗到自然語言對話的交互方式, 可以用在手機、電視、音箱、汽車、機器人等多種硬件設備上。
內(nèi)容涉影音娛樂、信息查詢、生活服務、出行路況等10大類目的250多項功能的操作。
早在2016年,景鯤團隊試圖把AI能力賦予智能硬件上,讓他印象深刻的就是跟國安廣視(電視機頂盒的公司)和小魚在家(陪伴機器人)合作,他們發(fā)現(xiàn)這種應用產(chǎn)品在國內(nèi)有巨大市場潛力,找到硬件商結(jié)合百度的技術(shù)優(yōu)勢是一個不錯的想法。
2017年美國CES展會上DuerOS系統(tǒng)首次亮相,一年內(nèi)DuerOS發(fā)布了升級版2.0版,在近日召開的百度AI開發(fā)者大會上,官方發(fā)布了DuerOS 3.0版,對比去年推廣初期,景鯤還會擔心用戶能否接受在酒店、車里和家里以及路上跟智能設備對話。
經(jīng)過一年發(fā)展后,他認為當時他有些想多了,原因其一是合作伙伴需求很多,倒逼團隊不斷快速優(yōu)化升級。
操作系統(tǒng)背后的核心要素有交互、應用和商業(yè)閉環(huán)三種要素,按照百度的理念,DuerOS不止是產(chǎn)品,它更是一個生態(tài)。
現(xiàn)在,在VIVO NEX、華為P20、OPPO FIND X等國產(chǎn)智能手機,創(chuàng)維、TCL電視已搭載了DuerOS系統(tǒng),另外他們也與5家汽車廠商進行合作。
新版DuerOS系統(tǒng)中包含了新版情感語音播放、聲紋識別、支持免喚醒多輪對話等功能,新增有屏設備和藍牙設備解決方案,方便了沒有能力做硬件產(chǎn)品的中小企業(yè)。而且還發(fā)布了開發(fā)者分成計劃,即前6個月收益將100%回饋給開發(fā)者。
為了吸引更多開發(fā)者,這也是很拼的。
據(jù)百度內(nèi)部人士透露,且不談變現(xiàn),今年團隊強調(diào)的是用戶量、硬件激活量、開發(fā)者數(shù)量,這是內(nèi)部KPI考核指標。
體驗做好并不簡單
同樣是開放平臺,國外科技巨頭出手略早,在2015年亞馬遜推出Echo智能音箱,內(nèi)置Alexa智能語音助手, 據(jù)公開資料顯示,亞馬遜 Alexa 平臺的技能數(shù)量已經(jīng)達到3萬個。
另外一個巨頭是谷歌,在今年5月召開的開發(fā)者大會他們發(fā)布了新版Google Assistant并展示了人工智能客服等產(chǎn)品,雖然這被業(yè)內(nèi)人士看來漂亮的Demo可以提前做好,但一定程度上,呈現(xiàn)了谷歌未來的重點發(fā)展方向。
智能語音交互技術(shù)可以用在方方面面,有趣的是,這些科技巨頭都先盯上了酒店這個應用場景。
今年6月,亞馬遜宣布與萬豪國際酒店集團達成合作,通過亞馬遜Echo智能音箱,利用Alexa語音助手來控制酒店內(nèi)的智能設備,而在本次大會上,百度也邀請到了合作方洲際酒店集團代表,DuerOS為洲際酒店量身定制了一套對話式人工智能的硬件設備和云端服務。
可以預見,科技巨頭們希望通過語音交互方式賦予智能硬件產(chǎn)品以此掌握用戶智能家居系統(tǒng),通過巧妙地方式構(gòu)建自己的生態(tài),讓語音交互技術(shù)擁有額外價值。
再來看國內(nèi),去年國內(nèi)也有很多不同背景的公司在推進自己的開放平臺,比如阿里云、小米IoT、思必馳DUI等。
最近,思必馳剛剛獲得5億元D輪融資,CMO龍夢竹對品途表示,不論谷歌、亞馬遜有多強,對于中文操作來說,全世界做得最好的還得是國內(nèi)企業(yè),因為中文是最難的語言。
國外擅長做從“0到1”開源工具,而國內(nèi)更擅長將“1到100”,如果關注國外語音、圖像一線技術(shù)比賽,可以發(fā)現(xiàn)國內(nèi)企業(yè)在很多領域都能拿到國賽大獎。
然而,這些合作企業(yè)利用平臺把用戶體驗做到極致卻并不簡單。
“有時候我們做的技術(shù)接口,跟平臺方并不適配,他們做的標準跟我們也對不齊,這就是一個問題。”一位參加開發(fā)者大會的技術(shù)提供商對品途說。
的確,相比過去互聯(lián)網(wǎng)公司做一款App來說,現(xiàn)在對于生態(tài)平臺團隊的挑戰(zhàn)會更大。
景鯤曾接受媒體采訪時說,“原來做一款產(chǎn)品很容易,了解你自己的能力+了解用戶,將這兩個結(jié)合在一起做一個 App 就能做出比較好的效果。但是,真正做一個生態(tài),尤其是在 AI 時代里,許多(案例)是軟硬結(jié)合的。”
正如他所言,AI時代的開放式平臺會接觸的各種合作伙伴:硬件、芯片、系統(tǒng)集成方案商、開發(fā)者還有內(nèi)容方。
在這里面如何整合所有角色訴求,讓各個企業(yè)發(fā)揮出自己最擅長的能力,最考驗團隊能力,因為這里面整合產(chǎn)業(yè)各個方面,難度復雜度都是可想而知的。
那么,這些中小企業(yè)合作方如何把握機會,與大平臺配合做好自身業(yè)務?
埃微手環(huán)創(chuàng)始人埃微老祝(網(wǎng)名)把國內(nèi)主要幾個平臺做了簡要的對比分析,相比小公司,DuerOS擅長的是出行、地圖、搜索等語音庫、語義庫、知識圖譜。
百度做開放平臺,小公司結(jié)合自己的優(yōu)勢,只需要調(diào)用這些數(shù)據(jù)并且做好細化應用即可。
阿里有阿里云LoT,也有基于語音的系統(tǒng),但缺乏百度豐富的搜索數(shù)據(jù)庫。
訊飛在語音識別方面號稱國內(nèi)第一,從語音準確率方面沒有問題,但是語義方面只有基礎數(shù)據(jù),沒有類似阿里的商品數(shù)據(jù)也沒有百度的搜索和地圖數(shù)據(jù)。
這幾家平臺各有優(yōu)勢,以后還會不斷強化,誰也取代不了誰。畢竟,在語義和知識圖譜方面,每家都不一樣。
消費端市場仍需培養(yǎng)
“現(xiàn)在還屬于一個市場的早期和教育期,雖然中國市場總量不是很多,不過用戶還是比較愿意用。另外,還需要剛需場景,有時候技術(shù)還沒有準備好,但是場景控制好,還是有剛需的。”景鯤說。
在去年團隊比較擔心沒有那么大市場和合作伙伴,而在一年后,對他們來說,如何把培育市場的時間縮短,讓用戶更快接受這種新興交互體驗重要。
無論是鼠標、鍵盤與電腦的交互還是觸屏、語音對話交互,每一個時代每個階段都有自身特點。
如果把人機交互的迭代方式分類匯總的話,第一代可以是以鼠標和鍵盤為代表的傳統(tǒng)交互方式,而iPhone的出現(xiàn)讓觸屏手機取代了傳統(tǒng)按鍵功能,交互方式再次升級,第三代交互方式可以理解為解放用戶雙手,實現(xiàn)人機對話的方式。
對于這個新興交互方式,家庭和車以及在路上為主的應用場景被各家企業(yè)看中已是不爭的事實。
思必馳CMO龍夢竹認為,這里分為兩個類型,一個是重依賴型:車載、家居、機器人及客服,另外一種輕應用:醫(yī)療、教育、投顧等,算錦上添花的應用。
車和家庭兩個場景現(xiàn)在產(chǎn)品體驗度和用戶接受度都非常好,從發(fā)展角度來看,并不是我們同國外技術(shù)差距有多大,而是在同一個技術(shù)水平下,現(xiàn)在要看誰能做好細分行業(yè)應用。
不難發(fā)覺,擺在開發(fā)者尤其是中國開發(fā)者面前的,是中國獨特的市場空間,在這塊肥沃土壤中未來五到十年,有機會生長出彎道超車的巨頭,移動時代的iOS、安卓或許將成為過去。
在AI時代,百度DuerOS、亞馬遜Alexa、谷歌 Assistant們?nèi)绾螖噭邮袌鲞€真有些看頭。
品途聊天室
AI時代即將到來,
留言說說,
你對未來AI融入生活有什么期待?