2015年之前,在中國很多人都不知道AI。但是在過去 3 年里,AI突然變成了一個全民熱議的話題。尤其是 Google 阿爾法狗機器人打敗世界圍棋冠軍這件事,給整個社會帶來了巨大的震撼。
雖然AI技術在突飛猛進地發(fā)展,但是如何實現(xiàn)AI技術的商業(yè)化,仍然是今天全世界AI企業(yè)面臨的最大的難題。
我以前在美國讀書,博士畢業(yè)之后本來是要去搞科研的,結果反而去了谷歌美國總部做科學家,后來又回國創(chuàng)建了AI公司“出門問問”。
從一個純粹的科研人員,到一個商業(yè)化的技術研究者,這是一個很大的轉變。在創(chuàng)業(yè)的過程中,我對于AI技術如何落地和商業(yè)化的問題,有了很多的思考和想法,今天和大家一起分享。
Google AI為什么要自己做硬件產品?
AI商業(yè)化的關鍵有兩點:場景和可掌控。
如果把AI的算法比作成靈魂,那這個場景就是身體,靈魂是需要身體才有意義的。AI技術去尋找場景的過程,就是一個靈魂附體的過程。
尋找可以掌控的場景,這就是 Google AI 一定要自己去做硬件產品的原因。
Google的安卓操作系統(tǒng)非常成功,占有了全球 70%-80% 的市場份額。安卓的戰(zhàn)略是以平臺為主,爆品為輔。而現(xiàn)在Google在AI層面的戰(zhàn)略則反過來了,平臺為輔,爆品為主,把自己的產品當作一個爆品去做,而不只是追求 demo (示范)效應。
(Google的AI硬件產品)
這其中的原因是:
第一,在 2007 年安卓剛剛起來的時候,多數(shù)硬件廠商并沒有做軟件的能力。
再加上iPhone的成功來得太快,很多手機廠商沒有反制之力,就很愿意把自己的場景讓 Google 的操作系統(tǒng)裝進去。而現(xiàn)在大部分硬件廠商都有研發(fā)軟件的能力,并不愿意把自己的場景交給你。
第二,安卓是一個系統(tǒng)級別的軟件,它是可靠的,可以預測的。而AI技術是概率性的,存在特別多的不確定性。
比如語音識別的時候,有時候能識別對,有時候識別不對;在某一個場景下可以識別對,在另一個場景下卻錯了。這就對硬件產品有更高的要求,很多硬件廠商達不到這樣的要求。
在這種情況下,Google想要以安卓的方式去推動AI的應用,就會非常困難。谷歌做硬件的主要目的,就是要使自己的很多高科技、黑科技直接放到自己研發(fā)的設備里,讓AI技術有一個可控的場景。
AI商業(yè)化的路徑:建立技術、產品、商業(yè)的閉環(huán)
一個獨立的AI企業(yè)要想存活下來,就應該在算法的基礎上,盡早找到可以掌控的場景,建立技術、產品、商業(yè)的閉環(huán),然后在更大的規(guī)模上循環(huán)、迭代。
核心技術:你會做的,別人也可以做出來
如果你是一家AI公司,想要把AI應用到某一個場景里面去,你首先得有一套非常核心的技術。而且這個核心技術必須要有一定的難度,形成一定的壁壘,這樣才能擋住 95% 的競爭者。
比如說語音交互、語音識別這樣的技術,在今天中國加起來不超過 10 家,絕大部分企業(yè)是無法進入的,因為它的技術難度非常高。
但技術的領先頂多只能保持 8-12 個月,不能構成絕對的壁壘。
深度學習在語音識別中的應用,首先是在2012年由微軟研究院的華人科學家鄧力搞出來的。但是第一個做成大規(guī)模系統(tǒng)的反而不是微軟,而是Google。
因為科研的圈子是沒有秘密的,你做出一個東西之后,很快就會有另外一批人把它做出來,甚至比你做得還好。
只有不斷迭代,持續(xù)性保持領先,才能形成真正的壁壘。也就是說,你得永遠比競爭者領先 8 個月。
你 8 個月前做的事情,可能現(xiàn)在有人已經學會了。但這時候你已經在做另外的事情,大家看到以后,又得再等 8 個月才能學會。
這是一個最好的正向循環(huán),Google正是靠這樣正向迭代的方式,使得它永遠能夠在競爭者面前保持幾個月的領先優(yōu)勢。
產品:算法只占整個產品開發(fā)的30%
商業(yè)和科研的本質是不一樣的。很多技術創(chuàng)業(yè)者都走不出技術或者算法這個階段,他們不知道什么叫產品,什么叫解決方案,把創(chuàng)業(yè)當作科研在做,結果很快就失敗了。
光有算法是不夠的,還必須快速圍繞著算法在一個具體的場景里做出一個端到端的產品(To C),或者一個解決方案(To B)。
比如我研發(fā)出了一個語音識別的系統(tǒng),但是這個算法不是一個通用的算法,它可能剛好在我訓練的相對安靜的環(huán)境下可以使用,在給投資人做 demo 的時候是ok的,因為大家面對的是黑乎乎的屏幕,沒有任何用戶體驗可言。
但是如果這種算法應用在 APP 上,在環(huán)境相對嘈雜的地鐵、公交或者街道上使用的時候,用戶體驗就會非常糟糕。
所以,要做成一個產品,除了有基本的算法和系統(tǒng)之外,還必須有具體的應用場景,讓用戶有一個良好的使用體驗,并在此基礎上不斷優(yōu)化。
出門問問現(xiàn)在應用的場景有智能手表、智能音箱、智能車載等,每應用于一個新的場景、新的設備的時候,我們的算法本身就要去做很多迭代和優(yōu)化。
算法只是一個起點,它離一個真正的產品還有非常遠的距離。
當你基于語音算法做出一個產品的時候,可能這個算法本身只占你整個開發(fā)的30%都不到,另外 70% 都跟這個算法沒有什么關系。
規(guī)?;耗軌蛑巫陨硌邪l(fā)和未來競爭
做出產品或者解決方案還遠遠不夠,商業(yè)上看的,是你到底有多少用戶,以及這個用戶帶來多少營收和商業(yè)價值,能不能形成一定的規(guī)?;?。
這種規(guī)模化要能夠做到:
第一,能夠支撐自身研發(fā)的迭代;
第二,可以通過這種迭代和規(guī)模,抵抗未來的競爭。只有這樣,才能對所應用的場景有一定的控制力。
這個時候就需要深度思考。所謂深度思考,就是說你腦海里要有一個模型,能夠把一段話或者一個事情量化。比如10萬規(guī)模的時候是什么樣子,50萬的時候是什么樣子,100萬的時候是什么樣子。
以價值 1000 元的智能手表為例,如果做出了 10 萬臺的規(guī)模的話,就可以cover(覆蓋)一些材料、模具成本和基本的研發(fā)費用。
如果要想cover(覆蓋)成本的話,就需要達到 50 萬臺的規(guī)模。
而如果做到了 100 萬臺的話,那就可以形成足夠高的壁壘。尤其是面對華為、小米、三星這樣的競爭對手,你對所在的場景是有一定掌控力的。
但是如果有 BAT 或者谷歌這樣的超級巨頭想闖入這個領域的話,那么 100 萬臺的規(guī)模就沒有任何意義,原先可控的場景又變得不可控了。
因為巨頭們不靠硬件賺錢,他們可以進來之后先扔“炸彈”,把市場搞亂,把量做上去之后,再通過后面的軟件服務去變現(xiàn)。
所以,規(guī)?;某潭热Q于你處于什么樣的市場,以及你自己處于什么樣的階段。
“出門問問”的AI商業(yè)化實踐:形成商業(yè)閉環(huán)
2012年我剛回國的時候,主要精力投入算法的研發(fā)。因為我以前是做自然語言處理和機器翻譯的,對非常復雜的算法很了解,所以花了 8 個月就做到了端到端的語音交互,完成了AI技術積累。
為了盡快實現(xiàn)商業(yè)化,2013年出門問問用研發(fā)出來的語音交互算法做了微信公眾號,也做了手機上面的語音助手。但是這些東西沒有形成閉環(huán),因為沒有用戶量,也沒有任何營收。
2015年,出門問問開始去做智能手表。我們當時沒有去做機器人或者車載,是因為在當時的人員規(guī)模和市場規(guī)模下,做機器人或者車載達不到閉環(huán)的效果。智能手表推出后,起到了良好的市場效果,銷量達到了 30 萬臺,占據了 30% 的市場份額,第一次實現(xiàn)了技術、產品、商業(yè)的閉環(huán)。
2016年,在出門問問的軟件能力、硬件能力、供應鏈的能力、商業(yè)推廣能力、營銷能力都達到一定的階段之后,我們又開始開拓更多可掌控的場景,去做車載、家居、耳機等等,因為我們需要在更大的規(guī)模上循環(huán)迭代。
(出門問問的正向循環(huán))
到現(xiàn)在為止,出門問問實現(xiàn)了各種智能設備上的語音交互,從手機、音箱、車載、耳機,凡是你能想到的語音交互比較有用的地方,我們都做過一個應用。
小結:
在AI領域創(chuàng)業(yè),并不會輕易死掉。因為AI公司同O2O公司不同,不需要每天花那么多錢補貼用戶,它的主要成本是人工成本。當公司盈利情況并沒有那么好的時候,只要少招點人就可以存活。
但是在我看來,如果一個創(chuàng)業(yè)公司沒有增長,跟死亡是一樣的。
如果一個公司第一年100人,第二年100人,第三年還是100人,營收也沒有任何變化。那么這種公司的價值是不大的。
對于“出門問問”來說,我們每天都在逼著自己跨越舒適區(qū),去思考如何找到更多的機會,如何有更多可控并且規(guī)?;膽脠鼍埃绾卧诩ち业母偁幹写婊钕聛?。
只有這樣,當BAT這樣的巨頭進入的時候,我們才能夠更加從容地去面對,完成一個初創(chuàng)AI公司的成人禮。