作者丨TOMASZ TUNGUZ,紅點(diǎn)資本合伙人
信任在軟件行業(yè)真的再重要不過(guò)了,一旦信任出現(xiàn)了的動(dòng)搖,那么用戶或者買家立刻掉頭走人,一秒鐘都不會(huì)猶豫。
「這個(gè)軟件有些時(shí)候連我的都存儲(chǔ)不下來(lái)」;「這個(gè)數(shù)據(jù)庫(kù)三天兩頭的崩潰」;「這家網(wǎng)站頻繁地宕機(jī)」,任何一句抱怨的話就會(huì)直接將你和你的產(chǎn)品送入深淵。
幾乎每一家公司都在存儲(chǔ)數(shù)據(jù)上面臨各種挑戰(zhàn)。但是,以機(jī)器學(xué)習(xí)為重點(diǎn)的初創(chuàng)公司所面臨的挑戰(zhàn)遠(yuǎn)不止這一點(diǎn),他們還需要面臨「概率」帶給他們的信任危機(jī)。
Nate Silver 曾利用機(jī)器學(xué)習(xí),成功預(yù)測(cè)了奧巴馬在 2008 年選舉上的大獲全勝,在各個(gè)選區(qū)里的預(yù)測(cè)正確率都近乎 100%,這也讓概率論再次站在世人面前大放異彩。原來(lái)真實(shí)世界的運(yùn)行跟學(xué)院派的概率論是能對(duì)接得上的啊。
而 8 年之后的今天,我們新總統(tǒng)的誕生,卻出現(xiàn)在了機(jī)器預(yù)判之外。在 2008 年的分析和 2016 年的兩次機(jī)器分析當(dāng)中,數(shù)學(xué)上的推演是正確的,理論也是一脈相承的。但在 2008 年,曾經(jīng)讓我們產(chǎn)生了對(duì)數(shù)據(jù)的信賴,而在 2016 年,現(xiàn)實(shí)卻反戈一擊,這其實(shí)就是人性使然。
很多機(jī)器學(xué)習(xí)系統(tǒng)同樣也依賴于概率。一個(gè)程序員將一個(gè)「閥值」編譯進(jìn)了機(jī)器學(xué)習(xí)模型中。這個(gè)系統(tǒng)會(huì)利用這個(gè)「閥值」去決定目前的這個(gè)概率是否足以讓我們得出結(jié)論。有些時(shí)候,它也被稱之為「信心指數(shù)」。
無(wú)論是「閥值」,還是「信心指數(shù)」,其實(shí)都代表著某件事實(shí)成立的最低標(biāo)準(zhǔn),只有邁過(guò)這個(gè)門檻,才能得出一個(gè)結(jié)論。
比如如果要確認(rèn)它是張圖片,至少「最小概率(minimum probability) 是這里面有一只貓;而「sacre blue」這個(gè)詞的「信心指數(shù)」應(yīng)該是將它翻譯成「我的天吶」,而不是按照字面意思來(lái)說(shuō):「神圣的藍(lán)色」。
在系統(tǒng)得出結(jié)論,給出推薦之前,這個(gè)標(biāo)準(zhǔn)成立的可能性(概率)要達(dá)到多少?80%?90%?95?
這個(gè)最小概率如果門檻太低,那么就會(huì)出現(xiàn)「1 型錯(cuò)誤」,也就是「誤報(bào)」;如果最小概率的門檻拉得太高,那么會(huì)帶來(lái)「漏報(bào)」,也就是計(jì)算機(jī)領(lǐng)域中的「漏報(bào)」,也就是「2 型錯(cuò)誤」
機(jī)器學(xué)習(xí)領(lǐng)域的 SaaS 公司必須從中拿捏其平衡,不能太緊,也不能太松。如果一個(gè)產(chǎn)品向一端太過(guò)傾斜,那么產(chǎn)品就會(huì)失去用戶的信任,最終毀掉一家公司。
那么如何去應(yīng)對(duì)「用戶有可能對(duì)你的產(chǎn)品失去信任」這個(gè)風(fēng)險(xiǎn)呢?目前「聊天機(jī)器人」(chatbot)的涌現(xiàn),讓我在人機(jī)互動(dòng)方面得出了一個(gè)原則:正確地引導(dǎo),塑造用戶對(duì)一個(gè)系統(tǒng)能力的期待值,這是至關(guān)重要的。更準(zhǔn)確地說(shuō),少承諾一點(diǎn)東西,多實(shí)現(xiàn)一些價(jià)值,讓用戶處于時(shí)常獲得驚喜的狀態(tài)中,這就大大降低了此類風(fēng)險(xiǎn)。
除此之外,如果說(shuō)還要做什么來(lái)降低風(fēng)險(xiǎn)的話,你必須清楚你的機(jī)器如果犯錯(cuò),會(huì)在哪方面出錯(cuò),其性質(zhì)有多嚴(yán)重,用戶在意的是什么。機(jī)器有可能把一些無(wú)關(guān)的信息推送給用戶,這是錯(cuò)誤 1;機(jī)器把用戶媽媽發(fā)來(lái)的郵件給標(biāo)記成為了垃圾郵件,這是錯(cuò)誤 2,很明顯這兩種錯(cuò)誤的嚴(yán)重性不在一個(gè)水平線上。
下一代機(jī)器學(xué)習(xí)產(chǎn)品,其關(guān)鍵就落在了誰(shuí)能最快地獲得用戶信任上面。而在「提示錯(cuò)誤」、「屏蔽郵件」、「翻譯詞語(yǔ)」、「識(shí)別圖片」等工作上面,產(chǎn)品必須自身決定臨界概率的大小到了多少,才能得出結(jié)論。
此事重大,不可不察。