最近幾年來(lái),市面上有不少關(guān)于大數(shù)據(jù)的宣傳, 凡有飲水處,都能聽(tīng)到 “big data“, ”data driven decision making” 等等高大上的詞匯。我在中關(guān)村街頭看見(jiàn)有人在溜大數(shù)據(jù)的豬,也吃過(guò)大數(shù)據(jù)的豬肉,飽食終日,也想分享一些零碎的感想。
0. 大數(shù)據(jù)的好處
【此處略去 250 萬(wàn)字】
1. 古已有之。很多現(xiàn)在流行的道理,國(guó)人往往說(shuō)古已有之。 “數(shù)據(jù)驅(qū)動(dòng)決定”也不例外:
… …先誑之曰:“與若芧,朝三而暮四,足乎?”眾狙皆起怒。俄而曰:“與若芧,朝四而暮三,足乎?”眾狙皆伏而喜。—— 《列子》
雖然都是七個(gè)“茅”, 但是朝四暮三會(huì)導(dǎo)致用戶爽, 那一定是有道理的!
2. 自己的數(shù)據(jù)和別人的數(shù)據(jù)
大部分人對(duì)自己的如雷鼾聲聽(tīng)而不聞,倒是別處有什么小響動(dòng),就坐臥不寧,說(shuō)影響自己休息。一些大公司里不少的經(jīng)理經(jīng)常發(fā)一些其他產(chǎn)品的成敗分析,最新動(dòng)向,謠言等等,但是自己產(chǎn)品的用戶發(fā)郵件來(lái)抱怨,卻沒(méi)人處理。
3. 數(shù)據(jù)的可見(jiàn)性 和 成本
當(dāng)我們談大數(shù)據(jù)的時(shí)候, 很多人的第一反應(yīng)是,希望看到更多的數(shù)據(jù),甚至所有的數(shù)據(jù),因?yàn)榭吹搅怂械臄?shù)據(jù),就能做決定了。
例如,兩個(gè)人在下陸戰(zhàn)棋, 你不知道對(duì)方的具體兵力部署,的確不好做決定。 但是,要看到對(duì)方的數(shù)據(jù),需要多少成本呢?你可以用連長(zhǎng),營(yíng)長(zhǎng)去實(shí)驗(yàn),但是這樣的實(shí)驗(yàn)是有成本的。
有時(shí)候自己人傳遞數(shù)據(jù),處理數(shù)據(jù)也是有成本的,我們以前小伙伴們?cè)趯W(xué)橋牌的時(shí)候,本來(lái)雙方已經(jīng)叫到4黑桃了,不料南方又叫了一個(gè)新花色 “5 草花”! 后來(lái)雙方總結(jié)的時(shí)候,南說(shuō) “我想表達(dá)一下我的草花也挺好...” 表達(dá)是有成本的,這意味著雙方又要為此在 5 階上面尋找合適的定約,增加了許多沒(méi)必要的風(fēng)險(xiǎn),最后牌局打宕了。
(下圖只是一個(gè)示意)
好,下面給你看所有的數(shù)據(jù),這回所有的棋子都沒(méi)有遮掩,雙方的信息都是公開(kāi)的。那么,這些數(shù)據(jù)展現(xiàn)了什么規(guī)律?下一步黑棋應(yīng)該怎么走?
(這是最高等級(jí)的決賽,請(qǐng)讀者慎重考慮。實(shí)戰(zhàn)中,黑棋的下一手考慮了 2 小時(shí) 57 分鐘,然后一招制敵。這位棋手的大腦在將近 3 小時(shí)的時(shí)間里收集了什么?計(jì)算了什么?)
4. 大數(shù)據(jù)和第一感
一葉落而知天下秋。 這是大數(shù)據(jù)么? 如果大數(shù)據(jù)的專家坐鎮(zhèn),要看到多少落葉,到什么時(shí)候才做出 “data driven” 的判斷 — 秋天到了!
大數(shù)據(jù),有人覺(jué)得大和紛亂,有人第一感就能看到問(wèn)題的實(shí)質(zhì)。例如 @winter 講得故事:
5. 大數(shù)據(jù)、把握和時(shí)間
如果有時(shí)間,我們總是可以得到更多的數(shù)據(jù)。 有積極的員工提出新想法,建議在某一個(gè)局部先試驗(yàn),當(dāng)然這需要資源。 其他人反對(duì)說(shuō), 你有100% 的把握么? 哦,沒(méi)有? 不然繼續(xù)收集數(shù)據(jù),等到有了我們?cè)儆懻摗?/p>
等到有充分?jǐn)?shù)據(jù)的時(shí)候,就是競(jìng)爭(zhēng)對(duì)手已經(jīng)占領(lǐng)市場(chǎng),大勢(shì)已定,各路專家都寫文章分析它的成功經(jīng)驗(yàn)的時(shí)候。 這時(shí),你拿了數(shù)據(jù)給領(lǐng)導(dǎo)看。 領(lǐng)導(dǎo)說(shuō),嗯,有道理啊,當(dāng)然,我們這個(gè)時(shí)候再進(jìn)入這個(gè)市場(chǎng)顯然已經(jīng)太晚了。。。
籃球場(chǎng)上,有隊(duì)員要投籃, 他的隊(duì)友不是各自做好準(zhǔn)備搶籃板,或者補(bǔ)位,而是問(wèn)你, 你有100% 的把握投進(jìn)么? 如果沒(méi)有,那就傳一會(huì)球吧,千萬(wàn)別 “風(fēng)投”。。。 籃球比賽有24 秒的進(jìn)攻時(shí)間限制。大公司往往沒(méi)有這樣的限制,在大公司工作的人可以永遠(yuǎn)頭腦風(fēng)暴,收集數(shù)據(jù),分析數(shù)據(jù), 把傳球過(guò)去,別人又傳過(guò)來(lái),這樣就能度過(guò)好幾年。事實(shí)上,別人在市場(chǎng)上已經(jīng)打了好幾個(gè)來(lái)回了。
6. 記一次 SMART 的大數(shù)據(jù)項(xiàng)目
王屋村進(jìn)駐了幾個(gè)大數(shù)據(jù)專業(yè)的實(shí)習(xí)生,他們品嘗了當(dāng)?shù)靥禺a(chǎn)芝麻燒餅之后,都贊這些燒餅外焦里嫩,焦得金黃,帶有芝麻的香味。 吃完好多燒餅之后,大家打著飽嗝,看著桌面上的芝麻粒兒,決定要對(duì)它進(jìn)行大數(shù)據(jù)的剖析和改進(jìn)。 首先,最容易數(shù)據(jù)化的,是芝麻粒兒。“最關(guān)鍵的,是要問(wèn)出好問(wèn)題”, 他們從課堂筆記中畫重點(diǎn)的字句里抽出這句話,開(kāi)始了一系列當(dāng)?shù)厝藦膩?lái)沒(méi)問(wèn)過(guò)的問(wèn)題:
一個(gè)燒餅表面附著有多少個(gè)芝麻?
當(dāng)燒餅沒(méi)有附著任何芝麻的時(shí)候,是不能叫“芝麻燒餅”的, 當(dāng)燒餅的芝麻數(shù)到了N 個(gè),用戶就會(huì)說(shuō)這是“芝麻燒餅”, 那么,N 是多少?
數(shù)據(jù)小組的目標(biāo)是:求出N,并優(yōu)化。
他們從MBA 和大數(shù)據(jù)的教材中,論證了這個(gè)項(xiàng)目是SMART 的:
Specific: 針對(duì)一個(gè)具體的問(wèn)題,避免過(guò)于寬泛的 – 王屋村新農(nóng)業(yè)改革前景展望,等問(wèn)題。
Measureable: 可以衡量的,而不是籠統(tǒng)的 “好吃”,“有嚼勁”。
Actionable: 可以具體操作的 – 增加或減少芝麻的數(shù)量,非常可操,操的過(guò)程可跟蹤,可衡量。
Result: 有結(jié)果的,這個(gè)活動(dòng)可以優(yōu)化資源,減少芝麻的浪費(fèi)。
Time: 有期限的,實(shí)習(xí)期三個(gè)月就要搞定。
他們看到這個(gè)項(xiàng)目是SMART 的,于是就報(bào)告領(lǐng)導(dǎo),領(lǐng)導(dǎo)看到的確是SMART 的,就認(rèn)為是好的。開(kāi)始行動(dòng)。 他們?cè)谌齻€(gè)月的時(shí)間內(nèi)實(shí)驗(yàn)(吃)了各種芝麻量的燒餅,并采訪用戶,衡量用戶味蕾打開(kāi)程度,做廣泛的用戶調(diào)查,跟蹤芝麻在消化系統(tǒng)的生命流程,等等。
最后,他們用Keynote 軟件分享了他們的大數(shù)據(jù)芝麻燒餅的建議:
N = 7.5
只要七顆半芝麻,用戶即認(rèn)同這個(gè)燒餅是 “芝麻燒餅”。為何要有半粒芝麻? 因?yàn)榇髷?shù)據(jù)的平均值就是這樣,同時(shí),我們要做到極致,讓用戶看到燒餅上的半粒芝麻尖叫!
然后他們帶著感恩的心,用技術(shù)了改變世界的的喜悅離開(kāi)了王屋村,還打包了很多燒餅。
7. 大數(shù)據(jù)是手段還是目的
有些讀者可能以為上面的例子太極端,其實(shí)在現(xiàn)實(shí)生活中,比這多彩的例子多了去了。 數(shù)據(jù)是我們的手段還是目的?
曾經(jīng)有一個(gè)小軟件,這個(gè)小軟件可以出現(xiàn)在屏幕的不同位置,給用戶帶來(lái)一些價(jià)值,用戶反饋還不錯(cuò),但是還可以做更多的事情。后來(lái)產(chǎn)品組的PM們想通過(guò)各種實(shí)驗(yàn)來(lái)了解不同位置對(duì)用戶的變化
界面初始是隱藏的 | 不隱藏
在任務(wù)欄中顯示 | 不顯示
有時(shí)主動(dòng)彈出窗口 | 永遠(yuǎn)不彈出
人們用常識(shí)就可以知道, 如果這個(gè)App 不斷地出現(xiàn)在用戶的視野中, 用戶就會(huì)用得更多,但是也有用戶會(huì)覺(jué)得煩,而卸載這個(gè)App。 但是好奇的PM們想知道究竟是多少,于是我們做了各種試驗(yàn), 過(guò)了好幾個(gè)月,好了, 我們知道了具體的百分比,的確是和常識(shí)差不多。
那現(xiàn)在怎么樣呢?下一步怎么辦?怎么贏得用戶?
大家討論了一會(huì),沒(méi)有什么辦法,最后這個(gè)項(xiàng)目也不做了。 如果我們把做各種實(shí)驗(yàn)的時(shí)間花到給用戶提供更多價(jià)值上面,是否會(huì)更好?
我們做軟件的目的是贏得用戶, 不服務(wù)這個(gè)目標(biāo)的東西都是耍流氓!
8. 當(dāng)你有很多數(shù)據(jù),但是沒(méi)有洞察力的時(shí)候
KK說(shuō) – 當(dāng)你對(duì)互聯(lián)網(wǎng)一無(wú)所知,卻試圖通過(guò)數(shù)據(jù)來(lái)弄懂互聯(lián)網(wǎng),那么你很自然地會(huì)得出結(jié)論:互聯(lián)網(wǎng)是用來(lái)傳輸廣告和黃色內(nèi)容的。
(凱文·凱利(Kevin Kelly )訪談--想法來(lái)自何處?)
9. 如何搞到數(shù)據(jù)
在一個(gè)平行世界中,亨利福特在研發(fā)汽車的時(shí)候,他去找當(dāng)時(shí)的主流用戶 — 馬車夫 — 做大數(shù)據(jù)研究。
他和馬車夫同吃同住同生活,他收集大量的數(shù)據(jù),例如馬糞。他在深夜和眾多馬車夫喝酒,開(kāi)頭腦風(fēng)暴會(huì)議,分享了無(wú)數(shù)勞動(dòng)人民的黃色笑話。 馬車夫杰克的暢想深深地打動(dòng)了他 – 如果馬又能跑,又不會(huì)吃草,就好了。
10. 沒(méi)有數(shù)據(jù)的地方
跟著數(shù)據(jù)跑,有這么大的錯(cuò)誤么? 不至于吧?! 數(shù)據(jù)在哪里,公司的生意就在那里,這有錯(cuò)么?
這當(dāng)然是有價(jià)值的,我在第 0 條就說(shuō)了大數(shù)據(jù)的 250萬(wàn)字的好處。 你看小朋友們踢足球, 球在哪里,他們就聚集在哪里。 這至少給大家一種參與感。 那么職業(yè)的選手怎么踢球呢?
我們看看 98 年世界杯 荷蘭 vs. 阿根廷的比賽
荷蘭隊(duì)球員弗蘭克-德波爾開(kāi)了一腳長(zhǎng)傳,他傳球計(jì)劃的落點(diǎn)上,沒(méi)有自己的隊(duì)友,也沒(méi)有防守隊(duì)員,那是一個(gè)沒(méi)有數(shù)據(jù)的地方。 但是,當(dāng)球落下的時(shí)候,自己的隊(duì)友就到了。
他的隊(duì)友博格坎普正跑向那個(gè)沒(méi)有數(shù)據(jù)的地方(紅衣服的那位):
現(xiàn)在人跑到了,球也到了,博格坎普一停,一晃,挑射。
守門員的手臂還在使勁伸展,三個(gè)剛剛到場(chǎng)的后衛(wèi)在看著皮球入網(wǎng),博格坎普的身影劃出一陣紅色的弧線,他開(kāi)始慶祝了。
沒(méi)有數(shù)據(jù)的地方,沒(méi)有球的地方,往往是有機(jī)會(huì)的地方。