最近,一家公司的大數(shù)據(jù)中心通過對用戶代駕數(shù)據(jù)的分析,發(fā)布了一個(gè)“應(yīng)酬指數(shù)報(bào)告”。聯(lián)想到兩個(gè)月前另一家公司還發(fā)布過一個(gè)“燒烤大數(shù)據(jù)報(bào)告”,不禁讓人產(chǎn)生一種錯(cuò)覺——聽上去高大上的大數(shù)據(jù)不但就在我們身邊,而且就像孩子手中的玩具一樣,信手拈來,可愛慈祥。
因被谷歌用來成功預(yù)測流感,大數(shù)據(jù)聲名鵲起。隨著今年成為國家戰(zhàn)略,中國互聯(lián)網(wǎng)公司也開始言必稱大數(shù)據(jù)。對于大數(shù)據(jù)的原理筆者無力解釋。但我想真正從“大數(shù)據(jù)”中得出的結(jié)論,至少應(yīng)該具備兩個(gè)特征。
首先是能夠被驗(yàn)證。
百度通過大數(shù)據(jù)分析,100%命中了2014年世界杯淘汰賽階段所有比賽的結(jié)果。同樣的命題,谷歌、百盛和微軟都有失手之處。后來在《黃金時(shí)代》的票房預(yù)測上百度也跌了跟頭。實(shí)際上即使谷歌,2011年到2013年之間對流感趨勢的預(yù)測也比實(shí)際情況高出50%。
其次是能夠被應(yīng)用。
今年“黑色星期五”前夕,谷歌在“Think with Google”網(wǎng)站上放出了與黑五相關(guān)的各種數(shù)據(jù),告訴人們什么時(shí)間去購物不必被人群擁擠,以及哪些店鋪可能不至于人山人海。在金融領(lǐng)域,2010年印第安納大學(xué)商學(xué)院教授Johan Bollen報(bào)告說,推特的數(shù)據(jù)能以87.6%的準(zhǔn)確率預(yù)測出道瓊斯工業(yè)平均指數(shù)。彭博也已經(jīng)講twitter、Facebook等社交網(wǎng)站上的“社交情緒分析”列入財(cái)經(jīng)數(shù)據(jù)推送服務(wù)。
如果只是頂著大數(shù)據(jù)的帽子,既無法被驗(yàn)證,也看不到有任何可用之處,充其量只是基于大量數(shù)據(jù)的歸納罷了。實(shí)際上無論最近的“應(yīng)酬指數(shù)”、“燒烤地圖”,還是早些年幾家電商網(wǎng)站發(fā)布的“文胸?cái)?shù)據(jù)報(bào)告”、“北京性福地圖”,正是這種既無法驗(yàn)證、又沒什么卵用的“大數(shù)據(jù)”成果。
但對不明真相的群眾來說,大數(shù)據(jù)既神奇又神秘。因?yàn)樯衿嫠钥梢杂脕盱偶?,因?yàn)樯衩厮钥梢噪S心所欲的定義。
當(dāng)然,讓“大數(shù)據(jù)”為營銷服務(wù)也是極好的。
“文胸?cái)?shù)據(jù)報(bào)告”第一年發(fā)布時(shí),就因?yàn)?ldquo;黑龍江女性胸最小”引來一片吐槽,“胸越大的妹子越有錢”的結(jié)論更是讓人浮想聯(lián)翩。去年雙11之后,京東特意將肥皂、手紙和套套的銷量公之于眾,既迎合了公眾的獵奇心理、又分散了行業(yè)對阿里雙11的關(guān)注、同時(shí)也悄悄告訴網(wǎng)友“京東賣快消也很牛”。
一旦被冠以“大數(shù)據(jù)”的名頭,這些東西立刻高大上起來。但他們和大數(shù)據(jù)可能只有一毛錢的關(guān)系,就是數(shù)據(jù)量確實(shí)挺大。
制造錯(cuò)覺一直是我們所擅長的。就像本來和驢肉火燒一個(gè)級別的麥當(dāng)勞、肯德基,在中國一度要穿得體體面面才能去消費(fèi)。甚至土生土長的仿制品,對不少人來說也是比驢火和肉夾饃牛逼N倍的食物。尚處于探索中的大數(shù)據(jù),在中國互聯(lián)網(wǎng)行業(yè)卻已經(jīng)得到“廣泛應(yīng)用”,其實(shí)并不是什么好事。畢竟如果謊話說得多了,自己可能真的會信。