大數(shù)據(jù)無疑是眼下的一個熱門話題,大家都在挖掘大數(shù)據(jù),這當(dāng)然是科技發(fā)展尤其是互聯(lián)網(wǎng)高速發(fā)展帶來的好東西。不過,大數(shù)據(jù)這個經(jīng)需要念好,念不好不僅起不到效果,反而會誤導(dǎo)市場,誤導(dǎo)大家。
所謂大數(shù)據(jù)說得簡單點(diǎn),就是從海量數(shù)據(jù)中挖掘有價值的信息,強(qiáng)大的計算機(jī)計算能力、互聯(lián)網(wǎng)搜索功能為數(shù)據(jù)分析創(chuàng)造了條件,也在實(shí)踐中起到較好的效果。比如,證券市場依靠大數(shù)據(jù)提高了監(jiān)管能力,近期捉的不少基金經(jīng)理老鼠倉就與大數(shù)據(jù)有關(guān)。監(jiān)管部門通過搜索、比對基金經(jīng)理建倉前一個月相同股票的買入情況,從而發(fā)現(xiàn)一些持續(xù)買入相同股票的賬戶,進(jìn)而追蹤這些賬戶的資金來往,最終抓住了一批碩鼠。
但是,所謂的大數(shù)據(jù)也會鬧出一些笑話。比如,某地圖公司前不久發(fā)布了一個分析全國重點(diǎn)城市擁堵情況的大數(shù)據(jù),結(jié)論是上海成為今年第二季度最擁堵城市。這個結(jié)論和大家的感受很不一致,全國最堵的城市顯然不是上海,而且,上海今年二季度并沒有比一季度更堵車,為什么二季度會上榜?之所以產(chǎn)生這個結(jié)果,是與該公司選取的樣本有關(guān),與大家是不是使用該公司的地圖軟件有關(guān),這種十分片面的選擇,導(dǎo)致最終的結(jié)論非常站不住腳。
類似的情況還有不少,世界杯期間,央視的一檔節(jié)目中發(fā)布了看球觀眾的大數(shù)據(jù)統(tǒng)計,其中很多結(jié)論明顯不對,比如,說晚上看球的都是30歲以下的觀眾,連電視主持人當(dāng)場就覺得這個數(shù)據(jù)有問題。因?yàn)樵摂?shù)據(jù)的統(tǒng)計結(jié)果是根據(jù)在網(wǎng)上參與互動節(jié)目人的數(shù)量得出的,而一些30歲以上球迷在看球卻沒有參與節(jié)目互動,結(jié)論就變成他們沒有看球。
數(shù)據(jù)是死的,如何選取數(shù)據(jù)標(biāo)準(zhǔn)則是人為的,可以說大數(shù)據(jù)最終不是計算機(jī)得出的,還是人為的結(jié)果。如果設(shè)定的標(biāo)準(zhǔn)不科學(xué),那么,結(jié)論一定是走樣的。從這個角度看,大數(shù)據(jù)是一門統(tǒng)計科學(xué),隨隨便便弄弄是不負(fù)責(zé)任的表現(xiàn),會誤導(dǎo)市場。長期來,中國的市場調(diào)查一直問題多多,原因就在于樣本統(tǒng)計標(biāo)準(zhǔn)不夠科學(xué)合理,希望這個毛病不要傳導(dǎo)到剛剛興起的大數(shù)據(jù),不要念歪了大數(shù)據(jù)這本經(jīng)。