蒼井空都30歲了,但真的還會(huì)有下一個(gè)蒼井空嗎,在此我要接力《用數(shù)據(jù)分析AV女優(yōu),尋找下一位蒼井空》一文,和虎兄虎妹一同挖掘——乘“大數(shù)據(jù)”的快車與數(shù)據(jù)分析的力量,如何能發(fā)現(xiàn)或者創(chuàng)造下一個(gè)蒼老師;但更重要的是由此分享一些對(duì)大數(shù)據(jù)誤解的辯證和認(rèn)知。
辯證大數(shù)據(jù)之一:來處與去向在先,占有和挖掘在后
按照《犯罪心理》的模式描述下一個(gè)AV女神的特征是富有娛樂性的,但同時(shí)缺少操作性,試問星座、血型、家境,甚至臉型真的就是造就蒼老師的原因嗎,或者我們傳統(tǒng)的數(shù)據(jù)分析誤區(qū)也存在于對(duì)大數(shù)據(jù)的使用。如果不明晰蒼老師是誰,她從哪兒而來,是找不出下一個(gè)蒼井空的。
蒼老師是填充國(guó)內(nèi)AV女神的名號(hào),未來是否還有全民女神的名號(hào)是一個(gè)問題,但如果要打造下一個(gè)蒼井空,拼臉型是行不通的,最直接的方式就是搜集迅雷云點(diǎn)播、快播,以及p2pSearcher等的點(diǎn)播和下載數(shù)據(jù),然后推出一部略有差異化的作品,找最密集的搜索時(shí)段,搶占用戶的視野,比如電驢退役了就投放草榴社區(qū)的置頂加亮,再使用技術(shù)手段提升在VaGaa和p2pSearcher等搜索器的排行,就最有可能抓住國(guó)內(nèi)AV用戶的心,走進(jìn)他們的硬盤;在有了一定知名度之后,積極參與公益事業(yè),然后投身普通見光的影視圈,新的蒼老師可能就此誕生了。
當(dāng)然這種方式也不一定能造出下一個(gè)蒼井空,但是一定比分析星座、血型和臉型來的靠譜一些?;貧w大數(shù)據(jù)的應(yīng)用也是如此,不是有了更多數(shù)據(jù),我們就能解決更多問題,而且數(shù)據(jù)搜集和處理本身也包含了物質(zhì)成本與機(jī)會(huì)成本;有時(shí)候方向要是出了問題,活兒再精也達(dá)成不了目標(biāo),使用大數(shù)據(jù)的出發(fā)點(diǎn)還是要先明晰我們需要解決什么問題,然后再試圖從相關(guān)數(shù)據(jù)與方法中挖掘答案;而不是根據(jù)獲取的數(shù)據(jù)和結(jié)構(gòu)化的處理,就直接把結(jié)果對(duì)號(hào)成我們現(xiàn)有問題的答案。
辯證大數(shù)據(jù)之二:大數(shù)據(jù)只是回答的開始,而非答案
大數(shù)據(jù)只是信息,是現(xiàn)象與結(jié)果的呈現(xiàn),不是現(xiàn)成的答案。比如還是分析AV女優(yōu)的問題,星座、血型等基本信息,身材、年齡和作品數(shù)目等職業(yè)信息也都只是結(jié)果,如果要問下一個(gè)蒼井空會(huì)是什么星座、身材和作品數(shù)目?這是新的問題,已有的數(shù)據(jù)不能直接地回答你。有兩個(gè)事例可幫我們理解本不存在的因果邏輯。一是羅振宇在《邏輯思維》所講的——不能從“所有游泳運(yùn)動(dòng)員的身材都好”的現(xiàn)象得出“游泳就能身材好”的結(jié)論,因?yàn)楹芏嗳顺蔀橛斡具\(yùn)動(dòng)員的原因正是身材本來就好,所以想通過單純的游泳來減肥不一定能成功;二是塔勒布在《黑天鵝》一書中講的事例,你投一枚硬幣正面的概率是50%,如果你聯(lián)系99次都得到了正面,在第100次投出正面的概率還是50%,這是數(shù)學(xué)理論中的獨(dú)立隨機(jī)事件,下一個(gè)蒼老師名號(hào)的觸發(fā)和上一個(gè)蒼老師名號(hào)沒有直接的因果聯(lián)系。歸納起來就是,現(xiàn)在大數(shù)據(jù)的結(jié)果都是已發(fā)生事件的必要條件,不是未發(fā)生事件的充分條件;而你要問的“用戶期待的下一款產(chǎn)品是什么”等問題都是純粹的未發(fā)生事件。
可能是數(shù)據(jù)越多,我們就越容易自主構(gòu)建本不存在的因果聯(lián)系。比如你分析近幾十年來日本AV女優(yōu)的變化,發(fā)現(xiàn)整體身高漸長(zhǎng)、罩杯漸豐,但不限于AV界,國(guó)內(nèi)外的影視明星群體也會(huì)出現(xiàn)“身高漸長(zhǎng)”和女性三圍趨向“兩凸一凹”的結(jié)果,可是這些因素早已融進(jìn)當(dāng)代社會(huì)的審美與時(shí)尚傾向,AV界也只是跟隨潮流的一部分而已(PS:影視界的標(biāo)準(zhǔn)限定在視覺效果,熒幕之外的真實(shí)情況不好確定,畢竟AV界的職業(yè)要求不容造假,身材要求就會(huì)更嚴(yán)格)。有些事情即使你不用大數(shù)據(jù)和數(shù)據(jù)分析,貌似也能分辨明白,但大數(shù)據(jù)的意義在何處?
第一,大數(shù)據(jù)回答不了未發(fā)生事件的問題,但能讓你客觀而全面地了解已發(fā)生的事情;第二,大數(shù)據(jù)不能告訴你正確答案,但在很多時(shí)候能幫你排除一個(gè)錯(cuò)誤答案,比如你要問“2014年服裝界的流行元素會(huì)是什么”,或者你瀏覽近幾年的數(shù)據(jù)都不會(huì)有直接的結(jié)果,但你至少確定明年基本不會(huì)再重復(fù)今年和去年的套路。
辯證大數(shù)據(jù)之三:大數(shù)據(jù)適用于控制與防御,與創(chuàng)新和創(chuàng)造是兩回事
大數(shù)據(jù)本身是用比特描述世界的方式,我們能由此全局地審視已知,但不能直觀地預(yù)見未知,就好比你能分析年度Top100歌曲的聲譜頻譜,然后再智能地寫出一套樂譜,就真的成為明年的Top嗎?我們借助大數(shù)據(jù),能發(fā)現(xiàn)一些我們本身在乎但容易忽視的現(xiàn)象,比如黑莓及時(shí)利用公有云數(shù)據(jù)洞察消費(fèi)者對(duì)觸摸屏的接受速度,就不會(huì)動(dòng)作遲遲導(dǎo)致錯(cuò)失重要的一班車了。但針對(duì)更多微觀的垂直產(chǎn)業(yè)而言,中小企業(yè)和創(chuàng)業(yè)團(tuán)隊(duì)獲取和解析大數(shù)據(jù)的成本就是高昂的,而且大數(shù)據(jù)適合發(fā)現(xiàn)危機(jī)與審視漏洞,對(duì)單點(diǎn)突破沒有直觀的意義。在蘋果和谷歌實(shí)驗(yàn)室的任何一款產(chǎn)品,都不會(huì)是由已知數(shù)據(jù)直觀推斷出來的,在下一個(gè)轉(zhuǎn)角處的iPod、iMac、iPad、Google Earth、Leap Motion,甚至下一個(gè)蒼老師,都有可能是冒險(xiǎn)和冒進(jìn)的嘗試,或者是復(fù)合因素的結(jié)果:來自我們生活中的真實(shí)痛點(diǎn),以及根植在我們DNA的人性本身,即使沒有大數(shù)據(jù)這般出色的定量驗(yàn)證工具,不妨礙你去定性地發(fā)現(xiàn)些什么,而在投放產(chǎn)品、接觸用戶等嘗試的過程中就已經(jīng)會(huì)得到驗(yàn)證了。
如果完善的公有云系統(tǒng)提供了一張完整的社會(huì)數(shù)據(jù)圖譜,所有的參與者只要根據(jù)數(shù)據(jù)做出相應(yīng)的反應(yīng)即可,商業(yè)世界就會(huì)無趣了。“大數(shù)據(jù)”是年度流行概念之一,在此分享簡(jiǎn)單的方法論就是“聚焦核心,掃視全局”,找出自己真正需要明晰的核心問題是什么,然后借助數(shù)據(jù)與工具去探尋答案(當(dāng)然也要好成本方面的考量),其他更加宏觀和多元的數(shù)據(jù),掃視了解即可。