隨著大數(shù)據(jù)概念的提出,新興相關(guān)數(shù)據(jù)公司也猶如雨后春筍般出現(xiàn),想象一下每早與大數(shù)據(jù)創(chuàng)業(yè)夢想一起醒來,這確實是一種美妙的感覺。粗淺地想象一下貌似處理大數(shù)據(jù)很容易,你只需要:
1)一個使一切工序“自動化”的想法
2)一伙能夠拿出一個個算法的“數(shù)據(jù)科學(xué)家”
3)數(shù)據(jù)!大量的數(shù)據(jù)!
如果你已經(jīng)有了一個基本的想法,而至于那些“數(shù)據(jù)科學(xué)家”們,你通??梢栽诤湍愫匣锏男』锇閭冎姓业剿麄儯ㄈ绻麤]有的話,去哈佛、耶魯、伯克利或者紐約大學(xué)這樣的高校碰碰運氣吧)。 萬事具備,只欠東風(fēng),那么問題來了,該如何找到數(shù)據(jù)呢?通常有以下幾個可以考慮的備選策略。
策略1:蚱蜢——相信開放數(shù)據(jù)吧!
蚱蜢先生是個樂天派,他總是告訴自己:“別擔(dān)心,總會有可供使用的數(shù)據(jù)出現(xiàn)的,說不定它們之中還會有可以自由訪問的呢!”不論現(xiàn)在或是將來,他相信開放數(shù)據(jù),這一切都是為了提供他自己的服務(wù)。
這種開放數(shù)據(jù)策略可以在金融和運輸市場中帶來可盈利的成果。例如,初創(chuàng)公司往往可以運用商品運輸信息,并且將它與貨物與市場價格進行交叉關(guān)聯(lián),從而對有關(guān)的工業(yè)提供高度相關(guān)的信息。
這個方法的主要缺點是數(shù)據(jù)的開放范圍往往有限。事實上,由于倫理或是經(jīng)濟方面的原因,當(dāng)你想研究一個具體的東西,比如一個人、一個產(chǎn)品或一個地址時,開放的數(shù)據(jù)總是有所遺漏的。無論如何,最有用的東西往往是那些自己私有的(真是幸運)和花錢買來的(真是悲催)。
策略2:蜘蛛——編織你自己的網(wǎng)絡(luò)吧!
蜘蛛先生總是那么一絲不茍。“沒有數(shù)據(jù)?沒關(guān)系,讓我們?nèi)ふ宜?rdquo;蜘蛛先生創(chuàng)建了一個網(wǎng)絡(luò)結(jié)點以供他捕獲數(shù)據(jù),有時他從一個小結(jié)點出發(fā),然后慢慢尋找更大的。蜘蛛先生將制造所有的接入點和鏈接器,并允許所有的參與者在使用他的服務(wù)的同時時把數(shù)據(jù)提供給他。
大多數(shù)的在線營銷者采取這樣的做法:這意味著你的“tracker”(從第三方網(wǎng)站獲取流量的組件)都在網(wǎng)上,從而能夠有最大化的數(shù)據(jù)量和最大的網(wǎng)絡(luò)可能性。而如今,這一切正在向移動應(yīng)用端轉(zhuǎn)移,我們不在談?wù)撊绾芜\用“tracker”而是如何運用SDK(軟件開發(fā)工具包)。在我們生活的現(xiàn)實世界中,Lokad公司已經(jīng)構(gòu)建了一個延伸到超市收銀機的網(wǎng)絡(luò),使得大部分的專用收銀機和庫存管理程序間實現(xiàn)了簡單的鏈接,從而為超市庫存管理提供了一個有效的解決方案。
如果一切順利,蜘蛛先生的方法將使得他足以建立一個擴張速度很快的成功企業(yè)。然而,這樣的方案對以下兩個風(fēng)險因素極其敏感:
蜘蛛網(wǎng)太脆弱了(一個大的網(wǎng)絡(luò)參與者可以決定“改變游戲規(guī)則”并摧毀一切)
足夠肥美的昆蟲太少了(也許那些大型客戶和真正有興趣的客戶并不在這個網(wǎng)絡(luò)的覆蓋的范圍內(nèi))
策略3:狐貍——狩獵“大集團”!
狐貍先生在哪里尋找“大數(shù)據(jù)”呢?答案是在那些已經(jīng)把“大數(shù)據(jù)”喂得飽飽的大企業(yè)里。 狐貍先生按照以下幾個步驟行動:
首先,他提出一個問題的可能的解決方案(例如,減少欺詐行為,提高你的廣告購買的投入,增加你的郵件營銷途徑,采購性能更好的原材料,等等) 接著,他開始收集客戶資料,并嘗試實現(xiàn)解決問題的方案 最后,他將運用從第一個客戶那學(xué)來的知識,對之后客戶提出的問題給出更為簡化的解決方案。
狐貍先生的一生十分艱辛,因為在他邁出走向成功的第一步時,就必須堅信自己能夠解決那些自己從未解決過的問題。為此,他必須激發(fā)出自身強大的欲望(為了吸引大集團老總的注意),招搖自己的能力(大談算法、職稱、學(xué)歷),炫耀自己所有的華麗衣冠(那些使人耳目一新的圖表設(shè)計規(guī)劃)。因此,“大數(shù)據(jù)”狐貍是一個吃力不討好的角色,往往在他得到用真實的數(shù)據(jù)證明自己的機會之前,就不得不費盡心思地去說服別人。
當(dāng)狐貍先生成功時,他便可以真真正正地為潛在的客戶解決一個有直接價值的實際問題了。然而,這么做同樣有非常顯著的副作用:那些辛辛苦苦為第一個大客戶建立的產(chǎn)品、服務(wù)和模型往往將會被賣給他們的競爭隊手,一些相對較小的客戶,這就相當(dāng)于狐貍先生教會了自己的大客戶如何更好服務(wù)于他們的競爭對手(那些小客戶)。這意味著,參與其中的大集團們有時將會間接地幫助自己的競爭者去以更低廉的價格獲得服務(wù),從而無形之中充當(dāng)了替罪羊的角色。
策略4 工具制造者!
既然所有人都想玩轉(zhuǎn)大數(shù)據(jù),那么為什么不把大數(shù)據(jù)分析交給工具,而我們只需成為工具制造者。
大數(shù)據(jù)分析工具市場是一個競爭化的市場,既有一些新創(chuàng)立的小企業(yè)的參與,也有一些類似于谷歌、微軟、Oracle等的行業(yè)龍頭的參與。同時,大數(shù)據(jù)分析工具市場也是一個強吸金市場,單2014年就有數(shù)十億美元的投資額。然而,當(dāng)這次大數(shù)據(jù)分析的熱潮過去之后,大數(shù)據(jù)分析工具的需求是否還會持續(xù)?這是目前該市場面臨的主要問題。這極其類似淘金時代過去后,對鎬這種工具的生產(chǎn)是否還具有大規(guī)??沙掷m(xù)性的問題。當(dāng)然,目前我們對大數(shù)據(jù)的分析尚停留在石器時代,能夠進行大數(shù)據(jù)分析的“鎬”還沒有完全被開發(fā)出來。智能計算機系統(tǒng)需要更高效更可控的分析工具。就讓我們先生產(chǎn)出“鎬”吧,然后期待以后的某一天可以生產(chǎn)出大數(shù)據(jù)分析的“手提鉆”!