“前兩天和一個在高盛工作的同學(xué)聊天,他去年做了一個項目,為此獲得了獎金40萬美元。項目主要研究的是全球各地的下雨天與股價走勢的關(guān)系,最后得出的結(jié)論是:沒有關(guān)系。”
“4月9日,F(xiàn)acebook宣布以10億美元的現(xiàn)金和股票收購Instagram公司。”
以上兩則是記者昨日登錄網(wǎng)絡(luò)時彈出的訊息,前者是一位朋友轉(zhuǎn)發(fā)的真實吐槽,后者是昨天業(yè)界最熱的話題。當(dāng)鼠標(biāo)在這兩則消息間反復(fù)切換,記者仿佛有感會在二者間發(fā)現(xiàn)什么聯(lián)系。關(guān)聯(lián)詞當(dāng)然不是“40萬美元”和“10億美元”,事實上,記者認為聯(lián)系它們的是一個詞:大數(shù)據(jù)。
數(shù)據(jù)提供決策依據(jù)
“大數(shù)據(jù)”(Big Data)是一個在近期才興起并爆紅的明星概念,它已經(jīng)上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網(wǎng)的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。
最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”
“大數(shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。
根據(jù)維基百科的定義,“大數(shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來衡量,大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。
回到本文開始提到的兩則消息,它們和“大數(shù)據(jù)”有什么聯(lián)系呢?
那位轉(zhuǎn)發(fā)高盛40萬美元獎金的朋友解釋說,“很多人聽說這件事后都會笑,我卻要替他辯解。這個結(jié)論很有價值,如果研究的結(jié)論是下雨天和股價有關(guān),那高盛就必須以幾十倍于此的代價開發(fā)衍生品。這個基于數(shù)據(jù)的研究結(jié)果提供了決策依據(jù)。”
“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。
數(shù)據(jù)的可視化
關(guān)于Instagram被高價收購一事,必須交代的背景是:收購方Facebook成立于2004年,月度活躍用戶8.45億,估值高達千億美元;被收購方Instagram,誕生551天,員工十?dāng)?shù)人,提供拍照分享服務(wù),此次出售價為10億美元。
由此可見,無論是Facebook還是Instagram,都是當(dāng)今互聯(lián)網(wǎng)時代的產(chǎn)物,信息、數(shù)據(jù)是一塊肥沃且富有創(chuàng)造力的新土壤,它們幫助當(dāng)代企業(yè)以須臾之速達到了過去百年老店也未能企及的規(guī)模。
“數(shù)據(jù)是新的石油。”亞馬遜前任首席科學(xué)家Andreas Weigend說。Instagram以10億美元出售之時,成立于1881年的世界最大影像產(chǎn)品及服務(wù)商柯達正申請破產(chǎn)。
大數(shù)據(jù)是如此重要,以至于其獲取、儲存、搜索、共享、分析,乃至可視化地呈現(xiàn),都成為了當(dāng)前重要的研究課題。
“當(dāng)時時變幻的、海量的數(shù)據(jù)出現(xiàn)在眼前,是怎樣一幅壯觀的景象?在后臺注視著這一切,會不會接近上帝俯視人間星火的感覺?”
這個問題我們曾請教過劉建國 ,中國著名的搜索引擎專家。劉曾主持開發(fā)過國內(nèi)第一個大規(guī)模中英文搜索引擎系統(tǒng)“天網(wǎng)”。
要知道,劉建國曾任至百度的首席技術(shù)官,在這樣一家每天需應(yīng)對網(wǎng)民各種搜索請求1.7億次(現(xiàn)在約為8.77億次)的網(wǎng)站中,如果只是在后臺靜靜端坐,可能片刻都不能安心吧。百度果然在提供搜索服務(wù)之外,逐漸增添了百度指數(shù),后又建立了基于網(wǎng)民搜索數(shù)據(jù)的重要產(chǎn)品“貼吧”及百度統(tǒng)計產(chǎn)品等。
劉建國沒有直接回答這個問題,他想了很久,似乎陷入了回憶,嘴角的笑容含著詭秘。
倒是有公司已經(jīng)在大數(shù)據(jù)中有接近上帝俯視的感覺,美國洛杉磯就有企業(yè)宣稱,他們將全球夜景的歷史數(shù)據(jù)建立模型,在過濾掉波動之后,做出了投資房地產(chǎn)和消費的研究報告。
而在數(shù)據(jù)可視化呈現(xiàn)方面,我最新接收到的故事是,一位在美國思科物流部門工作的朋友,很聰明的印度裔小伙子,近期被Facebook高價挖角,進入其數(shù)據(jù)研究小組。他后來驚訝地發(fā)現(xiàn),里面全是來自物流企業(yè)、供應(yīng)鏈方面的技術(shù)人員和專家,“Facebook想知道,能不能用物流的角度和流程的方式,分析用戶的路徑和行為。”