當(dāng)主流媒體選擇趨向于我們談?wù)撘丫玫脑掝}時(shí),我的確很愉快。對(duì)于我來(lái)說(shuō),這很有意義,即使為了吸引大眾而簡(jiǎn)化某些主題。但是,當(dāng)媒體把它弄錯(cuò)時(shí),我也會(huì)很惱火。例如:Dennis Overbye周一為紐約時(shí)報(bào)所寫(xiě)的一篇有關(guān)于大數(shù)據(jù)看似對(duì)人們利益無(wú)害的故事。
數(shù)據(jù)如此之大
在這篇文章中,Overbye斷言大數(shù)據(jù)平行領(lǐng)域之謎會(huì)帶來(lái)憂慮和興奮。
“Big Data對(duì)于我們的了解可能比我們自己了解的更多,但是會(huì)有Big Data本身并不知道它實(shí)際已經(jīng)知道的東西么?Big Data在注視著我們,但是誰(shuí)在注視它呢?”
當(dāng)Big Data這個(gè)詞常掛在嘴邊時(shí),很容易混淆。以至于我們說(shuō)Big Data時(shí),弄不清究竟想表達(dá)什么意思。
據(jù)IBM的人員所說(shuō),大數(shù)據(jù)跨越三個(gè)維度:容量,速率和種類(lèi)。并且可以用來(lái)作為找到新興數(shù)據(jù)類(lèi)型和內(nèi)容見(jiàn)解的契機(jī),可以使你的業(yè)務(wù)更加靈活并且能夠回答你之前考慮不到的問(wèn)題。
因此,大數(shù)據(jù)對(duì)于我們的了解遠(yuǎn)遠(yuǎn)大于我們自己。人類(lèi)的大腦是極為復(fù)雜的,然而它卻不能處理我們每時(shí)每刻所產(chǎn)生的信息量??茖W(xué)家告訴 Overbye世界銀行的數(shù)字信息以每秒5萬(wàn)億比特的速度增長(zhǎng),給他留下了深刻的印象。我承認(rèn),5萬(wàn)億聽(tīng)起來(lái)的確很多,但是數(shù)據(jù)正在以更快的速度和更大的 比率增長(zhǎng)??紤]下列情況:
·用戶每天能發(fā)送到Twitter上的信息量會(huì)達(dá)到2TB(IBM);
·2010年存儲(chǔ)了7EB的數(shù)據(jù)量(IDC);
·僅2011年,創(chuàng)建和復(fù)制的數(shù)字信息量超過(guò)了1800億千兆字節(jié)(IDC)。
數(shù)據(jù)越來(lái)越大
Overbye文章的后面部分提出了一個(gè)關(guān)于大數(shù)據(jù)存在的有趣的事情,我們所創(chuàng)建的數(shù)據(jù)是否會(huì)超越我們?我想,雖然它有可能發(fā)生,但是大數(shù)據(jù)的問(wèn)題并不在于它會(huì)被怎樣用來(lái)對(duì)付我們,我們又會(huì)怎樣看待擺在首位的大數(shù)據(jù)呢。
Forsyth Communications白皮書(shū)有一個(gè)貼切的標(biāo)題“大數(shù)據(jù)分析,沒(méi)有太大的數(shù)據(jù):引人注目的經(jīng)濟(jì)和科技大數(shù)據(jù)計(jì)算(For Big Data Analytics There’s No Such Thing as Too Big: The Compelling Economics and Technology of Big Data Computing)”。
作者是這樣寫(xiě)到:
數(shù)字領(lǐng)域相關(guān)的巨大天文數(shù)字使組織接受這一事實(shí),到目前為止為了保持競(jìng)爭(zhēng)力,他們一直在做傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)和企業(yè)數(shù)據(jù)倉(cāng)庫(kù)(EWD)。也就是說(shuō),如果他們想利用大數(shù)據(jù)的巨大優(yōu)勢(shì),而避免出現(xiàn)頭痛的問(wèn)題,就要使其轉(zhuǎn)換為真正的商業(yè)價(jià)值。這意味著將我們周?chē)y的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為有序的結(jié)構(gòu)化數(shù)據(jù)以從中提取價(jià)值;海量數(shù)據(jù)造成的問(wèn)題所引起的思考對(duì)于數(shù)據(jù)來(lái)說(shuō)是一個(gè)契機(jī)。
沒(méi)有人會(huì)否認(rèn)我們已經(jīng)接觸到大數(shù)據(jù)。并非所有的大數(shù)據(jù)都良好,所以我們沒(méi)有坐視不理,而要努力使它變得更好。并且已經(jīng)有許多人開(kāi)始這樣做了。市 場(chǎng)分析師和數(shù)據(jù)科學(xué)家同樣能夠理解我們的數(shù)據(jù)所表達(dá)的內(nèi)容,因此我們可以更好的使用它們,對(duì)未來(lái)的事情做出良好的計(jì)劃,并且能夠更好的管理它們。如果看不 到大數(shù)據(jù)給我們帶來(lái)的機(jī)遇和未來(lái),那么大數(shù)據(jù)對(duì)我們來(lái)講只能意味著毀滅。