大數(shù)據(jù)與科學(xué):存在不可調(diào)和的矛盾嗎?

責(zé)任編輯:editor008

2015-04-14 09:36:41

摘自:中國大數(shù)據(jù)

引言:我們先看一個(gè)故事:話說太平洋上有個(gè)小島,上面住了土著人,與世隔絕上千年,地處偏遠(yuǎn),各國都對(duì)這個(gè)島沒有興趣。

引言:我們先看一個(gè)故事:話說太平洋上有個(gè)小島,上面住了土著人,與世隔絕上千年,地處偏遠(yuǎn),各國都對(duì)這個(gè)島沒有興趣。直到二戰(zhàn)時(shí),美國發(fā)現(xiàn)這個(gè)島是個(gè)非常好的中轉(zhuǎn)站,就去建了個(gè)空軍基地。每次飛機(jī)來了送給養(yǎng),也給土著點(diǎn)東西比如午餐肉罐頭什么的。后來戰(zhàn)爭結(jié)束了,美軍關(guān)了基地離開了。后來,70年代有人去這個(gè)島,發(fā)現(xiàn)土著人有個(gè)宗教,是在廢棄的跑道兩側(cè)點(diǎn)燃兩溜火把,然后祭拜,等待天神的到來。

不懂大數(shù)據(jù),說下感覺,拋磚引玉,敬請(qǐng)批評(píng)。從學(xué)術(shù)界到商業(yè)屆,從基因組到客戶數(shù)據(jù)發(fā)掘,大數(shù)據(jù)已經(jīng)流行好多年了,有少數(shù)一些成功案例,大多數(shù)就是產(chǎn)生一些似是而非的結(jié)論。

其實(shí)大數(shù)據(jù)非常危險(xiǎn),首先單個(gè)數(shù)據(jù)錯(cuò)誤可能性非常大,雖然這對(duì)得出統(tǒng)計(jì)數(shù)據(jù)可能沒影響,但對(duì)得出精確結(jié)論影響很大。更有很多高通量低質(zhì)量的數(shù)據(jù),對(duì)統(tǒng)計(jì)結(jié)果都有影響,最后可能garbage in garbage out。其次數(shù)據(jù)量大了,總能形成pattern,但這不一定是真正的規(guī)律或者機(jī)制性規(guī)律。無論數(shù)據(jù)量多大,你也不能保證你采集的數(shù)據(jù)都有用,還有缺失數(shù)據(jù),你壓根都沒想到的。我認(rèn)為還有一個(gè)重要問題,就是有多少問題是計(jì)算機(jī)可以解決的。比如,現(xiàn)代的超級(jí)計(jì)算機(jī),就算聯(lián)網(wǎng),給它們輸入所有產(chǎn)生量子力學(xué)之前物理學(xué)的實(shí)驗(yàn)結(jié)果,比如光電效應(yīng),原子光譜等等,它們能不能產(chǎn)生量子力學(xué)?如果不能,憑什么就認(rèn)為大數(shù)據(jù)能解決復(fù)雜系統(tǒng)如生物的機(jī)理性問題?

商業(yè)上一些大數(shù)據(jù)結(jié)果的效用也非常可疑。打個(gè)比方,比如Amazon買東西,總會(huì)被推薦其他的產(chǎn)品,是其他人買了那個(gè)東西后也買或者看過的產(chǎn)品。反正我沒碰到過幾次推薦我喜歡的,現(xiàn)在直接略過。當(dāng)然這是小數(shù)據(jù)。但就算有一天大數(shù)據(jù)了,每個(gè)人的需求在某個(gè)時(shí)刻還是不一樣的。每個(gè)人的購物習(xí)慣也不一樣,還有各種偶然性。比如我喜歡先選好各種商品,比如我自己用的相機(jī)鏡頭,還有國內(nèi)親戚讓我?guī)У恼郫B童車,完全無關(guān),還就這一次,Amazon以后就給我推薦尿不濕了,嬰兒玩具了。也許大多數(shù)人符合統(tǒng)計(jì)規(guī)律,但這最終還是統(tǒng)計(jì)意義上的模糊營銷。

D1Net評(píng)論:

基于此,我覺得大數(shù)據(jù)流行,正說明科學(xué)停滯了,無法發(fā)現(xiàn)復(fù)雜系統(tǒng)的本質(zhì)規(guī)律。而沒有愛因斯坦,波爾和薛定諤那樣的天才,而擅于包裝的所謂能人又不喜歡閑著,資本也需要炒作。所以一拍即合。

(原文作者:Tianzi)
 

原文鏈接:http://www.thebigdata.cn/YeJieDongTai/13979.html

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)