話說太平洋上有個小島,上面住了土著人,與世隔絕上千年,地處偏遠,各國都對這個島沒有興趣。直到二戰(zhàn)時,美國發(fā)現(xiàn)這個島是個非常好的中轉(zhuǎn)站,就去建了個空軍基地。每次飛機來了送給養(yǎng),也給土著點東西比如午餐肉罐頭什么的。后來戰(zhàn)爭結(jié)束了,美軍關(guān)了基地離開了。后來,70年代有人去這個島,發(fā)現(xiàn)土著人有個宗教,是在廢棄的跑道兩側(cè)點燃兩溜火把,然后祭拜,等待天神的到來。
不懂大數(shù)據(jù),說下感覺,拋磚引玉,敬請批評。從學(xué)術(shù)界到商業(yè)屆,從基因組到客戶數(shù)據(jù)發(fā)掘,大數(shù)據(jù)已經(jīng)流行好多年了,有少數(shù)一些成功案例,大多數(shù)就是產(chǎn)生一些似是而非的結(jié)論。其實大數(shù)據(jù)非常危險,首先單個數(shù)據(jù)錯誤可能性非常大,雖然這對得出統(tǒng)計數(shù)據(jù)可能沒影響,但對得出精確結(jié)論影響很大。更有很多高通量低質(zhì)量的數(shù)據(jù),對統(tǒng)計結(jié)果都有影響,最后可能garbage in garbage out。其次數(shù)據(jù)量大了,總能形成pattern,但這不一定是真正的規(guī)律或者機制性規(guī)律。無論數(shù)據(jù)量多大,你也不能保證你采集的數(shù)據(jù)都有用,還有缺失數(shù)據(jù),你壓根都沒想到的。我認為還有一個重要問題,就是有多少問題是計算機可以解決的。比如,現(xiàn)代的超級計算機,就算聯(lián)網(wǎng),給它們輸入所有產(chǎn)生量子力學(xué)之前物理學(xué)的實驗結(jié)果,比如光電效應(yīng),原子光譜等等,它們能不能產(chǎn)生量子力學(xué)?如果不能,憑什么就認為大數(shù)據(jù)能解決復(fù)雜系統(tǒng)如生物的機理性問題?
商業(yè)上一些大數(shù)據(jù)結(jié)果的效用也非??梢伞4騻€比方,比如Amazon買東西,總會被推薦其他的產(chǎn)品,是其他人買了那個東西后也買或者看過的產(chǎn)品。反正我沒碰到過幾次推薦我喜歡的,現(xiàn)在直接略過。當然這是小數(shù)據(jù)。但就算有一天大數(shù)據(jù)了,每個人的需求在某個時刻還是不一樣的。每個人的購物習(xí)慣也不一樣,還有各種偶然性。比如我喜歡先選好各種商品,比如我自己用的相機鏡頭,還有國內(nèi)親戚讓我?guī)У恼郫B童車,完全無關(guān),還就這一次,Amazon以后就給我推薦尿不濕了,嬰兒玩具了。也許大多數(shù)人符合統(tǒng)計規(guī)律,但這最終還是統(tǒng)計意義上的模糊營銷。我覺得大數(shù)據(jù)流行,正說明科學(xué)停滯了,無法發(fā)現(xiàn)復(fù)雜系統(tǒng)的本質(zhì)規(guī)律。而沒有愛因斯坦,波爾和薛定諤那樣的天才,而擅于包裝的所謂能人又不喜歡閑著,資本也需要炒作。所以一拍即合。
原文鏈接:http://www.thebigdata.cn/YeJieDongTai/13979.html