如今,大數(shù)據(jù)在各個領域都是使用頻率很高的時髦詞,而大數(shù)據(jù)預測股市、獎項等應用也應運而生。昨天,中國科學院院士梅宏在南京工業(yè)大學演講時指出,大數(shù)據(jù)被炒得過熱,其實很多領域只是穿上大數(shù)據(jù)的馬甲而已。而關于大數(shù)據(jù)的各種預測,雖然有合理性,但也不能全信。
梅宏說,大數(shù)據(jù)正引發(fā)新一輪信息化建設熱潮。通過大數(shù)據(jù)構建一個數(shù)據(jù)空間,從樣本到全體、從精確到近似、從因果到關聯(lián)度,這個空間里面有很多規(guī)律可循,可以無限逼近我們的現(xiàn)實世界。根據(jù)大數(shù)據(jù)分析,可以對未來有所預見,從而影響政府的決策。國外,包括機構做的估算,大數(shù)據(jù)這個產(chǎn)業(yè)本身對GDP的帶動是2%-4%。一方面促進產(chǎn)業(yè)升級,促生新業(yè)態(tài),同時也在不斷改善民生服務。
不過,梅宏認為,大數(shù)據(jù)概念持續(xù)升溫,已處于過熱狀態(tài),有炒作之嫌。很多地方一窩蜂搞“大數(shù)據(jù)”,殊不知大數(shù)據(jù)不可能是解決一切問題的法寶,更不應該成為各行各業(yè)的馬甲。真正的大數(shù)據(jù)應該體現(xiàn)在多源數(shù)據(jù)的融合,絕不僅僅是數(shù)據(jù)的“海量”。而事實上,不少地方、行業(yè)搞的大數(shù)據(jù),只是單一數(shù)據(jù)的簡單疊加,并不是真正的大數(shù)據(jù)。更何況,有的行業(yè)根本不需要大數(shù)據(jù)分析,也來湊熱鬧。由此帶來的問題是,出現(xiàn)大量超前投資或重復投資,是對社會財富的浪費。
“大數(shù)據(jù)的價值已被廣泛認知,并應用在不少地方。”梅宏說,谷歌研發(fā)的無人駕駛汽車,不僅有實時感知系統(tǒng),而且還有基于大數(shù)據(jù)的認知網(wǎng)絡。“比如小球滾到路口,根據(jù)大數(shù)據(jù)分析,可能后面還會跟著一個小孩,無人駕駛汽車就要注意避讓。”梅宏還說到一個有趣的大數(shù)據(jù)應用:“這是發(fā)生在美國沃爾瑪連鎖超市的真實案例,尿布和啤酒赫然擺在一起出售,并且銷量雙雙增加了。原來,美國的婦女們經(jīng)常會囑咐她們的丈夫下班以后要為孩子買尿布。而丈夫在買完尿布之后又要順手買回自己愛喝的啤酒,因此啤酒和尿布在一起購買的機會還是很多的。而正是商家通過對超市一年多原始交易數(shù)字進行詳細的分析,才發(fā)現(xiàn)了這對神奇的組合。”
對于當下很火的大數(shù)據(jù)預測,梅宏表示有一定準確度,但也不能全信。比如大數(shù)據(jù)預測奧斯卡獎,根據(jù)不同維度來進行數(shù)據(jù)分析,有一定合理性,今年準確率高達87%。但是用大數(shù)據(jù)預測股市卻不能全信,因為這是一個開放的系統(tǒng),股民看到大數(shù)據(jù)分析后有從眾心理,會影響股市的走向。再如大數(shù)據(jù)預測流感,最早是很準的,但是后來隨著一些假數(shù)據(jù)的摻入,就大大影響了準確率。