當(dāng)下,各行各業(yè)都在大力尋求挖掘、利用大數(shù)據(jù)之道,科研領(lǐng)域亦不例外。然而,但凡撰寫過學(xué)位論文者,都會有這樣的經(jīng)歷:圍繞某個(gè)主題查找了大量的國內(nèi)外相關(guān)研究資料,但在認(rèn)真研讀后發(fā)現(xiàn),這些資料中真正可用、可信的東西甚少,倒是大量充斥廢話、不著邊際的話和似是而非的數(shù)字。這不能不提醒我們,要警惕大數(shù)據(jù)現(xiàn)象背后的假數(shù)據(jù)。那么,大科學(xué)時(shí)代的假數(shù)據(jù)來自何處?
一是來自主觀故意。今年3月底,英國大型學(xué)術(shù)醫(yī)療科學(xué)文獻(xiàn)出版商——現(xiàn)代生物出版公司宣布,撤銷存在同行評議造假的43篇論文。此非個(gè)例。2012年,生物科技公司安進(jìn)發(fā)現(xiàn),在關(guān)于癌癥研究的53項(xiàng)重大成果中,只有6項(xiàng)可被復(fù)制。本世紀(jì)最初10年,應(yīng)用于臨床的研究專利大約有8萬份被撤銷,因?yàn)樗鼈兌际清e(cuò)誤的。
二是來自文本不全或方法不當(dāng)。過去十幾年間,大陸學(xué)人在論證富國與強(qiáng)軍的關(guān)系時(shí),幾乎千遍一律地引用一個(gè)神話。它來自英國已故經(jīng)濟(jì)學(xué)家麥迪森于2001年出版的《世界經(jīng)濟(jì)千年史》一書:“中國清代gdp(國內(nèi)生產(chǎn)總值)曾長期占據(jù)世界第一寶座,1820年時(shí)占全球總量的33%(英國為5.2%),直到1900年仍高達(dá)11%。”這個(gè)神話出現(xiàn)在大量的學(xué)術(shù)論文、學(xué)術(shù)著作、教材和講臺上,卻偏偏無人在這個(gè)稍加思考就會發(fā)現(xiàn)破綻的通用注腳上畫出過問號。直到2013年11月,幾位記者通過追溯神話的出處以及該神話制造的過程和在國外得到的評價(jià),向我們傳遞了這樣一個(gè)信息:原來被我們奉若圭臬的麥迪森的gdp數(shù)據(jù)對比,竟然是“猜測性的”。
三是來自學(xué)術(shù)淺薄。美國科學(xué)計(jì)量學(xué)家普賴斯曾在上世紀(jì)50年代得出科學(xué)知識呈指數(shù)增長的結(jié)論,其依據(jù)是各國期刊文獻(xiàn)的數(shù)量增長。此后,有關(guān)知識爆炸的說法甚囂塵上?,F(xiàn)在看,普賴斯的判斷未免草率,因?yàn)槠诳墨I(xiàn)數(shù)量與人類知識量顯然是不能畫等號的,否則就會得出我們撤銷某些期刊就是限制知識增長的荒唐結(jié)論。當(dāng)下,期刊市場早已良莠不齊,魚龍混雜,更不用說那些明碼標(biāo)價(jià)的收費(fèi)期刊了。
總之,當(dāng)泥沙俱下且呈雪崩式的大數(shù)據(jù)襲來時(shí),我們更應(yīng)保持清醒的頭腦,用中國的古訓(xùn)來說,就是要防止以目廢心。