大數(shù)據(jù)飽含大玄機

責(zé)任編輯:editor004

2013-12-17 11:03:27

摘自:人民日報

有人說,拋開功利目的,統(tǒng)計學(xué)其實就是一項任務(wù)明確的客觀工作??v使我們對數(shù)據(jù)來源抱以高度的清醒,也未必能做到客觀真實。哲學(xué)家C.I.劉易斯告誡人們:“不存在任何先驗的理由足以證明,當(dāng)我們發(fā)現(xiàn)真理的時候,它會是有趣的。

有人說,拋開功利目的,統(tǒng)計學(xué)其實就是一項任務(wù)明確的客觀工作。要達成這一任務(wù),無非是處理數(shù)據(jù),從中尋找信息,繼而得出結(jié)論。但數(shù)據(jù)從來不是單純的數(shù)字,它是關(guān)于事實的符號記錄,構(gòu)成信息或知識的基礎(chǔ)材料。數(shù)字是抽象的符號,數(shù)據(jù)卻包含著特定的意義。比方說“157”這個數(shù)字,本身沒有任何主觀的含意??墒?,如果有人說,157是一個成年男子的身高,我們立刻就會明白,哦,它的單位肯定不是千克,也不是毫安,而是厘米。接著我們也許還會推斷說,這個人的個頭比較小,不太可能去打NBA??梢?,數(shù)字必須嵌在經(jīng)驗、上下文聯(lián)系、解釋等主觀判斷里才可能成為數(shù)據(jù)。換句話說,在統(tǒng)計學(xué)的范疇內(nèi),數(shù)據(jù)是“有內(nèi)容的數(shù)字”。而所謂內(nèi)容,其實大有玄機。

縱使我們對數(shù)據(jù)來源抱以高度的清醒,也未必能做到客觀真實。

2008年,納特·希爾弗在美國大選期間成功預(yù)測了49個州的選舉結(jié)果。2012年,他更是驚人地準確預(yù)測了美國全部50個州的選舉。但正是這個被譽為“神奇小子” 的人提醒大家,在如今所謂“大數(shù)據(jù)”的時代,作為一門炙手可熱的學(xué)問,統(tǒng)計學(xué)的第一戒條就是謙遜。一個好的統(tǒng)計學(xué)家必須認識到,哪些事情統(tǒng)計學(xué)可以辦到,哪些不能。而這一點,往往是分辨好數(shù)據(jù)與壞數(shù)據(jù)的前提。

上世紀七八十年代,當(dāng)計算機開始得到廣泛運用時,人們樂觀地以為,統(tǒng)計學(xué)可以解決經(jīng)濟預(yù)測問題。然而30年過去了,經(jīng)濟仍然是一個湍流難測的領(lǐng)域。很少有人預(yù)知到經(jīng)濟危機的發(fā)生,經(jīng)濟趨勢的預(yù)測通常也充滿了一個個互相矛盾的修正值。

經(jīng)濟學(xué)家哈祖斯是少數(shù)準確預(yù)測到2008年國際金融危機的人。他認為,人們在下判斷時,總是傾向于選擇那些滿足自身偏見的數(shù)據(jù)。不管這些偏見是經(jīng)濟動機還是政治信仰,它們都會使數(shù)據(jù)變得很不可靠。他說:“我認為人們絕對有這樣的傾向,急切地希望事情按照自己希望的方式發(fā)展下去。”正是這種一廂情愿的自以為是,使得數(shù)據(jù)、統(tǒng)計,以及它們描述的世界統(tǒng)統(tǒng)發(fā)生了扭曲。

哲學(xué)家C.I.劉易斯告誡人們:“不存在任何先驗的理由足以證明,當(dāng)我們發(fā)現(xiàn)真理的時候,它會是有趣的。”不僅是統(tǒng)計學(xué),任何以真理為最終目標(biāo)的知識,都應(yīng)該以此為圭臬。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號