大數(shù)據(jù)技術(shù)背后的認識論問題

責任編輯:jackye

作者:賀光燁編譯

2017-01-11 08:57:43

摘自:中國社會科學(xué)網(wǎng)-中國社會科學(xué)報

隨著信息技術(shù)和網(wǎng)絡(luò)及各類傳感設(shè)備、海量存儲技術(shù)的飛速發(fā)展,數(shù)據(jù)的定義和收集方式產(chǎn)生了革命性的變化,大數(shù)據(jù)應(yīng)運而生。更重要的是,這些局限性清晰地表達了大型軟件系統(tǒng)的常規(guī)誤差監(jiān)測、修正與評估對內(nèi)在認識論的挑戰(zhàn)。

隨著信息技術(shù)和網(wǎng)絡(luò)及各類傳感設(shè)備、海量存儲技術(shù)的飛速發(fā)展,數(shù)據(jù)的定義和收集方式產(chǎn)生了革命性的變化,大數(shù)據(jù)應(yīng)運而生。相比傳統(tǒng)分析方法,大數(shù)據(jù)技術(shù)擁有無可比擬的優(yōu)勢,然而大數(shù)據(jù)技術(shù)所引發(fā)的一系列關(guān)于認知論的哲學(xué)難題——大數(shù)據(jù)的假設(shè)及倫理問題——同樣不容忽視。John Symon和Ramón Alvarado 2016年發(fā)表在《大數(shù)據(jù)與社會》(Big Data &Society)的論文《我們可以信任大數(shù)據(jù)嗎?把科學(xué)哲學(xué)運用在計算機軟件上》(Can we trust big data? Applying philosophy of science to software)表示:在很多情況下,道德與認識論問題密不可分。解鈴還需系鈴人,只有盡可能弄清大數(shù)據(jù)如何影響并改變了認識論,才能從根本上改善大數(shù)據(jù)技術(shù)潛在的問題。例如,通過大數(shù)據(jù)技術(shù)我們可以知道什么?這些技術(shù)的局限性在哪里?以及大數(shù)據(jù)的“新”到底體現(xiàn)在哪里?

有關(guān)大數(shù)據(jù)的主流文獻常常表現(xiàn)出對科學(xué)哲學(xué)和認知論的不同看法,結(jié)論均基于一個假設(shè):大量的數(shù)據(jù)及通過大數(shù)據(jù)分析發(fā)現(xiàn)的模式是獨立于理論基礎(chǔ)的。換句話說,很多大數(shù)據(jù)學(xué)者錯誤地認為數(shù)據(jù)量越大,分析結(jié)果就越可靠,而理論立場可有可無。這種研究大數(shù)據(jù)而不考慮當代科學(xué)哲學(xué)的做法既不明智也不可取。大數(shù)據(jù)的核心在于如何使用大數(shù)據(jù)技術(shù)來捕捉和分析數(shù)據(jù),而大數(shù)據(jù)技術(shù)多涉及算法,我們只有充分理解各種算法的局限性和風險,明白這些算法會如何引致以及引致什么樣的誤差,才能決定到底多大程度可以對這些算法施以信任、加以限制。

文章首先介紹了大數(shù)據(jù)的定義并試圖解釋大數(shù)據(jù)的局限性,然后就以往研究對大數(shù)據(jù)的批評進行了概述,并接著論證為什么科學(xué)哲學(xué)和社會認識論與大數(shù)據(jù)技術(shù)息息相關(guān)。解決認識論擔憂的最好辦法是參與到計算建模與模擬的科學(xué)哲學(xué)辯論當中。基于Paul Humphreys提出的“認知模糊”,作者表示,大數(shù)據(jù)的“認知模糊”關(guān)鍵在于大數(shù)據(jù)技術(shù)對錯誤管理和錯誤檢驗的忽視,而錯誤問題同時也是大數(shù)據(jù)認識論的一個重要特征。要改善大數(shù)據(jù)認識論的缺陷,就必須正視誤差的影響?;谶@一考慮,文章就誤差檢驗與糾正的主要特性及軟件誤差和路徑復(fù)雜性之間的關(guān)系進行了闡述,并介紹了誤差檢驗的常規(guī)統(tǒng)計方法(如Mayo的嚴格檢驗及模擬驗證),以及當處理大數(shù)據(jù)的軟件系統(tǒng)受到高度制約時這些誤差檢驗的缺陷。最后,以谷歌流感趨勢為例,文章進一步討論了大數(shù)據(jù)技術(shù)的局限性,尤其是局限性的根源。

那么,我們可以信任大數(shù)據(jù)技術(shù)嗎?文章表示,這不僅僅在于軟件的開發(fā)與修正本身,而更加在于認知對軟件的開發(fā)—修改—更新這個循環(huán)過程的指引作用。大數(shù)據(jù)技術(shù)是科學(xué)哲學(xué)與社會認識論爭辯的產(chǎn)物,在運用時不應(yīng)脫離科學(xué)哲學(xué)思想的指引。缺乏認知則會大大限制我們發(fā)現(xiàn)錯誤的能力。

總而言之,大數(shù)據(jù)技術(shù)作為一種工具不可避免地存在局限性。從本質(zhì)上講,這些局限性反映了大數(shù)據(jù)技術(shù)背后理論的缺失。更重要的是,這些局限性清晰地表達了大型軟件系統(tǒng)的常規(guī)誤差監(jiān)測、修正與評估對內(nèi)在認識論的挑戰(zhàn)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號