大數(shù)據(jù)時代聊聊小數(shù)據(jù)

責(zé)任編輯:王李通

2014-04-16 08:32:44

摘自:中國青年報

現(xiàn)在好像人人都愛說“大數(shù)據(jù)”,就像平時我去開會,不是用大數(shù)據(jù)分析這個,就是用大數(shù)據(jù)建構(gòu)那個。閔應(yīng)驊系中國科學(xué)院計算技術(shù)研究所研究員、美國電子電氣工程師協(xié)會會士(IEEE Life Fellow)  

現(xiàn)在好像人人都愛說“大數(shù)據(jù)”,就像平時我去開會,不是用大數(shù)據(jù)分析這個,就是用大數(shù)據(jù)建構(gòu)那個。可是我最近看《美國計算機學(xué)會通訊》(CACM)上面提到了幾次小數(shù)據(jù),我覺得大家也有必要了解一下這個有趣的概念。

什么是小數(shù)據(jù)?小數(shù)據(jù)就是個體化的數(shù)據(jù),是我們每個個體的數(shù)字化信息。比如我天天都喝一兩酒,突然有天喝完酒了胃疼,我就想了,這天和之前有何不同?原來,這天喝的酒是個新牌子,可能就是喝了這個新牌子的酒讓我胃疼。這就是我生活中的“小數(shù)據(jù)”,它不比大數(shù)據(jù)那樣浩瀚繁雜,卻對我自己至關(guān)重要。

第一個意識到“小數(shù)據(jù)”重要性的是美國康奈爾大學(xué)教授德波哈爾·艾斯汀。艾斯汀的父親去年去世了,而早在父親去世之前幾個月,這位計算機科學(xué)教授就注意到老人在數(shù)字社會脈動中的些許不同——他不再發(fā)送電子郵件,不去超級市場買菜,到附近散步的距離也越來越短。

然而,這種逐漸衰弱的狀態(tài),真到醫(yī)院去檢查心電圖,卻不一定能看出來。到急診室檢查的時候,不管是測脈搏還是查病歷,這個90歲的老人都沒有表現(xiàn)出特別明顯的異常??墒聦嵣希粉櫵繒r每刻的個體化數(shù)據(jù),他的生活其實已經(jīng)明顯與之前不同。這種日常小數(shù)據(jù)帶來的生命訊息的警示和洞察,啟發(fā)了這位計算機科學(xué)教授——小數(shù)據(jù)可以看作是一種新的醫(yī)學(xué)證據(jù),它是“your row of their data”(他們數(shù)據(jù)中屬于你的那行數(shù)據(jù))。

人們愛說,大數(shù)據(jù)將改變當(dāng)代醫(yī)學(xué),譬如基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等等,不過由個人數(shù)字跟蹤驅(qū)動的小數(shù)據(jù),也將有可能會對個人醫(yī)療帶來變革,特別是當(dāng)可穿戴設(shè)備更成熟后,移動技術(shù)將可以連續(xù)、安全、私人地收集并分析你的數(shù)據(jù),這可能包括你的工作、購物、睡覺、吃飯、鍛煉和通訊,這些數(shù)字追蹤將得到一幅只屬于你的健康自畫像。

擁有了這幅專屬于自己的數(shù)字自畫像,有什么好處呢?假設(shè)你是一名患者,這樣精確個體化的小數(shù)據(jù)也許可以幫助你回答:我每次服藥應(yīng)該用怎樣的劑戀比渙耍┪鎪得魘檣匣嵊幸桓鲇靡┲傅跡歉鍪凳腔詿罅坎∪撕A渴萃臣品治齙美吹?,但它适不适合绰栘惤z痰哪隳??又o牽憔托枰私夤賾諛闋約旱摹靶∈蕁?。峨s諑圓?、溢娂R?、记忆?lambda;ネ撕涂寺薅韃?,浩S枰粘;疃浠氖蕁4笫菀話閌譴右桓齟驨的種群里面取得的,而小數(shù)據(jù)n=me。我們需要數(shù)據(jù)解放,把移動和網(wǎng)絡(luò)服務(wù)的數(shù)據(jù)解放到你我自己。

這樣一來,小數(shù)據(jù)也許可以為我們提供更多研究的可能性:能不能通過分析年老父母的集成數(shù)據(jù),進而獲得他們的健康信息?能不能通過這些集成數(shù)據(jù),比較不同的醫(yī)學(xué)治療方案?譬如數(shù)據(jù)跟蹤能說明你散步可以走多遠,你多早離開家,那就可以表明關(guān)節(jié)炎藥物治療效果如何。

更令人期待的是,小數(shù)據(jù)或許還將成為人類攻克癌癥的一個好幫手?,F(xiàn)在許多人認識到需要用患者的數(shù)據(jù)進行個性化的癌癥治療。我們要特征化所有患者。腫瘤細胞的DNA引起不同的癌癥病人非常不同的變化。譬如,大致相同的基因變異或刪除只占患者的10%。即使是同一個腫瘤,其細胞的變異也不同?;蛑g的相互作用可能引起二次變異,對患者的治療影響很大。所以,對許多患者用同一個治療方法是不可能成功的。個性化或者說層次式的藥物治療是要按照特定患者的條件開出藥方——不是“對癥下藥”,而是“對人下藥”。這些個性化的治療都需要記錄和分析個人行為隨時間變化的規(guī)律,這就是小數(shù)據(jù)。

當(dāng)然,這并不是說大數(shù)據(jù)就不重要。在醫(yī)學(xué)上發(fā)現(xiàn)治療的一般規(guī)律需要大數(shù)據(jù)。歐美各國都在計劃編制患者信息的數(shù)據(jù)庫,不但為了癌癥治療,也為開發(fā)新的治療方法。集成大量在線數(shù)據(jù)庫可以推動個性化用藥,減輕他們的痛苦。從大數(shù)據(jù)得到規(guī)律,用小數(shù)據(jù)去匹配個人。

大數(shù)據(jù)流行,大家就“言必稱大數(shù)據(jù)”,可這并不是做學(xué)問的態(tài)度,不要碰到大量的數(shù)據(jù),就給它戴上一頂帽子“大數(shù)據(jù)”。就像20年前,系統(tǒng)工程也很時髦。哪怕是做報告談到一個比較大的工程,都說那是系統(tǒng)工程??上到y(tǒng)工程又怎么樣呢?“那是很難的”,就沒有下文了。我們應(yīng)該敞開思想,研究實際問題,切忌空談。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號