來(lái)源:數(shù)據(jù)猿 作者:方向東
本文為數(shù)據(jù)猿年關(guān)策劃活動(dòng)《大數(shù)據(jù)的2016,我的2016》系列稿件,感謝本文作者 中科院博士 方向東 先生的投稿(數(shù)據(jù)猿專訪方向東)。
敬請(qǐng)期待春節(jié)后的2月16日,由數(shù)據(jù)猿與中歐商學(xué)院、騰訊視頻共同舉辦的高端領(lǐng)袖線下演講欄目中歐微論壇之《超聲波》。
人的一生,簡(jiǎn)單的講,不外乎“生老病死”。我們能抗?fàn)幍?、個(gè)體差異最大的就是“病”了。幾千年文化、知識(shí)、技術(shù)、經(jīng)驗(yàn)的累積,人類對(duì)自身健康狀況的了解以及疾病干預(yù)的能力都大大提高。然而,我們對(duì)自身健康的掌控能力離預(yù)期還遠(yuǎn)遠(yuǎn)不夠,面對(duì)各類疾病缺少深入的了解、精細(xì)的分類和有針對(duì)性的治療。
旨在正確的時(shí)間,給正確的人,使用正確的藥物的“精準(zhǔn)醫(yī)療”應(yīng)運(yùn)而生。獲取和掌握組學(xué)、臨床信息等生命大數(shù)據(jù)里包含的海量信息是醫(yī)療邁向精準(zhǔn)的重要前提。生命大數(shù)據(jù)的累積和挖掘?qū)⒅鸩浇沂窘】蹬c疾病的全景關(guān)聯(lián)圖。
生命大數(shù)據(jù)支撐精準(zhǔn)醫(yī)學(xué)研究
人類基因組計(jì)劃(human genome project,HGP)、基因組單體型圖計(jì)劃(hapmapproject)、全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)、DNA 元件百科全書(shū)(encyclopedia of DNA elements,ENCODE)、表觀路線圖(NIH roadmap epigenomics)等大型組學(xué)計(jì)劃的順利完成,帶動(dòng)了生命科學(xué)領(lǐng)域的重大變革。
高通量測(cè)序、高性能質(zhì)譜等組學(xué)技術(shù)得以快速發(fā)展,生命科學(xué)研究產(chǎn)生了大量有價(jià)值的包括基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等在內(nèi)的“生物大數(shù)據(jù)”。整合分析多重組學(xué)數(shù)據(jù)和臨床資料,構(gòu)建健康與疾病的知識(shí)網(wǎng)絡(luò),將有望對(duì)疾病發(fā)展和不同病理狀態(tài)進(jìn)行更加準(zhǔn)確的分類,為不同遺傳背景的患者提供個(gè)體化診斷及精準(zhǔn)治療。
很顯然,科學(xué)家們都已經(jīng)意識(shí)到各類生命大數(shù)據(jù)的重要作用。然而,以上重要的大型組學(xué)計(jì)劃均由歐美國(guó)家發(fā)起,獲得的數(shù)據(jù)主要基于歐美人群。中國(guó)人口眾多,遺傳背景與歐美人群有較大差異。實(shí)現(xiàn)中國(guó)人民的精準(zhǔn)醫(yī)療,則需要中國(guó)人群的生命大數(shù)據(jù)來(lái)推動(dòng)。
中科院在2015年啟動(dòng)重點(diǎn)部署項(xiàng)目“中國(guó)人群精準(zhǔn)醫(yī)學(xué)研究計(jì)劃”,將在4年內(nèi)完成4000名志愿者的DNA樣本和多種表現(xiàn)型數(shù)據(jù)的采集,并對(duì)其中2000人進(jìn)行深入的精準(zhǔn)醫(yī)學(xué)研究,包括全基因組序列分析,建立基因組健康檔案,針對(duì)一些重要慢性病的遺傳信號(hào)開(kāi)展疾病風(fēng)險(xiǎn)和藥物反應(yīng)的預(yù)警和干預(yù)研究。這些數(shù)據(jù)將會(huì)成為非常寶貴的中國(guó)人群遺傳信息資源。
科技部于2016年3月8日公布《關(guān)于發(fā)布國(guó)家重點(diǎn)研發(fā)計(jì)劃精準(zhǔn)醫(yī)學(xué)研究等重點(diǎn)專項(xiàng)2016年度項(xiàng)目申報(bào)指南的通知》,拉開(kāi)了精準(zhǔn)醫(yī)療重大專項(xiàng)科研行動(dòng)的序幕。本年度的科研專項(xiàng)包括構(gòu)建百萬(wàn)人以上的自然人群國(guó)家大型健康隊(duì)列和重大疾病專病隊(duì)列,建立生物醫(yī)學(xué)大數(shù)據(jù)共享平臺(tái)等。
在國(guó)家戰(zhàn)略需求層面,生命大數(shù)據(jù)研究正如火如荼的開(kāi)展起來(lái),為精準(zhǔn)醫(yī)學(xué)研究打下基礎(chǔ)。這一系列大數(shù)據(jù)項(xiàng)目的開(kāi)展,將建設(shè)一套符合我國(guó)國(guó)情的生命大數(shù)據(jù)的獲取、分析、存儲(chǔ)、使用等規(guī)范;多個(gè)與健康相關(guān)的中國(guó)人群生命大數(shù)據(jù)知識(shí)庫(kù);面向科研人員和醫(yī)務(wù)工作者的友好共享數(shù)據(jù)平臺(tái)等等?;谶@些大數(shù)據(jù)挖掘生命動(dòng)態(tài)規(guī)律,將是通向精準(zhǔn)醫(yī)療的重要基石。
綜合組學(xué)大數(shù)據(jù)和臨床大數(shù)據(jù)挖掘生命規(guī)律
生命大數(shù)據(jù)包含的種類繁多,包括基因組、轉(zhuǎn)錄組、蛋白組、表觀組、宏基因組等各類組學(xué)數(shù)據(jù)和影像、生化指標(biāo)、標(biāo)型特征等各類臨床數(shù)據(jù)。我國(guó)各類組學(xué)數(shù)據(jù)主要產(chǎn)生于科研院所和高校,臨床數(shù)據(jù)主要來(lái)源于各類醫(yī)療機(jī)構(gòu)。
整合多類數(shù)據(jù),挖掘深層機(jī)制無(wú)疑是行之有效的方法。過(guò)去的整合分析主要是限于各類組學(xué)數(shù)據(jù)內(nèi)部,例如綜合組蛋白修飾數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)和染色質(zhì)相互作用數(shù)據(jù)篩查全基因組范圍內(nèi)的順式作用元件。當(dāng)面對(duì)精準(zhǔn)醫(yī)療,需要明確疾病的不同亞型及對(duì)應(yīng)的分子機(jī)制,以及合適的治療方案,大數(shù)據(jù)在整合分析、挖掘時(shí)則必須要加上臨床大數(shù)據(jù)。
在2016年,多家科研機(jī)構(gòu)和醫(yī)療機(jī)構(gòu)聯(lián)合起來(lái),共同攻關(guān)生命大數(shù)據(jù):
中科院北京基因組研究所聯(lián)合中科院生物物理研究所、浙江大學(xué)、復(fù)旦大學(xué)、國(guó)家衛(wèi)計(jì)委信息統(tǒng)計(jì)中心、北大人民醫(yī)院、中南大學(xué)湘雅醫(yī)院系統(tǒng)等構(gòu)建精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)處理和利用的標(biāo)準(zhǔn)化技術(shù)體系。
軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所聯(lián)合多家機(jī)構(gòu)構(gòu)建精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理和共享技術(shù)平臺(tái)。
少量生命大數(shù)據(jù)的研究成果已經(jīng)進(jìn)入普通百姓的視野
在媒體的大力宣傳下,大數(shù)據(jù)和精準(zhǔn)醫(yī)療的概念已出現(xiàn)在普通百姓的生活中。一些基于生命大數(shù)據(jù)的成果已經(jīng)被用到普通消費(fèi)者身上,最為常見(jiàn)的就是基因檢測(cè)了。
通過(guò)對(duì)具有特定特征(如患某種疾病)的人群和對(duì)照人群進(jìn)行遺傳物質(zhì)的對(duì)比和關(guān)聯(lián)研究,可挖掘出一些與該特征相關(guān)的基因位點(diǎn)。一些商業(yè)公司將同類疾病的不同研究結(jié)果綜合起來(lái),評(píng)估消費(fèi)者患某類疾病的風(fēng)險(xiǎn)。這被認(rèn)為是一個(gè)很酷、有用、擁有巨大商業(yè)前景的行業(yè),因此近一兩年內(nèi)成立了許多面向普通消費(fèi)者的基因檢測(cè)公司。
“十三五”期間的生命大數(shù)據(jù)
我國(guó)的精準(zhǔn)醫(yī)療從今年開(kāi)始落地實(shí)施,研究?jī)?nèi)容涉及到大規(guī)模人群隊(duì)列研究和精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)研究??梢灶A(yù)見(jiàn),在三到五年內(nèi),將會(huì)產(chǎn)生大量中國(guó)人群的各類生命大數(shù)據(jù)以及對(duì)應(yīng)的知識(shí)注釋。
一方面,這些大數(shù)據(jù)將有望打破歐美國(guó)家對(duì)生命大數(shù)據(jù)的壟斷,形成世界范圍內(nèi)的新布局;同時(shí),將有力推動(dòng)我國(guó)生命科學(xué)研究和健康事業(yè);此外,階段性的成果也可能會(huì)被單獨(dú)拿出來(lái),直接走向面對(duì)普通消費(fèi)者的商業(yè)模式中(就像基因檢測(cè)一樣)。
伴隨著美好愿景的,也一定還有潛在問(wèn)題:
1、我國(guó)還缺乏一個(gè)國(guó)家級(jí)的、被廣大科研人員認(rèn)可的數(shù)據(jù)存儲(chǔ)、使用、共享平臺(tái);
2、大數(shù)據(jù)的安全與管理也是重中之重;
3、各類公司帶著一些成果直接面向普通消費(fèi)者,但缺乏統(tǒng)一、可用的行業(yè)標(biāo)準(zhǔn),不當(dāng)?shù)幕蚪庾x有可能傷害一些消費(fèi)者,造成普通百姓對(duì)大數(shù)據(jù)行業(yè)的誤解。
關(guān)于作者
方向東博士為中國(guó)科學(xué)院“百人計(jì)劃”研究員;中國(guó)科學(xué)院大學(xué)生命科學(xué)學(xué)院、醫(yī)學(xué)院、中丹學(xué)院教授、博士生導(dǎo)師;曾任美國(guó)華盛頓大學(xué)醫(yī)學(xué)院(UW, WA)醫(yī)學(xué)遺傳系助理教授。主要從事醫(yī)學(xué)遺傳學(xué)、生物大數(shù)據(jù)與精準(zhǔn)醫(yī)學(xué)研究。