基因大數(shù)據(jù)深度挖掘面臨挑戰(zhàn)

責(zé)任編輯:editor004

作者:彭科峰

2017-11-16 12:09:13

摘自:《中國科學(xué)報》

作為一種新型基因檢測技術(shù),基因測序能從血液或唾液中分析測定基因全序列,預(yù)測罹患多種疾病的可能性、個體的行為特征及行為合理性。

作為一種新型基因檢測技術(shù),基因測序能從血液或唾液中分析測定基因全序列,預(yù)測罹患多種疾病的可能性、個體的行為特征及行為合理性?;驕y序技術(shù)能鎖定個人病變基因,予以提前預(yù)防和治療。正因如此,今年華大基因的上市,就引發(fā)了資本市場的熱烈追捧。

在日前于北京召開的第四屆全國功能基因組學(xué)高峰論壇上,眾多與會專家就基因技術(shù)發(fā)展方向及面臨的機(jī)遇與挑戰(zhàn)進(jìn)行了深入交流。

基因測序用途廣泛

當(dāng)前,基因測序相關(guān)產(chǎn)品和技術(shù)已由實驗室研究演變到臨床應(yīng)用。有學(xué)者甚至認(rèn)為,基因測序技術(shù)可能是下一個改變世界的技術(shù),因為在自然界乃至人類世界,基因測序都有著無可替代的作用。

今年5月,由中科院昆明植物所牽頭的聯(lián)合科研團(tuán)隊通過基因組建庫與測序等一系列關(guān)鍵技術(shù),攻克了茶樹基因組測序難題,在國際上率先獲得高質(zhì)量茶樹基因組序列。

中科院昆明植物所研究員高立志坦言,這對揭示決定茶葉適制性、風(fēng)味和品質(zhì)以及茶樹全球生態(tài)適應(yīng)性的遺傳基礎(chǔ),都有重要促進(jìn)作用。

再比如,華中農(nóng)業(yè)大學(xué)張獻(xiàn)龍團(tuán)隊對棉花栽培品種和野生品種進(jìn)行了全基因組重測序,發(fā)現(xiàn)棉花在人工選擇過程中存在明顯的亞基因組不對稱選擇過程。“10多年的功能基因組研究發(fā)現(xiàn)20多個與重要性狀形成有關(guān)的基因,這將在棉花分子設(shè)計育種中發(fā)揮重要作用。”張獻(xiàn)龍團(tuán)隊成員王茂軍告訴《中國科學(xué)報》記者。

基因測序?qū)θ祟愥t(yī)學(xué)發(fā)展也有重要作用。中科院生物物理所研究員、中科院院士陳潤生介紹,基于組學(xué)大數(shù)據(jù)的精準(zhǔn)醫(yī)療作為劃時代的產(chǎn)業(yè),已被各國列入戰(zhàn)略規(guī)劃。它有著直接解決當(dāng)前醫(yī)療行業(yè)面臨的諸多困難的潛力,在接下來的幾年將會爆發(fā)式增長,預(yù)計到2018年全球市場規(guī)模將達(dá)2238億美元。

基因大數(shù)據(jù)時代開啟

華大基因科技服務(wù)原負(fù)責(zé)人、北京百邁客生物科技有限公司董事長鄭洪坤指出,隨著基因測序技術(shù)的不斷發(fā)展和成本的大幅下降,以及國家在基因研究領(lǐng)域的大力支持和投入,如今,科學(xué)家在基因領(lǐng)域的研究越來越深入,基因大數(shù)據(jù)的積累越來越多,“全世界累計花費數(shù)百億,已經(jīng)產(chǎn)出了近20Pb的海量基因數(shù)據(jù)”。

“測序技術(shù)的發(fā)展讓基因數(shù)據(jù)以遠(yuǎn)超摩爾定律的速度在積累,海量數(shù)據(jù)對科研工作者提出了新的要求。”中科院北京基因組所研究員章張表示。

章張介紹,據(jù)不完全統(tǒng)計,我國生命組學(xué)數(shù)據(jù)產(chǎn)量約占全球的40%,但這些寶貴的數(shù)據(jù)資源卻交給了他人管理,主要原因在于,我國長期缺乏涵蓋多組學(xué)數(shù)據(jù)資源的生物大數(shù)據(jù)中心。為此,中科院北京基因組所生命與健康大數(shù)據(jù)中心圍繞國家精準(zhǔn)醫(yī)學(xué)和重要戰(zhàn)略生物資源的組學(xué)數(shù)據(jù),建立海量生命組學(xué)大數(shù)據(jù)儲存、整合與挖掘分析研究體系,并已初步建成生命與健康多組學(xué)數(shù)據(jù)匯交與共享平臺。

亟待深度挖掘與科學(xué)解讀

與國外相比,目前國內(nèi)的基因組學(xué)、基因測序的推進(jìn)速度并不慢。從學(xué)術(shù)角度看,中科院北京基因組所、農(nóng)科院基因組所等機(jī)構(gòu)實力雄厚,華大基因、百邁客等一批從事基因測序的相關(guān)企業(yè)也在逐漸成長。但在專家們看來,基因組學(xué)面臨的挑戰(zhàn)依然不小,因為隨著信息、儀器等各個領(lǐng)域的快速發(fā)展,數(shù)據(jù)總量越來越多,加上各種新指標(biāo)、參數(shù)的加入,數(shù)據(jù)也變得越來越復(fù)雜。

“在海量測序結(jié)果面前,數(shù)據(jù)深度挖掘和解讀方面存在的嚴(yán)峻挑戰(zhàn)日益明顯。如何在基因大數(shù)據(jù)時代利用好這些數(shù)據(jù)資源,已經(jīng)成為生物科研新時代的重要課題。”鄭洪坤表示。

陳潤生也指出,當(dāng)前,快速積累的數(shù)據(jù)并未得到高效解讀;高度異質(zhì)化數(shù)據(jù)之間的整合尚處于起步階段。樣品端的挑戰(zhàn)直接威脅到數(shù)據(jù)質(zhì)量。但他同時表示,“這些挑戰(zhàn)往往意味著機(jī)遇,大量未解讀的數(shù)據(jù)同時也帶來了無限創(chuàng)新的可能。”

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號