生物大數(shù)據(jù)研發(fā)及創(chuàng)新凸顯國家意志

責(zé)任編輯:editor004

2014-10-16 11:26:52

摘自:科技日報(bào)

2014年,百度以大數(shù)據(jù)分析的方式預(yù)測高考試題,成功押中了全國18套作文考題中的12套,成為大數(shù)據(jù)在現(xiàn)實(shí)生活中應(yīng)用的一個(gè)經(jīng)典案例。中國標(biāo)準(zhǔn)化研究院副院長邱月明研究員指出,除了人才之外,國家在現(xiàn)階段應(yīng)該對大數(shù)據(jù)和生物大數(shù)據(jù)的標(biāo)準(zhǔn)化給予更多關(guān)注。

2014年,百度以大數(shù)據(jù)分析的方式預(yù)測高考試題,成功押中了全國18套作文考題中的12套,成為大數(shù)據(jù)在現(xiàn)實(shí)生活中應(yīng)用的一個(gè)經(jīng)典案例。近幾年,大數(shù)據(jù)的研究和實(shí)踐向各個(gè)領(lǐng)域滲透,當(dāng)人們把雜亂無章的信息通過一定的規(guī)范進(jìn)行數(shù)據(jù)整理和數(shù)據(jù)挖掘變成了有效的知識,并升華出改變社會(huì)能力的智慧因子的時(shí)候,大數(shù)據(jù)作為一種工具和平臺(tái)應(yīng)運(yùn)而生,生物則是大數(shù)據(jù)應(yīng)用最為關(guān)鍵的領(lǐng)域。從微生物數(shù)據(jù)分析研究到醫(yī)院大數(shù)據(jù)的存儲(chǔ)分析和管理,再到全國流行病數(shù)據(jù)分析在地圖上的疊加和展示,呈現(xiàn)出國內(nèi)不同慢性疾病及健康狀況的全面動(dòng)態(tài)實(shí)時(shí)分布,生物大數(shù)據(jù)正在給我們的未來提供更多創(chuàng)新機(jī)會(huì)。

歐美、日本等國家早已開始制定國家戰(zhàn)略,建立國家級別的生物數(shù)據(jù)庫,以此把控科技發(fā)展和創(chuàng)新的制高點(diǎn)以及市場先機(jī),我國亟待在這一新興的技術(shù)和戰(zhàn)略領(lǐng)域出現(xiàn)曙光之時(shí)謀得一席之地。

為此,9月26日,由科技部中國生物技術(shù)發(fā)展中心和復(fù)旦大學(xué)聯(lián)合主辦、復(fù)旦大學(xué)附屬中山醫(yī)院承辦的生物大數(shù)據(jù)戰(zhàn)略研討會(huì)在上海舉行。與會(huì)專家均為國內(nèi)大數(shù)據(jù)研究領(lǐng)域的領(lǐng)軍學(xué)者,大家一致認(rèn)為,生物大數(shù)據(jù)將是今后一個(gè)階段科技創(chuàng)新的基礎(chǔ),應(yīng)從國家層面給予重視,并制定相應(yīng)的國家策略,在大數(shù)據(jù)分析標(biāo)準(zhǔn)、人才培養(yǎng)、資源共享機(jī)制上提供具體的指導(dǎo)性意見,為中國生物大數(shù)據(jù)的發(fā)展培植一個(gè)良好的沃土和環(huán)境,為未來參與到全球大數(shù)據(jù)技術(shù)研發(fā)與競爭以及市場應(yīng)用提供可行的目標(biāo)和方案。

生物大數(shù)據(jù)創(chuàng)新價(jià)值無限

隨著以新一代基因組測序技術(shù)為代表的高通量生物實(shí)驗(yàn)技術(shù)的出現(xiàn),人類獲得了以前所未有的深度和廣度觀測生物體運(yùn)行機(jī)制的能力,生物實(shí)驗(yàn)數(shù)據(jù)的全面性、精確性和數(shù)據(jù)量達(dá)到了空前的程度,從而產(chǎn)生了生物大數(shù)據(jù)。更重要的是,這些數(shù)據(jù)仍然不斷的以幾何級數(shù)在增長。

“基因組數(shù)據(jù)給我們帶來了許多的創(chuàng)新機(jī)會(huì)”,中國科學(xué)院院士陳潤生在研討會(huì)上說,“大數(shù)據(jù)時(shí)代并不意味著為了大數(shù)據(jù)而大數(shù)據(jù),其目的是為我們發(fā)現(xiàn)新的生物學(xué)規(guī)律,為工業(yè)生產(chǎn)、醫(yī)療實(shí)踐提供更好的依據(jù)”。

陳潤生以基因組中的暗物質(zhì)——非編碼核酸為例指出,生物領(lǐng)域仍有許多重大的科學(xué)問題沒有解決。2012年12月17日的《科學(xué)》在評價(jià)人類進(jìn)入21世紀(jì)科學(xué)進(jìn)展的時(shí)候,提出了自然科學(xué)領(lǐng)域的十大突破,第一個(gè)提出來的就是所謂的基因組中的暗物質(zhì),并指出這是在人類自然科學(xué)領(lǐng)域最值得激動(dòng)和關(guān)心的,即遺傳密碼信息中迄今為止還有很多不為人知的秘密。

首先,當(dāng)科學(xué)家破譯了人類基因組后發(fā)現(xiàn),編碼蛋白質(zhì)的傳統(tǒng)基因的部分只占人類基因組的3%。“那97%才是我們大數(shù)據(jù)中未知的廣大領(lǐng)土,這里面蘊(yùn)含著重大的科學(xué)規(guī)律。而圍繞現(xiàn)有的3%的研究,整個(gè)世界科學(xué)領(lǐng)域已經(jīng)造就出了無數(shù)著名的科學(xué)家”,陳潤生感嘆道,大數(shù)據(jù)本身包括基因組大數(shù)據(jù),更多的是給我們提供了創(chuàng)新及實(shí)際應(yīng)用的機(jī)會(huì)。

其次,像華大基因這樣的企業(yè),測序量大約是世界基因組測序量的40%,處于全球第一的水平,但這些數(shù)據(jù)里有多少人們已經(jīng)從中獲得了認(rèn)知。“我們產(chǎn)生的數(shù)據(jù)遠(yuǎn)遠(yuǎn)比從中獲得的認(rèn)知大得多,如果不建立大數(shù)據(jù)的分析方法,發(fā)展大數(shù)據(jù)分析和應(yīng)用,就是很大的浪費(fèi)。”陳潤生強(qiáng)調(diào),要從理論基礎(chǔ)和方法上進(jìn)行重大變革,這樣方有機(jī)會(huì)在大數(shù)據(jù)的時(shí)代做出全新的創(chuàng)新,為我國的醫(yī)療實(shí)踐,為工農(nóng)業(yè)生產(chǎn)創(chuàng)造更多的價(jià)值和機(jī)會(huì)。

給醫(yī)療大數(shù)據(jù)應(yīng)用更多投入

復(fù)旦大學(xué)附屬中山醫(yī)院是從上個(gè)世紀(jì)90年代開始進(jìn)行信息化建設(shè)的。2003年,醫(yī)院獨(dú)立自主建立了信息化系統(tǒng),確立了以醫(yī)務(wù)為先導(dǎo),以數(shù)據(jù)為核心,服務(wù)臨床一線患者健康的宗旨。經(jīng)過多年的建設(shè),基本形成了覆蓋全院各個(gè)部門、各項(xiàng)流程、相對完備的信息系統(tǒng)。數(shù)據(jù)顯示,目前系統(tǒng)內(nèi)已經(jīng)積累了669萬條病史記錄,4958萬條醫(yī)囑信息,3.86億個(gè)檢驗(yàn),278萬份影像數(shù)據(jù)。

“我們醫(yī)院正在建設(shè)的病例系統(tǒng)更是數(shù)據(jù)驚人,每張ct片掃描后,數(shù)據(jù)量超過了1gb”,中山醫(yī)院院長樊嘉教授介紹說,檢查數(shù)量累計(jì)一年的數(shù)據(jù)要超過400tb,大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型,如何分析和利用這些數(shù)據(jù)是當(dāng)前急需研究的課題。中山醫(yī)院已做了一些嘗試,在全院信息系統(tǒng)的基礎(chǔ)上單獨(dú)建立了臨床數(shù)據(jù)庫,并逐步形成了一些單病種的數(shù)據(jù)庫,為臨床科研提供數(shù)據(jù)支持,建立了生物樣本庫管理系統(tǒng),為系統(tǒng)管理科研樣本提供了技術(shù)支撐。

生物大數(shù)據(jù)戰(zhàn)略要挖掘大數(shù)據(jù)的潛在價(jià)值,探討生物大數(shù)據(jù)的整合利用,構(gòu)建大數(shù)據(jù)的運(yùn)行和管理體系,完善大數(shù)據(jù)利用的法律法規(guī),對此,樊嘉教授呼吁,國家應(yīng)加大在大數(shù)據(jù)方面的投入。

大數(shù)據(jù)需法規(guī)保護(hù)和人才支持

生物大數(shù)據(jù)的研究包括數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)管理、大數(shù)據(jù)分析、大數(shù)據(jù)科學(xué)和大數(shù)據(jù)應(yīng)用,是一個(gè)多學(xué)科共同參與的領(lǐng)域。統(tǒng)計(jì)顯示,2014年對大數(shù)據(jù)分析師的職位空缺達(dá)100多萬。那么,從事大數(shù)據(jù)的科學(xué)家都需要什么技能呢?

來自emc中國研究院的技術(shù)總監(jiān)孫宇熙研究員認(rèn)為,一般做大數(shù)據(jù)的人比普通的軟件工程師有更多的統(tǒng)計(jì)學(xué)知識,但毫無疑問又會(huì)比統(tǒng)計(jì)學(xué)的從業(yè)人員有更多的編程能力。他強(qiáng)調(diào),數(shù)據(jù)科學(xué)的目的是為了挖掘隱藏在數(shù)據(jù)中的信息,獲取一個(gè)全面的洞察力。從業(yè)人員要從數(shù)據(jù)、信息、知識、理解、智慧五個(gè)方面入手。

目前,從事生物大數(shù)據(jù)的有三類人才,第一類被認(rèn)為是手里有數(shù)據(jù)的人,即那些從事生命科學(xué)領(lǐng)域研究的科學(xué)家以及掌握著很多有效數(shù)據(jù)的人;第二類是it領(lǐng)域做大數(shù)據(jù)技術(shù)開發(fā)和應(yīng)用的人;第三類是結(jié)合生產(chǎn)實(shí)踐進(jìn)行大數(shù)據(jù)二次開發(fā)的人。第一類人不斷挖掘出有效數(shù)據(jù),第二類人探索數(shù)據(jù)增長帶來的技術(shù)挑戰(zhàn),第三類人要用好數(shù)據(jù),但三者又是互通有無的。

中國標(biāo)準(zhǔn)化研究院副院長邱月明研究員指出,除了人才之外,國家在現(xiàn)階段應(yīng)該對大數(shù)據(jù)和生物大數(shù)據(jù)的標(biāo)準(zhǔn)化給予更多關(guān)注。“要解決誰可以利用大數(shù)據(jù),從什么途徑來保護(hù)這些大數(shù)據(jù)的知情權(quán)、使用權(quán)以保證隱私。目前,我國還沒有建立專門的法律法規(guī),要先有法律法規(guī),然后才有標(biāo)準(zhǔn),并通過系統(tǒng)構(gòu)建生物大數(shù)據(jù)平臺(tái)達(dá)成知識共享體系”,邱月明說。

國家層面進(jìn)行戰(zhàn)略設(shè)計(jì)及數(shù)據(jù)儲(chǔ)備

伴隨著生物大數(shù)據(jù)的信息技術(shù)維護(hù)是我國生物數(shù)字主權(quán)的必要手段。有科學(xué)家指出,世界上三大數(shù)據(jù)中心都在歐美和日本,我國產(chǎn)生了這么多數(shù)據(jù),可目前數(shù)據(jù)還要提交到上述幾大中心,這對我國的數(shù)字主權(quán)是極大的挑戰(zhàn)。

哈爾濱工業(yè)大學(xué)計(jì)算機(jī)學(xué)院和軟件學(xué)院院長王亞東教授告訴科技日報(bào)記者,我國生物信息獲取的平臺(tái)技術(shù)受制于國外產(chǎn)品,缺乏引領(lǐng)國際組學(xué)基礎(chǔ)研究計(jì)劃的能力,同時(shí),生物數(shù)據(jù)分析與利用能力嚴(yán)重不足,缺少自主知識產(chǎn)權(quán)的高價(jià)值生物數(shù)據(jù)資源,我國的醫(yī)療數(shù)據(jù)幾乎不能共享,轉(zhuǎn)化利用率低,我國生物大數(shù)據(jù)產(chǎn)業(yè)尚未形成。

與會(huì)代表認(rèn)為,我國已經(jīng)成為生物信息技術(shù)的產(chǎn)出大國,怎樣把有效的資源集中投入到研究中去,應(yīng)該形成業(yè)界共識,形成戰(zhàn)略發(fā)展目標(biāo)。當(dāng)務(wù)之急是建設(shè)國家生物大數(shù)據(jù)中心,將之看做“兩彈一星”同等的重要,此外,要持續(xù)加強(qiáng)對新一代/新原理測序設(shè)備的研發(fā)。以大數(shù)據(jù)為代表的生物信息技術(shù)發(fā)展已經(jīng)是箭在弦上,沒有退路,只有積極迎頭趕上全球技術(shù)的創(chuàng)新和應(yīng)用發(fā)展。

以應(yīng)用需求帶動(dòng)大數(shù)據(jù)技術(shù)發(fā)展

復(fù)旦大學(xué)金力院士指出,通過本次大會(huì)不同領(lǐng)域的專家,尤其是與生物醫(yī)藥領(lǐng)域之外的大數(shù)據(jù)專家的交流,達(dá)成了關(guān)于生物大數(shù)據(jù)的兩項(xiàng)基本共識:一是所謂生物大數(shù)據(jù)是由數(shù)據(jù)、技術(shù)、應(yīng)用三部分組成,三者缺一不可;二是應(yīng)該以生物醫(yī)藥領(lǐng)域的應(yīng)用需求來帶動(dòng)生物大數(shù)據(jù)技術(shù)的發(fā)展,并建議“十三五”國家在做大數(shù)據(jù)整體規(guī)劃設(shè)計(jì)方向的時(shí)候,最重要的是要明確生物大數(shù)據(jù)的發(fā)展目標(biāo)。

據(jù)悉,未來生物大數(shù)據(jù)的研究成果及數(shù)據(jù)將有望匯集到國家的層面上。國家的戰(zhàn)略目標(biāo)是使我國的組學(xué)大數(shù)據(jù)中心在世界上具有一定的發(fā)言權(quán)、話語權(quán)和主導(dǎo)權(quán),能夠讓世界看到中國,看到中國的生物醫(yī)藥產(chǎn)業(yè),更看到中國的強(qiáng)大。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號