大數(shù)據(jù)能為我們?nèi)祟悗砟男┖锰帲?/p>
舉個直觀的例子:我們知道人類的一些疾病與基因組異常有關(guān)。例如唐氏綜合癥、透納氏癥和許多其他疾病,是染色體的不分離現(xiàn)象所造成。同樣,癌細(xì)胞中的染色體則頻繁地出現(xiàn)非整倍性現(xiàn)象等等。
顯然,研究基因組,并讓每一個人檢測并了解自己的基因組,有著非常現(xiàn)實的意義——如果能發(fā)現(xiàn)所有人類基因并搞清其在染色體上的位置,破譯人類全部遺傳信息,就能使人類在分子水平上全面地認(rèn)識自我,從而規(guī)避各種疾病的困擾,改變自我。
但是,人類基因組DNA有多達(dá)30億個堿基對的序列,這就意味著巨大的數(shù)據(jù)量。還好,今天的科技憑借云計算、大數(shù)據(jù)的能力越來越強(qiáng),由于x86架構(gòu)的計算和存儲成本的大幅度降低,如今檢測并計算分析一個人的基因組,已經(jīng)從13年38億美元,下降到了120小時幾千美元。
如今云計算供應(yīng)商還在大數(shù)據(jù)處理能力上不斷實現(xiàn)突破。比如今年上半年,經(jīng)過阿里云深圳團(tuán)隊不斷摸索,千人基因組的分析,原來要做幾個月,如今的記錄還不到一天,花了僅僅21小時47分12秒。
在技術(shù)日新月異的今天,阿里云、英特爾、華大基因三方聯(lián)手,其目標(biāo)是在2020年以前,在24個小時之內(nèi)完成一個人全基因組的測試、分析,并將成本控制在2000人民幣以內(nèi)。
這樣的結(jié)果,直接導(dǎo)致了生命科學(xué)已經(jīng)從科學(xué)研究的殿堂,即將步入醫(yī)療的臨床,從而改變現(xiàn)今傳統(tǒng)醫(yī)療手段,顛覆整個醫(yī)學(xué)界的治病模式。
不僅如此,生命科學(xué)的范疇并不僅僅是我們?nèi)祟愖陨?,也包括和人類相關(guān)的食品,從蔬菜、水果、水稻、小麥到動物。
也正是因為此,德國醫(yī)藥和農(nóng)化巨頭拜耳公司今年提出將以620億美元全現(xiàn)金方案收購美國轉(zhuǎn)基因種子和農(nóng)化巨頭孟山都。目前孟山都拒絕了這一收購要約,因為這筆交易一旦達(dá)成,不僅將成為德國企業(yè)史上最大的對外收購交易,而且也將徹底改變歐盟和美國之間對于未來生命科學(xué)的主導(dǎo)權(quán)。
與此同時,生命科學(xué)和現(xiàn)代農(nóng)業(yè)領(lǐng)域的另一大并購案,也在緊鑼密鼓的進(jìn)行中:中國化工提議以每股470瑞士法郎(約合3069元人民幣)現(xiàn)金收購全球第一大農(nóng)化和植保公司及全球第三大種子公司——瑞士先正達(dá)70%股份。
如今,不論是先正達(dá)還是孟山都,都從農(nóng)業(yè)化學(xué)公司發(fā)展到目前具有“植保+種子+農(nóng)技服務(wù)”一體化作物綜合解決方案的提供商,而拜耳和中國化工的收購要約,也顯示出這兩家醫(yī)藥、化工和農(nóng)化領(lǐng)域科技巨頭的下一步發(fā)展方向。
很明顯,科技領(lǐng)域正在面臨洗牌重組的行業(yè)產(chǎn)業(yè)不僅僅是IT,同樣包括農(nóng)化、醫(yī)療、農(nóng)化等所謂的生命科學(xué)領(lǐng)域。
這些,都拜托大數(shù)據(jù)的價值再造——為整個行業(yè)帶來顛覆性的革命。
事實上,即便是一顆草也有基因,而且跟我們?nèi)祟惖幕蛴?7%是一樣的;一只蒼蠅,有40%基因和人類是共享的;一條魚與人類相同的基因竟然高達(dá)63%;到了經(jīng)常被用作生命科學(xué)試驗的小白鼠,其與人類共享的基因已經(jīng)達(dá)到80%;而大猩猩與我們?nèi)祟愅|(zhì)化基因高達(dá)96%。到了人類自身,無論是男人女人、黑人白人,人類在生物學(xué)上就一種,人與人的差異只有0.5%。
別小看這0.5%。你的拇指是直的還是彎的,舌頭能不能卷起來,喝牛奶會不會拉肚子,酒量大小的差異,這些都是基因決定的。是基因和自然選擇決定了你對乳糖的耐受,因為歐洲人和蒙古人在數(shù)千年前比中國人更適應(yīng)游牧生活,從牛奶中獲取與農(nóng)作物同樣的營養(yǎng)。
在生命科學(xué)中,唯一不例外的就是例外,它總會發(fā)生,比如一個媽媽生出來的異卵雙胞胎,長得很像,但是膚色不同,這個概率只有幾百萬份之一。這樣的突變,使得我們的基因變得越來越豐富和多樣,也使得每一個人的基因有了那0.5%的差別?;蛟S有一天,因為基因組的測試分析變得更容易和更低成本,你在社交軟件中就可以跟朋友對比你的基因,說哪些基因好,哪些基因弱爆了。
這就是數(shù)據(jù)的價值。大數(shù)據(jù)可以幫助我們終結(jié)很多疾病,比如從NIPT數(shù)據(jù)中,我們可以發(fā)現(xiàn)孕期腫瘤的蹤跡,我們還可以比對遺傳病的分子流行病學(xué)數(shù)據(jù)庫,找到BRCA2突變位點(diǎn)的頻譜分布,從而有效控制腫瘤、癌癥的發(fā)生;大數(shù)據(jù)也可以幫我們改變體內(nèi)腸道的菌群生態(tài),讓我們從肥胖癥中,恢復(fù)健康。
一句話,當(dāng)每一個人都有自己的基因數(shù)據(jù)的時候,這個世界帶給我們的生物醫(yī)藥的領(lǐng)域是完全不同的——大數(shù)據(jù)將帶來健康革命。