不同個體的基因組中有99.9%的基因是相同的,正是那0.1%的差異決定了每個人的與眾不同——性別、體貌特征、情緒、甚至是疾病。這些數(shù)據(jù)對我們個人來說是至關(guān)重要的。
2018年,我們看到了太多數(shù)據(jù)被損壞或者濫用的例子。對于那些想要保護(hù)自己基因組信息的人來說,區(qū)塊鏈?zhǔn)菍ΜF(xiàn)有基因組數(shù)據(jù)市場封閉架構(gòu)的一種強(qiáng)大的替代方案。
區(qū)塊鏈的用武之地
耗時13年,耗資37億美元的人類基因組測序計(jì)劃于2003年完成?,F(xiàn)如今,一個人要是想進(jìn)行基因測序大概只需花費(fèi)1000美元,而且整個時間也縮短到了幾天。據(jù)估計(jì),這一費(fèi)用很快就會降低到100美元。
隨著基因組數(shù)據(jù)驅(qū)動的藥物設(shè)計(jì)和靶向治療的發(fā)展,制藥和生物技術(shù)公司預(yù)計(jì)將在未來幾年推動基因組數(shù)據(jù)市場的發(fā)展,到2025年這方面的投入將達(dá)到276億美元。與此同時,隨著精準(zhǔn)醫(yī)療和基因編輯技術(shù)的革新步伐加快,個體基因中所包含的價值也將呈指數(shù)級增長。而且就在過去的一年里,美國還史無前例地批準(zhǔn)了新的基因療法。然而,這一過程存在著很多問題。
基因組學(xué)在推動現(xiàn)代醫(yī)學(xué)范式轉(zhuǎn)變上具有無與倫比的潛力,但它依賴于利用大量的數(shù)據(jù)集來建立遺傳變異和性狀之間的相關(guān)性。而想要獲得大量的基因組數(shù)據(jù),不僅面臨著科學(xué)上的障礙,也面臨著倫理上、社會上和技術(shù)上的障礙。
對于處于這一前沿的許多研究者來說,這正是中本聰在2008年發(fā)布的白皮書、以及后來被稱為區(qū)塊鏈技術(shù)的用武之地。
George Church教授是來自哈佛大學(xué)的知名遺傳學(xué)家。他多年來一直在努力加速和推動大規(guī)模的基因組數(shù)據(jù)生成。他曾呼吁志愿者為他的非營利組織個人基因組計(jì)劃(PGP)做貢獻(xiàn)。PGP相當(dāng)于一個“維基百科”,它包含開放獲取的大約1萬個人類基因組樣本數(shù)據(jù)。
PGP依靠人們放棄隱私和數(shù)據(jù)所有權(quán)來追求科學(xué)的進(jìn)步。分享數(shù)據(jù)的人要么是“特別無私的人”,要么是那些因?yàn)榧彝ソ?jīng)歷而關(guān)心某一特定疾病研究的人。
現(xiàn)在基因組學(xué)發(fā)展的限制在于如何讓所有人都參與進(jìn)來,據(jù)估計(jì),全球大約只有100萬人接受了基因組測序。
為了解決這個問題,一個通證化的、支持區(qū)塊鏈的生態(tài)系統(tǒng)可能成為向大眾開放的技術(shù)引爆點(diǎn)。通過允許人們將自己的基因組貨幣化,并將訪問權(quán)直接出售給數(shù)據(jù)購買者,區(qū)塊鏈平臺可以幫助將測序成本降低到“免費(fèi)甚至可以為人們提供凈利潤”。
通證化為啟用不同的場景提供了靈活性。數(shù)據(jù)所有者可以根據(jù)他們所支持的研究開發(fā)任何藥物,或者通過加密貨幣通證來償還他們的醫(yī)療處方。相關(guān)合同會被公開進(jìn)行哈希處理,并將個人的同意書記錄在區(qū)塊鏈上。
基因組學(xué)的窘境
Nebula公司進(jìn)行的一項(xiàng)調(diào)查發(fā)現(xiàn),當(dāng)人們被問及是否會考慮對他們的基因組進(jìn)行測序時,隱私和倫理方面的問題遠(yuǎn)遠(yuǎn)超過了所有其他因素。在另一項(xiàng)對13000人進(jìn)行的研究中,86%的人表示他們擔(dān)心自己的基因數(shù)據(jù)被濫用:超過一半的人表達(dá)了對隱私的擔(dān)憂。
今年4月,在Cambridge Analytica丑聞爆出后,有消息稱警探挖掘出了一個業(yè)余愛好者的基因組數(shù)據(jù)庫,其中包含了一些個人DNA片段,他們希望這些片段能幫助破案。
在不知情的公眾上傳的集中存儲的基因材料中,執(zhí)法部門沒有遇到任何阻力。當(dāng)許多人通過DNA的糾纏歡呼金州殺手的逮捕時,其他人表達(dá)了相當(dāng)?shù)牟话病?/p>
這種模糊的訪問權(quán)限具有超出了取證的意義?,F(xiàn)如今人們擔(dān)心雇主和保險公司的基因歧視——后者目前只在法律上被部分禁止。
為基因組學(xué)帶來變革的匿名區(qū)塊鏈系統(tǒng)
在這個越來越不透明的基因組數(shù)據(jù)領(lǐng)域中,私人公司將消費(fèi)者產(chǎn)生的基因型數(shù)據(jù)貨幣化,而序列數(shù)據(jù)則分散在專有的、中心化的系統(tǒng)中。
將基因組學(xué)引入?yún)^(qū)塊鏈將允許加速研究所需的時間,同時通過將匿名身份與加密標(biāo)識分開來保護(hù)這種獨(dú)特的個人信息。用戶仍然控制著他們的數(shù)據(jù),并確切地決定與誰共享數(shù)據(jù)以及共享數(shù)據(jù)的目的。反過來,這種訪問將在一個可審計(jì)和不可變的分類帳本上被跟蹤。
區(qū)塊鏈可以去除醫(yī)療領(lǐng)域的病情錯報問題
據(jù)稱,23andMe存儲了大約500萬份基因型客戶資料,其競爭對手Ancestry.com存儲了約1000萬份。這些公司針對每一份個人資料會收集大約300個表現(xiàn)型數(shù)據(jù),以此來了解你的健康情況和生活習(xí)慣。
表現(xiàn)型是個體的一組可觀察的特征,這些特征是個體的基因型與環(huán)境相互作用的結(jié)果。生成和共享對這些數(shù)據(jù)的訪問對于通過變異和特征的相關(guān)性解碼基因組至關(guān)重要。但由于大部分表現(xiàn)型數(shù)據(jù)都來自于自我報告,現(xiàn)有數(shù)據(jù)的質(zhì)量是不確定的。而錯誤的數(shù)據(jù)會影響醫(yī)療研究的效率和準(zhǔn)確性。
區(qū)塊鏈系統(tǒng)可以提供獨(dú)特的機(jī)制來阻止欺騙的發(fā)生。如果發(fā)現(xiàn)某人試圖隱瞞自己的健康狀況,那么他們的加密貨幣存款就會被扣留。
2018年:染色體和區(qū)塊鏈
考慮到人體基因組的數(shù)據(jù)強(qiáng)度,中心化存儲器是無法滿足哪怕是一小部分人的需求。
單個基因組的復(fù)雜原始數(shù)據(jù)集可達(dá)200GB。據(jù)報道,在2017年6月,美國國家衛(wèi)生研究院的GenBank擁有超過兩萬億堿基的序列。鑒于基因組的數(shù)據(jù)龐大,這仍然需要先將其壓縮再寫入到區(qū)塊鏈上。而截止到2018年6月中旬,比特幣區(qū)塊鏈的平均交易額為423千字節(jié)。
今年6月,DNAtix宣布首次使用區(qū)塊鏈技術(shù)傳輸了一條完整的染色體。Lidsky告訴Cointelegraph,公司已經(jīng)成功地在今年8月實(shí)現(xiàn)了99%的DNA信息壓縮率。
但即使在區(qū)塊鏈上,由于基因組學(xué)的獨(dú)特敏感性,數(shù)據(jù)傳輸也是不必要和不明智的。一些研究者建議共享數(shù)據(jù)訪問,該解決方案將區(qū)塊鏈與先進(jìn)的加密技術(shù)和分布式計(jì)算方法相結(jié)合。
加密數(shù)據(jù)可以提供給所謂的基因組應(yīng)用程序的開發(fā)者,它們還可以為研究人員和其他第三方開發(fā)者提供進(jìn)一步的盈利來源。但是,將基因解釋外包給一個應(yīng)用程序真的那么簡單嗎?這種有著幾十年歷史的醫(yī)療模式讓患者去找遺傳顧問,讓他們檢查風(fēng)險,討論病情預(yù)期,幫助他們解釋可能令人困惑、甚至是害怕的結(jié)果。
一些基因檢測公司已經(jīng)被指責(zé)給他們的客戶留下了“大量數(shù)據(jù)和很少答案”的印象。“23andMe能解釋一系列‘健康’基因,它還能揭示你是否攜帶一種可能影響孩子未來健康的基因突變體,而且截至2017年,它甚至被授權(quán)披露包括乳腺癌和帕金森癥在內(nèi)的遺傳健康風(fēng)險。”
Nebula和DNAtix都在考慮如何將遺傳咨詢師集成到他們的生態(tài)系統(tǒng)中,Grishin還提議用戶可以“選擇”是否真的想“知道基因組結(jié)果的一切”,或者僅僅想要“現(xiàn)代醫(yī)學(xué)能夠解決的病情”。
生物技術(shù)前沿
區(qū)塊鏈對基因組學(xué)的重要性逐漸顯現(xiàn)。既然我們細(xì)胞中的DNA被理解為信息的終身存儲者,那么就需要一種新的顛覆性技術(shù)來安全地、靈活地管理人體代碼的連鎖網(wǎng)絡(luò)。
基因組學(xué)的出現(xiàn)提出了僅靠科學(xué)無法解決的問題。對于我們所有的受訪者來說,區(qū)塊鏈可能是創(chuàng)造公平和透明的所有權(quán)和流通方式的關(guān)鍵,以確保這些原始的生物信息載體不會被濫用。