北京時間8月20日消息,據(jù)國外媒體報道,在談到信息存儲時,硬盤完全不能和DNA相提并論。在人類的基因序列中,1克的重量就可以包含幾十億GB的數(shù)據(jù),而1毫克分子的信息存儲空間就可以包含美國國會圖書館全部的書籍,并且還有剩余。在過去,這些只是理論上的概念。現(xiàn)在,最新的一項研究表明,研究人員可以把一部遺傳學(xué)教科書的內(nèi)容存儲到1微微克(picogram,相當(dāng)于萬億分之一克)DNA中,這一技術(shù)上的突破很可能會革命性的提升人類存儲信息的能力。
過去,有些研究團(tuán)隊一直試圖向活細(xì)胞中的基因組寫入數(shù)據(jù),但是這種方式有一些不足之處。首先,細(xì)胞會死亡,這并不是你存儲學(xué)期論文的好方法。另外,細(xì)胞還會分裂、復(fù)制,其中會不斷發(fā)生變異,從而改變數(shù)據(jù)的內(nèi)容。
為了解決這些問題,一個由波士頓哈佛醫(yī)學(xué)院合成生物學(xué)家喬治-丘奇(George Church)領(lǐng)導(dǎo)的研究團(tuán)隊發(fā)明了一種DNA信息歸檔系統(tǒng),完全不需要利用細(xì)胞。相反,利用的是一臺噴墨打印機,從而將化學(xué)合成的一小段DNA嵌入到一塊微型玻璃芯片的表面。為了給數(shù)字文件進(jìn)行編碼,研究人員把文件劃分為微小的數(shù)據(jù)塊,并把這些數(shù)據(jù)塊以A、C、G、T(DNA的四種脫氧核苷酸)的字母組合來表示,放棄了過去在計算機上的1和0編碼方法。每條DNA片段還包含了一個數(shù)字“條碼”,用來記錄數(shù)據(jù)在原文件中的位置信息。在讀取信息時,需要 DNA測序儀和電腦將所有片段按序重新組合起來,并轉(zhuǎn)換為數(shù)字的格式。計算機還需要負(fù)責(zé)處理錯誤信息,因為每個數(shù)據(jù)塊都可能會被復(fù)制上千次,經(jīng)過比對,任何小錯誤都可以被發(fā)現(xiàn)和糾正。
為了證實這一系統(tǒng)在實際應(yīng)用中的能力,該團(tuán)隊使用了這種 DNA芯片將丘奇同他人合著的一本遺傳學(xué)書籍進(jìn)行了編碼。他們成功了。在將書籍內(nèi)容轉(zhuǎn)換為DNA的信息、并將其翻譯成數(shù)字存儲模式后,該系統(tǒng)顯示的出錯率為每百萬比特僅兩個錯誤,相當(dāng)于一些小小的拼寫錯誤。這同DVD的性能差不多,遠(yuǎn)遠(yuǎn)好過硬盤。本周五,該團(tuán)隊在《科學(xué)》雜志上發(fā)布的報告稱,考慮到DNA芯片的體積非常小,它成為了目前世界上最密集的信息存儲介質(zhì)。
不過,你最好別急著將閃存上的數(shù)據(jù)復(fù)制到基因存儲上。美國馬里蘭州羅克維爾市克雷格-文特爾研究所的合成生物學(xué)家丹尼爾-吉布森(Daniel Gibson)表示,DNA測序儀和其他設(shè)備的成本相當(dāng)高,目前還不適宜推廣,但是這一領(lǐng)域發(fā)展迅速,這項科技將會變得更便宜、更快速和更輕便。吉布森過去領(lǐng)導(dǎo)的研究團(tuán)隊曾合成了世界上第一個最完整的基因組,并在DNA中加入了一些額外的信息作為“水印”。不過,這些研究人員使用的是三個字母的編碼系統(tǒng),要比丘奇團(tuán)隊的效率低一些,但是卻成功阻止了活體細(xì)胞的復(fù)制,從而不會將DNA轉(zhuǎn)換為蛋白質(zhì)。吉布森說,“如果DNA要被用來存儲信息,并且使用環(huán)境不在實驗室里,那么你還需要DNA測序儀的幫助,而這是很不現(xiàn)實的。”丘奇不同意這種觀點。他表示,除非某人有意識的“破壞”他的DNA數(shù)據(jù)存儲系統(tǒng),否則信息將非常安全。