數(shù)字時(shí)代預(yù)示著歷史的終結(jié)?

責(zé)任編輯:王李通

作者:Matthew Wall

2015-05-06 10:45:51

摘自:機(jī)器之心

自20世紀(jì)80年代以來,我們的生活以令人眩暈的速度向數(shù)字化攀升。未來世代將要面對保存完好卻無法讀取的數(shù)據(jù)汪洋,因?yàn)樗麄兪チ舜蜷_它們的鑰匙。轉(zhuǎn)載請?jiān)谖恼麻_頭顯著注明“本文來源于微信公眾號(hào)‘機(jī)器之心’(almosthuman2014)”,并保留原文作者和來源。

自20世紀(jì)80年代以來,我們的生活以令人眩暈的速度向數(shù)字化攀升。我們大部分的相片、錄像、對話、研究和著述現(xiàn)在都以0和1的字符串形式存儲(chǔ)在分布于全世界的個(gè)人電腦或數(shù)據(jù)中心里。數(shù)據(jù)專家EMC推測在2013年,世界將有大約4.4 ZB的數(shù)據(jù)(4.4萬億GB)。到2020年,預(yù)期還將上漲10倍。換句話說,歷史已經(jīng)在網(wǎng)上了。

當(dāng)這意味著我們可以空前方便地接觸得到海量知識(shí)文化的同時(shí),它也意味著數(shù)字化數(shù)據(jù)對保管人至關(guān)重要,且未來我們所記錄的「歷史」處于刪除、腐化、盜竊、荒廢、自然或人為災(zāi)難的潛在危脅之下。怎么會(huì)這樣的?

數(shù)據(jù)威脅

在以往的歲月,我們在石頭、蠟板、羊皮紙、小牛皮、紙以及任何我們能拿到手的東西上寫東西。而且這些可讀副本保存得真的很好——有些洞穴壁畫存在超過了40000年,而埃及的象形文字也不過始于公元前約3500年。

  如果在線的醫(yī)學(xué)知識(shí)丟失了,我們會(huì)回到中世紀(jì)騙術(shù)醫(yī)療的時(shí)代嗎?

任何見過他們照片或音樂藏品被抹掉的人,知道數(shù)字化文檔或者丟失得多么輕易。就像幾乎毀掉偉大亞歷山大圖書館的那場大火的數(shù)字版,其中許多文名卓著的書和卷宗,在公元前48年,也許不像聽起來這般勉強(qiáng)。比如說,一個(gè)核爆產(chǎn)生的電磁脈沖(EMP)就可以輕易抹去整個(gè)電子網(wǎng)絡(luò)并將整個(gè)文明帶入徹頭徹尾的停滯狀態(tài)。電腦,和打印出來的的書不一樣,需要電力才能工作。Billionaire 對沖基金經(jīng)理Paul Singer去年警告他的投資者們,電磁脈沖是對美國及其同盟「最顯著的威脅」。

  Google副總裁Vint Cerf擔(dān)憂我們未能正確地保存我們的數(shù)字資料

在一個(gè)數(shù)字網(wǎng)絡(luò)化不斷攀升的世界里,同樣悲慘的結(jié)果還可能是由一個(gè)惡意軟件的病毒部分或國家發(fā)起的信息戰(zhàn)導(dǎo)致。數(shù)據(jù)的丟失可能讓世界陷入「數(shù)據(jù)黑暗年代」,「因特網(wǎng)之父」、網(wǎng)絡(luò)語言和架構(gòu)發(fā)明者之一Vint Cerf警告我們,許多最早期的軟磁盤都無法讀取了,它們里面保存的數(shù)據(jù)已永久丟失。如果數(shù)據(jù)是用已倒閉的私人公司軟件寫的或壓縮的,新的技術(shù)和操作系統(tǒng)可能無法將這些數(shù)據(jù)讀譯出來。

未來世代將要面對保存完好卻無法讀取的數(shù)據(jù)汪洋,因?yàn)樗麄兪チ舜蜷_它們的鑰匙。實(shí)際上,最新的操作系統(tǒng)常無法處理更早版本書寫的文件。而且現(xiàn)代網(wǎng)絡(luò)瀏覽器對網(wǎng)絡(luò)插件比如JAVA和Silverlight的兼容性也越來越差了,潛在地使某些舊網(wǎng)站無法讀取?!高@些數(shù)據(jù)形式肯定不會(huì)像巖畫一樣持久,」 BOX數(shù)據(jù)管理公司的行政總裁及創(chuàng)立者之一Aaron Levie說,「這肯定是個(gè)問題,沒有可互換的、可移植的的數(shù)據(jù)格式真是一風(fēng)險(xiǎn)。」

長期思考,如何應(yīng)對?

Cerf先生建議給內(nèi)容、應(yīng)用和操作系統(tǒng)一起來次「數(shù)字的X光快照」,以有效的對它們寫成時(shí)的初始狀態(tài)進(jìn)行復(fù)制。這種他所謂的「數(shù)字牛皮紙」,正在由卡內(nèi)基梅隆大學(xué)Mahadev Satyanarayanan的Olive項(xiàng)目進(jìn)行論證 。

  EMC幫忙把梵諦岡圖書館的8萬2千份手稿數(shù)字化了

但這需要信息被要數(shù)據(jù)化并保存在云端的虛擬機(jī)中,達(dá)到這個(gè)目的「并非易事」,Cerf先生說。其他人相信,科技企業(yè)迫于市場壓力會(huì)提出他們自己的解決方案?!肝覀儾徽J(rèn)為會(huì)有數(shù)據(jù)黑暗時(shí)代」,EMC的產(chǎn)品市場負(fù)責(zé)人Jeremy Burton說。他相信隨著儲(chǔ)存能力越來越不是問題,行業(yè)范圍內(nèi)的數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)會(huì)變得越來越通用。十年前,保存1GB數(shù)據(jù)要花費(fèi)30英鎊;而現(xiàn)在只要幾便士?!肝覀儤酚诳吹綌?shù)字歸檔服務(wù)的增加」,他說,「新生代會(huì)希望得到任何他們想要的信息,不只是最近幾天或幾月的數(shù)據(jù),而是所有的數(shù)據(jù)。」

  數(shù)據(jù)中心雨后春筍般在全世界出現(xiàn),但他們有多安全?

EMC幫梵諦岡將其圖書館中的8萬2千份手稿數(shù)字化,大約4萬5千GB的數(shù)據(jù),數(shù)字化時(shí)用到了被廣泛接受的FITS標(biāo)準(zhǔn)。Aaron Levie相信,這是對長期保護(hù)數(shù)據(jù)至關(guān)重要的通用標(biāo)準(zhǔn)。

我們的數(shù)據(jù)有多安全?

直到15世紀(jì)古登堡印刷機(jī)出現(xiàn),復(fù)制和傳播紙質(zhì)文件一直是個(gè)辛苦事,獲取知識(shí)僅是少數(shù)精英的特權(quán)。

  手寫稿抄來辛苦且不耐火

但在「云」時(shí)代,我們可以無限拷貝文件且在數(shù)個(gè)地方存儲(chǔ)大數(shù)據(jù)庫鏡像并實(shí)時(shí)更新?!脯F(xiàn)在公司數(shù)據(jù)常規(guī)備有三份,并在不同地理區(qū)域分散保存」,Burton先生說。由日益復(fù)雜的物理和網(wǎng)絡(luò)安全系統(tǒng)保護(hù)的防炸彈的數(shù)據(jù)中心正變得越來越常見,就像銀行、保險(xiǎn)公司、政府做的那樣,其他需要保證數(shù)據(jù)安全和長期存取的既得利益方也開始打起精神以應(yīng)對潛在威脅。

讓我們面對它,我們中大多數(shù)人對Facebook、Twitter、Instagram和所有其他社會(huì)化媒體如何保存以及如何安全保存我們的數(shù)據(jù)一無所知。我們知道這些數(shù)據(jù)有多重要,以及如果我們失去它可能有什么后果,但這僅僅是個(gè)開始。


 

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)