“大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。”以上是百度百科給出的定義。
從自身出發(fā)對(duì)這個(gè)概念進(jìn)行簡單理解,大數(shù)據(jù)就是對(duì)涉及到生活中方方面面的數(shù)據(jù)量大的、數(shù)據(jù)種類多樣的具有高價(jià)值的信息進(jìn)行存儲(chǔ)、分析和處理。
從某種程度上說,大數(shù)據(jù)時(shí)代已經(jīng)降臨了。目前互聯(lián)網(wǎng)公司每天產(chǎn)生的數(shù)據(jù)量非常龐大,已經(jīng)不能用G或T來衡量,以至于現(xiàn)在數(shù)據(jù)量的級(jí)別最高已經(jīng)達(dá)到ZB(1ZB=1024EB=1024PB=1024TB)。想必隨著以后大數(shù)據(jù)來襲的更加兇猛,再增加幾個(gè)級(jí)別也不是太異想天開的事情。
在這個(gè)網(wǎng)絡(luò)技術(shù)肆意蔓延的時(shí)代,所有人已經(jīng)被卷入了一股名為大數(shù)據(jù)的龍卷風(fēng)之中,身處這龍卷風(fēng)的漩渦之中又有多少人明白大數(shù)據(jù)來襲,究竟意味著什么?
大數(shù)據(jù) 未來的新石油
在中國科協(xié)近日舉辦的科學(xué)家與媒體面對(duì)面活動(dòng)上,中國某網(wǎng)絡(luò)技術(shù)研究院首席專家給出一組直觀數(shù)據(jù)來描繪了大數(shù)據(jù)的未來圖景:到2030年,中國一個(gè)普通的家庭會(huì)有40~50個(gè)智能終端,一個(gè)家庭產(chǎn)生的數(shù)據(jù)是20TB,相當(dāng)于半個(gè)國家圖書館的藏書容量,即2600萬冊(cè),40TB。
“最近兩三年產(chǎn)生的數(shù)據(jù)可能比人類歷史上4萬年產(chǎn)生的數(shù)據(jù)還要多,實(shí)際就是由于互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)是大數(shù)據(jù)來源的最重要的地方。”該專家說,如果在一輛普通家用轎車上安裝傳感器,大約需要幾十到近百只,而豪華轎車的傳感器數(shù)量可達(dá)200余只。在傳感器的監(jiān)測(cè)之下,汽車每小時(shí)能產(chǎn)生5~250GB的數(shù)據(jù),而谷歌的無人駕駛汽車每秒產(chǎn)生約1GB數(shù)據(jù)。而據(jù)IDC預(yù)測(cè),到2020年,全球?qū)⒂?00億個(gè)物聯(lián)網(wǎng)終端,遠(yuǎn)超人類的數(shù)量。
這些龐大數(shù)字的價(jià)值堪比黃金,也可以說大數(shù)據(jù)就是未來的新石油。這位專家說:“數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟(jì)資產(chǎn)類別,就像貨幣或黃金一樣,將形成數(shù)據(jù)材料、數(shù)據(jù)探礦、數(shù)據(jù)加工、數(shù)據(jù)服務(wù)等一系列新興產(chǎn)業(yè)。”正如《大數(shù)據(jù)時(shí)代》一書里所說的:知道“是什么”就夠了,沒必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。
“谷歌流感趨勢(shì)”曾震撼世人。2009年2月,谷歌在《自然》雜志上發(fā)文,解釋了谷歌僅僅通過研究人們上網(wǎng)的搜索記錄,就能夠預(yù)測(cè)季節(jié)性流感的爆發(fā)和傳播。谷歌的預(yù)測(cè)與美國疾控中心的預(yù)測(cè)數(shù)據(jù)存在很高的相關(guān)性。但美國疾控中心通告新流感往往會(huì)有一兩周的延遲,而谷歌的預(yù)測(cè)數(shù)據(jù)更有效、更及時(shí)。為此,谷歌公司處理了5000萬條詞條與將近5億數(shù)學(xué)模型。
“要在數(shù)據(jù)里面找出有價(jià)值的東西來,這是大數(shù)據(jù)技術(shù)的核心,迅速完成數(shù)據(jù)價(jià)值的提純。”這位專家說道。以監(jiān)控?cái)z影為例,有的監(jiān)控累計(jì)一整天,其中真正有價(jià)值的可能只有“發(fā)現(xiàn)你干壞事的那一兩秒鐘”,在這中間怎么找出來,就是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵。
數(shù)據(jù)加密 為海量信息安全撐起防護(hù)圈
當(dāng)然,在利用大數(shù)據(jù)價(jià)值的同時(shí),也須警惕數(shù)據(jù)安全和隱私保護(hù)問題。某互聯(lián)網(wǎng)中心主任說,對(duì)于政策制定,原來對(duì)用戶的隱私保護(hù)更多側(cè)重于隱私本身,如個(gè)人姓名、電話號(hào)碼、銀行賬號(hào)等,而大數(shù)據(jù)時(shí)代除了保護(hù)這些信息,更需要一些新的思路和方法,如果只是保護(hù)用戶信息的采集環(huán)節(jié),在大數(shù)據(jù)時(shí)代就是不完整的,因?yàn)榭傆幸恍┢渌畔⒛軌蚍治龀鲇行┥婕坝脩綦[私的信息。
大數(shù)據(jù)時(shí)代每天必然要產(chǎn)出海量的信息數(shù)據(jù),從個(gè)人隱私至國家機(jī)密信息,包羅萬象,保障這些高價(jià)值信息的安全也是一個(gè)很大的挑戰(zhàn)。雖然說亡羊補(bǔ)牢為時(shí)未晚,但是重要信息一旦遭受攻擊被竊取,在信息價(jià)值水漲船高的現(xiàn)代社會(huì),一定會(huì)收到嚴(yán)重的創(chuàng)傷,那時(shí)就來不及了
大數(shù)據(jù)時(shí)代才剛剛來臨,在信息技術(shù)持續(xù)飛速發(fā)展的現(xiàn)在,隨著智能終端的增多,必定也會(huì)帶來更多的信息安全風(fēng)險(xiǎn)。如何應(yīng)對(duì)未來可能會(huì)發(fā)生的數(shù)據(jù)安全隱患自然也成了需要重點(diǎn)研究的問題。
大數(shù)據(jù)時(shí)代的到來是當(dāng)今計(jì)算機(jī)技術(shù),網(wǎng)絡(luò)技術(shù)蓬勃發(fā)展的最好的證明,為所有現(xiàn)代人帶來了福音,但是在享受的同時(shí)還要擔(dān)憂可能會(huì)發(fā)生的數(shù)據(jù)安全隱患是很掃興的事情。事先做好防護(hù),主動(dòng)使用加密軟件對(duì)所有重要信息進(jìn)行加密,做到有備無患,盡情享用大數(shù)據(jù)時(shí)代創(chuàng)造的數(shù)據(jù)財(cái)富!