隨著互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)等網(wǎng)絡(luò)技術(shù)快速發(fā)展和智能終端、智慧城市廣泛應(yīng)用及大范圍建設(shè),全球數(shù)據(jù)量呈現(xiàn)爆炸式增長,驅(qū)動著整個互聯(lián)網(wǎng)世界邁入大數(shù)據(jù)時代。
為應(yīng)對大數(shù)據(jù)時代的挑戰(zhàn),推廣大數(shù)據(jù)基礎(chǔ)分析、技術(shù)研發(fā)與應(yīng)用、安全技術(shù),以及推進大數(shù)據(jù)技術(shù)創(chuàng)新管理能力和業(yè)務(wù)能力、加強大數(shù)據(jù)安全與隱私管理,廣東省信息協(xié)會、廣東省計算機信息網(wǎng)絡(luò)安全協(xié)會、廣東省大數(shù)據(jù)技術(shù)聯(lián)盟聯(lián)合主辦的“2014廣東省大數(shù)據(jù)應(yīng)用與安全高峰論壇”定于10月21日(星期二)上午在廣東亞洲國際大酒店召開且圓滿結(jié)束。
藍盾股份作為中國信息安全行業(yè)領(lǐng)先的專業(yè)網(wǎng)絡(luò)安全企業(yè)和服務(wù)提供商,也應(yīng)邀參加該次峰會,并圍繞“大數(shù)據(jù)應(yīng)用安全隱患與安全體系建設(shè)”作出了重要演講。
下文就演講的幾個重要方面整理成文,重點歸納總結(jié)了大數(shù)據(jù)的應(yīng)用價值、大數(shù)據(jù)背景下面臨的安全問題以及對大數(shù)據(jù)時代安全建設(shè)的幾點考慮。
一、大數(shù)據(jù)背景介紹
1、大數(shù)據(jù)特性
大數(shù)據(jù)(Big Data)是指“無法用現(xiàn)有的軟件工具提取、存儲、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合。”業(yè)界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的基本特征。
一是數(shù)據(jù)體量巨大(Volume)。據(jù)國際知名數(shù)據(jù)公司IDC 提供的更為復(fù)雜的新數(shù)據(jù)已經(jīng)出現(xiàn),而且生成的速度達到了前所未有的程度,IBM預(yù)計,到2020年將增至40萬億GB的水平。
二是數(shù)據(jù)類型繁多(Variety)。大數(shù)據(jù)來源種類豐富,更為復(fù)雜的新數(shù)據(jù)已經(jīng)出現(xiàn),社交網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)絡(luò)日志、存檔數(shù)據(jù)和傳感器數(shù)據(jù)、地理位置信息都屬于人們在分析中關(guān)注的新數(shù)據(jù)源。
三是價值密度低(Value)。雖然每天產(chǎn)生25億GB數(shù)據(jù),但其中只有接近0.5%的經(jīng)檢測數(shù)據(jù)才具有分析價值。
四是處理速度快(Velocity)。面對如此海量的數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)也越來越多,如何快速地處理這些數(shù)據(jù)并挖掘出有價值的信息,這也是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。
2、大數(shù)據(jù)技術(shù)趨勢
1)Hadoop技術(shù)的應(yīng)用
Apache
hadoop是一個開源的分布式計算框架,通過集成MapReduce技術(shù),Hadoop將大數(shù)據(jù)分布到多個數(shù)據(jù)節(jié)點上進行處理。Hadoop遵循Apache 2.0許可證,可以輕松處理結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),一舉成為現(xiàn)在非常流行的大數(shù)據(jù)解決方案,可以用來應(yīng)對PB甚至ZB級的海量數(shù)據(jù)存儲。
2)與云計算的融合
大數(shù)據(jù)和云是兩個不同的概念,但兩者之間有很多交集。支撐大數(shù)據(jù)以及云計算的底層原則是一樣的,即規(guī)模化、自動化、資源配置、自愈性,因此實際上大數(shù)據(jù)和云之間存在很多合力的地方。可以說大數(shù)據(jù)和云計算是相伴而生的,大數(shù)據(jù)的處理離不開云,大數(shù)據(jù)應(yīng)用是在云上跑的、非常典型的應(yīng)用。
二、大數(shù)據(jù)的應(yīng)用價值
《華爾街日報》將大數(shù)據(jù)時代、智能化生產(chǎn)和無線網(wǎng)絡(luò)革命稱為引領(lǐng)未來繁榮的三大技術(shù)變革。麥肯錫公司的報告指出數(shù)據(jù)是一種生產(chǎn)資料,大數(shù)據(jù)是下一個創(chuàng)新、競爭、生產(chǎn)力提高的前沿。更有世界經(jīng)濟論壇報告認定:大數(shù)據(jù)為新財富,價值堪比石油。
就國內(nèi)外對大數(shù)據(jù)的研究與投入來看,2014年,Intel、IBM、微軟、阿里巴巴[微博]等行業(yè)巨頭紛紛布局大數(shù)據(jù)。IDC預(yù)測2014年產(chǎn)生2萬TB數(shù)據(jù),2014年大數(shù)據(jù)產(chǎn)值超6億,2016年將可望突破100億。
那么,這些看似平凡的數(shù)據(jù)能為我們帶來什么?事實上當(dāng)你把微博等社交平臺當(dāng)作發(fā)泄工具時,專業(yè)的斂財高手們卻正在挖掘這些互聯(lián)網(wǎng)的“數(shù)據(jù)財富”,先人一步用這些數(shù)據(jù)來預(yù)判市場走勢,做出正確的決定,并取得不俗的收益。
大數(shù)據(jù)的核心價值是能夠為政府、企業(yè)提供決策服務(wù),幫助企業(yè)把握市場機遇、迅速實現(xiàn)大數(shù)據(jù)商業(yè)模式創(chuàng)新,協(xié)助政府建設(shè)智慧城市和應(yīng)對公共安全,幫助公安進行犯罪預(yù)測與預(yù)防。
例如,華爾街根據(jù)民眾情緒拋售股票;美國疾控中心依據(jù)國民搜索,分析全球范圍內(nèi)流感等病疫的傳播狀況;投資機構(gòu)搜集并分析上市企業(yè)聲明,從中尋找破產(chǎn)的蛛絲馬跡;電信行業(yè)利用大數(shù)據(jù)幫助電信業(yè)對業(yè)務(wù)的分析和優(yōu)化;電子商務(wù)收集、分析海量的消費者數(shù)據(jù),從中挖掘消費者多變、復(fù)雜的需求。
總之,在大數(shù)據(jù)時代,以利用數(shù)據(jù)價值為核心,合理挖掘和利用大數(shù)據(jù),已經(jīng)為各行各業(yè)帶來了巨額財富。
三、大數(shù)據(jù)的安全隱患
隨著大數(shù)據(jù)應(yīng)用的爆發(fā)性增長,大數(shù)據(jù)衍生出獨特架構(gòu),并推動存儲、網(wǎng)絡(luò)及計算機技術(shù)的發(fā)展,同時也引發(fā)了新的安全問題。
1、網(wǎng)絡(luò)化社會使大數(shù)據(jù)成攻擊目標(biāo)
開放的網(wǎng)絡(luò)化社會,大數(shù)據(jù)的數(shù)據(jù)量大且相互關(guān)聯(lián),對于攻擊者而言,相對低的成本可以獲得“滾雪球”的收益。用戶數(shù)據(jù)泄露,個人賬號信息失竊的事件時有發(fā)生,一旦遭受攻擊,失竊的數(shù)據(jù)量也是巨大的。
最近幾年來數(shù)以百萬計的信息大泄密和大量的網(wǎng)絡(luò)犯罪案件說明,大數(shù)據(jù)和云環(huán)境下的信息安全的風(fēng)險度已非昔時可比。
2、大數(shù)據(jù)加大隱私泄露風(fēng)險
大數(shù)據(jù)是把“雙刃劍”,快捷的網(wǎng)絡(luò)、精準的營銷,雖能帶給人們一個更加便捷的生活方式,同時,卻也讓個人隱私的保護幾成空談。數(shù)據(jù)分析技術(shù)的發(fā)展,勢必對用戶隱私產(chǎn)生極大威脅。如今的大數(shù)據(jù)營銷,對于消費者而言,就好似被一雙眼睛盯著,每時每刻窺探著你的一舉一動,作為個體消費者,我們早就無法避免自己的個人隱私被網(wǎng)絡(luò)系統(tǒng)記取被商家掌握并挖掘利用,甚至被惡意使用。
3、技術(shù)短板帶來的安全隱患
NOSQL(非關(guān)系型數(shù)據(jù)庫)作為大數(shù)據(jù)處理的基礎(chǔ)技術(shù),與當(dāng)前廣泛應(yīng)用的SQL(關(guān)系型數(shù)據(jù)庫)技術(shù)不同,沒有經(jīng)過長期改進和完善,在維護數(shù)據(jù)安全方面也未設(shè)置嚴格的訪問控制和隱私管理,缺乏保密性和完整性特質(zhì)。
4、大數(shù)據(jù)環(huán)境打破傳統(tǒng)安全壁壘
大數(shù)據(jù)的處理和存儲離不開云,其運營環(huán)境的特殊性打破了傳統(tǒng)的網(wǎng)絡(luò)邊界壁壘,使得傳統(tǒng)的安全技術(shù)手段無法做到有效的安全防護。
大數(shù)據(jù)本身的安全防護存在漏洞,雖然云計算對大數(shù)據(jù)提供了便利,但對大數(shù)據(jù)的安全控制力度仍然不夠。
5、大數(shù)據(jù)可能成為高級可持續(xù)攻擊的載體
APT攻擊是一個持續(xù)的過程,不具有被實時檢測到的明顯特征。同時,隱藏在大量數(shù)據(jù)中的APT攻擊代碼也很難被發(fā)現(xiàn)。此外,攻擊者還可以利用社交網(wǎng)絡(luò)和系統(tǒng)漏洞進行攻擊,在威脅特征庫無法檢測出來的時間段發(fā)起攻擊行為。
四、大數(shù)據(jù)時代下的安全體系建設(shè)
1、大數(shù)據(jù)存儲安全
大量的數(shù)據(jù)產(chǎn)生、存儲和分析,數(shù)據(jù)安全存儲問題將在未來幾年內(nèi)成為一個更大的問題。行業(yè)必須盡快盡早規(guī)劃和布局大數(shù)據(jù)安全存儲防護措施,協(xié)同技術(shù)的發(fā)展,加大安全防護投入。安全存儲是大數(shù)據(jù)安全的最基本需求,我們可以從集中存儲、加密存儲、加密傳輸、認證授權(quán)和日志審計等方面來對大數(shù)據(jù)的安全存儲環(huán)境加大保護力度。
2、個人隱私信息的保護
大數(shù)據(jù)和個人隱私之間的“戰(zhàn)爭”早已打響,必須從技術(shù)和法規(guī)層面上保障大數(shù)據(jù)時代的隱私安全,完善用戶個人信息的保障體系。
法規(guī)層面應(yīng)從標(biāo)準和法律兩個方面界定數(shù)據(jù)屬性和銷售許可,出臺相應(yīng)資質(zhì)認證和法律法規(guī),建立健全大數(shù)據(jù)隱私安全保障體系。
技術(shù)層面應(yīng)使用大數(shù)據(jù)清洗、去隱私化等技術(shù)完成對客戶隱私數(shù)據(jù)的隱藏化處理。
3、大數(shù)據(jù)云安全
大數(shù)據(jù)一般都需要在云中實現(xiàn)上傳、下載及交互,在吸引越來越多黑客和病毒攻擊的云端及客戶端做好安全保護必不可少。
我們可基于虛擬化的云數(shù)據(jù)中心提供系統(tǒng)性的安全解決方案,以安全虛擬器件代替原有硬件設(shè)備的產(chǎn)品交付方式,確保物理、虛擬和云環(huán)境中服務(wù)器的應(yīng)用程序和數(shù)據(jù)的安全,可以為云和虛擬化環(huán)境提供主動防御、自動安全保護,將傳統(tǒng)數(shù)據(jù)中心的安全策略擴展到云計算平臺上。
4、建立防御機制
在規(guī)劃大數(shù)據(jù)發(fā)展的同時,建立并完善大數(shù)據(jù)信息安全體系很有必要。結(jié)合傳統(tǒng)信息安全技術(shù)和考量大數(shù)據(jù)收集、處理和應(yīng)用時的實際環(huán)境安全需求,建立面向大數(shù)據(jù)信息安全的事件監(jiān)測機制,及時發(fā)現(xiàn)信息系統(tǒng)安全問題,當(dāng)大數(shù)據(jù)運營環(huán)境遭到攻擊前或已經(jīng)遭到攻擊時,快速、準確地發(fā)現(xiàn)攻擊行為,并迅速啟動處置和應(yīng)急機制。
5、重新規(guī)范管理員的權(quán)限
大數(shù)據(jù)的跨平臺傳輸應(yīng)用在一定程度上會帶來內(nèi)在風(fēng)險,可以根據(jù)大數(shù)據(jù)的密級程度和用戶需求的不同,將大數(shù)據(jù)和用戶設(shè)定不同的權(quán)限等級,并嚴格控制訪問權(quán)限。而且,通過單點登錄的統(tǒng)一身份認證與權(quán)限控制技術(shù),對用戶訪問進行嚴格的控制,有效地保證大數(shù)據(jù)應(yīng)用安全。
總之,大數(shù)據(jù)時代機遇與挑戰(zhàn)并存,在推進大數(shù)據(jù)技術(shù)創(chuàng)新管理能力和業(yè)務(wù)能力的同時,要加強大數(shù)據(jù)安全與隱私管理相關(guān)研究的力度,通過政策法規(guī)與技術(shù)手段相互作用,使大數(shù)據(jù)在我國各個行業(yè)得以沿著正確的方向更快、更深入的發(fā)展。