個(gè)人數(shù)據(jù)泄露帶來的影響和潛在損失巨大,從華住泄露數(shù)據(jù)被兜售8比特幣(按照當(dāng)天匯率約合37萬人民幣)的價(jià)格可見一斑。事實(shí)上,從國(guó)內(nèi)外來看,數(shù)據(jù)泄露的事件從來沒有停止過,2018年以來就發(fā)生了幾十起影響較大的數(shù)據(jù)泄露事件。比如運(yùn)動(dòng)品牌Under Armour在3月份表示,MyFitnessPal飲食和健身應(yīng)用上1.5億個(gè)賬戶數(shù)據(jù)遭遇有史以來最規(guī)模的黑客攻擊,被盜數(shù)據(jù)包括MyFitnessPal移動(dòng)應(yīng)用和網(wǎng)站的賬戶用戶名、電子郵件地址和加密密碼;1月份,美國(guó)Sacramento Bee報(bào)社的一個(gè)數(shù)據(jù)庫(kù)發(fā)生泄露,其中包括1940萬選民的聯(lián)系信息(地址和電話號(hào)碼)、黨派關(guān)系、出生日期和出生地點(diǎn)等。
數(shù)據(jù)安全公司Gemalto 《2017數(shù)據(jù)泄露水平指數(shù)報(bào)告》顯示,2017 年上半年全球范圍內(nèi)數(shù)據(jù)泄露總量為19 億條,超過2016 年全年總量(14 億),比2016 年下半年增長(zhǎng)了160%多。2017 年,全球同樣發(fā)生了多起影響重大的數(shù)據(jù)泄露事件,例如美國(guó)共和黨下屬數(shù)據(jù)分析公司征信機(jī)構(gòu)先后發(fā)生大規(guī)模用戶數(shù)據(jù)泄露事件,影響人數(shù)均達(dá)到億級(jí)規(guī)模。我國(guó)數(shù)據(jù)泄露事件也時(shí)有發(fā)生,并且數(shù)據(jù)泄露的潛在隱患同樣不容樂觀。據(jù)Shodan 統(tǒng)計(jì),截至2017 年2月3 日,中國(guó)有15046個(gè)MangoDB數(shù)據(jù)庫(kù)暴露在公網(wǎng),存在嚴(yán)重安全問題。
這足以說明,數(shù)據(jù)泄露風(fēng)險(xiǎn)的勢(shì)頭沒有止步,并且隨著云計(jì)算、大數(shù)據(jù)等新型IT技術(shù)的演進(jìn),數(shù)據(jù)安全風(fēng)險(xiǎn)愈演愈烈。
毫無疑問,如今數(shù)據(jù)安全威脅已滲透在數(shù)據(jù)生產(chǎn)、采集、處理和共享等大數(shù)據(jù)產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié),風(fēng)險(xiǎn)成因復(fù)雜交織;既有外部攻擊,也有內(nèi)部泄露;既有技術(shù)漏洞,也有管理缺陷;既有新技術(shù)新模式觸發(fā)的新風(fēng)險(xiǎn),也有傳統(tǒng)安全問題的持續(xù)觸發(fā)。
尤其在大數(shù)據(jù)場(chǎng)景下,數(shù)據(jù)從多個(gè)渠道大量匯聚,數(shù)據(jù)類型、用戶角色和應(yīng)用需求更加多樣化,訪問控制面臨諸多新的問題。首先,多源數(shù)據(jù)的大量匯聚增加了訪問控制策略制定及授權(quán)管理的難度,過度授權(quán)和授權(quán)不足現(xiàn)象嚴(yán)重。其次,數(shù)據(jù)多樣性、用戶角色和需求的細(xì)化增加了客體的描述困難,傳統(tǒng)訪問控制方案中往往采用數(shù)據(jù)屬性(如身份證號(hào))來描述訪問控制策略中的客體,非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)無法采取同樣的方式進(jìn)行精細(xì)化描述,導(dǎo)致無法準(zhǔn)確為用戶指定其可以訪問的數(shù)據(jù)范圍,難以滿足最小授權(quán)原則。大數(shù)據(jù)復(fù)雜的數(shù)據(jù)存儲(chǔ)和流動(dòng)場(chǎng)景使得數(shù)據(jù)加密的實(shí)現(xiàn)變得異常困難,海量數(shù)據(jù)的密鑰管理也是亟待解決的難題。
中國(guó)信息通信研究院發(fā)布的《2018年大數(shù)據(jù)安全白皮書》指出,大數(shù)據(jù)促使數(shù)據(jù)生命周期由傳統(tǒng)的單鏈條逐漸演變成為復(fù)雜多鏈條形態(tài),增加了共享、交易等環(huán)節(jié),且數(shù)據(jù)應(yīng)用場(chǎng)景和參與角色愈加多樣化,在復(fù)雜的應(yīng)用環(huán)境下,保證國(guó)家重要數(shù)據(jù)、企業(yè)機(jī)密數(shù)據(jù)以及用戶個(gè)人隱私數(shù)據(jù)等敏感數(shù)據(jù)不發(fā)生外泄,是數(shù)據(jù)安全的首要需求。
就此次華住事件來看,隱私保護(hù)是建立在數(shù)據(jù)安全防護(hù)基礎(chǔ)之上的保障個(gè)人隱私權(quán)的更深層次安全要求。中國(guó)信息通信研究院報(bào)告指出,我們應(yīng)該也要意識(shí)到大數(shù)據(jù)時(shí)代的隱私保護(hù)不再是狹隘地保護(hù)個(gè)人隱私權(quán),而是在個(gè)人信息收集、使用過程中保障數(shù)據(jù)主體的個(gè)人信息自決權(quán)利。實(shí)際上,個(gè)人信息保護(hù)已經(jīng)成為一個(gè)涵蓋產(chǎn)品設(shè)計(jì)、業(yè)務(wù)運(yùn)營(yíng)、安全防護(hù)等在內(nèi)的體系化工程,不是一個(gè)單純的技術(shù)問題。
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)安全技術(shù)提供了機(jī)密性、完整性和可用性的防護(hù)基礎(chǔ),隱私保護(hù)是在此基礎(chǔ)上,保證個(gè)人隱私信息不發(fā)生泄露或不被外界知悉。目前應(yīng)用最廣泛的是數(shù)據(jù)脫敏技術(shù),學(xué)術(shù)界也提出了同態(tài)加密、安全多方計(jì)算等可用于隱私保護(hù)的密碼算法,但應(yīng)用尚不廣泛。
安全是發(fā)展的前提,必須全面提高大數(shù)據(jù)安全技術(shù)保障能力,進(jìn)而構(gòu)建貫穿大數(shù)據(jù)應(yīng)用云管端的綜合立體防御體系,以滿足國(guó)家大數(shù)據(jù)戰(zhàn)略和市場(chǎng)應(yīng)用的需求。數(shù)據(jù)是信息系統(tǒng)的核心資產(chǎn),是大數(shù)據(jù)安全的最終保護(hù)對(duì)象。除大數(shù)據(jù)平臺(tái)提供的數(shù)據(jù)安全保障機(jī)制之外,目前所采用的數(shù)據(jù)安全技術(shù),一般是在整體數(shù)據(jù)視圖的基礎(chǔ)上,設(shè)置分級(jí)分類的動(dòng)態(tài)防護(hù)策略,降低已知風(fēng)險(xiǎn)的同時(shí)考慮減少對(duì)業(yè)務(wù)數(shù)據(jù)流動(dòng)的干擾與傷害。對(duì)于結(jié)構(gòu)化的數(shù)據(jù)安全,主要采用數(shù)據(jù)庫(kù)審計(jì)、數(shù)據(jù)庫(kù)防火墻,以及數(shù)據(jù)庫(kù)脫敏等數(shù)據(jù)庫(kù)安全防護(hù)技術(shù);對(duì)于非結(jié)構(gòu)化的數(shù)據(jù)安全,主要采用數(shù)據(jù)泄露防護(hù)(Data leakage prevention, DLP)技術(shù)。同時(shí),細(xì)粒度的數(shù)據(jù)行為審計(jì)與追蹤溯源技術(shù),能幫助系統(tǒng)在發(fā)生數(shù)據(jù)安全事件時(shí),迅速定位問題,查缺補(bǔ)漏。
對(duì)于數(shù)據(jù)安全技術(shù)保護(hù),中國(guó)信息通信研究院給出了建議:
● 一是建立覆蓋數(shù)據(jù)收集、傳輸、存儲(chǔ)、處理、共享、銷毀全生命周期的安全防護(hù)體系,綜合利用數(shù)據(jù)源驗(yàn)證、大規(guī)模傳輸加密、非關(guān)系型數(shù)據(jù)庫(kù)加密存儲(chǔ)、隱私保護(hù)、數(shù)據(jù)交易安全、數(shù)據(jù)防泄露、追蹤溯源、數(shù)據(jù)銷毀等技術(shù),與系統(tǒng)現(xiàn)有網(wǎng)絡(luò)信息安全技術(shù)設(shè)施相結(jié)合,建立縱深的防御體系;
● 二是提升大數(shù)據(jù)平臺(tái)本身的安全防御能力,引入用戶和組件的身份認(rèn)證、細(xì)粒度的訪問控制、數(shù)據(jù)操作安全審計(jì)、數(shù)據(jù)脫敏等隱私保護(hù)機(jī)制,從機(jī)制上防止數(shù)據(jù)的未授權(quán)訪問和泄露,同時(shí)增加大數(shù)據(jù)平臺(tái)組件配置和運(yùn)行過程中隱含的安全問題的關(guān)注,加強(qiáng)對(duì)平臺(tái)緊急安全事件的響應(yīng)能力;
● 三是實(shí)現(xiàn)從被動(dòng)防御到主動(dòng)檢測(cè)的轉(zhuǎn)變,借助大數(shù)據(jù)分析、人工智能等技術(shù),實(shí)現(xiàn)自動(dòng)化威脅識(shí)別、風(fēng)險(xiǎn)阻斷和攻擊溯源,從源頭上提升大數(shù)據(jù)安全防御水平,提升對(duì)未知威脅的防御能力和防御效率。
此外,在個(gè)人數(shù)據(jù)隱私方面還應(yīng)該意識(shí)到,大數(shù)據(jù)應(yīng)用與個(gè)人信息保護(hù)之間的突出矛盾不單是技術(shù)問題,更需要通過加快立法、加強(qiáng)執(zhí)法規(guī)范大數(shù)據(jù)應(yīng)用場(chǎng)景下的個(gè)人信息收集、使用行為,盡快構(gòu)建政府管理、企業(yè)履責(zé)、社會(huì)監(jiān)督、網(wǎng)民自律等多主體共同參與的個(gè)人信息保護(hù)制度體系。