由于系統(tǒng)改造的代價(jià)之高,使用適于系統(tǒng)設(shè)計(jì)的網(wǎng)絡(luò)安全措施則是最好的選擇。而新科技和應(yīng)用則帶來(lái)更多安全與隱私的新挑戰(zhàn)。此外,新技術(shù)的應(yīng)用效果經(jīng)常難以預(yù)測(cè),例如本文介紹的圖像數(shù)據(jù)庫(kù)——一項(xiàng)越來(lái)越受歡迎的數(shù)據(jù)庫(kù)科技。本文探索了圖像數(shù)據(jù)庫(kù)的價(jià)值以及調(diào)查了其中一些數(shù)據(jù)庫(kù)的安全與隱私問(wèn)題。
NoSQL的出現(xiàn)
關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS) 是在E.F.Codd博士發(fā)表的論文《大規(guī)模共享數(shù)據(jù)銀行的關(guān)系型模型》(Communications of the ACM雜志1970年6月刊)基礎(chǔ)上設(shè)計(jì)出來(lái)的。它通過(guò)數(shù)據(jù)、關(guān)系和對(duì)數(shù)據(jù)的約束三者組成的數(shù)據(jù)模型來(lái)存放和管理數(shù)據(jù)。目前許多企業(yè)的在線交易處理系統(tǒng)、內(nèi)部財(cái)務(wù)系統(tǒng)、客戶管理系統(tǒng)等大多采用了RDBMS。太字節(jié)級(jí)關(guān)系型數(shù)據(jù)庫(kù)在大型企業(yè)集團(tuán)中已是司空見(jiàn)慣。常用的數(shù)據(jù)庫(kù)軟件有Oracle、SQL Server等。
非關(guān)系型數(shù)據(jù)庫(kù)
非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL = Not Only SQL)意即“不僅僅是SQL”,是一項(xiàng)全新的數(shù)據(jù)庫(kù)革命性運(yùn)動(dòng),早期就有人提出,發(fā)展至2009年趨勢(shì)越發(fā)高漲。NoSQL的擁護(hù)者們提倡運(yùn)用非關(guān)系型的數(shù)據(jù)存儲(chǔ),相對(duì)于鋪天蓋地的關(guān)系型數(shù)據(jù)庫(kù)運(yùn)用,這一概念無(wú)疑是一種全新的思維的注入。簡(jiǎn)單地講,NOSQL數(shù)據(jù)庫(kù)可以按照它們的數(shù)據(jù)模型分成4類(lèi):
鍵-值存儲(chǔ)庫(kù)(Key-Value-stores)
BigTable實(shí)現(xiàn)(BigTable-implementations)
文檔庫(kù)(Document-stores)
圖形數(shù)據(jù)庫(kù)(Graph Database)
圖像數(shù)據(jù)庫(kù)(Graph Database)
圖形數(shù)據(jù)庫(kù)是一種非關(guān)系型數(shù)據(jù)庫(kù),它應(yīng)用圖形理論存儲(chǔ)實(shí)體之間的關(guān)系信息。最常見(jiàn)的一個(gè)例子,就是社會(huì)網(wǎng)絡(luò)中人與人之間的關(guān)系。關(guān)系型數(shù)據(jù)庫(kù)用于存儲(chǔ)“關(guān)系型”數(shù)據(jù)的效果并不好,其查詢復(fù)雜、緩慢、超出預(yù)期,而圖形數(shù)據(jù)庫(kù)的獨(dú)特設(shè)計(jì)恰恰彌補(bǔ)了這個(gè)缺陷。
網(wǎng)絡(luò)(如一個(gè)電網(wǎng)、一個(gè)企業(yè)供應(yīng)鏈或者整個(gè)生態(tài)系統(tǒng))通常由大量共享多重關(guān)系弧的節(jié)點(diǎn)構(gòu)成。圖像數(shù)據(jù)庫(kù)發(fā)揮它這強(qiáng)大的能力來(lái)表示網(wǎng)絡(luò)的組成和鏈接。圖像數(shù)據(jù)庫(kù)在支持開(kāi)發(fā)、知識(shí)管理甚至預(yù)測(cè)方面已逐步成熟起來(lái)。
在互聯(lián)網(wǎng)世界,各種不同類(lèi)型的網(wǎng)絡(luò)越來(lái)越卓越,正如具備上網(wǎng)能力已經(jīng)成為了現(xiàn)代社會(huì)必須。然而,圖像數(shù)據(jù)庫(kù)(像RDBMS)只是盒子里的另一個(gè)工具,可以利用好或者不好。因此,考慮新技術(shù)的大規(guī)模安全影響并不過(guò)早,至少應(yīng)該從最高的水平開(kāi)始。
圖像探索(Graph Discovery)
因?yàn)樘幚韺傩院玩溄?,圖像數(shù)據(jù)庫(kù)包括了海量仍隱藏著的信息。圖形數(shù)據(jù)庫(kù)最初并沒(méi)有被視為一種有益于探索的工具,它需要一個(gè)特別設(shè)計(jì)的超級(jí)計(jì)算機(jī)家族才能實(shí)現(xiàn)圖像發(fā)掘的全部威力。盡管它可以直接展示圖像,并數(shù)量增加到數(shù)十億,只有最為強(qiáng)大的機(jī)器才有能力在計(jì)算限制內(nèi)快速遍歷多路徑。
像是緊密排列的蛋白質(zhì)網(wǎng)絡(luò)一樣,圖像也如此密集。在這里,圖片細(xì)節(jié)查詢能夠壓垮計(jì)算能力較弱的系統(tǒng)。而超級(jí)計(jì)算機(jī)則克服了時(shí)間與能力的限制。有些這樣的設(shè)備運(yùn)用了Hadoop分析工具。
為探索而創(chuàng)造的高端圖形超級(jí)計(jì)算機(jī)確實(shí)為業(yè)界帶來(lái)了巨大的希望。例如,它可以支持建立復(fù)雜的海洋與構(gòu)成氣候條件的大氣之間的關(guān)系。當(dāng)氣候發(fā)生巨大變化時(shí),會(huì)進(jìn)一步發(fā)現(xiàn)非線性因素與結(jié)果變得越來(lái)越重要。同樣,一臺(tái)圖形超級(jí)計(jì)算機(jī)能夠加速發(fā)現(xiàn)西非的埃博拉傳播情況,這會(huì)有助于防范疾病的傳播。
圖1:基本圖形推理。這個(gè)簡(jiǎn)單的node-arc-node三位一體,常被成為三元組,是被用來(lái)詳細(xì)描述構(gòu)建描述各種各樣復(fù)雜網(wǎng)絡(luò)的基本工具。
圖2:用于探索的圖形數(shù)據(jù)庫(kù)。這樣的探索可以支持構(gòu)建海洋與大氣的關(guān)系,也可以用來(lái)加速發(fā)現(xiàn)埃博拉病毒在西非的傳播。
[page]探索:隱私與安全
圖像探索被認(rèn)為是一種解決復(fù)雜且相互關(guān)聯(lián)問(wèn)題的良好工具,然而卻存在大量對(duì)于隱私和安全問(wèn)題的擔(dān)憂。舉個(gè)例子,如果圖像超級(jí)計(jì)算機(jī)未來(lái)成為我們社會(huì)或金融交易的監(jiān)測(cè)工具,那么有針對(duì)性的廣告與其他的蓄意利用將會(huì)侵犯?jìng)€(gè)人隱私,個(gè)人的身份很可能被進(jìn)一步曝光。
期望通過(guò)立法來(lái)阻止存在的全部威脅是很容易被人理解的,但是社會(huì)要付出怎樣的代價(jià)呢?正如那些急于通過(guò)各種手段將銷(xiāo)售產(chǎn)品的人將會(huì)通過(guò)大數(shù)據(jù)而獲利,卻忽略了一旦他們受到攻擊要付出的個(gè)人代價(jià)又是什么呢?現(xiàn)實(shí)就是在這樣一個(gè)高端開(kāi)發(fā)僅僅是目前被建立的一個(gè)趨勢(shì)的投影。
在這種社會(huì)經(jīng)濟(jì)研究學(xué)設(shè)計(jì)中,尤其是廣泛涉及社會(huì)和商業(yè)事物關(guān)系的領(lǐng)域,安全要求應(yīng)該是更高的。近來(lái)發(fā)生黑客針對(duì)信用卡發(fā)行方或者電影公司等企業(yè)的攻擊事件造成了大規(guī)模的破壞,然而任何蓄謀的犯罪攻擊、大數(shù)據(jù)泄露都能造成更具毀滅性的影響。當(dāng)由無(wú)數(shù)傳感器、執(zhí)行器和移動(dòng)設(shè)備構(gòu)成的“互聯(lián)網(wǎng)+所有”(Internet of Anything,簡(jiǎn)稱(chēng)IoA)會(huì)進(jìn)一步增加安全隱患,這一切似乎都為隱私泄露提供了極大的方便。
圖像知識(shí)管理:隱私與安全
安全——特別是定制建筑設(shè)計(jì)——一定要將這一點(diǎn)考慮在內(nèi)。如果Web共享被認(rèn)為是一個(gè)生成大量典型三元組系統(tǒng)的合理方式,設(shè)計(jì)一個(gè)RDF(Resource Description Framework,一種用于描述Web資源的標(biāo)記語(yǔ)言)數(shù)據(jù)儲(chǔ)存的傳送門(mén)將變得異常重要。同樣,用戶身份驗(yàn)證和檢定都很重要。
盡管知識(shí)管理并不是探索運(yùn)用的廣泛,但是由于關(guān)聯(lián)的數(shù)據(jù)庫(kù)的特殊身份屬性仍必須受到嚴(yán)格保護(hù)。前端規(guī)定必須同時(shí)保證圖像數(shù)據(jù)庫(kù)的防入侵及個(gè)人數(shù)據(jù)隱私的的安全。若數(shù)據(jù)庫(kù)不能提供足夠保護(hù)可能會(huì)被取消資格,因?yàn)閭溥x圖像數(shù)據(jù)庫(kù)產(chǎn)品的接口仍易受攻擊。
圖像預(yù)測(cè):隱私與安全
例如天氣或者經(jīng)濟(jì)趨勢(shì),在涉及一個(gè)演變過(guò)程的動(dòng)態(tài)環(huán)境中,預(yù)測(cè)未來(lái)行為的能力變得非??赡?。
圖像有助于提高預(yù)測(cè)的準(zhǔn)確性,讓我們可以有資格同時(shí)量化一個(gè)系統(tǒng)代表的網(wǎng)絡(luò)。能夠聯(lián)系節(jié)點(diǎn)與弧(地址、時(shí)間、重量或者數(shù)量)的能力讓我們基于相似的屬性從而定性地評(píng)價(jià)圖像。更重要的是,量化技術(shù)讓我們?cè)趲缀跛械膱D像中評(píng)估內(nèi)在指標(biāo)。這也適用于許多領(lǐng)域,像是神經(jīng)科學(xué)。
當(dāng)前維護(hù)網(wǎng)絡(luò)安全的最佳實(shí)踐通常建議在研究其安全性和隱私性的漏洞時(shí)對(duì)系統(tǒng)進(jìn)行快照,以獲得證明系統(tǒng)“安全性”的證明。這種實(shí)踐的繆誤在于大多數(shù)系統(tǒng)都會(huì)受到不斷變化的環(huán)境的影響,這些影響將改變系統(tǒng)的活動(dòng)。所以,這只適用于證明快照拍攝那一瞬的安全。
鑒于數(shù)據(jù)庫(kù)的日趨復(fù)雜性,為我們監(jiān)控實(shí)時(shí)動(dòng)態(tài)變化提供了有利條件。通過(guò)檢測(cè)數(shù)據(jù)流異常節(jié)點(diǎn)或關(guān)系模式改變了我們使用定量方法,我們能夠檢測(cè)以及調(diào)查盡早地發(fā)現(xiàn)入侵和其他安全漏洞,迅速對(duì)任何監(jiān)測(cè)到的犯罪作出反映。
總結(jié)
從預(yù)測(cè)的角度來(lái)看,數(shù)據(jù)完整性必須搶占先機(jī)。因此,由于預(yù)測(cè)的風(fēng)險(xiǎn)很高,數(shù)據(jù)來(lái)源變得至關(guān)重要。預(yù)測(cè)的結(jié)果將盡可能的與預(yù)測(cè)工具暗示的數(shù)據(jù)一致。錯(cuò)誤數(shù)據(jù)會(huì)嚴(yán)重影響結(jié)果,安全也將變?yōu)榭罩袠情w。
良好的安全實(shí)踐將帶來(lái)最高級(jí)別的道德準(zhǔn)則。盡管圖像數(shù)據(jù)庫(kù)蘊(yùn)含著世界各種網(wǎng)絡(luò)的巨大希望,它同時(shí)帶來(lái)了潛在的安全風(fēng)險(xiǎn)還未被完全了解和鑒別。與追求流行時(shí)尚不同,IT專(zhuān)業(yè)人士必須認(rèn)真評(píng)估預(yù)期操作環(huán)境與執(zhí)行必要交易時(shí)的潛在風(fēng)險(xiǎn),以此達(dá)到安全和數(shù)據(jù)保護(hù)的基準(zhǔn)線。如果安全與隱私問(wèn)題圍繞新的技術(shù)(例如日益流行的圖像數(shù)據(jù)庫(kù))大量產(chǎn)生,那么在后期會(huì)成為一種新燒錢(qián)途徑。因?yàn)椴话踩?,所以很昂貴。
注:本文原刊登于IEEE IT Professional雜志。