如今企業(yè)開(kāi)始部署機(jī)器學(xué)習(xí)。企業(yè)希望員工使用機(jī)器學(xué)習(xí)的三個(gè)主要原因包括:節(jié)省成本、更快處理海量數(shù)據(jù)以及更快發(fā)現(xiàn)新的漏洞。
大型零售商使用機(jī)器學(xué)習(xí)應(yīng)用來(lái)發(fā)現(xiàn)電子商務(wù)中的欺詐性交易,同時(shí)防止合法交易被阻止。他們利用機(jī)器學(xué)習(xí)來(lái)分析客戶對(duì)產(chǎn)品的態(tài)度,并找出冒充長(zhǎng)期客戶的攻擊者。
金融機(jī)構(gòu)利用機(jī)器學(xué)習(xí)應(yīng)用或系統(tǒng)來(lái)預(yù)測(cè)貸款違約以及欺詐和洗錢(qián)行為;醫(yī)院可通過(guò)機(jī)器學(xué)習(xí)預(yù)測(cè)可節(jié)省的急診室等候時(shí)間、可預(yù)測(cè)的中風(fēng)和癲癇發(fā)作以及浪費(fèi)式的再次住院;大型律師事務(wù)所則可利用機(jī)器學(xué)習(xí)幫助律師更快決定選擇處理哪些案件,法律機(jī)器人被訓(xùn)練用以確定企業(yè)合同是否包含所有必備條款。
機(jī)器學(xué)習(xí)的其他應(yīng)用包括預(yù)測(cè)健康狀況和股票價(jià)格,以及電力負(fù)荷與太陽(yáng)能發(fā)電。
機(jī)器學(xué)習(xí)自帶風(fēng)險(xiǎn)
即便是最好的機(jī)器學(xué)習(xí)模型也存在著風(fēng)險(xiǎn),這包括因糟糕學(xué)習(xí)算法導(dǎo)致的誤報(bào),這可能被攻擊者利用。同時(shí),機(jī)器學(xué)習(xí)模型還可能獲取來(lái)自最近被攻擊主機(jī)的受感染數(shù)據(jù),沒(méi)有誤報(bào)并不意味著沒(méi)有任何風(fēng)險(xiǎn),攻擊者可以利用運(yùn)行機(jī)器學(xué)習(xí)應(yīng)用平臺(tái)系統(tǒng)中的漏洞。
機(jī)器學(xué)習(xí)面臨的風(fēng)險(xiǎn)之一是攻擊者可利用偽造的生物識(shí)別指紋和虹膜以及面部特征來(lái)冒充合法用戶。另一個(gè)風(fēng)險(xiǎn)是攻擊者在測(cè)試或執(zhí)行期間可以騙過(guò)機(jī)器學(xué)習(xí)模型將惡意訓(xùn)練樣本分至合法類別。這可能導(dǎo)致機(jī)器學(xué)習(xí)模型產(chǎn)生與預(yù)期完全不同的結(jié)果。
機(jī)器學(xué)習(xí)風(fēng)險(xiǎn)管理
下面是降低機(jī)器學(xué)習(xí)應(yīng)用風(fēng)險(xiǎn)的五種方法:
1. 執(zhí)行道德攻擊
道德攻擊是指值得信賴的安全專家入侵系統(tǒng)以發(fā)現(xiàn)被防火墻、入侵檢測(cè)系統(tǒng)或其他任何安全工具忽視的機(jī)器學(xué)習(xí)漏洞。在獲取訪問(wèn)權(quán)限方面,道德攻擊者利用的是合法用戶在設(shè)備上遺留的指紋所重構(gòu)的偽造指紋。在進(jìn)入系統(tǒng)后,道德攻擊者可潛入指紋數(shù)據(jù)庫(kù),獲取另一位合法用戶的生物特征模板,再重建一個(gè)假的指紋。為了應(yīng)對(duì)這種風(fēng)險(xiǎn),設(shè)備讀取器必須在每次使用后進(jìn)行清理,數(shù)據(jù)庫(kù)應(yīng)被加密。
2.加密安全日志
系統(tǒng)管理員擁有超級(jí)用戶權(quán)限來(lái)分析機(jī)器學(xué)習(xí)日志文件,這樣做的原因包括:檢查是否遵守安全政策、對(duì)系統(tǒng)進(jìn)行故障排查以及取證。加密日志文件是防止日志文件被攻擊的一種方法。更改日志內(nèi)容所需要的加密密鑰不會(huì)暴露給惡意攻擊者,如果攻擊者試圖刪除日志文件,管理員會(huì)立即收到警報(bào)。
3. 清理訓(xùn)練數(shù)據(jù)
當(dāng)提供良好的訓(xùn)練數(shù)據(jù)時(shí),機(jī)器學(xué)習(xí)模型可良好地運(yùn)作。該模型開(kāi)發(fā)人員必須知道這些數(shù)據(jù)從何而來(lái),這些數(shù)據(jù)必須是干凈的數(shù)據(jù),而不是異?;蚴芨腥镜臄?shù)據(jù)。如果數(shù)據(jù)來(lái)源主機(jī)受到攻擊,則應(yīng)該停止使用這些數(shù)據(jù)。糟糕的數(shù)據(jù)可能導(dǎo)致機(jī)器模型無(wú)法良好運(yùn)作,最終導(dǎo)致系統(tǒng)關(guān)閉。當(dāng)使用機(jī)器學(xué)習(xí)工具來(lái)為特定目的評(píng)估數(shù)據(jù)時(shí),模型開(kāi)發(fā)人員應(yīng)該將所有數(shù)據(jù)轉(zhuǎn)換為通用格式。
4. 對(duì)模型生命周期采用DevOps
攻擊者可利用來(lái)自機(jī)器學(xué)習(xí)平臺(tái)的誤報(bào)信息。對(duì)于這種風(fēng)險(xiǎn),我們可對(duì)機(jī)器學(xué)習(xí)模型生命周期應(yīng)用DevOps,DevOps讓開(kāi)發(fā)和訓(xùn)練、質(zhì)量保證及生產(chǎn)團(tuán)隊(duì)相互協(xié)作。
DevOps會(huì)從開(kāi)發(fā)和訓(xùn)練階段開(kāi)始,然后進(jìn)入到質(zhì)量保障階段來(lái)看看模型的訓(xùn)練情況。不滿意的測(cè)試結(jié)果意味著需要返回到開(kāi)發(fā)階段,為模型提供更好的數(shù)據(jù)。如果測(cè)試結(jié)果很好,模型則會(huì)進(jìn)入生產(chǎn)階段,處理真實(shí)世界的數(shù)據(jù)。如果結(jié)果不符合預(yù)期,DevOps應(yīng)該從開(kāi)發(fā)或質(zhì)量保障階段再次重復(fù)。
5. 部署安全政策
最后,我們還應(yīng)該部署安全政策。在簡(jiǎn)單的情況下,安全政策應(yīng)該包括五個(gè)部分:目的、范圍、背景、行動(dòng)和限制。范圍會(huì)確定涵蓋哪些內(nèi)容:機(jī)器學(xué)習(xí)模型類型、訓(xùn)練數(shù)據(jù)和數(shù)據(jù)挖掘算法(回歸、聚類或神經(jīng)網(wǎng)絡(luò))。背景部分則會(huì)查看政策背后的原因,行動(dòng)部分介紹如何利用DevOps來(lái)降低風(fēng)險(xiǎn),而限制部分則會(huì)查看機(jī)器學(xué)習(xí)的限制以及測(cè)試數(shù)據(jù)的可用性。