機(jī)器學(xué)習(xí)在物聯(lián)網(wǎng)中面臨怎樣的挑戰(zhàn)和機(jī)遇?

責(zé)任編輯:zsheng

2018-07-19 14:33:24

摘自:ssdfans

模型開發(fā)人工智能取得令人矚目的進(jìn)步的主要因素之一是出現(xiàn)了更好的技術(shù),如GPU:可以實(shí)現(xiàn)更快速的數(shù)據(jù)處理。物聯(lián)網(wǎng)的機(jī)器學(xué)習(xí)帶來了一個(gè)有趣的難題:最好的模型需要接受大量數(shù)據(jù)的訓(xùn)練,而大多數(shù)物聯(lián)網(wǎng)設(shè)備仍然受限于存儲(chǔ)空間和處理能力

模型開發(fā)人工智能取得令人矚目的進(jìn)步的主要因素之一是出現(xiàn)了更好的技術(shù),如GPU:可以實(shí)現(xiàn)更快速的數(shù)據(jù)處理。物聯(lián)網(wǎng)的機(jī)器學(xué)習(xí)帶來了一個(gè)有趣的難題:最好的模型需要接受大量數(shù)據(jù)的訓(xùn)練,而大多數(shù)物聯(lián)網(wǎng)設(shè)備仍然受限于存儲(chǔ)空間和處理能力。因此,安全高效地將大量數(shù)據(jù)從物聯(lián)網(wǎng)設(shè)備傳送到服務(wù)器或云端,并提高數(shù)據(jù)輸出的能力是AI應(yīng)用程序開發(fā)的關(guān)鍵。

在云計(jì)算時(shí)代,一種較好的解決方案是將數(shù)據(jù)導(dǎo)出到開發(fā)模型的云中,并在模型能夠投入使用后將模型導(dǎo)回到設(shè)備上。這非常具有吸引力,特別是因?yàn)轭A(yù)計(jì)到2021年所有生成的數(shù)據(jù)中有94%將在云中處理,這意味著可以利用其他數(shù)據(jù)源,無(wú)論是歷史數(shù)據(jù)還是源于其他物聯(lián)網(wǎng)設(shè)備的數(shù)據(jù)。然而,將復(fù)雜模型存儲(chǔ)回內(nèi)存受限的設(shè)備本身可能是一個(gè)挑戰(zhàn),因?yàn)榫哂写罅繀?shù)的復(fù)雜模型(如深度學(xué)習(xí)模型)本身通常非常大。另一方面,包括從設(shè)備向云上的模型發(fā)送數(shù)據(jù)以進(jìn)行推理步驟的解決方案也可能不是最優(yōu)方案,尤其是在需要延遲非常低的情況下進(jìn)行。另一個(gè)挑戰(zhàn)是物聯(lián)網(wǎng)設(shè)備可能無(wú)法連續(xù)連接到云,因此可能需要一些本地參考數(shù)據(jù)用于脫機(jī)處理,并具有獨(dú)立運(yùn)行的功能。

這是邊緣計(jì)算架構(gòu)變得有趣的地方,因?yàn)樗箶?shù)據(jù)能夠在邊緣設(shè)備級(jí)別進(jìn)行初始處理。在安全性方面,這種方法特別有吸引力;而且這種方法非常有利,因?yàn)檫@樣的邊緣設(shè)備能夠過濾數(shù)據(jù),減少噪聲并且當(dāng)場(chǎng)改善數(shù)據(jù)質(zhì)量。

不出所料,人工智能工程師一直試圖獲得兩全其美的方案,并最終開發(fā)了霧計(jì)算,這是一個(gè)去中心化的計(jì)算基礎(chǔ)設(shè)施。在這種方法中,數(shù)據(jù),計(jì)算能力,存儲(chǔ)和應(yīng)用程序以最合理的方式在設(shè)備和云之間分布,最終將它們更緊密地結(jié)合在一起來發(fā)揮它們各自的優(yōu)勢(shì)。轉(zhuǎn)移學(xué)習(xí)事實(shí)證明,物聯(lián)網(wǎng)設(shè)備能夠生成大數(shù)據(jù),但,使用外部歷史數(shù)據(jù)集開發(fā)物聯(lián)網(wǎng)智能應(yīng)用程序并不罕見。

這意味著可以依靠多個(gè)物聯(lián)網(wǎng)設(shè)備(通常是多個(gè)用戶的相同類型的設(shè)備)或完全不同的數(shù)據(jù)源生成的數(shù)據(jù)。

應(yīng)用程序越具體和獨(dú)特,現(xiàn)有數(shù)據(jù)集可供使用的可能性就越小,例如,當(dāng)設(shè)備捕獲Imagenet中特定類型的圖像而與開放源圖像數(shù)據(jù)集沒有相似性時(shí)。但物聯(lián)網(wǎng)應(yīng)用程序?qū)嶋H上是幾種現(xiàn)有的現(xiàn)成模型的巧妙結(jié)合,這使得轉(zhuǎn)換學(xué)習(xí)很好地適應(yīng)了物聯(lián)網(wǎng)背景下智能應(yīng)用的發(fā)展。轉(zhuǎn)移學(xué)習(xí)范式包括在數(shù)據(jù)集上訓(xùn)練模型(通常是黃金標(biāo)準(zhǔn)),并用它來推斷另一個(gè)數(shù)據(jù)集。或者,可以將在生成此模型期間計(jì)算的參數(shù)用作在實(shí)際數(shù)據(jù)集上訓(xùn)練模型時(shí)的起點(diǎn),而不是將模型初始化為隨機(jī)值。在這種情況下,我們將原始模型稱為“預(yù)先訓(xùn)練好的”模型,我們對(duì)應(yīng)用程序特定的數(shù)據(jù)進(jìn)行微調(diào)。這種方法可以將訓(xùn)練階段加速幾個(gè)數(shù)量級(jí)。

使用相同的范例,可以訓(xùn)練一個(gè)通用模型,最終用戶可以直接使用這些數(shù)據(jù)。安全和隱私問題由于互聯(lián)網(wǎng)連接設(shè)備技術(shù)通過提供物理和網(wǎng)絡(luò)世界之間的連接來擴(kuò)展當(dāng)前的互聯(lián)網(wǎng),因此它生成的數(shù)據(jù)是通用的,但也是導(dǎo)致嚴(yán)重隱私問題的原因。

事實(shí)上,參與物聯(lián)網(wǎng)的大約50%的組織認(rèn)為安全性是物聯(lián)網(wǎng)部署的最大障礙??紤]到大約三分之二的物聯(lián)網(wǎng)設(shè)備處于消費(fèi)領(lǐng)域,以及一些共享數(shù)據(jù)的私密性,也就不難理解安全性問題為什么會(huì)是一個(gè)難題了。 這些顧慮以及與云頻繁數(shù)據(jù)傳輸相關(guān)的預(yù)期風(fēng)險(xiǎn),解釋了用戶為何提出保護(hù)其數(shù)據(jù)的要求。然而,當(dāng)這些物聯(lián)網(wǎng)應(yīng)用程序由“聯(lián)合”數(shù)據(jù)(即由多個(gè)用戶生成的數(shù)據(jù))驅(qū)動(dòng)時(shí),事情會(huì)變得更加隱伏:不僅可能直接泄露用戶數(shù)據(jù),當(dāng)惡意代理對(duì)機(jī)器學(xué)習(xí)算法的輸出進(jìn)行逆向工程以推斷私人信息時(shí),就可能間接暴露用戶數(shù)據(jù)。

因此,很有必要在發(fā)展物聯(lián)網(wǎng)的同時(shí)建立起完整的數(shù)據(jù)保護(hù)法。物聯(lián)網(wǎng)機(jī)器學(xué)習(xí)是以人為中心的機(jī)器學(xué)習(xí)由于物聯(lián)網(wǎng)設(shè)備使互聯(lián)網(wǎng)更貼近用戶并觸及人類生活的各個(gè)方面,因此它們通常允許收集相關(guān)數(shù)據(jù)。物聯(lián)網(wǎng)數(shù)據(jù)描述了用戶生活的方方面面,并使其比以往更容易理解用戶的需求,愿望,歷史和偏好。這使得物聯(lián)網(wǎng)數(shù)據(jù)成為完善的數(shù)據(jù),可以根據(jù)用戶的個(gè)性創(chuàng)建個(gè)性化的應(yīng)用程序。而且由于物聯(lián)網(wǎng)通過收集高度個(gè)性化的數(shù)據(jù)以及提供高度個(gè)性化的應(yīng)用和服務(wù)來親密接觸我們的生活,因此物聯(lián)網(wǎng)機(jī)器學(xué)習(xí)有真正成為以人為本的機(jī)器學(xué)習(xí)的資格。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)