蘋果正在加緊向人工智能領(lǐng)域發(fā)起沖擊,以趕上競爭對手的步伐。此前,其他企業(yè)一直在機器學(xué)習(xí)AI的高速公路上全速前進,這得益于它們挖掘起用戶數(shù)據(jù)來毫不手軟。
蘋果則不然,在一大群對數(shù)據(jù)如饑似渴的企業(yè)之中,蘋果獨以用戶數(shù)據(jù)守衛(wèi)者的角色自居。當(dāng)其他數(shù)據(jù)“吸血鬼”們悄悄上傳位置信息、鍵盤行為和搜索詞條的時候,蘋果對用戶信息不聞不問,還不斷推出新的硬件解決方案,讓自己(以及黑客、政府和身份信息盜用者)無從訪問用戶數(shù)據(jù),而且,其數(shù)據(jù)分析歷來都限制在用戶設(shè)備上,不會上傳到蘋果服務(wù)器。
但iOS中有幾道繞不過去的坎,蘋果需要知曉用戶行為,才能對特定功能進行精細(xì)的調(diào)整,對于一家將隱私放在第一位的公司,問題就出現(xiàn)了。差分隱私(differential privacy)的概念由此登場。在近日召開的全球開發(fā)者大會(WWDC)上,蘋果軟件工程高級副總裁克雷格·費德里吉(Craig Federighi)就此作了簡要的討論。
“差分隱私是統(tǒng)計和數(shù)據(jù)分析領(lǐng)域的一個研究課題,指使用散列、子采樣和噪聲注入等方式,在每個用戶的信息仍然完全保密的情況下,使眾包形式的學(xué)習(xí)成為可能,”費德里吉解釋說。
差分隱私并非蘋果首創(chuàng);學(xué)術(shù)界多年前就開始研究這一概念。但隨著iOS 10的逐步推出,蘋果將開始使用差分隱私來收集并分析來自鍵盤、Spotlight和Notes的用戶數(shù)據(jù)。
差分隱私的原理是用算法加擾個人用戶數(shù)據(jù),使之無法回溯到個人,然后對數(shù)據(jù)進行批量分析,得出大規(guī)模的趨勢規(guī)律。其目標(biāo)是保護用戶身份信息和數(shù)據(jù)細(xì)節(jié),同時提取機器學(xué)習(xí)所需的通用信息。
重要的是,iOS 10會先對單個用戶的數(shù)據(jù)進行隨機化處理,再將設(shè)備數(shù)據(jù)集體發(fā)送給蘋果公司,保證任何時候都不會以不安全的格式傳輸。蘋果也不會收集用戶鍵入的每一個單詞或搜索關(guān)鍵字——該公司表示,對于從每個用戶那里獲取的數(shù)據(jù)量,它會設(shè)置一個上限。
頗不尋常的是,蘋果公司還將其差分隱私執(zhí)行文件交給賓夕法尼亞大學(xué)教授亞倫·羅斯(Aaron Roth),接受同行評審。這位計算機科學(xué)教授是差分隱私領(lǐng)域的權(quán)威人士,著有《差分隱私的算法基礎(chǔ)》一書。費德里吉說,羅斯用“開創(chuàng)性”一詞評價了蘋果在差分隱私方面的工作。
蘋果表示,它可能會在iOS 10發(fā)布之前,發(fā)布差分隱私實施政策和數(shù)據(jù)保留政策方面的更多細(xì)節(jié)。
那么,這一切對你來說意味著什么呢?
鍵盤
在WWDC主旨演講中,蘋果宣布了iMessage的重大改進。差分隱私是這些改進的一大組成部分,因為蘋果希望收集數(shù)據(jù),用以改進QuickType和表情符號鍵盤的建議功能。在iOS 9中,QuickType在用戶的個人設(shè)備上學(xué)習(xí)短語并更新字典——新詞輸入達(dá)到一定次數(shù)以后,自動更正就會停止修改動作。
但在iOS 10中,蘋果將使用差分隱私,識別數(shù)十億用戶的用語趨勢——因此,你可能會驚奇地發(fā)現(xiàn),鍵盤給出的建議是你從未使用過的某個俚語。
“當(dāng)然,讓軟件更加智能的重要工具之一,就是在眾多用戶之中發(fā)現(xiàn)使用規(guī)律,”費德里吉解釋說。“比如,找出時下流行的新詞,使QuickType鍵盤對新詞信手拈來。”
差分隱私也一勞永逸地解決了常用表情符號之爭,給表情符號鍵盤重新排序,愛心符號再也不會藏在散亂的星座符號和鳶尾花之間了。
Spotlight
在此之前,iOS 9為改進Spotlight搜索功能,引入了深度鏈接(deep linking)。費德里吉在去年的WWDC上揭曉了深度鏈接,他在演示中用Spotlight搜索了“土豆”,出現(xiàn)的是設(shè)備上其他應(yīng)用中的菜譜,而不僅僅是網(wǎng)頁搜索結(jié)果。
如今,被孤立在應(yīng)用程序之中的信息越來越多,超越了傳統(tǒng)搜索引擎的覆蓋范圍,為了這些內(nèi)容變得可搜索,深度鏈接就成為必須。然而iOS 9該如何對深度鏈接的搜索結(jié)果進行排名,以防止不相關(guān)的建議泛濫Spotlight,這方面依然存在問題。
蘋果計劃使用差分隱私來解決這個問題。憑借被擾亂的用戶數(shù)據(jù),蘋果可以將極受歡迎的深度鏈接識別出來,并分配以較高的排名——故而當(dāng)你用Spotlight查找土豆食譜時,你會得到像Yummly這樣的應(yīng)用提供的最美味的土豆食譜。
Notes
iOS 10用差分隱私來加以改進的最后一項功能是Notes。
在主旨演講中,費德里吉還討論了Notes的改進。在iOS 10中,Notes將變得更具互動性,可操作信息將著重顯示——打個比方,如果你在Notes中記下一位朋友的生日,它可能會著重顯示該日期,建議你創(chuàng)建日歷事件以得到提醒。
為提供此類智能建議,蘋果需要知道用戶普遍喜歡記錄何種筆記,而這就要用到差分隱私。
工作原理
那么,差分隱私究竟是什么?它不是一種單一技術(shù),賓夕法尼亞州立大學(xué)計算機科學(xué)與工程系副教授亞當(dāng)·斯密(Computer Science)說,他與羅斯一道,從事這方面的研究已有十多年。
它其實是一種數(shù)據(jù)處理方式,在數(shù)據(jù)中加入限制,防止通過數(shù)據(jù)聯(lián)系到具體個人。它允許你對數(shù)據(jù)進行總體分析,但會在提取自單獨設(shè)備的數(shù)據(jù)中注入噪聲,讓數(shù)據(jù)在接受批量處理的同時,不至于危及個人隱私。
“嚴(yán)格來說,這是一個數(shù)學(xué)定義。它限制了你處理數(shù)據(jù)的方式,在數(shù)據(jù)集里面間隔取點的時候,任何點都不會鏈向太多信息,”史密斯說。
他用沒有調(diào)準(zhǔn)的電臺打了個比方,差分隱私就好比在一層靜態(tài)噪聲之下,聽到背后的旋律。“一旦你知道自己在聽什么,忽略靜態(tài)噪聲就很容易了。你了解不到什么個人信息,但可以看到比較清晰的整體規(guī)律。
“如果對自己不加約束,不插入這些噪聲,得到的規(guī)律還會更加清晰、準(zhǔn)確。但為了更有力地保障用戶隱私,這是必須作出的犧牲,”史密斯說。
史密斯認(rèn)為,蘋果是第一家嘗試大規(guī)模采用差分隱私的公司,盡管他也承認(rèn),其他大型商業(yè)實體(如AT&T)也曾做過這方面的研究(可能讓人意想不到的是,谷歌也通過Rappor項目做過這方面的研究)。他指出,初創(chuàng)企業(yè)也表現(xiàn)出了興趣。
雖然除蘋果之外,沒有其他商業(yè)實體大規(guī)模部署差分隱私,但史密斯表示,這一概念的穩(wěn)妥性是毋庸置疑的,不過他指出,實施也要得當(dāng)才行。
“與任何事關(guān)安全性的技術(shù)一樣,魔鬼就在細(xì)節(jié)間。落實必須非常妥善。但背后思路是非常穩(wěn)妥的,這一點沒有爭議。”
AI的未來將受何影響?
史密斯說,蘋果公司采用差分隱私是AI領(lǐng)域的一件大事,差分隱私或能給機器學(xué)習(xí)技術(shù)發(fā)揮作用的方式帶來翻天覆地的變化。
在硅谷,隱私之爭往往以執(zhí)法視角呈現(xiàn),體現(xiàn)為用戶與美國國家安全之爭。但在科技企業(yè),隱私之爭就成了用戶隱私與功能之間的取舍。蘋果引入差分隱私,可能會從根本上改變這場辯論。
谷歌和Facebook就一直困擾于這個問題:如何提供功能豐富同時又保護隱私的產(chǎn)品。谷歌的最新消息應(yīng)用Allo以及Facebook的Messenger都不將端到端加密設(shè)為默認(rèn),因為兩家公司都需要大量用戶對話來提升機器學(xué)習(xí),使聊天機器人運轉(zhuǎn)起來。蘋果也想從用戶數(shù)據(jù)中獲取深入的信息,但它不愿讓端到端加密的iMessage開倒車。
史密斯說,蘋果選擇差分隱私,將使企業(yè)重新權(quán)衡保護隱私與改進機器學(xué)習(xí)之間的取舍。“我們現(xiàn)在收集那么多數(shù)據(jù),但真正需要的根本沒那么多,”史密斯說。“這類技術(shù)絕對是隱私保護的另一條出路。”
雖然iOS 10只會用差分隱私來改進鍵盤、深度鏈接及Notes,但史密斯指出,如果試水成功,蘋果可能將此策略延伸到地圖、語音識別等功能。史密斯說,蘋果還可以看看人們在一天中哪些時段使用哪些應(yīng)用。
蘋果不收集原始用戶數(shù)據(jù),或能提升用戶對它的信賴,同時在政府面前,蘋果也可以展現(xiàn)出更加強硬的立場——在近期與FBI的官司大戰(zhàn)之中,蘋果就為了用戶隱私據(jù)理力爭。
由于差分隱私研究已有十年的積淀,它對蘋果來說是個相對低風(fēng)險的安全策略。史密斯表示,這個概念找到了創(chuàng)新和用戶安全之間的“最佳位置”。
“無論蘋果的成功是否徹底,這都將徹底改變隱私對話,”史密斯說。“我認(rèn)為,人們對私人信息收集的看法將因此改變。這可能是蘋果公司這一項目的最大遺產(chǎn),也許會遠(yuǎn)遠(yuǎn)超出它對蘋果業(yè)績的影響。”