人工智能時代,深度學習和大數(shù)據(jù)成了密不可分的一對兒。深度學習可以從大數(shù)據(jù)中挖掘出以往難以想象的有價值的數(shù)據(jù)、知識或規(guī)律。簡單來說,有足夠的數(shù)據(jù)作為深度學習的輸入,計算機就可以學會以往只有人類才能理解的概念或知識,然后再將這些概念或知識應用到之前從來沒有看見過的新數(shù)據(jù)上。
《智能時代》的作者吳軍博士說:“在方法論的層面,大數(shù)據(jù)是一種全新的思維方式。按照大數(shù)據(jù)的思維方式,我們做事情的方式與方法需要從根本上改變。”
谷歌的圍棋程序AlphaGo已經(jīng)達到了人類圍棋選手無法達到的境界。沒有人可以與之競爭,這是因為AlphaGo在不斷進行學習。AlphaGo不但從人類專業(yè)選手以往的數(shù)百萬份棋譜中學習,還可以從自己和自己的對弈棋譜中學習。人類專業(yè)選手的對局、AlphaGo自己與自己的對局,這些都是AlphaGo賴以學習提高的大數(shù)據(jù)。
基于大數(shù)據(jù)的深度學習到底如何在現(xiàn)實生活中發(fā)揮作用呢?一個非常好的例子是,計算機可以通過預先學習成千上萬張人臉圖片,掌握認識和分辨人臉的基本規(guī)律。然后,計算機可以記住全國所有通緝犯的長相。沒有一個單獨的人類警察可以做到這一點。這樣一來,只要通緝犯在公共場合一露面,計算機就可以通過監(jiān)控攝像頭采集的圖像將通緝犯辨認出來。大數(shù)據(jù)和深度學習一起,可以完成以前也許需要數(shù)萬名人類警察才能完成的任務。
任何擁有大數(shù)據(jù)的領(lǐng)域,我們都可以找到深度學習一展身手的空間,都可以做出高質(zhì)量的人工智能應用。任何有大數(shù)據(jù)的領(lǐng)域,都有創(chuàng)業(yè)的機會。
金融行業(yè)有大量客戶的交易數(shù)據(jù),基于這些數(shù)據(jù)的深度學習模型可以讓金融行業(yè)更好地對客戶進行風險防控,或針對特定客戶進行精準營銷;電子商務企業(yè)有大量商家的產(chǎn)品數(shù)據(jù)和客戶的交易數(shù)據(jù),基于這些數(shù)據(jù)的人工智能系統(tǒng)可以讓商家更好地預測每月甚至每天的銷售情況,并提前做好進貨準備;城市交通管理部門擁有大量交通監(jiān)控數(shù)據(jù),在這些數(shù)據(jù)的基礎(chǔ)上開發(fā)的智能交通流量預測、智能交通疏導等人工智能應用正在大城市中發(fā)揮作用;大型企業(yè)的售后服務環(huán)節(jié)擁有大規(guī)模的客服語音和文字數(shù)據(jù),這些數(shù)據(jù)足以將計算機訓練成為滿足初級客服需要的自動客服員;教育機構(gòu)擁有海量的課程設(shè)計、課程教學數(shù)據(jù),針對這些數(shù)據(jù)訓練出來的人工智能模型可以更好地幫助老師發(fā)現(xiàn)教學中的不足……
需要注意的是,大數(shù)據(jù)和人工智能的結(jié)合也可能給信息流通和社會公平帶來威脅。在2016年的美國大選中,有一家名為Cambridge Analytica的公司就基于人工智能技術(shù),用一整套分析和引導輿論的軟件系統(tǒng)來操縱選情。這個系統(tǒng)可以自動收集和分析互聯(lián)網(wǎng)上的選情信息,評估人們對兩位總統(tǒng)候選人的滿意度,并通過給定向用戶投放信息,自動發(fā)送虛假新聞等技術(shù)手段,宣傳自己所支持的候選人,還可以通過A/B組對照試驗,準確判斷每個州的選民特征,為自己所支持的競選團隊提供第一手的數(shù)據(jù)資料和決策依據(jù)。美國伊隆大學的助理教授兼數(shù)據(jù)科學家喬納森·奧爾布賴特不無憂慮地說:“這簡直就是臺宣傳機器。它一個個地拉攏公眾,使他們擁護某個立場。如此程度的社會工程,我還是頭一次見……”
此外,在大數(shù)據(jù)發(fā)揮作用的同時,人工智能研發(fā)者也一定不要忘了,大數(shù)據(jù)的應用必然帶來個人隱私保護方面的挑戰(zhàn)。為了給你推送精準的廣告信息,就要收集你的購買習慣、個人喜好等數(shù)據(jù),這些數(shù)據(jù)中往往包含了許多個人隱私;為了獲得以人類基因為基礎(chǔ)的醫(yī)療大數(shù)據(jù)來改進疾病的診療,就要通過某種渠道收集盡可能多的人類基因樣本,而這些數(shù)據(jù)一旦保管不善,就可能為提供基因樣本的個人帶來巨大風險;為了建立智能城市,就要監(jiān)控和收集每個人、每輛車的出行信息,而這些信息一旦被壞人掌握,往往就會成為案犯最好的情報來源……
有效、合法、合理地收集、利用、保護大數(shù)據(jù),是人工智能時代的基本要求,需要政府、企業(yè)、個人三方共同協(xié)作,既保證大規(guī)模信息的正常流動、存儲和處理,又避免個人隱私被濫用或被泄露。