人工智能的缺憾

責(zé)任編輯:zsheng

2018-11-27 19:07:45

摘自:人機與認(rèn)知實驗室

對于人工智能的發(fā)展最近一直有一些思考,抽空整理下來,算是拋磚引玉吧。歡迎指教討論。

對于人工智能的發(fā)展最近一直有一些思考,抽空整理下來,算是拋磚引玉吧。歡迎指教討論。

人工智能的嶄新范式

人工智能的研究范式和數(shù)理科學(xué)截然不同。這種范式數(shù)據(jù)導(dǎo)向,非常工程化,方法論發(fā)達(dá)而認(rèn)識論不足。首先我們談數(shù)據(jù)導(dǎo)向。李飛飛老師的ImageNet項目是一個非常典型的例子。海量圖片的收集,整理和標(biāo)注,有巨大的工作量。在這些高質(zhì)量數(shù)據(jù)基礎(chǔ)上進(jìn)行了世界范圍的圖像識別競賽,參賽隊通過構(gòu)建規(guī)模更大的深度學(xué)習(xí)網(wǎng)絡(luò),表現(xiàn)迅速超過了傳統(tǒng)算法,這也成為深度學(xué)習(xí)標(biāo)志性的成就。其基本的工作流程是積累大規(guī)模數(shù)據(jù),得到更深的網(wǎng)絡(luò)模型,實現(xiàn)更好的表現(xiàn)。雖然現(xiàn)在我們有了更多不同種類的深度網(wǎng)絡(luò)應(yīng)對不同任務(wù),但這一基本框架并沒有本質(zhì)的改變。在該框架中,數(shù)據(jù)收集幾乎占據(jù)了最為重要的位置,若數(shù)據(jù)質(zhì)量不過關(guān),很容易造成所說的garbage in - garbage out。而數(shù)據(jù)集大小是影響深度學(xué)習(xí)效能的重要因素,一般認(rèn)為,當(dāng)數(shù)據(jù)集較小時,深度學(xué)習(xí)不一定優(yōu)于傳統(tǒng)機器學(xué)習(xí)方法。而隨著數(shù)據(jù)集規(guī)模的增大,傳統(tǒng)機器學(xué)習(xí)算法的表現(xiàn)很容易飽和,深度學(xué)習(xí)的表現(xiàn)卻可以隨著網(wǎng)絡(luò)規(guī)模的增大而更加優(yōu)異。

在傳統(tǒng)數(shù)理科學(xué)領(lǐng)域,我們并沒有如此依賴數(shù)據(jù)來進(jìn)行模型構(gòu)建??赡苡捎谌四X思維能力的限制,人們更習(xí)慣于從簡單假設(shè)出發(fā),利用邏輯演繹或者公式推導(dǎo)來構(gòu)建一套模型系統(tǒng),用以解釋實際數(shù)據(jù)。數(shù)理科學(xué)存在利用大量數(shù)據(jù)的情形:比如開普勒從第谷得觀測數(shù)據(jù)中也找到了特定的結(jié)構(gòu),不過這種結(jié)構(gòu)不是用神經(jīng)網(wǎng)絡(luò)的方式來描述的,而是采取了數(shù)學(xué)上更為簡潔的形式。而該規(guī)律只有納入牛頓力學(xué)的框架的時候才成為一個自然的結(jié)果?,F(xiàn)在觀測手段更加進(jìn)步,據(jù)說LHC每秒可以產(chǎn)生100萬億字節(jié)的對撞數(shù)據(jù)。但這些數(shù)據(jù)不是為了導(dǎo)出模型,而主要是為了驗證只有幾十個參數(shù)的人為構(gòu)建的標(biāo)準(zhǔn)模型,其包含的信息量也沒有超過這個模型。在很多時候,理論的提出或者發(fā)展,可以用到很少的數(shù)據(jù),甚至幾乎不用數(shù)據(jù)。伽利略構(gòu)建其運動學(xué)的時候,應(yīng)該只依據(jù)很少的觀測。而泰勒斯提出原子理論的時候我相信是沒有什么觀測數(shù)據(jù)的。理論的魅力在于可以從人的經(jīng)驗,思維或者直覺中生產(chǎn),具有內(nèi)在的簡潔性卻能解釋大量的現(xiàn)實觀測。

對數(shù)據(jù)的內(nèi)在追求,導(dǎo)致人工智能研究中有很多重勞力的部分。和產(chǎn)業(yè)的結(jié)合,資本的進(jìn)入進(jìn)一步放大了這一效應(yīng)。國內(nèi)人工智能創(chuàng)業(yè)公司不斷涌現(xiàn),數(shù)據(jù)標(biāo)注儼然已經(jīng)成為一種新的職業(yè)。已經(jīng)有不少相關(guān)的報道,比如可以參考甲子光年的《那些人工智能背后的人工》一文。這些人每個月拿著4000左右的工資,在電腦前機械的點著鼠標(biāo)做圖片標(biāo)注,得到的數(shù)據(jù)最終用于無人駕駛項目。還有很多下到村里收集人臉識別數(shù)據(jù)的,報酬是洗衣粉或者豆油。即使是科學(xué)研究逐漸資本化的今天,也很難想象一門學(xué)科可以像這樣直接催生新的勞動關(guān)系。這也部分由于我們要談的第二個問題,也就是人工智能研究非常工程化。

如果上過吳恩達(dá)老師的深度學(xué)習(xí)課程,就會發(fā)現(xiàn),深度學(xué)習(xí)在工程上非常先進(jìn),具有一套非常清晰的工作模式。對于一個深度網(wǎng)絡(luò)模型,那些參數(shù)具有最大的影響,如何通過表現(xiàn)判斷調(diào)節(jié)參數(shù)的方向,人們有著豐富的經(jīng)驗。最終決定表現(xiàn)的還是數(shù)據(jù)質(zhì)量,規(guī)模,以及特征(feature)選取。這就導(dǎo)致了人工智能領(lǐng)域的工作,非常容易scale-up,也就是規(guī)模化。這也是硅谷最喜歡的發(fā)展模式--通過資本催化迅速實現(xiàn)技術(shù)飛越和革新。類似的模式造就了我們熟悉的facebook,amazon,現(xiàn)在的互聯(lián)網(wǎng)移動互聯(lián)網(wǎng)世界。

在數(shù)理科學(xué)領(lǐng)域,我們不能簡單通過積累用戶或者數(shù)據(jù)獲得革新。一般情況下,理論的發(fā)育程度對應(yīng)了工程范疇的發(fā)展程度。新的工程實踐可能要求理論的創(chuàng)新,而理論的進(jìn)步又可以拓展人們進(jìn)行工程化創(chuàng)造的能力。沒有愛因斯坦的質(zhì)能方程,我想人們試再多年,有再多數(shù)據(jù)也不會造出原子彈。所以人工智能可以算是一朵奇葩,感謝計算能力的巨大發(fā)展,它工程的發(fā)展程度已經(jīng)可以跟理論脫節(jié)。這種缺乏理論或者認(rèn)識論會帶來比較嚴(yán)重的后果,我們后面會有所述及。

人工智能沒有催生理念的進(jìn)步

對人工智能最大的批評在于它的可詮釋性,人們難以理解越發(fā)龐大的深度網(wǎng)絡(luò)是如何發(fā)揮它的作用,每個節(jié)點有著怎樣的功能。拿圖像識別任務(wù)來說,比較早期的深度網(wǎng)絡(luò)AlexNet有35K個參數(shù)。到了2014年,VGG16網(wǎng)絡(luò)有138M個參數(shù)。在強大的表現(xiàn)背后,是一個人們從未接觸過的,難以理解的龐大造物(考慮到標(biāo)準(zhǔn)模型只有19個自由參數(shù))。關(guān)于如何解讀網(wǎng)絡(luò),現(xiàn)在逐漸有一些工作。但似乎還沒有令人信服的結(jié)果。在數(shù)學(xué)上可能也沒有成熟的工具來針對這類問題。神經(jīng)網(wǎng)絡(luò)算法的提出,最開始是受到了生物學(xué)研究,尤其是神經(jīng)研究的啟發(fā)。不過即使針對比較簡單的模式生物,比如只有302個神經(jīng)元的線蟲,我們也剛剛能理解一些最簡單行為,比如趨熱或者趨冷在神經(jīng)系統(tǒng)里細(xì)胞層面是如何編碼的。詮釋神經(jīng)網(wǎng)絡(luò)的工作,一方面受制于網(wǎng)絡(luò)規(guī)模的飛速增大,參數(shù)的急劇膨脹,以及應(yīng)用場景的逐漸復(fù)雜。另一方面,這本身可能就是不可解的問題,類似于我們本身都不知道大腦是如何運作,產(chǎn)生復(fù)雜思維。

沒有理論的學(xué)科會造成很多問題,可以參看我之前的博文《沒有理論的學(xué)科會怎么樣》。針對人工智能這一領(lǐng)域,第一個負(fù)面結(jié)果是會造成邊際效益遞減。也就是隨著數(shù)據(jù)規(guī)模的增大,網(wǎng)絡(luò)復(fù)雜度的增大,獲得的進(jìn)步越來越少。我們談到深度學(xué)習(xí)一個重要的特征是表現(xiàn)隨著數(shù)據(jù)體量增大而提高,這也是為什么大數(shù)據(jù)時代最適合深度學(xué)習(xí)。有時候我們覺得參數(shù)的膨脹標(biāo)志著一種進(jìn)步。但從物理學(xué)的角度看,這其實是退步--因為這標(biāo)志著參數(shù)解釋力的下降。這正是現(xiàn)實發(fā)生的情況,但即使我們在計算能力以及數(shù)據(jù)規(guī)模(感謝資本)上大躍進(jìn),表現(xiàn)的提高卻越來越慢。還是拿圖像識別為例,AlexNet的錯誤率是16.4%,而參數(shù)增加了4000倍的VGG網(wǎng)絡(luò)錯誤率是7.3%,基本錯誤減半。換過來說,是35K個參數(shù)可以識別83.6%的圖片,多出幾千倍的參數(shù)只多識別了9.1%的圖片,效能加起來只有接近九分之一。這也是為什么每當(dāng)人工智能進(jìn)入一個新的領(lǐng)域時,往往可以產(chǎn)生激動人心的初步結(jié)果(因為數(shù)據(jù)要求低),但對表現(xiàn)的改善卻是趨于更慢的。這對于一些要求苛刻的領(lǐng)域這其實是致命的,比如對于自動駕駛,我們必須把失誤控制在非常低的水平(每次失誤可能都會造成致命的事故),而現(xiàn)實情況又非常復(fù)雜多變,有些情況不僅靠訓(xùn)練,也要靠應(yīng)變和經(jīng)驗上的判斷。

沒有理論的另一個負(fù)面結(jié)果是研究過程近似于盲人摸象。雖然我們也有越來越多的網(wǎng)絡(luò)模型,但這些模型的構(gòu)建似乎更受到靈感的作用,而不是通過理論的啟發(fā)。這種try and error類型的研究,試對了就好,試不對就重來,運氣的成分會比較大。從理念上看,深度學(xué)習(xí)領(lǐng)域似乎還沒有根本上的創(chuàng)新,其最大的進(jìn)步似乎還是計算力上的進(jìn)步,工作的模式仍然接近于對生物神經(jīng)系統(tǒng)的模仿。而這種模仿其實并不能算是效率很高的模仿,我相信人腦完成復(fù)雜任務(wù)計算的效率平均講還是高于神經(jīng)網(wǎng)絡(luò)的。至少從計算時間和所需能量來講是遠(yuǎn)優(yōu)于計算機的。人腦的功率據(jù)說是20W左右,而現(xiàn)在好點的英偉達(dá)顯卡比如GeForce GTX 1080Ti的功耗已經(jīng)到了200W大關(guān)了。好在現(xiàn)在計算力不是瓶頸,再低的效率乘上龐大的計算力都能得到可觀的結(jié)果。

人工智能從應(yīng)用方式和應(yīng)用場景上,都是對人的一些基本能力的模仿。吳恩達(dá)老師有過一個說法,說如果一個問題,人可以憑借直覺在幾秒內(nèi)判斷出來,那么就有可能用人工智能來解決?,F(xiàn)在出現(xiàn)比較多的也的確是這類問題,比如對于圖像識別,到底是貓是狗,人一般幾秒鐘就能看出來?;蛘咴谧詣玉{駛方面,在一個路口是要剎車還是左轉(zhuǎn),正常的司機幾秒鐘也能判斷出來。所以說人工智能是對人的能力的再現(xiàn),這使得它在一些場景下可以代替人工,提高生產(chǎn)效率。但它難以完成更高級的一些思維活動,比如創(chuàng)造性思維。雖然有些“靈感一現(xiàn)”發(fā)生的時間也很短,但目前的計算框架并不具備相應(yīng)的發(fā)散性,聯(lián)想性和隨機性。所以深度學(xué)習(xí)研究不僅自身缺乏理論,而且也很難為其他學(xué)科領(lǐng)域帶來新的理論。根本的區(qū)別在于數(shù)理科學(xué)的研究具有不同的工作模式,一般包括假設(shè)提出,理論發(fā)展和實驗驗證,三者之間相互促進(jìn)。其中假設(shè)的提出是最為關(guān)鍵的一步,也是研究設(shè)計的基礎(chǔ)。人工智能在這第一步就敗下陣來。人怎么能夠提出假設(shè),這是一個復(fù)雜的問題。但其基本原因,脫不開人是有自我意識的,對世界的認(rèn)識是自由的,人的思維也是自由的。人工智能有沒有思維,有沒有意識是另外的話題,但目前來看它的訓(xùn)練數(shù)據(jù)都是高度單一的,它的結(jié)構(gòu)或者結(jié)構(gòu)的規(guī)則也是比較單一的,難以形成更復(fù)雜的思維結(jié)構(gòu)。

人工智能與社會發(fā)展

所以綜上人工智能最佳的應(yīng)用場景是對人類勞動的部分替代。人工智能的革命,可能是生產(chǎn)效率的革命,類似于工業(yè)革命把人的雙手解放出來。但現(xiàn)在還很難講它在產(chǎn)業(yè)上會不會產(chǎn)生類似工業(yè)革命的影響,主要的區(qū)別可能有幾點,第一,現(xiàn)在社會一般性產(chǎn)品的生產(chǎn)基本已經(jīng)飽和,需要更多的是創(chuàng)新性產(chǎn)品,消費主要為了提高生活品質(zhì),也就是所說的“滿足美好生活需要”。在生產(chǎn)創(chuàng)新性產(chǎn)品和服務(wù)方面,還沒有看到人工智能的優(yōu)勢。第二,全球經(jīng)濟發(fā)展不平均(以及國內(nèi)發(fā)展不平衡)造成的大量的低成本勞動力,在一些場景下替代這部分勞動力效益不高。舉一個極端的例子,一些創(chuàng)業(yè)公司搞線上的人工智能產(chǎn)品或者demo,背后其實可以在人力成本比較低的地方雇真人來做,這也是實際發(fā)生過的事情。如果人力成本很低,電子化的人不一定能競爭過肉身的人。如果有一天人力成本都很高了,我們可能就進(jìn)入共產(chǎn)主義社會了。我懷疑人工智能最危險的地方在于它對社會治理和網(wǎng)絡(luò)治理的影響,而且這種影響很可能是負(fù)面的。這里就不展開多說了。

另外像我提到的,人工智能對生產(chǎn)力的解放是有限的,它還難以替代創(chuàng)造性勞動,尤其是科研活動。我們支持人工智能是合理的,all-in人工智能是危險的?;A(chǔ)研究還應(yīng)該受到重視,目前看這是唯一可能導(dǎo)向新技術(shù)革命的路徑。不重視基礎(chǔ)研究,永遠(yuǎn)會被人落在后面。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號