亚洲一区在线播放不卡,国产mv在线观看视频免费

人工智能的缺憾

責(zé)任編輯：zsheng

2018-11-27 19:07:45

摘自：人機與認(rèn)知實驗室

對于人工智能的發(fā)展最近一直有一些思考，抽空整理下來，算是拋磚引玉吧。歡迎指教討論。

人工智能的嶄新范式

人工智能的研究范式和數(shù)理科學(xué)截然不同。這種范式數(shù)據(jù)導(dǎo)向，非常工程化，方法論發(fā)達(dá)而認(rèn)識論不足。首先我們談數(shù)據(jù)導(dǎo)向。李飛飛老師的ImageNet項目是一個非常典型的例子。海量圖片的收集，整理和標(biāo)注，有巨大的工作量。在這些高質(zhì)量數(shù)據(jù)基礎(chǔ)上進(jìn)行了世界范圍的圖像識別競賽，參賽隊通過構(gòu)建規(guī)模更大的深度學(xué)習(xí)網(wǎng)絡(luò)，表現(xiàn)迅速超過了傳統(tǒng)算法，這也成為深度學(xué)習(xí)標(biāo)志性的成就。其基本的工作流程是積累大規(guī)模數(shù)據(jù)，得到更深的網(wǎng)絡(luò)模型，實現(xiàn)更好的表現(xiàn)。雖然現(xiàn)在我們有了更多不同種類的深度網(wǎng)絡(luò)應(yīng)對不同任務(wù)，但這一基本框架并沒有本質(zhì)的改變。在該框架中，數(shù)據(jù)收集幾乎占據(jù)了最為重要的位置，若數(shù)據(jù)質(zhì)量不過關(guān)，很容易造成所說的garbage in - garbage out。而數(shù)據(jù)集大小是影響深度學(xué)習(xí)效能的重要因素，一般認(rèn)為，當(dāng)數(shù)據(jù)集較小時，深度學(xué)習(xí)不一定優(yōu)于傳統(tǒng)機器學(xué)習(xí)方法。而隨著數(shù)據(jù)集規(guī)模的增大，傳統(tǒng)機器學(xué)習(xí)算法的表現(xiàn)很容易飽和，深度學(xué)習(xí)的表現(xiàn)卻可以隨著網(wǎng)絡(luò)規(guī)模的增大而更加優(yōu)異。

在傳統(tǒng)數(shù)理科學(xué)領(lǐng)域，我們并沒有如此依賴數(shù)據(jù)來進(jìn)行模型構(gòu)建?？赡苡捎谌四X思維能力的限制，人們更習(xí)慣于從簡單假設(shè)出發(fā)，利用邏輯演繹或者公式推導(dǎo)來構(gòu)建一套模型系統(tǒng)，用以解釋實際數(shù)據(jù)。數(shù)理科學(xué)存在利用大量數(shù)據(jù)的情形：比如開普勒從第谷得觀測數(shù)據(jù)中也找到了特定的結(jié)構(gòu)，不過這種結(jié)構(gòu)不是用神經(jīng)網(wǎng)絡(luò)的方式來描述的，而是采取了數(shù)學(xué)上更為簡潔的形式。而該規(guī)律只有納入牛頓力學(xué)的框架的時候才成為一個自然的結(jié)果?，F(xiàn)在觀測手段更加進(jìn)步，據(jù)說LHC每秒可以產(chǎn)生100萬億字節(jié)的對撞數(shù)據(jù)。但這些數(shù)據(jù)不是為了導(dǎo)出模型，而主要是為了驗證只有幾十個參數(shù)的人為構(gòu)建的標(biāo)準(zhǔn)模型，其包含的信息量也沒有超過這個模型。在很多時候，理論的提出或者發(fā)展，可以用到很少的數(shù)據(jù)，甚至幾乎不用數(shù)據(jù)。伽利略構(gòu)建其運動學(xué)的時候，應(yīng)該只依據(jù)很少的觀測。而泰勒斯提出原子理論的時候我相信是沒有什么觀測數(shù)據(jù)的。理論的魅力在于可以從人的經(jīng)驗，思維或者直覺中生產(chǎn)，具有內(nèi)在的簡潔性卻能解釋大量的現(xiàn)實觀測。

對數(shù)據(jù)的內(nèi)在追求，導(dǎo)致人工智能研究中有很多重勞力的部分。和產(chǎn)業(yè)的結(jié)合，資本的進(jìn)入進(jìn)一步放大了這一效應(yīng)。國內(nèi)人工智能創(chuàng)業(yè)公司不斷涌現(xiàn)，數(shù)據(jù)標(biāo)注儼然已經(jīng)成為一種新的職業(yè)。已經(jīng)有不少相關(guān)的報道，比如可以參考甲子光年的《那些人工智能背后的人工》一文。這些人每個月拿著4000左右的工資，在電腦前機械的點著鼠標(biāo)做圖片標(biāo)注，得到的數(shù)據(jù)最終用于無人駕駛項目。還有很多下到村里收集人臉識別數(shù)據(jù)的，報酬是洗衣粉或者豆油。即使是科學(xué)研究逐漸資本化的今天，也很難想象一門學(xué)科可以像這樣直接催生新的勞動關(guān)系。這也部分由于我們要談的第二個問題，也就是人工智能研究非常工程化。

如果上過吳恩達(dá)老師的深度學(xué)習(xí)課程，就會發(fā)現(xiàn)，深度學(xué)習(xí)在工程上非常先進(jìn)，具有一套非常清晰的工作模式。對于一個深度網(wǎng)絡(luò)模型，那些參數(shù)具有最大的影響，如何通過表現(xiàn)判斷調(diào)節(jié)參數(shù)的方向，人們有著豐富的經(jīng)驗。最終決定表現(xiàn)的還是數(shù)據(jù)質(zhì)量，規(guī)模，以及特征(feature)選取。這就導(dǎo)致了人工智能領(lǐng)域的工作，非常容易scale-up，也就是規(guī)模化。這也是硅谷最喜歡的發(fā)展模式--通過資本催化迅速實現(xiàn)技術(shù)飛越和革新。類似的模式造就了我們熟悉的facebook，amazon，現(xiàn)在的互聯(lián)網(wǎng)移動互聯(lián)網(wǎng)世界。

在數(shù)理科學(xué)領(lǐng)域，我們不能簡單通過積累用戶或者數(shù)據(jù)獲得革新。一般情況下，理論的發(fā)育程度對應(yīng)了工程范疇的發(fā)展程度。新的工程實踐可能要求理論的創(chuàng)新，而理論的進(jìn)步又可以拓展人們進(jìn)行工程化創(chuàng)造的能力。沒有愛因斯坦的質(zhì)能方程，我想人們試再多年，有再多數(shù)據(jù)也不會造出原子彈。所以人工智能可以算是一朵奇葩，感謝計算能力的巨大發(fā)展，它工程的發(fā)展程度已經(jīng)可以跟理論脫節(jié)。這種缺乏理論或者認(rèn)識論會帶來比較嚴(yán)重的后果，我們后面會有所述及。

人工智能沒有催生理念的進(jìn)步

對人工智能最大的批評在于它的可詮釋性，人們難以理解越發(fā)龐大的深度網(wǎng)絡(luò)是如何發(fā)揮它的作用，每個節(jié)點有著怎樣的功能。拿圖像識別任務(wù)來說，比較早期的深度網(wǎng)絡(luò)AlexNet有35K個參數(shù)。到了2014年，VGG16網(wǎng)絡(luò)有138M個參數(shù)。在強大的表現(xiàn)背后，是一個人們從未接觸過的，難以理解的龐大造物(考慮到標(biāo)準(zhǔn)模型只有19個自由參數(shù))。關(guān)于如何解讀網(wǎng)絡(luò)，現(xiàn)在逐漸有一些工作。但似乎還沒有令人信服的結(jié)果。在數(shù)學(xué)上可能也沒有成熟的工具來針對這類問題。神經(jīng)網(wǎng)絡(luò)算法的提出，最開始是受到了生物學(xué)研究，尤其是神經(jīng)研究的啟發(fā)。不過即使針對比較簡單的模式生物，比如只有302個神經(jīng)元的線蟲，我們也剛剛能理解一些最簡單行為，比如趨熱或者趨冷在神經(jīng)系統(tǒng)里細(xì)胞層面是如何編碼的。詮釋神經(jīng)網(wǎng)絡(luò)的工作，一方面受制于網(wǎng)絡(luò)規(guī)模的飛速增大，參數(shù)的急劇膨脹，以及應(yīng)用場景的逐漸復(fù)雜。另一方面，這本身可能就是不可解的問題，類似于我們本身都不知道大腦是如何運作，產(chǎn)生復(fù)雜思維。

沒有理論的學(xué)科會造成很多問題，可以參看我之前的博文《沒有理論的學(xué)科會怎么樣》。針對人工智能這一領(lǐng)域，第一個負(fù)面結(jié)果是會造成邊際效益遞減。也就是隨著數(shù)據(jù)規(guī)模的增大，網(wǎng)絡(luò)復(fù)雜度的增大，獲得的進(jìn)步越來越少。我們談到深度學(xué)習(xí)一個重要的特征是表現(xiàn)隨著數(shù)據(jù)體量增大而提高，這也是為什么大數(shù)據(jù)時代最適合深度學(xué)習(xí)。有時候我們覺得參數(shù)的膨脹標(biāo)志著一種進(jìn)步。但從物理學(xué)的角度看，這其實是退步--因為這標(biāo)志著參數(shù)解釋力的下降。這正是現(xiàn)實發(fā)生的情況，但即使我們在計算能力以及數(shù)據(jù)規(guī)模(感謝資本)上大躍進(jìn)，表現(xiàn)的提高卻越來越慢。還是拿圖像識別為例，AlexNet的錯誤率是16.4%，而參數(shù)增加了4000倍的VGG網(wǎng)絡(luò)錯誤率是7.3%，基本錯誤減半。換過來說，是35K個參數(shù)可以識別83.6%的圖片，多出幾千倍的參數(shù)只多識別了9.1%的圖片，效能加起來只有接近九分之一。這也是為什么每當(dāng)人工智能進(jìn)入一個新的領(lǐng)域時，往往可以產(chǎn)生激動人心的初步結(jié)果(因為數(shù)據(jù)要求低)，但對表現(xiàn)的改善卻是趨于更慢的。這對于一些要求苛刻的領(lǐng)域這其實是致命的，比如對于自動駕駛，我們必須把失誤控制在非常低的水平(每次失誤可能都會造成致命的事故)，而現(xiàn)實情況又非常復(fù)雜多變，有些情況不僅靠訓(xùn)練，也要靠應(yīng)變和經(jīng)驗上的判斷。

沒有理論的另一個負(fù)面結(jié)果是研究過程近似于盲人摸象。雖然我們也有越來越多的網(wǎng)絡(luò)模型，但這些模型的構(gòu)建似乎更受到靈感的作用，而不是通過理論的啟發(fā)。這種try and error類型的研究，試對了就好，試不對就重來，運氣的成分會比較大。從理念上看，深度學(xué)習(xí)領(lǐng)域似乎還沒有根本上的創(chuàng)新，其最大的進(jìn)步似乎還是計算力上的進(jìn)步，工作的模式仍然接近于對生物神經(jīng)系統(tǒng)的模仿。而這種模仿其實并不能算是效率很高的模仿，我相信人腦完成復(fù)雜任務(wù)計算的效率平均講還是高于神經(jīng)網(wǎng)絡(luò)的。至少從計算時間和所需能量來講是遠(yuǎn)優(yōu)于計算機的。人腦的功率據(jù)說是20W左右，而現(xiàn)在好點的英偉達(dá)顯卡比如GeForce GTX 1080Ti的功耗已經(jīng)到了200W大關(guān)了。好在現(xiàn)在計算力不是瓶頸，再低的效率乘上龐大的計算力都能得到可觀的結(jié)果。

人工智能從應(yīng)用方式和應(yīng)用場景上，都是對人的一些基本能力的模仿。吳恩達(dá)老師有過一個說法，說如果一個問題，人可以憑借直覺在幾秒內(nèi)判斷出來，那么就有可能用人工智能來解決?，F(xiàn)在出現(xiàn)比較多的也的確是這類問題，比如對于圖像識別，到底是貓是狗，人一般幾秒鐘就能看出來?；蛘咴谧詣玉{駛方面，在一個路口是要剎車還是左轉(zhuǎn)，正常的司機幾秒鐘也能判斷出來。所以說人工智能是對人的能力的再現(xiàn)，這使得它在一些場景下可以代替人工，提高生產(chǎn)效率。但它難以完成更高級的一些思維活動，比如創(chuàng)造性思維。雖然有些“靈感一現(xiàn)”發(fā)生的時間也很短，但目前的計算框架并不具備相應(yīng)的發(fā)散性，聯(lián)想性和隨機性。所以深度學(xué)習(xí)研究不僅自身缺乏理論，而且也很難為其他學(xué)科領(lǐng)域帶來新的理論。根本的區(qū)別在于數(shù)理科學(xué)的研究具有不同的工作模式，一般包括假設(shè)提出，理論發(fā)展和實驗驗證，三者之間相互促進(jìn)。其中假設(shè)的提出是最為關(guān)鍵的一步，也是研究設(shè)計的基礎(chǔ)。人工智能在這第一步就敗下陣來。人怎么能夠提出假設(shè)，這是一個復(fù)雜的問題。但其基本原因，脫不開人是有自我意識的，對世界的認(rèn)識是自由的，人的思維也是自由的。人工智能有沒有思維，有沒有意識是另外的話題，但目前來看它的訓(xùn)練數(shù)據(jù)都是高度單一的，它的結(jié)構(gòu)或者結(jié)構(gòu)的規(guī)則也是比較單一的，難以形成更復(fù)雜的思維結(jié)構(gòu)。

人工智能與社會發(fā)展

所以綜上人工智能最佳的應(yīng)用場景是對人類勞動的部分替代。人工智能的革命，可能是生產(chǎn)效率的革命，類似于工業(yè)革命把人的雙手解放出來。但現(xiàn)在還很難講它在產(chǎn)業(yè)上會不會產(chǎn)生類似工業(yè)革命的影響，主要的區(qū)別可能有幾點，第一，現(xiàn)在社會一般性產(chǎn)品的生產(chǎn)基本已經(jīng)飽和，需要更多的是創(chuàng)新性產(chǎn)品，消費主要為了提高生活品質(zhì)，也就是所說的“滿足美好生活需要”。在生產(chǎn)創(chuàng)新性產(chǎn)品和服務(wù)方面，還沒有看到人工智能的優(yōu)勢。第二，全球經(jīng)濟發(fā)展不平均(以及國內(nèi)發(fā)展不平衡)造成的大量的低成本勞動力，在一些場景下替代這部分勞動力效益不高。舉一個極端的例子，一些創(chuàng)業(yè)公司搞線上的人工智能產(chǎn)品或者demo，背后其實可以在人力成本比較低的地方雇真人來做，這也是實際發(fā)生過的事情。如果人力成本很低，電子化的人不一定能競爭過肉身的人。如果有一天人力成本都很高了，我們可能就進(jìn)入共產(chǎn)主義社會了。我懷疑人工智能最危險的地方在于它對社會治理和網(wǎng)絡(luò)治理的影響，而且這種影響很可能是負(fù)面的。這里就不展開多說了。

另外像我提到的，人工智能對生產(chǎn)力的解放是有限的，它還難以替代創(chuàng)造性勞動，尤其是科研活動。我們支持人工智能是合理的，all-in人工智能是危險的?；A(chǔ)研究還應(yīng)該受到重視，目前看這是唯一可能導(dǎo)向新技術(shù)革命的路徑。不重視基礎(chǔ)研究，永遠(yuǎn)會被人落在后面。

智能