4月9日下午消息,第三屆中國電子信息博覽會新一代信息技術產(chǎn)業(yè)發(fā)展高峰論壇與今日下午召開,峰會上中國工程院的李德毅院士進行了大數(shù)據(jù)人工智能的前景相關的主題演講。
李德毅院士稱大數(shù)據(jù)標志著一個新時代的到來,這個時代的特征不只是追求豐富的物質資源,也不只是無所不在的互聯(lián)網(wǎng)帶來的方便的多樣化信息服務,同時還包含區(qū)別于物質的數(shù)據(jù)資源的價值發(fā)現(xiàn)和價值轉換,以及由大數(shù)據(jù)帶來的精神和文化方面的嶄新現(xiàn)象。
李德毅院士認為大數(shù)據(jù)本身既不是科學,也不是技術,我個人認為,它反映的是網(wǎng)絡時代的一種客觀存在,各行各業(yè)的大數(shù)據(jù),規(guī)模從TB到PB到EB到ZB,都是以三個數(shù)量級的階梯迅速增長,是用傳統(tǒng)工具難以認知的,具有更大挑戰(zhàn)的數(shù)據(jù)。
以下為演講實錄:
李德毅:尊敬的懷部長,各位來賓,女士們,先生們,我匯報的主題是大數(shù)據(jù)認知,云計算、大數(shù)據(jù)、認知,大家知道認知是現(xiàn)在全球都感興趣的話題。所謂認知,就是怎么樣獲取知識和技能的能力,所以我的第一個小標題是講一下認知。
大數(shù)據(jù)標志著一個新時代的到來,這個時代的特征不只是追求豐富的物質資源,也不只是無所不在的互聯(lián)網(wǎng)帶來的方便的多樣化信息服務,同時還包含區(qū)別于物質的數(shù)據(jù)資源的價值發(fā)現(xiàn)和價值轉換,以及由大數(shù)據(jù)帶來的精神和文化方面的嶄新現(xiàn)象。
大數(shù)據(jù)來源于人類的測量、記錄和分析世界的渴望和無盡的追求。隨著信息技術,尤其是傳感器、通信、計算機和互聯(lián)網(wǎng)技術的迅猛發(fā)展和廣泛應用,人類獲取數(shù)據(jù)的手段越來越多,速度大大加快、成本急劇降低,層次和尺度更為精細,揭示自然現(xiàn)象和社會現(xiàn)象更加深刻,人聯(lián)網(wǎng)和物聯(lián)網(wǎng)又使得人人物物都成為數(shù)據(jù)源,這樣一來,大數(shù)據(jù)成為網(wǎng)絡時代人類社會的重要資產(chǎn)。
我想說一個觀點,大數(shù)據(jù)本身既不是科學,也不是技術,我個人認為,它反映的是網(wǎng)絡時代的一種客觀存在,各行各業(yè)的大數(shù)據(jù),規(guī)模從TB到PB到EB到ZB,都是以三個數(shù)量級的階梯迅速增長,是用傳統(tǒng)工具難以認知的,具有更大挑戰(zhàn)的數(shù)據(jù)。
數(shù)據(jù)量巨大,價值密度低,實時在線,多源異構,怎么辦?舉個例子吧!聚類,物以類聚,人以群分,這是人類幾千年來認識世界和社會的基本能力,是從大數(shù)據(jù)中發(fā)現(xiàn)價值必須面對的一個普遍性、基礎性問題,是認知科學作為學科的學科,要解決的首要問題。無論是政治、經(jīng)濟、文學、歷史、社會、文化、還是數(shù)理、化工、醫(yī)農(nóng)、交通、地理、各行各業(yè)的大數(shù)據(jù)或宏觀或微觀的任何價值發(fā)現(xiàn)。
2008年XX??橇艘黄恼?,人們對小標題關注不夠,這個小標題講的PB時代的科學怎么做。大數(shù)據(jù)分析和挖掘的首要任務是聚類,這種聚類是跨學科、跨領域、跨媒體的。
聚類的挑戰(zhàn)性很多,有人是并行計算等等,我不細講了。我想說的是大數(shù)據(jù)聚類表現(xiàn)形態(tài)。
我想用幾個例子來講一講,人類走過了幾千年的實驗科學、幾百年的理論科學,保險是一個很傳統(tǒng)的行業(yè),基于概念評估的生意,保險公司對車險客戶是這樣聚類的:A類連續(xù)兩年沒有出車禍的,B類,最近一年沒有出車禍的,C類過去一年出了一次車禍的,D類過去一年出了兩此及以上車禍的。我從機場到深圳來,你坐飛機從北京到深圳,保險公司給你付了,我一了解,這個保險是20塊錢,這個保險公司買了你三個大數(shù)據(jù),身份證,還有你的手機號,各位企業(yè)、各位領導,各位老百姓,你們想一想。
物聯(lián)網(wǎng)時代,當汽車成為輪式機器人,成為大數(shù)據(jù)發(fā)生器以后,就是一個大數(shù)據(jù)發(fā)生體,每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車,都會記錄在岸,利用大數(shù)據(jù)聚類,保險公司可對一個車況好、駕駛習慣好、常走線路事故率低,不勤開車的特定客戶,給予更大的優(yōu)惠,而對風險太高的客戶報高價甚至拒絕,例如出租車司機跑的比老百姓多得多,總之能夠給出包括保險費支付方式在內的個性化解決方案,這就顛覆了保險公司的傳統(tǒng)商業(yè)模式。這就是大數(shù)據(jù)聚類成為保險公司的核心競爭力,我擴張一下,就是大數(shù)據(jù)聚類成為很多行業(yè)的核心競爭力。
非大數(shù)據(jù)時代,做一個人臉的識別,我們可以提取它十個特征,第二類先結構化存起來,你想一想,如果十個特征都一樣的話,兩個人是不是同一個人呢?當然,這也是不可能的,但是我們再想一想,人類智能來看,它忽略了什么呢?我認為它忽略了太多,這種人臉識別僅僅是幾何結構的聚類,落入集合學框架,忽略了聚類的不確定性,忽略了聚類的多樣性等等。
再舉個例子,大數(shù)據(jù)寫詩,人們熟讀眾多詩詞,記住了針對各種意境的大量字串。例如說李白一生寫詩1010首,把他所有詩句進行機械切割。李白給毛主席誕辰100周年寫一首詩,就是這樣。
大數(shù)據(jù)對形式化方法的挑戰(zhàn)是非常嚴峻的,在數(shù)據(jù)密集型的網(wǎng)絡時代,任何傳統(tǒng)學科,或者傳統(tǒng)的行業(yè),它的公理、原理和定理組成的語境,遇到互聯(lián)網(wǎng)+的挑戰(zhàn)之后,這樣一來,傳統(tǒng)的學科行業(yè),或者是交叉學科,成為一個大數(shù)據(jù)、小模型、小定律、交叉學科的時代,模型和程序要圍繞數(shù)據(jù)轉。
創(chuàng)新,表示在創(chuàng)造一個新的語境,新的坐標系,在這個坐標系下研究大數(shù)據(jù),在互聯(lián)網(wǎng)情況下,如何創(chuàng)造你新的坐標系,新的語境,否則難以有新的發(fā)現(xiàn)。
實踐中的研究,由下而上要深入,數(shù)據(jù)要勝過程序,價值要勝過知識,關聯(lián)要勝過因果,更多要關注有意義的小眾,把這些小眾累積起來才成為大眾。
通過大數(shù)據(jù)聚類即時發(fā)現(xiàn)價值,要充分認識大數(shù)據(jù)中的不確定性和價值的隱蔽性。
機器人如何認知是我講的第二個問題,這七個字,可以有兩種劃分,一種是機器人如何認知,你要把這個弄清楚,我覺得實際上是在弄這個,機器人在想,人如何認知,智能機器人是集新材料、新工藝、新能源、機械、電子、移動通信、全球定位導航、移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、自動化、人工智能、認知科學、乃至人文藝術等多個學科、多種技術于一身的人造精靈,是人聯(lián)網(wǎng)、物聯(lián)網(wǎng)不可或缺的端設備,是人類社會走向智慧生活的重要伴侶。
機器人既是使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動者,機器人是大數(shù)據(jù)的認知的典型代表,機器人時代真的來了,我們希望我們以后的黃牛退休、鐵牛耕地,這個鐵牛就是機器人,農(nóng)民進城,機器人耕地,醫(yī)療與健康機器人,服務機器人更是上上下下,當然還有太空機器人等。
我先講一下服務機器人,高考機器人,就是由知識的碎片化,大數(shù)據(jù)來認知,就說明我們的教育不能光是填知識,我們現(xiàn)在做一個報告,我們可以用機器人來撰稿,機器人導航,機器人手術等。
如果語言、文本、歌曲、劇本,都可以用虛擬機器人,訓練他的形象、情感、動作、語音、語調、風格,利用大數(shù)據(jù),發(fā)出新的歌聲。
機器人革命是世界性的、時代性的,機器人換人首先不是換掉理發(fā)師之類的勞動者,而可能是產(chǎn)業(yè)工人、文秘人員、醫(yī)生、服務員、甚至士兵,他們將升級轉型成為機器人的創(chuàng)造者和使用者,成為懂得集成、維修、管理機器人的專業(yè)人才。跨界滲透和跨界創(chuàng)新誕生的智能制造也是我國抓住歷史機遇的又一次崛起。
我想做一個可穿戴設備的案例,如果你能做一個人和人的衣服,動力驅動,研制一個可穿戴的機械,幫助負重、助行、轉體、條約的話,不僅可以讓機器人站起來走路,還可以讓特種兵成為飛人、超人。
這就是這樣一些機器人,可穿戴的外部增強的機器人,這是我想做的家庭服務機器人,今天企業(yè)家很多,我在這投一個標,我想做這邊這一個機器人,誰能做下面的輪子,從餐廳到臥室,從臥室到書房,希望大家有興趣能夠談一談。
機器人還將進一步刮起穿戴風,蘋果做了手表,這個手表里面有一個檢查老年癡呆的,蘋果發(fā)表了5個APP商家,啟動全新醫(yī)療應用,我們想一想,如果有一天讓手機或者手表成為醫(yī)療診斷的工具,成為用于慢性管理的醫(yī)患視頻互動平臺,成為醫(yī)療互聯(lián)網(wǎng)個人健康與醫(yī)療的數(shù)據(jù)發(fā)生器,成為遠程診療的開始,成為某種流行病的社會調查,成為病友社交網(wǎng)絡,甚至會顛覆傳統(tǒng)看病模式,顛覆傳統(tǒng)醫(yī)學研究。
生物機器人遐想,我們人的想象中,生命的多種形象,如果器官移植越來越發(fā)達,那么移花接木就屢見不鮮。將來,誰是誰搞不清楚了,如果這個人的臉換到另一個人的身上去,怎么界定?從定制治療到定制嬰兒,改造人類胚胎DNA,會不會避免遺傳性疾病?如果將人的思維移植到機器人,那么思想是不是不朽的呢?
我現(xiàn)在想做一個東西,我想做一個機器駕駛腦。在腦科學取得重大突破前,能不能做得出來?人腦很復雜,我跟一個美國科學院士,是個華人,在科技部開的咨詢會上,他告訴我一句話,讓我很吃驚,他回答我的問題,腦里要花一個腦袋功能結構圖,100年都畫不出,他說你看一看生命科學的書,那叫人腦的組織結構圖,全球已經(jīng)發(fā)現(xiàn)500多種腦部疾病。
科學界正把腦科學和認知科學作為當前的重大研究領域,我們熱切期待生物腦的出現(xiàn)。
難道認知科學就是研究生物腦的自然屬性嗎?怎樣把社會屬性研究進去呢?我提出來要研究文字、文明和傳承,我們各種高端生物都會有語言、文字的,因為有了文字,才有了文明。要研究腦認知的后天屬性,研究腦發(fā)育、可塑性與自然環(huán)境的關系,認知也是后天學習和積累的結果,是與社會環(huán)境、社會實踐、群體交互等密切相關的,要建立人腦認知的成長機制:如何創(chuàng)建神經(jīng)元之間新的連接和新的認知。
我們想一下,人的智能,除了記憶之外,在學習和思維上,到底有什么能耐?客觀地說,或者概括地說,一個是邏輯思維,一個是形象思維,形象思維最主要的是兩個,一個是類比,一個是聯(lián)想,主要解決的是圖象。
因此我的技術觀點是如果人腦的認知能力不能夠全部、完整、統(tǒng)一地形式化、但特定的情境下的認知能力是否可以先局部地形式化,例如算術運算、簡單游戲、博弈、定點開車等。
就在此時此刻,美國的一個汽車公司,真的從洛杉磯往紐約開,他要開5000多公里。我們有很多攝像頭,還有汽車本身的運動參數(shù),再一個就是我們的導航地圖,還有雷達傳感器,我們利用一次規(guī)劃,和駕駛地圖,形成一個初位化。我們認為,我們的駕駛腦主要涵蓋了人腦關于駕駛行為的主要功能,長期記憶、短期記憶,還有瞬間記憶,就是感覺記憶,從感知到認知,到行動。我今天在博覽會上找了好幾個廠家,希望跟他們合作,X1芯片,我們能不能做出我們自己的XPA,讓我們的汽車工業(yè)在智能時代到來中不錯失又一次機遇。謝謝大家!
中國腦計劃馬上要啟動了,我個人認為是要將三項研究同步進行,因為大數(shù)據(jù)三化來認識腦袋,保護腦,模擬腦,謝謝!