深度學(xué)習(xí)與大數(shù)據(jù)解析

責(zé)任編輯:editor004

作者:陳慶修

2016-12-05 12:22:46

摘自:學(xué)習(xí)時(shí)報(bào)

深度學(xué)習(xí)的概念于2006年提出,是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來解釋數(shù)據(jù)

深度學(xué)習(xí)的概念于2006年提出,是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來解釋數(shù)據(jù),例如圖像、聲音和文本,已被應(yīng)用于許多領(lǐng)域,如人臉識(shí)別、語音識(shí)別等。深度學(xué)習(xí)已成為人工智能領(lǐng)域研究的熱點(diǎn)。

隨著人工智能的迅速發(fā)展,通過深度學(xué)習(xí),用計(jì)算機(jī)來模擬人的思考、推理、規(guī)劃等思維過程和智能行為取得了長足進(jìn)步。人工智能的重要特征就是擁有學(xué)習(xí)的能力,也就是說系統(tǒng)的能力會(huì)隨著經(jīng)驗(yàn)數(shù)據(jù)的積累不斷演化和提升。近年來,正是得益于深度學(xué)習(xí)為大數(shù)據(jù)處理開辟了有效途徑,人工智能得到了空前發(fā)展。

(一)

機(jī)器學(xué)習(xí)來源于早期的人工智能領(lǐng)域,是計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)的交叉學(xué)科。它使用算法來解析數(shù)據(jù)、從中學(xué)習(xí),然后對真實(shí)世界中的事件進(jìn)行決策和預(yù)測。傳統(tǒng)人工智能的機(jī)器學(xué)習(xí)是通過標(biāo)記數(shù)據(jù)進(jìn)行有監(jiān)督學(xué)習(xí),隨著時(shí)間推移其多樣性、復(fù)雜性和進(jìn)化力也隨之增長,呈現(xiàn)加速度特點(diǎn),對于這種傳統(tǒng)算法數(shù)據(jù)量越大負(fù)擔(dān)越重,很容易達(dá)到極限或產(chǎn)生錯(cuò)誤結(jié)果。

深度學(xué)習(xí)有明顯長處,首先它是一套豐富的建模語言,或者說是建??蚣?,可以用來表達(dá)數(shù)據(jù)內(nèi)在的豐富關(guān)系和結(jié)構(gòu),比如圖像中的2D空間結(jié)構(gòu),自然語言的時(shí)序結(jié)構(gòu);其次,它幾乎是唯一的端到端(end-to-end)的機(jī)器學(xué)習(xí)系統(tǒng),它的目標(biāo)是直接作用于原始數(shù)據(jù),自動(dòng)逐層做數(shù)據(jù)特征變換,整個(gè)學(xué)習(xí)過程直接優(yōu)化某個(gè)問題相關(guān)的目標(biāo)函數(shù),而傳統(tǒng)的機(jī)器學(xué)習(xí)往往被分解為幾個(gè)不連貫的步驟,并非一致優(yōu)化某個(gè)整體的目標(biāo)。

(二)

大數(shù)據(jù)給人工智能的發(fā)展提供了前所未有的機(jī)遇。隨著各個(gè)行業(yè)信息化程度的普及,數(shù)據(jù)積累地越來越多。大數(shù)據(jù)資產(chǎn)化和規(guī)模化具有很大的潛在價(jià)值,當(dāng)沒有足夠高效的處理工具時(shí),即使這些數(shù)據(jù)樣本再大,也難以提取出任何有價(jià)值的東西。數(shù)據(jù)的數(shù)量和效率之間存在矛盾,收集更多的數(shù)據(jù)有助于提高最終結(jié)果的準(zhǔn)確性,但數(shù)據(jù)量越大,處理起來就越費(fèi)時(shí)費(fèi)力。面對海量數(shù)據(jù),如何低成本且高效率地存儲(chǔ)和處理大數(shù)據(jù)任重道遠(yuǎn)。

數(shù)據(jù)挖掘是個(gè)很寬泛的概念,其常用方法大多來自于機(jī)器學(xué)習(xí)這門學(xué)科。深度學(xué)習(xí)可以更好地通過增加數(shù)據(jù)集的規(guī)模來改善學(xué)習(xí)結(jié)果,它取得成功的條件是,大規(guī)模訓(xùn)練數(shù)據(jù)集的支撐、先進(jìn)的硬件平臺(tái)支持、新的優(yōu)化技術(shù)的創(chuàng)新。

從統(tǒng)計(jì)和計(jì)算的角度來說,深度學(xué)習(xí)是在海量數(shù)據(jù)中尋找復(fù)雜規(guī)律的算法工具。由于以深度學(xué)習(xí)分析和處理大數(shù)據(jù)效果不錯(cuò),它自然而然就成了大數(shù)據(jù)挖掘開發(fā)應(yīng)用的有力工具。如果把深度學(xué)習(xí)比作火箭的發(fā)動(dòng)機(jī),大數(shù)據(jù)就是燃料,深度學(xué)習(xí)可以利用大數(shù)據(jù)這種燃料將人工智能推到一個(gè)新高度。面對萬物互聯(lián)時(shí)代所產(chǎn)生的數(shù)據(jù)暴增,深度學(xué)習(xí)大有可為。

(三)

深度學(xué)習(xí)算法可以做到傳統(tǒng)人工智能算法無法做到的事情,而且輸出結(jié)果會(huì)隨著數(shù)據(jù)處理量的增大而更加準(zhǔn)確。這將大幅度提高計(jì)算機(jī)處理信息的效率,從而吸引更多的資源向它聚合,使其發(fā)展更為迅速。深度學(xué)習(xí)使得機(jī)器學(xué)習(xí)能夠?qū)崿F(xiàn)眾多的應(yīng)用,并可拓展人工智能的領(lǐng)域范圍。

以深度學(xué)習(xí)挖掘無標(biāo)簽的數(shù)據(jù)是大數(shù)據(jù)時(shí)代的一個(gè)熱點(diǎn)。僅以醫(yī)學(xué)領(lǐng)域?yàn)槔?,?jīng)過深度學(xué)習(xí)訓(xùn)練的圖像識(shí)別,從辨別血液中癌癥的早期成分,到識(shí)別核磁共振成像中的腫瘤,在許多情況下甚至可以做得比人更好。今后醫(yī)療就變成了一個(gè)數(shù)據(jù)處理的過程,利用深度學(xué)習(xí)可以在基因未能被勘測的區(qū)域發(fā)現(xiàn)自閉癥和癌癥的突變跡象,通過構(gòu)建虛擬現(xiàn)實(shí)可以治療毒癮、酗酒、自閉癥等疾病。同時(shí),由于機(jī)器在處理病情時(shí)可以做到完全按照數(shù)據(jù)處理結(jié)果進(jìn)行客觀診斷,所以不會(huì)像人類一樣因?yàn)榍楦蟹矫娴脑蜃鞒鲥e(cuò)誤判斷。

深度學(xué)習(xí)帶來更好的信息處理能力,不僅體現(xiàn)在人工智能領(lǐng)域,還體現(xiàn)在信息化醫(yī)療、經(jīng)濟(jì)社會(huì)、軍事科技和資源環(huán)境等眾多領(lǐng)域,從而產(chǎn)生廣泛和深遠(yuǎn)的影響。有了深度學(xué)習(xí),人工智能就會(huì)在語音識(shí)別、計(jì)算機(jī)視覺、自然語言理解、機(jī)器人、自動(dòng)駕駛等領(lǐng)域取得突破性進(jìn)展,甚至可以像科幻小說所描述的一樣,使得所有的機(jī)器輔助功能都變?yōu)榭赡堋?/p>

總之,大數(shù)據(jù)已經(jīng)變成各個(gè)行業(yè)的基礎(chǔ)架構(gòu),而真正能幫助這些行業(yè)處理好數(shù)據(jù),并最終實(shí)現(xiàn)具體應(yīng)用的還是深度學(xué)習(xí)。深度學(xué)習(xí)既可以從眾多領(lǐng)域的大數(shù)據(jù)中淘出“金子”,又可以利用這些大數(shù)據(jù)為人工智能的發(fā)展插上翅膀。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)