近日,市場研究&咨詢公司GrandViewResearch發(fā)布了一份深度學(xué)習(xí)市場分析報(bào)告。報(bào)告表明,2016年全球深度學(xué)習(xí)市場估值為2.72億美元,其在自動駕駛和醫(yī)療行業(yè)的應(yīng)用越來越多,有望為行業(yè)增長做出突出貢獻(xiàn)。這項(xiàng)技術(shù)的崛起得益于數(shù)據(jù)驅(qū)動的復(fù)雜應(yīng)用,包括語音和圖像識別,它可以和其他技術(shù)一起克服大數(shù)據(jù)量和高計(jì)算能力的挑戰(zhàn)以及改進(jìn)數(shù)據(jù)存儲。同時在剛舉行的“2017 CCF青年精英大會”上,香港中文大學(xué)教授湯曉鷗作了《人工智能的明天,中國去哪?》的主題演講。其中,針對人工智能和深度學(xué)習(xí)的應(yīng)用、發(fā)展,湯教授發(fā)表了自己的看法。
到底什么是深度學(xué)習(xí)技術(shù)?落地到安防領(lǐng)域,深度學(xué)習(xí)如何應(yīng)用呢?首先來聽聽湯教授如何理解深度學(xué)習(xí)。
什么是深度學(xué)習(xí)?
首先,人工智能和深度學(xué)習(xí)是什么關(guān)系?湯教授認(rèn)為,人工智能真正落地的部分就是深度學(xué)習(xí)。因?yàn)橐郧暗娜斯ぶ悄艽_實(shí)是在很多情況下用不起來,人手設(shè)計(jì)的智能來做某一件事情還是比較難超越人。而有了深度學(xué)習(xí)之后,可以把這個過程變成一個數(shù)據(jù)驅(qū)動的過程:當(dāng)做某一件特定事情時,數(shù)據(jù)量及參數(shù)量大到一定程度之后,機(jī)器就可能在做這件事情上超過人類。很多現(xiàn)實(shí)中落地的產(chǎn)品化的東西,都是深度學(xué)習(xí)做出來的。深度學(xué)習(xí)做的東西,成功的案例比較多,一方面是在語音識別領(lǐng)域,另外可能更多的是視覺這方面,所以大家可以看到很多計(jì)算機(jī)視覺方面新的成果。
深度學(xué)習(xí)到底在做什么事情?實(shí)際上它所做的事情抽象出來是比較簡單的,就是在做一個從X到Y(jié)的回歸、或者說從A到B的Mapping(對應(yīng))--你給它一個輸入,它怎么樣給出一個對應(yīng)的輸出?特殊的地方就是深度學(xué)習(xí)把這件事情做得非常非常好。以前也有其他算法可以做,只不過一直做不過人,現(xiàn)在深度學(xué)習(xí)做到了極致。
比如說給了一張人臉照片,它就可以給你對應(yīng)出這個人的名字;給一個物體的形狀,它就可以告訴你是什么物體;給一個車的行駛場景,它就可以給你輸出這個車應(yīng)該往哪兒拐;給一個棋局,它能算出下一步怎么走;給一個醫(yī)療的圖像,它就能幫你判斷這是什么病……實(shí)際上就是這樣的一個過程。不要把人工智能想象成可以超越人類,可以控制人類,這些都是所謂的“好萊塢的人工智能”或者想象中的人工智能,真正人工智能在現(xiàn)在這個階段其實(shí)就是做這么簡單的事,當(dāng)然,做成這個簡單的事情其實(shí)已經(jīng)很不簡單了。
深度學(xué)習(xí)的突破?
最近這幾年深度學(xué)習(xí)確實(shí)在學(xué)術(shù)界、工業(yè)界取得了重大的突破。第一個突破是在語音識別上,語音識別取得了巨大成功以后,深度學(xué)習(xí)緊接著在視覺方面又取得了重大突破。接著人工智能在自動駕駛領(lǐng)域也取得了一些重大的突破,現(xiàn)在比較熱門的是醫(yī)療影像方面,借助人工智能進(jìn)行診斷。
深度學(xué)習(xí)有三個核心的要素:學(xué)習(xí)算法的設(shè)計(jì),你設(shè)計(jì)的大腦到底夠不夠聰明;要有高性能的計(jì)算能力,訓(xùn)練一個大的網(wǎng)絡(luò);必須要有大數(shù)據(jù)。
“深度學(xué)習(xí)+安防”的應(yīng)用
目前深度學(xué)習(xí)主要的研究領(lǐng)域在語音識別和視覺方面,而且將深度學(xué)習(xí)應(yīng)用到各個方向,可以不同的領(lǐng)域做出不同的技術(shù)創(chuàng)新。對于掌握了許多視頻圖像資源的安防行業(yè)來說,深度學(xué)習(xí)和安防的結(jié)合擁有比較高的契合度,即對圖像和視頻的分析,包括:
——在圖像分析方面,比如人們熟悉的人臉識別、文字識別和大規(guī)模圖像分類等,深度學(xué)習(xí)大幅提升了復(fù)雜任務(wù)分類的準(zhǔn)確率,使得圖像識別、語音識別,以及語義理解準(zhǔn)確率大幅提升。
——在人臉方面,可以實(shí)現(xiàn)人臉檢測、人臉關(guān)鍵點(diǎn)定位、身份證對比、聚類以及人臉屬性、活體檢測等等。在智能監(jiān)控方面,可以做人、機(jī)動車、非機(jī)動車視頻結(jié)構(gòu)化研究。
——在文字方面,小票的識別、信用卡的識別、車牌的識別,這些都是由深度學(xué)習(xí)的算法來做的。同時在圖像的處理方面,在去霧、超分辨率、去抖動、去模糊,HDR、各種智能濾鏡的設(shè)計(jì)都是用深度學(xué)習(xí)的算法。
有人說,深度學(xué)習(xí)技術(shù)可謂安防行業(yè)的“顛覆性力量”,極大地推動了智能安防的發(fā)展。較之以往的傳統(tǒng)智能算法,深度學(xué)習(xí)在解決視頻結(jié)構(gòu)化和人臉識別等方面更“智能”。比如視頻結(jié)構(gòu)化,把視頻里面的人、機(jī)動車、非機(jī)動車及其特性都檢測出來了,并且自動標(biāo)注出來了,這樣整個視頻就變成了文檔,可以進(jìn)行文檔性的搜索;人臉的布控系統(tǒng),目前已在很多城市實(shí)時布控了,還有百米之外抓人,百米之外看到一個目標(biāo)拉近然后進(jìn)行人臉識別。
隨著深度學(xué)習(xí)算法的突破,目標(biāo)識別、物體檢測、場景分割、人物和車輛屬性分析等智能分析技術(shù),都取得了突破性進(jìn)展。
現(xiàn)階段,不僅安防行業(yè),越來越多的產(chǎn)業(yè)和企業(yè)在深度學(xué)習(xí)領(lǐng)域進(jìn)行探索。當(dāng)然我們也期待在深度學(xué)習(xí)甚至是人工智能的影響和各個安防生廠商的創(chuàng)新下,更多的智能安防產(chǎn)品能迅速落地應(yīng)用,提高城市安防系統(tǒng)的工作效率!