国产成人综合亚洲怡春院,91popny丨九色丨国产,国产午夜无码精品免费看秒播

深度學(xué)習(xí)奏響智能視頻分析技術(shù)新樂章

責(zé)任編輯：editor007

2017-03-22 16:40:10

摘自：cps

在2017年兩會熱詞中，被譽(yù)為互聯(lián)網(wǎng)下一個風(fēng)口的人工智能，成為兩會期間大眾的關(guān)注熱點(diǎn)，與創(chuàng)業(yè)緊緊聯(lián)系在一起，成為創(chuàng)業(yè)者的新寵

在2017年兩會熱詞中，被譽(yù)為互聯(lián)網(wǎng)下一個風(fēng)口的人工智能，成為兩會期間大眾的關(guān)注熱點(diǎn)，與創(chuàng)業(yè)緊緊聯(lián)系在一起，成為創(chuàng)業(yè)者的新寵。同時，網(wǎng)友也熱衷于深扒人工智能背后的“黑科技”，深度學(xué)習(xí)技術(shù)也因此成為關(guān)注點(diǎn)聚焦。其實(shí)，深度學(xué)習(xí)和安防搭配食用更美味。

　　深度學(xué)習(xí)奏響智能視頻分析技術(shù)新樂章

隨著各地視頻接入規(guī)模的迅猛增長及視頻監(jiān)控對高清、智能、聯(lián)網(wǎng)的要求越來越高，每天產(chǎn)生的數(shù)據(jù)量正以驚人的速度在不停增長。視頻監(jiān)控正迎來全新的大數(shù)據(jù)時代，數(shù)據(jù)越來越成為最寶貴的資源，如何有效對數(shù)據(jù)進(jìn)行存儲、共享以及應(yīng)用變得愈加重要。在這個新時代，智能化也成為視頻監(jiān)控的新趨勢。

一、傳統(tǒng)智能視頻分析技術(shù)的不足

智能視頻分析技術(shù)利用一些圖像處理、模式識別或機(jī)器學(xué)習(xí)等領(lǐng)域的算法來分析視頻序列中的信息，以達(dá)到理解視頻內(nèi)容的目的，也有人稱為視頻內(nèi)容分析。有了智能視頻分析技術(shù)，我們就可以及時地發(fā)現(xiàn)視頻中的異常情況，第一時間做出反應(yīng)，減少損失。

當(dāng)我們還在憧憬著智能視頻分析技術(shù)的前景時，現(xiàn)實(shí)給所有安防智能化廠商上了沉重的一課。很多智能視頻分析技術(shù)受限于應(yīng)用場景，為了得到較好的準(zhǔn)確率，往往需要“天時”、“地利”和“人和”。好不容易湊齊了三個要素，提供了非常標(biāo)準(zhǔn)的場景，我們?nèi)钥赡苡龅街悄芊治?ldquo;罷工”的情況。其實(shí)，問題就出在算法本身上。

首先，傳統(tǒng)的智能分析算法通常采取人工選擇特征的方法，如尺度不變特征,方向梯度直方圖特征，局部二值模式特征等。很明顯，特征選擇的好壞直接決定著算法準(zhǔn)確率的上限。算法研究團(tuán)隊(duì)的重點(diǎn)任務(wù)變成了投入更多的人力去挖掘出更好的特征。

數(shù)據(jù)集越大，特征越難發(fā)現(xiàn)和選擇，就好像一個無底洞一樣，不斷地試探，不斷地積累，時間和人力成本相當(dāng)之高。而所謂SIFT特征、HOG特征、LBP特征，都是算法人員在某種假設(shè)的前提下，尋找特定數(shù)據(jù)集在某一層面的表示。但這種表示是否真的有效，還是要靠算法人員的經(jīng)驗(yàn)和運(yùn)氣呢?每種特征都有自己的提取方式，遵循著自己的理論支持，但如果理論假設(shè)本身與現(xiàn)實(shí)相悖呢?我們無從知曉。

其次，有些智能分析算法模型為淺層學(xué)習(xí)模型，如支持向量機(jī)、邏輯回歸等。淺層學(xué)習(xí)模型通常有0或1層隱層節(jié)點(diǎn)，可以在一定規(guī)模的數(shù)據(jù)集下發(fā)揮較強(qiáng)的表達(dá)能力。但當(dāng)數(shù)據(jù)量不斷增大時，這些模型就會處于欠擬合的狀態(tài)。通俗點(diǎn)說就是數(shù)據(jù)量太大，模型不夠復(fù)雜，覆蓋不了所有數(shù)據(jù)。而算法模型無法解析大數(shù)據(jù)，直接制約了其應(yīng)用的廣度和深度，也限制了其進(jìn)一步發(fā)展的空間。

深度學(xué)習(xí)技術(shù)的興起，為我們解決了以上問題。在討論深度學(xué)習(xí)技術(shù)之前，我們先來談一談大數(shù)據(jù)，因?yàn)樯疃葘W(xué)習(xí)與大數(shù)據(jù)密不可分。

二、大數(shù)據(jù)時代的變革

生活在大數(shù)據(jù)時代的算法人員是幸運(yùn)的，因?yàn)樗麄儞碛袛?shù)據(jù);生活在大數(shù)據(jù)時代的算法人員也可能是不幸的，如果他不懂得如何利用這些數(shù)據(jù)，陷入數(shù)據(jù)的汪洋中無從抽身。大數(shù)據(jù)對智能視頻分析技術(shù)有著深遠(yuǎn)的影響意義。

大數(shù)據(jù)時代為算法研究提供了足夠多、足夠豐富的訓(xùn)練樣本。樣本的容量和種類是算法模型是否具有泛化能力的重要因素。換句話說，訓(xùn)練樣本集的規(guī)模決定了模型能否對訓(xùn)練樣本以外的數(shù)據(jù)有效的解釋。傳統(tǒng)的算法研究不可避免地要遇到小樣本問題為了解決小樣本問題，模型中加入了很多技巧性的手段，并都沒有本質(zhì)的區(qū)別，小樣本仍然存在。大數(shù)據(jù)時代，問題的解決就變得簡單粗暴多了。將所觀測到的海量數(shù)據(jù)扔進(jìn)模型中訓(xùn)練，只要模型足夠復(fù)雜，就能夠有效地表示這些數(shù)據(jù)。

大數(shù)據(jù)時代為算法研究提供了高效的計(jì)算工具。前面提到，數(shù)據(jù)量的增加意味著需要更復(fù)雜的模型來詮釋它。我們辛辛苦苦構(gòu)建了一個模型，到頭來發(fā)現(xiàn)模型無法求解，或者求解的時間遠(yuǎn)遠(yuǎn)超出我們的想象。我們只能眼巴巴地看著一堆數(shù)據(jù)，然后酸酸地說，大數(shù)據(jù)似乎沒那么有用。值得慶幸的是，有人已經(jīng)走在了前面。無論是分布式計(jì)算、并行計(jì)算還是云計(jì)算，都在為之努力，試圖解決日益增長的計(jì)算能力需求。

三、深度學(xué)習(xí)技術(shù)的出現(xiàn)

許多工業(yè)界、互聯(lián)網(wǎng)界的業(yè)內(nèi)大佬已經(jīng)開始利用大數(shù)據(jù)開發(fā)了一些系統(tǒng)。百度利用一個近10萬小時的語音數(shù)據(jù)集開發(fā)出一款語音識別系統(tǒng)。據(jù)介紹，這個系統(tǒng)可以在嘈雜環(huán)境下實(shí)現(xiàn)81%的準(zhǔn)確率。與傳統(tǒng)的語音識別系統(tǒng)不同，這套系統(tǒng)并沒有采取標(biāo)準(zhǔn)的、計(jì)算代價(jià)昂貴的聲學(xué)模型，而是給算法提供豐富的數(shù)據(jù)，然后讓它自己去學(xué)習(xí)，并取得了卓越的性能。

在這些成果的背后，有著一套共同的算法框架，那就是深度學(xué)習(xí)。前面提到過淺層學(xué)習(xí)模型,而深度學(xué)習(xí)，往往含有更深的層次結(jié)構(gòu)。我們可以認(rèn)為高層級的特征是由底層級的特征組合得到的。越是低層，特征越簡單，如一些直線、斜線、曲線等。越是高層，特征越抽象，越接近所要表達(dá)的意圖。我們回到圖像分析的范疇，對于一個圖片來說，最低級的特征是像素，也就是0到255的矩陣。我們通過像素，無法理解圖片里的目標(biāo)是什么。我們從像素中找到了邊緣特征，然后用邊緣特征組合成不同的部件，最后形成了不同種類的目標(biāo)物。顯然這個是我們所想要實(shí)現(xiàn)的。

深度學(xué)習(xí)初期是一種無監(jiān)督的特征學(xué)習(xí)算法，減少了人工干預(yù)的步驟，通過多層迭代得到更優(yōu)的特征。本質(zhì)上，深度學(xué)習(xí)也是一種非線性變換，但通過多層嵌套，更適合應(yīng)用于對大數(shù)據(jù)內(nèi)部關(guān)系的表示。

四、深度學(xué)習(xí)的應(yīng)用

近年來，深度學(xué)習(xí)在語音識別、圖像識別、自然語言處理等應(yīng)用中取得了顯著的成效。但是在安防行業(yè)，深度學(xué)習(xí)剛剛起步。筆者注意到，已經(jīng)有很多安防企業(yè)開始投入資源開發(fā)基于深度學(xué)習(xí)技術(shù)的算法、產(chǎn)品?？梢?，深度學(xué)習(xí)正影響著安防企業(yè)，影響著智能視頻分析技術(shù)。接下來我們將從幾個行業(yè)應(yīng)用來分析深度學(xué)習(xí)的前景。

1、人臉識別應(yīng)用。事實(shí)上，在安防領(lǐng)域的人臉識別還沒有達(dá)到理想的效果。究其原因，視頻中的人臉處在一種非常復(fù)雜的狀態(tài)。光照、姿態(tài)、表情、飾物、分辨率等都影響著人臉識別算法。已有的訓(xùn)練算法，或者說已有的訓(xùn)練數(shù)據(jù)無法調(diào)整出一個具有很強(qiáng)泛化能力的算法模型。未來的人臉識別模型如果想要取得突破，一方面需要更多更豐富的樣本數(shù)據(jù)，如各種光照、姿態(tài)、表情下的人臉圖像。誰掌握了大數(shù)據(jù)，誰將搶奪先機(jī)。另一方面，深度學(xué)習(xí)模型還需要進(jìn)一步優(yōu)化。深度模型的理論性還需要加強(qiáng)。到底什么樣的模型才算是最優(yōu)的表示，目前并沒有很好的答案。

2、車輛特征識別應(yīng)用。作為智能交通的一個典型應(yīng)用，車輛特征識別一直是安防廠商重點(diǎn)關(guān)注的技術(shù)領(lǐng)域。早期的車輛特征通常為車牌號碼和車身顏色等。前幾年各大廠商推出的產(chǎn)品都能對車牌號碼和車身顏色進(jìn)行準(zhǔn)確識別，但對于車輛品牌和車型系列這些更加復(fù)雜的信息特征，并沒有很好的識別手段。近兩年，深度學(xué)習(xí)技術(shù)興起，很多廠商利用大規(guī)模的數(shù)據(jù)集訓(xùn)練取得了實(shí)質(zhì)性進(jìn)展。目前行業(yè)水平已經(jīng)可以達(dá)到上千種車系和上百種車標(biāo)的識別。識別的準(zhǔn)確率也已達(dá)到實(shí)用程度。今后的智能交通設(shè)備所能提取的車輛特征將更加豐富，將有助于提升業(yè)務(wù)部門的工作效率，推動智能交通行業(yè)的發(fā)展。

深度學(xué)習(xí)還有很多應(yīng)用場景，只要涉及到目標(biāo)檢測、目標(biāo)識別的地方，理論上都可以應(yīng)用深度學(xué)習(xí)來解決。就像百度首席科學(xué)家吳恩達(dá)在一些報(bào)告中提到的，深度學(xué)習(xí)可以取代現(xiàn)有的很多特征提取、目標(biāo)檢測技術(shù)。在未來，深度學(xué)習(xí)技術(shù)將與安防應(yīng)用碰撞出更多的火花。

五、結(jié)束語

智能視頻分析技術(shù)從產(chǎn)生開始，一直備受關(guān)注。經(jīng)歷了起初的期待，走過了應(yīng)用的無奈，到如今重新審視技術(shù)本身，智能視頻分析確實(shí)還有很長的一段路要走。深度學(xué)習(xí)和大數(shù)據(jù)為智能視頻分析技術(shù)提供了前進(jìn)的方向。我們也期待，未來有更多新的、合理的模型出現(xiàn)，為我們提供可用的方法，讓設(shè)備真正擁有“智能”，讓安防真正成為大家心目中的“智能安防”。

智能學(xué)習(xí)算法視頻序列