圖像識別技術(shù)在安防領(lǐng)域的應(yīng)用研究

責(zé)任編輯:editor006

作者:葉霞

2016-03-18 16:17:39

摘自:安防知識網(wǎng)

圖像識別技術(shù)是實(shí)現(xiàn)攝像機(jī)從看清到看懂質(zhì)的飛躍。隨著計(jì)算機(jī)技術(shù)及人工智能技術(shù)的發(fā)展,圖像識別技術(shù)越來越成為人工智能的基礎(chǔ)技術(shù),它將是未來科技領(lǐng)域幾大關(guān)鍵產(chǎn)業(yè)的核心技術(shù)之一。

圖像識別技術(shù)是實(shí)現(xiàn)攝像機(jī)從看清到看懂質(zhì)的飛躍。在安防視頻監(jiān)控領(lǐng)域,圖像識別技術(shù)結(jié)合行業(yè)視頻業(yè)務(wù)的應(yīng)用,有效地提高了公安、交通、司法、零售等行業(yè)的效率,讓感知型攝像機(jī)實(shí)現(xiàn)了高附加值的市場定位。

文/葉霞蘇州科達(dá)科技股份有限公司新媒體營銷總監(jiān)

近一兩年來,人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注,機(jī)器正在越來越多的取代人類特有的優(yōu)勢和技能,這其中最為重要的可能就是圖像識別技術(shù)。本文將從圖像識別技術(shù)的原理闡述出發(fā),介紹這一技術(shù)在安防行業(yè)的具體應(yīng)用,并且闡述其在當(dāng)前安防應(yīng)用上碰到的困難。當(dāng)然,面對這些困難,圖像識別技術(shù)將以此為契機(jī),與安防技術(shù)實(shí)現(xiàn)更大范圍的融合與發(fā)展。

1

  圖像識別技術(shù)與人工智能

說起圖像識別,人類的這一能力非常突出。圖形**作用于感覺器官,人們辨認(rèn)出它是經(jīng)驗(yàn)過的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過程叫做圖像再認(rèn)。在圖像識別中,既要有當(dāng)時(shí)進(jìn)入感官的信息,也要有記憶中存儲的信息。只有通過存儲的信息與當(dāng)前的信息進(jìn)行比較的加工過程,才能實(shí)現(xiàn)對圖像的再認(rèn)。

計(jì)算機(jī)圖像識別技術(shù),則是利用計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對象的技術(shù)。圖像識別所研究的問題,是如何用計(jì)算機(jī)代替人類去自動處理大量的物理信息,解決人類所無法識別或者識別過于耗費(fèi)資源的問題,從而很大程度上解放人類的勞動力。

圖像識別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。圖像識別技術(shù)是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,對圖像識別時(shí)眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見,在圖像識別過程中,知覺機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺映象。

為了編制模擬人類圖像識別活動的計(jì)算機(jī)程序,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認(rèn)為,識別某個(gè)圖像,必須在過去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,又叫模板。當(dāng)前的**如果能與大腦中的模板相匹配,這個(gè)圖像也就被識別了。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識別,有一定的局限性。格式塔心理學(xué)家又據(jù)此提出了一個(gè)原型匹配模型。這種模型認(rèn)為,在長時(shí)記憶中存儲的并不是所要識別的無數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗(yàn)所要識別的圖像。如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識別了。但是,這種模型沒有說明人是怎樣對相似的刺激進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”識別模型。

隨著計(jì)算機(jī)技術(shù)及人工智能技術(shù)的發(fā)展,圖像識別技術(shù)越來越成為人工智能的基礎(chǔ)技術(shù),它將是未來科技領(lǐng)域幾大關(guān)鍵產(chǎn)業(yè)的核心技術(shù)之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動這項(xiàng)功能進(jìn)步。比如微軟的圖像識別應(yīng)用“我看起來有多大”(HowOldDoILook?),成為網(wǎng)絡(luò)上紅極一時(shí)的話題。在去年舉行的第六屆ImageNet圖像識別技術(shù)比賽中,微軟憑借“圖像識別的深度殘差學(xué)習(xí)”(DeepResidualLearningforImageRecognition)系統(tǒng)獲得第一名。科技公司如此熱衷于圖像識別技術(shù)的應(yīng)用和創(chuàng)新,這種進(jìn)步顯然會大大方便互聯(lián)網(wǎng)、傳媒行業(yè)及科研領(lǐng)域的相關(guān)工作。

圖像識別技術(shù)與安防技術(shù)的融合

現(xiàn)在,圖像識別技術(shù)的應(yīng)用范圍已經(jīng)遠(yuǎn)遠(yuǎn)突破視覺的范圍,而更多地體現(xiàn)為機(jī)器智能、數(shù)字技術(shù)的特點(diǎn)??梢哉f,圖像識別技術(shù)就是人類視覺認(rèn)知的延伸。

視頻監(jiān)控在過去的實(shí)際應(yīng)用中,面臨的最大問題就是必須由人工查看視頻。視頻智能分析技術(shù)正是為解決這一問題而生,它通過對視頻進(jìn)行智能分析、有效信息的結(jié)構(gòu)化數(shù)據(jù)提取,從而讓視頻監(jiān)控的使用者真正告別人工安防而走進(jìn)自動化安防的新時(shí)代。

目前視頻智能分析主要有兩種產(chǎn)品形態(tài):前端智能和后端智能。前端智能以科達(dá)感知型攝像機(jī)為代表,將智能分析算法嵌入到前端攝像機(jī),前端攝像機(jī)對采集的視頻內(nèi)容立即進(jìn)行分析,提取出畫面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù),將后端感興趣的內(nèi)容實(shí)時(shí)傳給后端做存儲或深入分析。后端智能是前端攝像機(jī)只負(fù)責(zé)采集視頻圖像,將碼流傳遞到后端服務(wù)器做集中處理。這樣對于后端的計(jì)算壓力比較大,也不利于實(shí)時(shí)處理。更合理的方式是前端攝像機(jī)進(jìn)行基礎(chǔ)的結(jié)構(gòu)化數(shù)據(jù)提取,后端服務(wù)器再進(jìn)行深度二次分析;也就是說,將前端和后端配合起來做智能分析,才真正讓視頻圖像智能分析實(shí)現(xiàn)最大化價(jià)值。

視頻監(jiān)控領(lǐng)域是圖像識別技術(shù)一直在尋求突破的主要領(lǐng)域之一。視頻智能分析技術(shù)目前在公安、交通、零售、司法、教育等行業(yè)都獲得了普及性應(yīng)用。

公安

公安行業(yè)借助智能視頻分析主要用于實(shí)現(xiàn)城市道路、廣場及各類重點(diǎn)場所的人、車、物等目標(biāo)的識別,提取包括人的性別、人臉、全身等信息,車的車標(biāo)、車牌、車身顏色等信息,這些信息均可提煉為計(jì)算機(jī)能識別的結(jié)構(gòu)化數(shù)據(jù),送入后端進(jìn)行專業(yè)的安全管理應(yīng)用,主要包括實(shí)時(shí)布控、高危人員比對、以圖搜圖、多點(diǎn)碰撞、語義搜索等方面。

交通

具有分析、感知能力的智能攝像機(jī)通過視頻識別分析技術(shù),可對每輛車進(jìn)行完整的違法行為分析、識別、抓拍和錄像,記錄車輛違法的整個(gè)過程,再將每條記錄生成非結(jié)構(gòu)化的視頻、照片數(shù)據(jù)和結(jié)構(gòu)化的文本數(shù)據(jù)提交給后端智能管理與分析系統(tǒng),由系統(tǒng)進(jìn)行高度智能的交通違法行為處理?;谥悄芤曨l分析技術(shù),智能交通管理系統(tǒng)還能得出不同品牌的車型擁有量、過車高峰期、車輛進(jìn)出城高峰期及行駛方向等豐富的交通數(shù)據(jù),為城市交通流量管控、交通道路規(guī)劃等提供詳實(shí)的數(shù)據(jù)支撐。

零售

視頻智能分析在零售門店視頻監(jiān)控方面的領(lǐng)先應(yīng)用,是科達(dá)為聯(lián)合利華門店建設(shè)的熱點(diǎn)統(tǒng)計(jì)系統(tǒng),系統(tǒng)通過感知型攝像機(jī)和后端的大數(shù)據(jù)分析平臺相配合,用于開展個(gè)人護(hù)理類商品陳列和貨架布局的顧客行為數(shù)據(jù)收集及分析,比如顧客在不同商品前的停留時(shí)間是多少、商品陳列和貨架布局調(diào)整前后的人流動向?qū)Ρ群唾徺I金額對比等,進(jìn)而作為最終的經(jīng)營決策參考。這一系統(tǒng)不僅創(chuàng)新了視頻監(jiān)控系統(tǒng)遠(yuǎn)程管理零售門店的應(yīng)用,更為連鎖零售行業(yè)如何通過視頻監(jiān)控系統(tǒng)開展消費(fèi)數(shù)據(jù)比對、分析等大數(shù)據(jù)應(yīng)用開創(chuàng)了有益啟示。

司法和教育

在監(jiān)獄和看守所,視頻智能分析技術(shù)更是較早得到了運(yùn)用。除傳統(tǒng)的智能分析技術(shù)應(yīng)用之外,感知型攝像機(jī)也被用在AB門等出入口,用于對所有過往人員進(jìn)行臉部和全身的圖像采集,同時(shí)提供結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)給后端管理平臺,平臺對人員進(jìn)行實(shí)時(shí)比對,用于有效杜絕非法出入。學(xué)校采用視頻智能分析技術(shù)可以開展安全管理和教育錄播兩種應(yīng)用,后者通過教室內(nèi)的智能跟蹤攝像機(jī)自動識別、跟蹤老師的運(yùn)動圖像,同時(shí)對視頻和聲音進(jìn)行記錄,再生成錄播課程。

應(yīng)該說,圖像識別技術(shù)對于整個(gè)安防方案來說都是一項(xiàng)艱巨而又關(guān)鍵的任務(wù),直接決定了后續(xù)圖像處理與分析的準(zhǔn)確性和便捷性。在視頻監(jiān)控領(lǐng)域,圖像識別技術(shù)正面臨著不小的挑戰(zhàn),具體可闡釋為:其一,對圖像質(zhì)量的要求越來越高,圖像識別與處理的算法也越來越復(fù)雜;其二,對圖像的實(shí)時(shí)性處理和傳輸要求越來越高;其三,圖像識別的算法更加個(gè)性化,也更加成為市場競爭力的關(guān)鍵所在;其四,圖像數(shù)據(jù)往往涉及隱私,因此也需要提供可以信任的安全保證。面對這些挑戰(zhàn),科達(dá)深知要使圖像識別技術(shù)與安防技術(shù)實(shí)現(xiàn)更好的融合,任重而道遠(yuǎn)。盡管在業(yè)界已經(jīng)擁有了一定的知名度,科達(dá)仍然深耕于安防行業(yè),把感知型攝像機(jī)視為視頻監(jiān)控的未來,在將圖像識別技術(shù)更好地應(yīng)用于具體的行業(yè)需求方面,為其他人工智能的應(yīng)用提供了一條有價(jià)值的參考路徑。

熱文推薦

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號