安防AI大數(shù)據(jù)全流程解析

責(zé)任編輯:zsheng

2018-11-23 18:04:03

摘自:人人都是產(chǎn)品經(jīng)理

本篇文章介紹了安防AI大數(shù)據(jù)流程的三個(gè)環(huán)節(jié)、數(shù)據(jù)預(yù)處理技術(shù)及方法、以及大數(shù)據(jù)的應(yīng)用。

本篇文章介紹了安防AI大數(shù)據(jù)流程的三個(gè)環(huán)節(jié)、數(shù)據(jù)預(yù)處理技術(shù)及方法、以及大數(shù)據(jù)的應(yīng)用。

對(duì)于安防AI,看上去是AI,實(shí)際上最后是大數(shù)據(jù),大數(shù)據(jù)才是智能化的基礎(chǔ)。人工智能、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、大數(shù)據(jù)應(yīng)用在安防AI中, 說到底都是對(duì)大數(shù)據(jù)的采集、建模和應(yīng)用。

本文大致說一下安防AI中,對(duì)于大數(shù)據(jù)的運(yùn)用過程與環(huán)節(jié),讓大家有個(gè)大致的印象。

一、安防AI大數(shù)據(jù)流程三個(gè)環(huán)節(jié) 1. 數(shù)據(jù)采集

數(shù)據(jù)采集,有說數(shù)據(jù)獲取,這是數(shù)據(jù)的來源,安防AI中這個(gè)數(shù)據(jù)是來源于視頻監(jiān)控系統(tǒng)中的視頻流,當(dāng)然往大了說安防,還包括很多內(nèi)容,但是基本都是以視頻監(jiān)控為核心,這里主要指視頻監(jiān)控系統(tǒng)。

2. 數(shù)據(jù)預(yù)處理

對(duì)于采集到的實(shí)時(shí)或者歷史視頻,是只能看不能應(yīng)用的,要調(diào)用就得結(jié)構(gòu)化,先給視頻流解碼,把視頻流還原成一張張圖片,再對(duì)圖片進(jìn)行預(yù)處理。

可能不同的公司對(duì)預(yù)處理包含的步驟內(nèi)容說法不太一致,我是以安軟慧視的技術(shù)負(fù)責(zé)人介紹為準(zhǔn)。

先對(duì)圖片進(jìn)行目標(biāo)清洗垃圾,清洗掉模糊的、不合尺寸的,目標(biāo)無法識(shí)別的、無目標(biāo)對(duì)象的等等,當(dāng)然,有些場(chǎng)景可能只有這樣的圖像,這需要用到另外一些圖像處理方法,和我們的主題相關(guān)但不是一回事。

這樣我們就可以得到基本符合要求的圖像。然后對(duì)這些圖像中的目標(biāo)對(duì)象進(jìn)行檢測(cè)和分割,并改變目標(biāo)的大小與標(biāo)準(zhǔn)圖片大小一致,目標(biāo)對(duì)象包括人形、人臉、車形等,這樣就可以拿去訓(xùn)練模型了。

3. 模型訓(xùn)練

對(duì)圖片中的目標(biāo)對(duì)象進(jìn)行識(shí)別,提取和構(gòu)建模型,在安防AI中,需要的結(jié)構(gòu)化描述是比較具體的,比如對(duì)人的描述就包括性別、年齡、發(fā)型特征、發(fā)飾、上衣款式特征、下衣款式特征、鞋帽款式特征、交通工具特征、隨身物品特征、同行人特征等一系列描述。

對(duì)車的描述包括車牌號(hào)碼、廠牌、車身顏色、車輛品牌、車輛類型、車輛特征物(如:年檢標(biāo)、掛飾、紙巾盒、遮陽板)等。

有了這些識(shí)別模型,就可以通過語義分析等技術(shù)對(duì)視頻數(shù)據(jù)進(jìn)行分類處理存儲(chǔ),并通過后端服務(wù)器的智能分析功能進(jìn)行業(yè)務(wù)處理,將人、車、物的信息從數(shù)據(jù)中分離出來。

這樣公安民警就可以進(jìn)行快速檢索、條件搜圖(人)、以圖搜圖,再配以圖片的拍攝地點(diǎn)、時(shí)間等數(shù)據(jù),就可以進(jìn)行軌跡查詢,再匹配一下大安防系統(tǒng)中的住宿、手機(jī)號(hào)碼、車票等大數(shù)據(jù),基本上嫌疑人就是插翅難逃,這對(duì)民警的破案效率將是百千倍的提升。這才是安防AI真正的價(jià)值所在。

這在上一篇文章《安防AI大規(guī)模落地,解析一線場(chǎng)景及創(chuàng)新關(guān)鍵點(diǎn)》有過論述。

二、安防AI數(shù)據(jù)預(yù)處理技術(shù)及方法 1. 目前常見的數(shù)據(jù)預(yù)處理技術(shù)

1)數(shù)據(jù)清理

數(shù)據(jù)清理例程就是通過填寫缺失值、光滑噪聲數(shù)據(jù)、識(shí)別或者刪除離群點(diǎn),并且解決不一致性來進(jìn)行“清理數(shù)據(jù)”。

2)數(shù)據(jù)集成

數(shù)據(jù)集成過程將來自多個(gè)數(shù)據(jù)源的數(shù)據(jù)集成到一起。

3)數(shù)據(jù)規(guī)約

數(shù)據(jù)規(guī)約是為了得到數(shù)據(jù)集的簡(jiǎn)化表示。數(shù)據(jù)規(guī)約包括維規(guī)約和數(shù)值規(guī)約。

4)數(shù)據(jù)變換

通過變換使用規(guī)范化、數(shù)據(jù)離散化和概念分層等方法,使得數(shù)據(jù)的挖掘可以在多個(gè)抽象層面上進(jìn)行。數(shù)據(jù)變換操作是提升數(shù)據(jù)挖掘效果的附加預(yù)處理過程。

2. 數(shù)據(jù)清理方法

1)缺失值

對(duì)于缺失值的處理,一般是能補(bǔ)的就想辦法把它補(bǔ)上,實(shí)在補(bǔ)不上的就丟棄處理。

通常的處理方法有:忽略元組、人工填寫缺失值、使用一個(gè)全局變量填充缺失值、使用屬性的中心度量填充缺失值、使用與給定元組屬同一類的所有樣本的屬性均值或中位數(shù)、使用最可能的值填充缺失值。

2)噪聲數(shù)據(jù)

噪聲是被測(cè)量變量的隨機(jī)誤差或方差。去除噪聲、使數(shù)據(jù)“光滑”的技術(shù)有分箱、回歸、離群點(diǎn)分析等。

3)數(shù)據(jù)清理過程

這個(gè)環(huán)節(jié)主要包括數(shù)據(jù)預(yù)處理、清理方法、校驗(yàn)清理方法、執(zhí)行清理工具及數(shù)據(jù)歸檔。

數(shù)據(jù)清理的原理是通過分析“無效數(shù)據(jù)”產(chǎn)生的原因和存在形式,利用現(xiàn)有的技術(shù)手段和方法去清理,將“無效數(shù)據(jù)”轉(zhuǎn)化為滿足數(shù)據(jù)質(zhì)量或應(yīng)用要求的數(shù)據(jù),從而提高數(shù)據(jù)集的數(shù)據(jù)質(zhì)量。

常用的工具有Excel、Access、SPSS Modeler、SAS、SPSS Statistics等。

4)模型構(gòu)建數(shù)據(jù)統(tǒng)計(jì)分析

數(shù)據(jù)統(tǒng)計(jì)為模型構(gòu)建提供基礎(chǔ),只有通過數(shù)據(jù)統(tǒng)計(jì)分析探索到了數(shù)據(jù)中隱藏的規(guī)律,深度學(xué)習(xí)才有意義,人工智能才有可能。

數(shù)據(jù)統(tǒng)計(jì)又包括數(shù)據(jù)分析與結(jié)果分析,基本的分析方法有:對(duì)比分析法、分組分析法、交叉分析法、因素分析法、結(jié)構(gòu)分析法、漏斗圖分析法、矩陣關(guān)聯(lián)分析法、綜合評(píng)價(jià)分析法等。

高級(jí)的分析方法有:主成分分析法、因子分析法、對(duì)應(yīng)分析法、相關(guān)分析法、回歸分析法、聚類分析法、判別分析法、時(shí)間序列等。這些類別并不是獨(dú)一使用的,往往是混合使用的,然后再通過進(jìn)一步的分析對(duì)比從中挑選某些組合模型。

5)數(shù)據(jù)可視化

數(shù)據(jù)可視化,就是通過一些可視化圖形或者報(bào)表形式進(jìn)行展示,增強(qiáng)對(duì)分析結(jié)果的理解。再針對(duì)結(jié)果進(jìn)行進(jìn)一步的數(shù)據(jù)再分析,使得整個(gè)業(yè)務(wù)環(huán)節(jié)形成閉環(huán)。只有閉環(huán)的數(shù)據(jù)才能真正發(fā)揮出深度學(xué)習(xí)的效用。

三、安防AI大數(shù)據(jù)的應(yīng)用

安防大數(shù)據(jù)的應(yīng)用當(dāng)前是圍繞提升破案率和提升警務(wù)工作效率為中心的,要想在安防數(shù)據(jù)的基礎(chǔ)上開發(fā)出優(yōu)秀的應(yīng)用,必須要深入了解警務(wù)工作流程,從接處警、現(xiàn)場(chǎng)勘查、情報(bào)研判、應(yīng)急指揮、關(guān)聯(lián)碰撞、合成作戰(zhàn),再到各類型警用裝備間的互聯(lián)互通,再到各警種間的配合,再到各警種業(yè)務(wù)數(shù)據(jù)庫間的融合。

這些都要有詳細(xì)地了解,才能發(fā)現(xiàn)針對(duì)刑偵破案、治安防控、交通管理的應(yīng)用間的差異。

舉例說,比如針對(duì)嫌疑人的追蹤,可能是臉,但是大部分時(shí)候視頻是識(shí)別不出臉的,這是事實(shí),人臉識(shí)別僅在車站、機(jī)場(chǎng)、銀行等卡點(diǎn)場(chǎng)景才有用。但是絕大多數(shù)逃犯都是有點(diǎn)反偵察能力的,不是看到攝像頭就繞著走,就是故意遮擋不讓看,或者干脆等到天黑再走。

這時(shí)候能運(yùn)用到的主要就是通過嫌疑人的外形特征進(jìn)行追蹤,以圖搜圖配上區(qū)域范圍選擇、時(shí)間段選擇,再配上同行人特征、隨行物品特征、工具特征,就可以有效地對(duì)嫌疑人進(jìn)行高效篩選,再通過綜合情報(bào)進(jìn)行軌跡研判,這種情況下,嫌疑人幾乎就是甕中之鱉,上天無路入地?zé)o門。

如果再出現(xiàn)小朋友老年人走失,想找到就是分分鐘的事,再也不會(huì)出現(xiàn)讓發(fā)動(dòng)大批警力沿街查找,動(dòng)輒耗費(fèi)數(shù)十個(gè)小時(shí)的情況了。這樣,公安會(huì)不喜歡么?

說到底,大數(shù)據(jù)最終是為應(yīng)用服務(wù)的,只有最后真正提高了公安民警的工作效率和破案率,才能證明安防AI的價(jià)值和意義。這就要求我們既要懂AI業(yè)務(wù),又要懂公安業(yè)務(wù)。脫離了這兩者,想讓安防AI得到大面積推廣是連想都不要想的。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)