還記得上月,??低曆芯吭侯A(yù)研團(tuán)隊(duì)基于深度學(xué)習(xí)技術(shù)研發(fā)的OCR(Optical Character Recognition,圖像中文字識(shí)別)技術(shù),在ICDARRobust Reading競(jìng)賽數(shù)據(jù)集競(jìng)賽中刷新全球最好成績(jī),并在“互聯(lián)網(wǎng)圖像文字”、“對(duì)焦自然場(chǎng)景文字”和“隨拍自然場(chǎng)景文字”三項(xiàng)挑戰(zhàn)的文字識(shí)別(Word Recognition)任務(wù)中獲得第一嗎?《??低暽疃葘W(xué)習(xí)“文字識(shí)別技術(shù)”國(guó)際競(jìng)賽中獲第一》
安防OCR技術(shù)實(shí)力彰顯 市場(chǎng)應(yīng)用其實(shí)很廣
借助先進(jìn)的OCR技術(shù),??低暤奈淖肿R(shí)別系統(tǒng)能夠應(yīng)對(duì)更為復(fù)雜文字識(shí)別場(chǎng)景,如污損及模糊、背景干擾及形變、惡劣天氣等。目前,基于全新OCR技術(shù)的??低曑?chē)牌識(shí)別系統(tǒng)已經(jīng)覆蓋全球六十余個(gè)國(guó)家和地區(qū)?;谲?chē)牌識(shí)別技術(shù)的卡口、電子警察、出入口控制、停車(chē)系統(tǒng)等應(yīng)用也已經(jīng)全面鋪開(kāi)。
這里是不是有人要問(wèn)OCR技術(shù)是個(gè)什么?小編這就先科普下:OCR 技術(shù)是通過(guò)識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。具體的說(shuō),OCR意為光學(xué)字符識(shí)別,即自動(dòng)識(shí)別通過(guò)掃描儀、數(shù)碼相機(jī)、攝像機(jī)等得到的圖像中的文字(含字符)或書(shū)寫(xiě)在紙面上的文字,便于存儲(chǔ)、編輯和檢索。
事實(shí)上,OCR智能識(shí)別技術(shù)還可以進(jìn)行細(xì)分,下面介紹下幾種OCR智能識(shí)別技術(shù)。
1.證件OC識(shí)別
此類(lèi)最開(kāi)始是基于PC的,近幾年開(kāi)始向移動(dòng)端發(fā)展,主要有android,ios平臺(tái)的SDK,目前成熟的有身份證識(shí)別,行駛證識(shí)別,駕駛證識(shí)別,護(hù)照識(shí)別等。
2.銀行卡OCR識(shí)別
此類(lèi)技術(shù)是2014年以后開(kāi)始興起的技術(shù),主要用于移動(dòng)支付綁卡,是一項(xiàng)非常有技術(shù)含量的細(xì)分OCR技術(shù),目前有一些APP已經(jīng)在用,如拉卡拉,宜人貸,支付寶,微信等。
3.名片OCR識(shí)別
這一類(lèi)技術(shù)也非常成熟了,目前市場(chǎng)上名片管理的APP也非常多,多半已經(jīng)使用這類(lèi)技術(shù)。
4.文檔OCR識(shí)別
其實(shí)OCR最早的時(shí)候就是主要識(shí)別文檔,主要針對(duì)圖書(shū),報(bào)刊等,把這些紙質(zhì)文檔進(jìn)行電子化。但這類(lèi)技術(shù)主要是借助在掃描儀的基礎(chǔ)上得到快速發(fā)展,目前識(shí)別率也非常高。移動(dòng)端的文檔OCR識(shí)別,近幾年也有不少成功的應(yīng)用。
5.票據(jù)類(lèi)OCR識(shí)別
這類(lèi)技術(shù)主要是針對(duì)各種不同格式的票據(jù),主要基于模板機(jī)制,需要針對(duì)不同的票據(jù),定制不同的識(shí)別要素,這項(xiàng)技術(shù)也稱要素識(shí)別OCR,最早的其實(shí)運(yùn)用的是銀行行業(yè),主要在銀行的后督中,有非常成功的應(yīng)用。
6.手寫(xiě)OCR識(shí)別
其實(shí)手寫(xiě)OCR可以分為兩類(lèi),一類(lèi)是書(shū)面手寫(xiě)的識(shí)別,這類(lèi)技術(shù)沒(méi)有得到很好的應(yīng)用,只有是因?yàn)槊總€(gè)人的手寫(xiě)習(xí)慣不太一樣。目前能識(shí)別好是手寫(xiě)的數(shù)字和字母,因?yàn)檫@些差異不會(huì)太大,手寫(xiě)的漢子,難度還是非常大的。第二類(lèi)是聯(lián)機(jī)手寫(xiě)技術(shù):聯(lián)機(jī)手寫(xiě)技術(shù)得到了非常好的應(yīng)用,各種手寫(xiě)輸入法,都是基于這個(gè)技術(shù)??赡苡行┤藭?huì)問(wèn),同時(shí)手寫(xiě)OCR智能識(shí)別技術(shù),為了聯(lián)機(jī)手寫(xiě)識(shí)別的非常好,其實(shí)有兩點(diǎn),一是聯(lián)機(jī)手寫(xiě)是單字識(shí)別,不用做切分,OCR里最難的不是比對(duì)識(shí)別,而是字符切分。二是因?yàn)槁?lián)機(jī)手寫(xiě)技術(shù)是單字選擇,有人進(jìn)行判斷。所以應(yīng)用的非常廣。
7.車(chē)牌OCR識(shí)別
車(chē)牌識(shí)別技術(shù)相信大家都不會(huì)覺(jué)得陌生,智能交通,小區(qū)停車(chē)場(chǎng)等,都有很好的應(yīng)用,車(chē)牌識(shí)別的原理其實(shí)技術(shù)對(duì)車(chē)牌進(jìn)行OCR識(shí)別,再進(jìn)行比對(duì)的過(guò)程。也是相當(dāng)成熟的技術(shù)。
目前,人工智能蓬勃發(fā)展,OCR作為AI黑技術(shù)的重要組成部分已經(jīng)深深融入人們的日常生活工作當(dāng)中。以當(dāng)下最流行的身份證識(shí)別為例,最簡(jiǎn)單的描述它的工作流程包括,圖像的采集輸入、圖像預(yù)處理、圖像文字的分割與識(shí)別、信息關(guān)鍵詞歸屬的判斷和處理,以及OCR識(shí)別信息的輸出。在這五大模塊中,圖像的文字分割與識(shí)別作為核心技術(shù)在開(kāi)源的OCR中,作為一個(gè)技術(shù)開(kāi)發(fā)新人,無(wú)法從開(kāi)源的OCR內(nèi)獲取到有用的算法或代碼。例如谷歌的OCR開(kāi)源項(xiàng)目,Tesseract-OCR需要通過(guò)復(fù)雜的配置和訓(xùn)練方式才有可能接近自己想要的結(jié)果。冗余的代碼讓工程師在代碼熟悉階段就對(duì)OCR技術(shù)望而怯步。
其實(shí)仔細(xì)觀察,我們會(huì)發(fā)現(xiàn)OCR識(shí)別技術(shù)在身邊生活中隨處可見(jiàn),比如網(wǎng)上購(gòu)物手機(jī)充值要用移動(dòng)支付、理財(cái)貸款要找互聯(lián)網(wǎng)金融、轉(zhuǎn)賬要用手機(jī)銀行、股票開(kāi)戶要用證券移動(dòng)、公司票據(jù)信息錄入存檔等,在這些業(yè)務(wù)里你會(huì)發(fā)現(xiàn)很多環(huán)節(jié)都已經(jīng)用到了OCR技術(shù),在錄入身份證和銀行卡證件或發(fā)票等票據(jù)信息時(shí)現(xiàn)在不需要再手動(dòng)輸入,通過(guò)OCR識(shí)別,信息就會(huì)自動(dòng)識(shí)別并錄入存檔,速度快而且準(zhǔn)確度提升很多。
隨著未來(lái)業(yè)務(wù)流程的自動(dòng)化、智能化和多樣化趨勢(shì),OCR識(shí)別將會(huì)被更廣泛應(yīng)用,很多場(chǎng)景會(huì)實(shí)現(xiàn)操作的實(shí)時(shí)識(shí)別錄入存檔,屆時(shí)人們將真正感受到智能化生活所帶來(lái)的便利,看到人工智能時(shí)代發(fā)展將收獲跨越式的發(fā)展。