在《海康威視深度學(xué)習(xí)“文字識別技術(shù)”國際競賽中獲第一》一文中??祽{借OCR(OpticalCharacterRecognition,圖像中文字識別)技術(shù),刷新了ICDARRobustReading競賽數(shù)據(jù)集的全球最好成績。在未來這位安防大佬還將繼續(xù)提升OCR技術(shù)性能,并想以此推動機器的智能化和自動化水平的提高,應(yīng)用于視頻監(jiān)控、智能感知和場景理解等方面。那么,什么是OCR技術(shù)?應(yīng)用場景有哪些?
OCR智能識別技術(shù)
OCR智能識別技術(shù)即是OCR識別軟件,通過OCR軟件對圖片中的文字進行提取識別,轉(zhuǎn)換成可檢索的數(shù)據(jù)。但OCR智能識別技術(shù)其實分的非常細,下面介紹下OCR智能識別技術(shù)。
1.證件OC識別
此類最開始是基于PC的,近幾年開始向移動端發(fā)展,主要有android,ios平臺的SDK,目前成熟的有身份證識別,行駛證識別,駕駛證識別,護照識別等。
2.銀行卡OCR識別
此類技術(shù)是2014年以后開始興起的技術(shù),主要用于移動支付綁卡,是一項非常有技術(shù)含量的細分OCR技術(shù),目前有一些APP已經(jīng)在用,如拉卡拉,宜人貸,支付寶,微信等。
3.名片OCR識別
這一類技術(shù)也非常成熟了,目前市場上名片管理的APP也非常多,多半已經(jīng)使用這類技術(shù)。
4.文檔OCR識別
其實OCR最早的時候就是主要識別文檔,主要針對圖書,報刊等,把這些紙質(zhì)文檔進行電子化。但這類技術(shù)主要是借助在掃描儀的基礎(chǔ)上得到快速發(fā)展,目前識別率也非常高。移動端的文檔OCR識別,近幾年也有不少成功的應(yīng)用。
5.票據(jù)類OCR識別
這類技術(shù)主要是針對各種不同格式的票據(jù),主要基于模板機制,需要針對不同的票據(jù),定制不同的識別要素,這項技術(shù)也稱要素識別OCR,最早的其實運用的是銀行行業(yè),主要在銀行的后督中,有非常成功的應(yīng)用。
6.手寫OCR識別
其實手寫OCR可以分為兩類,一類是書面手寫的識別,這類技術(shù)沒有得到很好的應(yīng)用,只有是因為每個人的手寫習(xí)慣不太一樣。目前能識別好是手寫的數(shù)字和字母,因為這些差異不會太大,手寫的漢子,難度還是非常大的。第二類是聯(lián)機手寫技術(shù):聯(lián)機手寫技術(shù)得到了非常好的應(yīng)用,各種手寫輸入法,都是基于這個技術(shù)。可能有些人會問,同時手寫OCR智能識別技術(shù),為了聯(lián)機手寫識別的非常好,其實有兩點,一是聯(lián)機手寫是單字識別,不用做切分,OCR里最難的不是比對識別,而是字符切分。二是因為聯(lián)機手寫技術(shù)是單字選擇,有人進行判斷。所以應(yīng)用的非常廣。
7.車牌OCR識別
車牌識別技術(shù)相信大家都不會覺得陌生,智能交通,小區(qū)停車場等,都有很好的應(yīng)用,車牌識別的原理其實技術(shù)對車牌進行OCR識別,再進行比對的過程。也是相當成熟的技術(shù)。