人臉識(shí)別技術(shù)是基于人的臉部特征,對(duì)輸入的人臉圖像或者視頻流,根據(jù)具體的面貌特征信息進(jìn)行判斷。并與數(shù)據(jù)庫(kù)中的人臉進(jìn)行對(duì)比,從而達(dá)到識(shí)別每個(gè)人身份的目的。
人臉識(shí)別基本方式
人臉識(shí)別的方法很多,以下介紹一些主要的人臉識(shí)別方法。
(1)幾何特征的人臉識(shí)別方法
幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識(shí)別速度快,需要的內(nèi)存小,但識(shí)別率較低。
(2)基于特征臉(PCA)的人臉識(shí)別方法
特征臉?lè)椒ㄊ腔贙L變換的人臉識(shí)別方法,KL變換是圖像壓縮的一種最優(yōu)正交變換。高維的圖像空間經(jīng)過(guò)KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識(shí)別的特征矢量,這就是特征臉?lè)椒ǖ幕舅枷?。這些方法需要較多的訓(xùn)練樣本,而且完全是基于圖像灰度的統(tǒng)計(jì)特性的。目前有一些改進(jìn)型的特征臉?lè)椒ā?/p>
(3)神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法
神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等。這類(lèi)方法同樣需要較多的樣本進(jìn)行訓(xùn)練,而在許多應(yīng)用中,樣本數(shù)量是很有限的。
(4)彈性圖匹配的人臉識(shí)別方法
彈性圖匹配法在二維的空間中定義了一種對(duì)于通常的人臉變形具有一定的不變性的距離,并采用屬性拓?fù)鋱D來(lái)代表人臉,拓?fù)鋱D的任一頂點(diǎn)均包含一特征向量,用來(lái)記錄人臉在該頂點(diǎn)位置附近的信息。該方法結(jié)合了灰度特性和幾何因素,在比對(duì)時(shí)可以允許圖像存在彈性形變,在克服表情變化對(duì)識(shí)別的影響方面收到了較好的效果,同時(shí)對(duì)于單個(gè)人也不再需要多個(gè)樣本進(jìn)行訓(xùn)練。
(5)線段Hausdorff 距離(LHD) 的人臉識(shí)別方法
心理學(xué)的研究表明,人類(lèi)在識(shí)別輪廓圖(比如漫畫(huà))的速度和準(zhǔn)確度上絲毫不比識(shí)別灰度圖差。LHD是基于從人臉灰度圖像中提取出來(lái)的線段圖的,它定義的是兩個(gè)線段集之間的距離,與眾不同的是,LHD并不建立不同線段集之間線段的一一對(duì)應(yīng)關(guān)系,因此它更能適應(yīng)線段圖之間的微小變化。實(shí)驗(yàn)結(jié)果表明,LHD在不同光照條件下和不同姿態(tài)情況下都有非常出色的表現(xiàn),但是它在大表情的情況下識(shí)別效果不好。
(6)支持向量機(jī)(SVM) 的人臉識(shí)別方法
近年來(lái),支持向量機(jī)是統(tǒng)計(jì)模式識(shí)別領(lǐng)域的一個(gè)新的熱點(diǎn),它試圖使得學(xué)習(xí)機(jī)在經(jīng)驗(yàn)風(fēng)險(xiǎn)和泛化能力上達(dá)到一種妥協(xié),從而提高學(xué)習(xí)機(jī)的性能。支持向量機(jī)主要解決的是一個(gè)2分類(lèi)問(wèn)題,它的基本思想是試圖把一個(gè)低維的線性不可分的問(wèn)題轉(zhuǎn)化成一個(gè)高維的線性可分的問(wèn)題。通常的實(shí)驗(yàn)結(jié)果表明SVM有較好的識(shí)別率,但是它需要大量的訓(xùn)練樣本(每類(lèi)300個(gè)),這在實(shí)際應(yīng)用中往往是不現(xiàn)實(shí)的。而且支持向量機(jī)訓(xùn)練時(shí)間長(zhǎng),方法實(shí)現(xiàn)復(fù)雜,該函數(shù)的取法沒(méi)有統(tǒng)一的理論。
人臉識(shí)別的方法很多,當(dāng)前的一個(gè)研究方向是多方法的融合,以提高識(shí)別率。
人臉識(shí)別常用見(jiàn)問(wèn)題解決之道
一、影響人臉識(shí)別技術(shù)的因素及解決方法
測(cè)量人臉識(shí)別的主要性能指標(biāo)有:
1.誤識(shí)率(False;Accept;Rate;FAR):這是將其他人誤作指定人員的概率;
2.拒識(shí)率(False;RejectRate;FRR):這是將指定人員誤作其它人員的概率。
計(jì)算機(jī)在判別時(shí)采用的閾值不同,這兩個(gè)指標(biāo)也不同。一般情況下,誤識(shí)率FAR;隨閾值的增大(放寬條件)而增大,拒識(shí)率FRR;隨閾值的增大而減小。因此,可以采用錯(cuò)誤率(Equal;Error;Rate;ERR)作為性能指標(biāo),這是調(diào)節(jié)閾值,使這FAR和FRR兩個(gè)指標(biāo)相等時(shí)的FAR;或FRR。
二、影響人臉識(shí)別性能的因素及解決方法
(1)背景和頭發(fā):消除背景和頭發(fā),只識(shí)別臉部圖象部分。
(2)人臉在圖象平面內(nèi)的平移、縮放、旋轉(zhuǎn):采用幾何規(guī)范化,人臉圖象經(jīng)過(guò)旋轉(zhuǎn)、平移、縮放后,最后得到的臉部圖象為指定大小,兩眼水平,兩眼距離一定。
(3)人臉在圖象平面外的偏轉(zhuǎn)和俯仰:可以建立人臉的三維模型,或進(jìn)行三維融合(morphing),將人臉圖象恢復(fù)為正面圖象。
(4)光源位置和強(qiáng)度的變化:采用直方圖規(guī)范化,可以消除部分光照的影響。采用對(duì)稱(chēng)的從陰影恢復(fù)形狀(symmteric;shape;from;shading)技術(shù),可以得到一個(gè)與光源位置無(wú)關(guān)的圖象。
(5)年齡的變化:建立人臉圖象的老化模型。
(6)表情的變化:提取對(duì)表情變化不敏感的特征,或者將人臉圖象分割為各個(gè)器官的圖象,分別識(shí)別后再綜合判斷。
(7)附著物(眼鏡、胡須)的影響。
(8)照相機(jī)的變化:同一人使用不同的照相機(jī)拍攝的圖象是不同的。