新疆位于中国的西北部地区,具有独特的地理位置,少数民族众多,其中维吾尔族属于新疆最大的少数民族,具有独特的面部特征,并且与中亚国家的人脸有着高度的相似面部特征,人脸识别技术的研究对于发展当地的信息处理能力有着很大的帮助,而且其结果会影响到中亚乃至西亚地区,具有很大的意义。人脸识别由于其自然性具有不被个体察觉的特点,一直以来是模式识别和机器视觉领域的研究热点,但人脸容易受到光照、噪声、表情和遮挡等的影响,如何有效获取人脸特征信息一直是人脸识别研究重点[1]。
当前研究表明,对人脸图像的辨识率影响比较大的因素主要是非均匀光照和局部遮挡,尤其是在新疆南部地区,南疆少数民族地区光照强烈并具有面部遮挡的习惯,比如胡须、面纱、帽子、眼镜等自然遮挡物。研究者们为了排除在非均匀光照变化和局部遮挡下的人脸识别问题,提出了其基本方法,即基于局部二值模式(LBP)[2-3]、POEM的人脸识别方法[4]、DCT和2D-PCA相结合的改进算法[5]、加权分块(2D)2PCA方法[6]、Gabor人脸特征提取[7]等识别方法。
以上这些方法虽然具有一定的辨识能力,但是也有不完善之处。基于LBP算法的人脸识别会导致其所获得的LBP直方图二维向量维数过大,计算量也多。单一的POEM融合了其方向和幅值特性,得到了很好的辨识性。但是却忽视了块与块之间的二维像素问题,导致其辨识能力下降。DCT和2D-PCA相融合的改进算法虽然能够很好地储存非均匀光照、局部遮挡等非敏感信息并将识别时间大大缩短,但在特征提取方面的计算量较大;虽然应用(2D)2PCA和图像分块想法得到比较完善的人脸特征信息,但其辨识效果不理想;Gabor人脸特征提取由于其多尺度方向的维数特征过高,导致计算过程比较复杂,因此很难实现实时性和有效性需求在实际中的应用中[8]。
同时也有不同学者提出了不同方法,殷俊等[9]提出基于最近正交矩阵的二维鉴别投影及人脸识别应用;Deng等[10] 提出对光照变化具有较强适应性的PCA(principal component analysis)特征脸,用于人脸特征表示; Y. Chen等[11]提出基于人脸识别的稀疏嵌入式词典学习;何林巍等[12]提出基于POEM_SLPP的人脸识别算法;Z. Chen等[13]提出了一种基于不相关判别稀疏保留投影的人脸识别方法;J.Lu等[14]提出基于图像集人脸识别的并行特征与字典学习;S.Guo等[15]提出基于卷积神经网络和支持向量机的人脸识别。
鉴于以上工作,本文提出了二维离散余弦变换(2DDCT)与方向边缘幅值模式(POEM)相融合的维吾尔族人脸识别算法,将二维离散余弦变换与方向边缘幅值模式相互充分结合,在得到人脸梯度图像的幅值和方向信息时考虑了非均匀光照与局部遮挡对维吾尔族人脸图像整体像素的影响,使获得的梯度信息更能反映维吾尔族人脸图像的本质特征,从而有效克服了光照和局部遮挡对人脸识别的影响,提取出的特征占用空间小,提高了识别率,通过特征融合方法,增加了特征丰富度,解决了利用单一类型特征识别率不高的问题。
1 方向边缘幅值算法描述假定一幅二维人脸图像
$\left\{ \begin{array}{l}{G_x}\left( {x,y} \right) = I\left( {x,y} \right) - I\left( {x - 1,y} \right)\\{G_x}\left( {x,y} \right) = I\left( {x,y} \right) - I\left( {x,y - 1} \right)\end{array} \right.$ | (1) |
式中:
$\left\{ \begin{aligned}& G\left( {x,y} \right) = \sqrt {{G_x}{{\left( {x,y} \right)}^2} + {G_y}{{\left( {x,y} \right)}^2}} \\ & O\left( {x,y} \right) = \arctan \frac{{{G_y}\left( {x,y} \right)}}{{{G_x}\left( {x,y} \right)}}\end{aligned} \right.$ | (2) |
POEM提取人脸特征的步骤如下:
1) 给定一幅二维人脸图像,计算其梯度图,即得到每个像素点的梯度图和方向图。二维人脸图像像素点的梯度方向为
2) 将以像素点
3) 对每个阶段的中心二维像素点构建最后的POEM直方图,以中心二维像素点为核心的Cell块与别的二维像素点的Cell块来估算。
4)对每一个梯度方向,编码过程是以中心二维像素点块为核心,与圆周内的其余二维像素点块进行如下计算。
在一个直径为
${\rm{POEM}}_{R,w,n}^{{\theta _i}}\left( q \right) = \sum\limits_{j = 1}^n {f\left( {S\left( {I_q^{{\theta _i}},I_{{c_j}}^{{\theta _i}}} \right)} \right){2^j}} $ | (3) |
式中:
然后将该固有特征点
${\rm{POEM}}_{R,w,n}\left( q \right) = \left\{ {{\rm{POEM}}_{R,w,n}^{{\theta _1}}, \cdots ,{\rm{POEM}}_{R,w,n}^{{\theta _m}}} \right\}$ | (4) |
这样就可以获得每个二维像素点的POEM特征值。
2 2DDCT算法描述一幅
${B_{p,q}} = {a_p}{a_q}\sum {\sum {{A_{mn}} \cos \frac{{{\text{π}} \left( {2m + 1} \right)p}}{{2M}}} } \cos \frac{{{\text{π}} \left( {2n + 1} \right)q}}{{2N}}$ | (5) |
式中:
2DDCT是一种可逆的变换,它的逆变换为
${A_{mn}} = \sum {\sum {{a_p}{a_q}{B_{p,q}}\cos \frac{{{\text{π}} \left( {2m + 1} \right)p}}{{2M}}\cos \frac{{{\text{π}} \left( {2n + 1} \right)q}}{{2N}}} } $ | (6) |
离散余弦变换的特点:当二维频率域改变因子
经过POEM与2DDCT融合算法后得到维吾尔族人脸纹理特征信息后,采用深度学习算法构建人脸分类器。深度学习算法是基于传统神经网络学习的一种全新算法,很好解决了其传统神经网络算法的固有缺陷,即局部极小性在机器学习领域掀起了学习热潮,并引起了广泛关注[20]。
深度学习算法网络本质就是将几个深度置信网络叠加,每个深度置信网络的可视层
在训练的程序中,将可视向量二维值反映给隐元素单元,即可视元素单元由隐藏层元素单元重新构建,把新的可视元素单元再次反映给隐藏层元素,就产生了新的隐藏层元素,继而使用结合分布概率阐述输入二维向量
$\begin{array}{c} P\left( {{{x}},{{{g}}^1},{{{g}}^2}, \cdots ,{{{g}}^l}} \right) = \\P\left( {{{x}}\left| {{{{g}}^1}} \right.} \right)P\left( {{{{g}}^1}\left| {{{{g}}^2}} \right.} \right) \cdots P\left( {{{{g}}^{l - 2}}\left| {{{{g}}^{l - 1}}} \right.} \right)P\left( {{{{g}}^{l - 1}}\left| {{{{g}}^l}} \right.} \right)\end{array}$ | (7) |
式中
$\left\{ \begin{array}{l}P\left( {{{{g}}^i}\left| {{{{g}}^{i + 1}}} \right.} \right) = \prod\limits_{j = 1}^{{n^i}} {P\left( {{{g}}_j^i\left| {{{{g}}^{i + 1}}} \right.} \right)} \\P\left( {{{g}}_j^i = 1\left| {{{{g}}^{i + 1}}} \right.} \right) = {\rm{sigm}}\left( {b_j^i + \sum\limits_{k = 1}^{{n^{i + 1}}} {{{W}}_{kj}^i{\rm{ }}{{g}}_k^{i + 1}} } \right)\end{array} \right.$ | (8) |
式中:
预训练过程结束后,就要进行微调解训练。依照其输入信息和重构信息损耗函数的关联程度网络二维参数进行微调解,使损耗函数尽可能地减少到最小,损耗函数的公式为
$L\left( {{{x}} - {{x}}'} \right) = \left\| {\left. {{{x}} - {{x}}'} \right\|} \right._2^2$ | (9) |
式中:
维吾尔族人脸在光照以及部分遮挡下识别率会下降并且鲁棒性会变差,因此提出了二维离散余弦变换(2DDCT)与方向边缘幅值模式(POEM)相结合的维吾尔族人脸识别方法。具体识别步骤如下。
1) 将训练样本维吾尔族人脸图像规划为
2) 对规划的所有子块的维吾尔族人脸图像进行2DDCT变换,将构建到的2DDCT变换系数的左上角10个系数进行存留,并进行二维离散余弦逆变换得到重构的维吾尔族人脸图像。
3) 对所有的训练样本维吾尔族人脸图像进行步骤1)、2)的处理后,将重构的维吾尔族人脸图像构建成一个正方形块,将正方形块分割成A、B、C、D 4个区域,通过计算POEM特征的过程,得到相应区域的维吾尔族人脸图像的POEM直方图。
4) 按照A到D的次序过程,将所有范围内的直方图级联在一起,作为该中心特征点的POEM固有纹理直方图。
5) 在训练阶段的人脸特征点
$\overline {{\rm{POEM}}{_{L,w,n}}\left( q \right)} = \frac{1}{M}\sum\limits_{i = 1}^M {{\rm{POEM}}{_{L,w,n}}\left( q \right)}$ | (10) |
由此,
6) 最后利用深度学习算法求得样本所属类别。
本文算法的具体流程如图1所示。
Download:
|
|
在这部分实验中,使用了课题组成员自己收集并自建的光照下的100幅男性维吾尔族人脸图像数据库,其维吾尔族人脸图像均来自新疆不同地区、不同年龄段、不同性别,具有典型的代表性。在实验中选取20幅图像作为训练样本,其余为测试图像,如图2所示。
Download:
|
|
从图3、表1中的识别率可以看到,本文算法对维吾尔族人脸数据库的识别达到了很高的效果,识别率也比传统的识别算法具有很大的提升,因为维吾尔族人脸图像的全局特征和局部特征比较明显,因此该算法很适合识别维吾尔族人脸。
Download:
|
|
本文采用了局部遮挡下自建的维吾尔族人脸自建数据库,包含戴墨镜、戴围巾和胡子。选取了120幅遮挡下的维吾尔族人脸,将含有30幅戴墨镜、30幅戴围巾、30幅有胡子的维吾尔族人脸作为训练样本,其余的作为测试样本。在局部遮挡下的维吾尔族人脸实验中,设不确定的遮挡因素占据整个脸部的10%~20%,确定因素即墨镜大概占据了整个脸部的30%左右,围巾大概占据了整个脸部的40%左右,胡子加墨镜大概占据了整个脸部的50%左右,口罩大概占据了45%左右。本文中采用了部分维吾尔族人脸加以实验,如图4所示。
Download:
|
|
从图5、表2中的识别率效果来看,本文所提出的算法在局部遮挡下的维吾尔族人脸自建数据库中的实验识别率最好。当遮挡率的面积在10%左右时,除了2DDCT算法剩下的3个算法识别率都达到了90%以上;遮挡率在20%~30%时候,基于2DDCT算法识别率下降到了70%左右,而DCT+LDA算法和DCT+PCA算法的识别率也相应地下降到了90%以下,本文所提出的算法识别率依然很高,仍然在90%以上;当遮挡率在40%左右时候,除了本文所提出的算法识别率仍然在90%以上之外,其他3个算法其识别率下降都比较快;最后遮挡率在50%左右时候,可以看到,本文所提出的算法识别率高居榜首,在87.2%,而其余3个算法均低于60%。由此可见,本文所提出的算法在局部遮挡下的维吾尔族人脸自建数据库的实验中,具有很强的鲁棒性。
Download:
|
|
基于运算速度考虑,在AMD A6-3420M APU 2.4 GHz的CPU,4 GB内存的计算机上,利用MATLAB R2010a软件进行了本文算法、DCT+LDA算法、2DDCT算法及DCT+PCA算法在非均匀光照变化下与经过遮挡的维吾尔人脸自建数据库下的人脸识别的处理运算速度的对比。实验中,采用了100,
Download:
|
|
由图6、表3中的数据显示,本文所提出的算法在计算机运行上有很大程度的提高,比DCT+LDA算法的速度提升了71.8%,比2DDCT算法速度提升了69%,比DCT+PCA算法速度提升了57%。这说明,本文提出的算法在自建维吾尔族人脸库上的运行时间有很大的优势,很大程度上缩短了时间。
本文通过研究非均匀光照与局部遮挡因素干扰维吾尔族人脸识别效果,影响维吾尔族人脸的特征提取效率和维吾尔族人脸识别正确率的问题,提出了二维离散余弦变换(2DDCT)与方向边缘幅值模式(POEM)相结合的维吾尔族人脸识别方法。本算法很好地降低了维吾尔族人脸图像所需的特征维数,进一步缩短了计算量,并获得了维吾尔族人脸的纹理特征信息,最后采用深度学习算法进行分类识别。实验表明,本文算法在提高维吾尔族人脸有很高的识别率,鲁棒性强,拥有很好的优势。在今后的工作中,将就维吾尔族人脸在非均匀光照和局部遮挡方面做进一步研究,以便提高其辨识率。
[1] | LU Jiwen, WANG Gang, DENG Jie. Simultaneous feature and dictionary learning for image set based face recognition[J]. IEEE transactions on image processing, 2017, 26(8): 4042-4054. DOI:10.1109/TIP.2017.2713940 (0) |
[2] | AHONEN T, HADID A, PIETIKAINEN M. Face description with local binary patterns: application to face recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2006, 28(12): 2037-2041. DOI:10.1109/TPAMI.2006.244 (0) |
[3] |
周汐, 曹林. 分块LBP的素描人脸识别[J]. 中国图象图形学报, 2015, 20(1): 50-58. ZHOU Xi, CAO Lin. The sketch face recognition combining with AdaBoost and blocking LBP[J]. Journal of image and graphics, 2015, 20(1): 50-58. DOI:10.11834/jig.20150106 (0) |
[4] | VU N S, DEE H M, CAPLIER A. Face recognition using the POEM descriptor[J]. Pattern recognition, 2012, 45(7): 2478-2488. DOI:10.1016/j.patcog.2011.12.021 (0) |
[5] | ZHANG Haiyang. Face recognition based on DCT and PCA[M]//WAN Xiaofeng. Electrical Power Systems and Computers. Berlin, Heidelberg, 2011: 451–455. (0) |
[6] | SONG Haifeng, CHEN Guangsheng, WEI Hairong, et al. The improved (2D)2 PCA algorithm and its parallel implementation based on image block[J]. Microprocessors and microsystems, 2016, 47: 170-177. (0) |
[7] | BHAT F A, WANI M A. Gabor wavelet based face recognition under varying lighting, pose and expression conditions[C]//Proceedings of the 2nd International Conference on Computing for Sustainable Global Development. New Delhi, Indi, 2015: 1314–1318. (0) |
[8] | GAO Xiaojing, XUE Heru, PAN Xin, et al. Mongolia nationality face recognition based on G(2D)2PCA and SVM Classification[C]//Proceedings of the 4th International Conference on Information Science and Control Engineering. Changsha, China, 2017: 461–465.) (0) |
[9] |
殷俊, 孙仕亮. 基于最近正交矩阵的二维鉴别投影及人脸识别应用[J]. 计算机辅助设计与图形学学报, 2017, 29(8): 1457-1464. YIN Jun, SUN Shiliang. Two dimensional discriminative projection based on nearest orthogonal matrix and its application to face recognition[J]. Journal of computer-aided design & computer graphics, 2017, 29(8): 1457-1464. (0) |
[10] | DENG Weihong, HU Jiani, LU Jiwen, et al. Transform-invariant PCA: A unified approach to fully automatic faceAlignment, representation, and recognition[J]. IEEE Transactions on pattern analysis and machine intelligence, 2014, 36(6): 1275-1284. DOI:10.1109/TPAMI.2013.194 (0) |
[11] | CHEN Yefei, SU Jianbo. Sparse embedded dictionary learning on face recognition[J]. Pattern recognition, 2017, 64: 51-59. DOI:10.1016/j.patcog.2016.11.001 (0) |
[12] |
何林巍, 黄福珍. 基于POEM_SLPP的人脸识别算法[J]. 计算机应用研究, 2017, 34(6): 1896-1899. HE Linwei, HUANG Fuzhen. Face recognition algorithm based on POEM_SLPP[J]. Application research of computers, 2017, 34(6): 1896-1899. (0) |
[13] | CHEN Zhanwei, HUANG Wei, LV Zhihan. Towards a face recognition method based on uncorrelated discriminant sparse preserving projection[J]. Multimedia tools and applications, 2017, 76(17): 17669-17683. DOI:10.1007/s11042-015-2882-0 (0) |
[14] | Lu J, Liong V E, Wang G, et al. Joint feature learning for face recognition[J]. IEEE transactions on information forensics and security, 2017, 10(7): 1371-1383. (0) |
[15] | GUO Shanshan, CHEN Shiyu, LI Yanjie. Face recognition based on convolutional neural network and support vector machine[C]//Proceedings of IEEE International Conference on Information and Automation. Ningbo, China, 2017: 1787–1792. (0) |
[16] | DING Changxing, CHOI J, TAO Dacheng, et al. Multi-directional multi-level dual-cross patterns for robust face recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2016, 38(3): 518-531. DOI:10.1109/TPAMI.2015.2462338 (0) |
[17] | DA MARSICO M, NAPPI M, RICCIO D, et al. Robust face recognition for uncontrolled pose and illumination changes[J]. IEEE transactions on systems, man, and cybernetics: systems, 2012, 43(1): 149-163. (0) |
[18] | KUSUMA G P, CHUA C S. PCA-based image recombination for multimodal 2D + 3D face recognition[J]. Image and vision computing, 2011, 29(5): 306-316. DOI:10.1016/j.imavis.2010.12.003 (0) |
[19] | BENGHERABI M, MEZAI L, HARIZI F. 2DPCA-based techniques in DCT domain for face recognition[J]. International journal of intelligent systems technologies and applications, 2009, 7(3): 243-265. DOI:10.1504/IJISTA.2009.027108 (0) |
[20] | FANG Bingwu, HUANG Zhiqiu, LI Yong, et al. υ-Support vector machine based on discriminant sparse neighborhood preserving embedding [J]. Pattern analysis and applications, 2017, 20(4): 1077-1089. DOI:10.1007/s10044-016-0547-x (0) |
[21] | BENGIO Y. Learning deep architectures for AI[J]. Foundations and trends in machine learning, 2009, 2(1): 1-127. (0) |