人脸识别系统源于20世纪,直到计算机技术和光学成像技术发展后才有所提高。20世纪90年时期以美国、德国的技术为主[1],系统能力取决于其关键技术即人脸的识别率以及识别速度。实际生活中,各种安全防御系统遍布我们周围,大到机场出入境登记信息采集[2]、机场安检[3],小到职工考勤系统[4]。虽然人脸识别系统样式千变万化,但其原理归根结底都是利用一种生物特征[5]比对进行识别。实际系统在采集生物特征源数据时,由于受各方面因素制约,例如光照、角度、表情的影响,被采集的人脸照片则呈现出不同质量水平、不同模型。若采用均匀的光照,可以从照片中提取无干扰的人脸特征信息,而使用偏光源则会弱化光线较强一侧所提取的特征。另外,基于不同表情建立的模型其差异性比较大,给后续识别比对工作造成一定的难度。人脸识别系统经历了从模拟相机到数字高清摄像机的升级,其采集的数据源也随之发生了根本性的变化。采集数据量的提升给人脸识别系统的处理能力提出了更高的要求,采集质量的提升则给人脸识别系统提供更大的选择余地。如何在大量的采集数据中挑选出更适合系统识别的数据是当前核心问题,一套合理的评价机制可以提高人脸识别系统输入的质量,提高人脸识别系统识别能力。
1 评价要素拿到一张日常生活中的照片,可以从中看到所拍对象的脸部表情、左右旋转姿态、俯仰旋转姿态、拍摄的清晰度、光照度等各种视觉信息。从这些信息可以直观判断出所拍摄的照片是否适合观察者以此进行个体分析识别。通常,人脸识别系统的采集端尽可能采集大量连续帧照片数据,对这些数据进行分析识别。但随着数据量的增加,许多不满足基本判定条件的照片也消耗了系统的运算时间,降低了系统的识别能力,因此,通过一定的方法从多个方面对其进行排序,选择优质数据送入系统中分析可以提升系统运算能力。
从人脸检测建模角度[6]考虑,采集数据的质量评价由以下几个要素决定:照片清晰度、照片对比度、人脸左右旋转姿态及人脸俯仰旋转姿态。本文主要从量化照片的清晰度及对比度,进行分析排序。
1.1 照片的清晰度照片的清晰度是最重要的指标,也是最难准确衡量的指标。清晰度即肉眼宏观看到的图像的清晰程度,是由系统和设备的客观性能的综合结果造成的人们对最终图像的主观感觉[7]。主要侧重于人脸区域的纹理信息是否明显,特别是人脸、嘴巴、眼睛等主要器官的轮廓,不采用耳朵的轮廓、额头的皱纹等这些不稳定信息。如图 1所示,上面2张照片人脸的颗粒性较强,,便于肉眼对被采集者进行识别,下面2张照片照片的清晰度则较差,肉眼无法清楚识别部分脸部纹理特征,对人眼的识别造成一定难度。
1.2 照片的对比度照片的对比度主要指的是一幅图像中明暗区域最亮的白和最暗的黑之间不同亮度层级的测量,差异范围越大表示二者对比越大,差异范围越小表示二者对比越小。采用的最低对比度是90。从人脸的直方图看,低于这个阈值的人脸灰度等级往往集中在直方图的某一较窄的区域内[8]。从肉眼看,这种人脸照片一般层次感不够,比如过暗或过爆的人脸照片。
如图 2所示,上面2张照片由于光照条件较差,照片中脸部纹理特征丢失较严重,在建模过程中无法对相应部位建模,更造成无法识别。下面2张照片的光照条件明显优于前2张,则其建模的过程中数据无丢失,也不容易造成系统误报,降低系统的误报率。
2 评价模型的建立 2.1 模型分析在实际的照片识别中,经常会碰到各种模糊照片和清晰照片。对于模糊照片来说,它的细节特征已经丢失,无法恢复和提取,但照片中五官的位置关系、轮廓等特征还存在。因此,可以依据这些信息来识别人脸部位的清晰度等要素。而对于清晰照片来说,也可以提取一些更具识别意义的细节特征。
2.2 模型建立由于照片中人脸五官的位置关系、轮廓等具有低频特征,所以本文采用傅里叶变换提取人脸中的低频成分特征,保留了全局性差异。
当照片的清晰度较高时,则人脸部分的颗粒感较强,纹理特征保持连续、跳变情况少。本文按照人脸照片边界连续性以及人脸各部位的纹理特征为考虑因素建模,对各特征部位的灰度点连续性及亮度差异进行考量,根据建模过程中所有特征部位的考量结果给出综合值,从而得到的整个模型的清晰度评价量。
对比度的评价主要是分析照片中黑白部分渐变的层次情况。高对比度的照片,灰度层次感高,肉眼观看更为清晰醒目,色彩艳丽,更利于人眼的主观识别。对照片进行灰度处理,将连续灰度值块统计后,计算其所占像素面积大小。若高低灰度区域面积比越悬殊则其对比度值越高。
实际应用的识别系统应综合考虑计算机建模及人眼评定二者之间的平衡。这里给出经验的照片评价权重公式。
在评价系统获取到照片的清晰度q及对比度∂结果后,利用权重公式给出综合评价结果,排序后对输入数据进行优选。实际使用中由于不同系统的安装条件、光照条件以及人为因素不同,按照各自的经验系数进行调节,本文按照本实际安装系统进行配置。
3 评价的测试结果针对本文所提出的建模及评价方法做软件工程化实现与验证。从实际使用中的安防系统区域随机选取100组安防系统采集的数字高清照片作为测试数据。先对数据源不进行挑选建模并识别得出一组识别结果,然后利用质量评价方法挑选数据源后再建模识别给出另外一组识别结果,最后对本系统的运行结果进行统计,如图 3所示。
如图 3所示,横坐标为测试组序号,纵坐标为每组测试样本与自身匹配结果,1为完全相似。从这组数据统计结果可以看出,经过质量评价后的源数据识别的结果绝大部分相对未挑选的数值要高,识别过程被适量优化。当然,图中也存在少量识别结果低于未挑选的数值,其原因在于实际质量评价存在一定误差,如同人肉眼选择的结果一样,则挑选的误差数据也影响到了系统识别的结果,但此部分数据为可接受误差,并未影响整体结果。
为克服实际评价中存在一定比率的错误数据,收集测试中所有错误数据对建模的过程数据进行分析,发现部分背景区域融合至人脸边缘从而降低了边缘识别[9]的准确性,造成部分清晰度评价较差图片其对比度评价较高,其入选后并不能优化输入数据的作用。后续调整评价参数的权重数据,再次用同样的数据再次进行测试,分析结果发现,在满足绝大部分数据正确的情况下,总存在少量错误数据,即在无法避免错误数据的情况下,只能将权重数据调整至系统准确率最高。
4 结束语提出通过用人脸部纹理、轮廓边缘等特征将照片的清晰度量化,采用照片中灰度区域分析将照片的对比度量化的思路及具体实现方法。给出了一种量化评价采集数据源的方法。从评价测试的结果可以看出,照片的清晰度及对比度是可以具体量化的指标,验证了利用质量因素评价数据源并筛选是可行的。选择角度分别从适合计算机量化以及人眼观察的角度进行评价,数据表明采用这2个指标为照片评价过程的主要因素具有一定客观性、误差性。
对本次测试中的清晰度和对比度数据进行分析,选择对建模过程中影响较大的评价因素清晰度为高权重比,可以提高识别模型的准确率并优化输入端数据,从而降低系统的误报率。当识别结果处于临界状态时,需要人为干预后确认结果,此时质量的另一个评价要素对比度就起到了增强人眼视觉识别的作用。由于选择了高对比度照片提供操作人员进行处理,使人工确认更直观准确,运行结果大部分符合预期,但仍存在小概率的误差不可避免。如何在本文基础上降低误差比率,优化评价环节,是今后工作中需要进一步解决的问题和研究的方向,误差的修正将更好地提升安防系统识别的精度。
该方法实用性较强,由于本次测试中所涉及的数据源来自于实际安防系统中,则测试结果亦可体现本方法在实际应用中起到降低误报率,优化系统性能的作用。
[1] | 唐勇. 人脸识别技术综述[J]. 硅谷, 2011(9): 16-17. |
[2] | 李丹. 人脸检测在机场离港旅客识别系统中的应用研究[D]. 成都: 四川大学, 2005: 10-12. |
[3] | 胡大涛. 人脸识别系统在机场安检中的应用[J]. 科技信息, 2010, 20: 8-12. |
[4] | 高原. 门禁考勤系统中人脸识别的研究[D]. 武汉: 武汉理工大学, 2012: 7-10. |
[5] | 刘欢喜. 人体生物特征的综合分析与应用[D]. 上海: 上海交通大学, 2010: 15-17. |
[6] | 田源, 于凤芹. 人脸检测方法综述[J]. 计算机安全, 2009(5): 14-15. |
[7] | 江昊,何明一. 基于特征约束点的纹理映射算法[J]. 计算机仿真, 2009(1): 25-29. |
[8] | 陈柯, 杜利民, 赵向阳. 基于三角剖分的人脸纹理映射[J]. 微计算机应用, 2007(1): 39-44. |
[9] | 方昱春, 王蕴红, 谭铁牛. 融合人脸轮廓信息和区域信息改进人脸检测[J]. 计算机学报, 2004(4): 56-62. |