扩展功能
文章信息
- 程文冬, 付锐, 张文霞
- CHENG Wen-dong, FU Rui, ZHANG Wen-xia
- 动态光照下驾驶人面部特征识别算法与试验研究
- Algorithm and Experimental Research of Driver's Face Feature Recognition under Dynamic Illumination
- 公路交通科技, 2014, 31(10): 97-103,118
- Journal of Highway and Transportation Research and Denelopment, 2014, 31(10): 97-103,118
- 10.3969/j.issn.1002-0268.2014.10.016
-
文章历史
- 收稿日期:2013-10-29
2. 西安工业大学 机电工程学院, 陕西 西安 710032
2. School of Mechatronic Engineering, Xi'an Technological University, Xi'an Shaanxi 710032, China
基于机器视觉的驾驶人面部监测与预警是车辆主动安全技术领域中的一个热点研究方向[1]。眼睛、鼻孔、嘴巴等面部特征的识别是进行驾驶人面部监测的重要途径,可推导出驾驶人的注视方向、面部表情、头部姿态等,进而判断驾驶人的驾驶意图、疲劳与精神分散等状态[2]。如何从大量的视频信息中快速准确定位面部特征是判断驾驶人状态的关键问题之一。
面部特征识别的算法基础主要包括机器学习分类器与人脸先验性稳定特征。常见的机器学习分类器有支持向量机(Support Vector Machine,SVM)、高斯混合模型(Gaussian Mixture Model,GMM)、人工神经网络(Artificial Neural Net,ANN)等。机器学习须在大量的样本基础上提取相关特征向量,建立合理的数学模型进行特征训练,最终实现目标的估计与分类。国内外很多学者在特征提取与训练算法上进行优化改进[3,4]、在模型关键参数方面进行设计研究[5],旨在降低计算复杂度,提高识别能力。此类方法对固定姿态的面部特征识别具有精度与速度优势,但共同的问题是对头部姿态与面部表情容忍度较差,正负样本的数量大,计算与训练复杂。
人脸具有很多先验性稳定特征,如五官位置关系、肤色纹理、灰度值分布等,通过建立相应的阈值分割规则能够识别面部特征[6,7]。由于此类方法不需要样本的训练学习,目标信息的冗余度较低,因此算法结构更为简单,运算开销较小,实时监测速度快,对面部表情与头部姿态的容忍度较高。但此类方法对光照条件较为敏感,复杂环境中阈值分割的自适应性较差。
任何一种特征识别方法都必须考虑光照条件。例如文献[8]采用光照子空间方法,建立了各种光照条件下的训练样本以适应光照变化,成倍增加了算法的时间复杂度;而人脸先验性特征通常是基于图像的亮度和颜色获得的,实时监测中难以保证特征阈值的自适应性[9]。国内外文献多针对稳定理想的光照与背景环境识别面部特征,或针对标准人脸数据库测试算法的鲁棒性[10],这与实际驾驶场景中的人脸监测存在较大差距。
考虑到驾驶室的光照复杂性与人脸监测的实时性要求,本文利用驾驶人视频相邻帧的连续性和相关性,建立了具有光照自适应的卡尔曼滤波算法与HSI空间模型阈值分割算法,旨在有效克服动态光照与背景变化对驾驶人眼睛、鼻孔等特征的干扰,以此建立眼鼻特征的搜索模型。最后在不同的光照与头部姿态下进行了眼鼻特征识别试验,检验融合算法的鲁棒性能。 1 考虑光照的肤色分割模型 1.1 照度E
光照强度E(简称照度)是图像采集与目标识别的重要影响参数,用于描述光照的强弱和物体表面被照明的程度。我国主要地区的日间室外照度通常划分为五个级别,如表 1所示。
| E/(×104 lx) | 8~10 | 6~8 | 4~6 | 2~4 | 0.1~2 |
|
参考 环境 | 晴朗, 阳光直射 | 少云, 明亮 | 多云, 较明亮 | 多云, 阴天 | 阴雨, 傍晚 |
人的皮肤色度分布比较集中,具有良好的聚类性。如果将图像中光照分量进行提取与去除,则可以通过肤色特征识别人脸区域[11]。Chaves-González[12]等人在AR人脸数据库中测试了RGB,HSI,YCbCr等多类色彩空间的肤色分割能力,发现HSI空间对肤色分割效果最好。HSI色彩空间模型如图 1所示,色度H(Hue)描述基本颜色,为光谱波长分布的波峰位置;饱和度S(Saturation) 测量颜色纯度,表示白光和色调的混合量;明度I(Intensity)表示各像素的亮度值。HSI模型可由标准图片中红、绿、蓝三原色通道R,G,B的强度值进行转换,算法见式(1):
|
| 图1HSI色彩空间模型 Fig. 1 HSI color space model |

图 2的上排为驾驶人图像的H,S,I通道分量,下排为3D灰度分布,可发现HSI空间各分量之间是相互独立的,能够将图像中与光照关系密切的明度I分量分离出来,充分发挥肤色的聚类特性分割面部区域,简化图像分析和处理的工作量。
|
| 图2 HSI通道与3D灰度分布 Fig.2 Channels of HSI and GV-3D distribution |
通过图 3(a)H通道灰度直方图可见,肤色的灰度区间为3~35,具有显著的聚类性。依此得到的肤色分割结果如图 3(b)所示。由于车内背景中的类肤色区域(如米黄色顶棚和座椅)与人脸肤色构成了色度上的重叠,因此大面积的类肤色背景被误检为肤色区域,且各区域间存在多处联通,难以在实际检测中实现准确的面部分割。
|
| 图3 肤色区域分割 Fig.3 Segmentation of skin region |
针对上述问题,本文通过设计一种适应光照变化的分割算法首先去除动态背景,分割出驾驶人的前景区域,再根据HSI色彩模型建立阈值分割算法实现驾驶人肤色分割与面部特征识别。 2 AKF背景分割算法
卡尔曼滤波(Kalman Filtering,KF)是基于最优化自回归数据的预测算法,能够从一系列离散时间的测量中估计动态系统的状态,在进行背景估计与分割中得到了广泛地应用,学者们在KF基础上设计了多种非线性次优滤波器。KF或扩展KF的理想前提条件为高斯噪声,而现实场景中噪声通常是非高斯的,故KF在实际应用中存在一些不足[13]:如系统模型和观测模型建立条件比较苛刻,易导致KF滤波发散或精度下降;传感器或光照条件变化时会由于数据突变产生野值,影响滤波器的收敛性。行驶中车内由于光照变化会产生的大量伪前景与噪声,具有光照自适应的改进卡尔曼滤波(Adaptive Kalman Filtering,AKF) 算法[14]是克服光照变化的一种有效手段。
由于相邻视频帧的驾驶室背景与光照变化是微小的,故本文在Kalman滤波理论基础上进行背景的逐帧递归预测以及自适应更新,背景分割算法见式(2):


联立式(2)、式(3)可知:第t帧图像Imaget(i,j)值越接近Vt(i,j),对应的自适应算子Gt(i,j)值越大,该点越有可能为背景像素。
由第t+1帧图像Imaget+1 (i,j)与背景图像Bt+1(i,j)进行求差运算与阈值控制,得到驾驶人前景图像Ft+1(i,j),该算法见式(4),其中T为设定阈值。最终分割出驾驶人前景图像如图 4所示。

|
| 图4 驾驶人区域 Fig.4 Region of driver |
基于高斯概率密度的AKF算法能有效抑制背景因素的干扰,最大程度上减小面部肤色区域的搜索任务,增加面部检测的准确率。本文以此为基础制定了基于AKF-HSI算法的眼睛鼻孔识别流程,见图 5。
|
| 图5 基于AKF-HSI的眼鼻特征识别流程 Fig.5 Flowchart of eye-nostril feature recognition |
由于眼睛、鼻孔、嘴巴等区域的色度、面积与几何形状具有阈值稳定性,各区域之间具有特定的位置关系,故本文在HSI空间模型中建立肤色阈值分割算法与眼鼻坐标搜索模型。 3.1 肤色阈值分割算法
在图 4中可发现由AKF分割的驾驶人前景区域存在一定面积的伪前景,其色度H分布明显不同于肤色,因此可通过色度H阈值与面积阈值的双项控制去除伪前景区域,算法见式(5):

|
| 图6 面部区域Rface的分割 Fig.6 Segmentation of face region Rface |
驾驶过程中眼睛、鼻孔的几何形态较为稳定,灰度值很低(近似于黑色)且具有明显的聚类性,抵抗光照干扰的能力较强。相比而言,眉毛与嘴唇的几何形态与HSI各通道阈值离散性较大。另外在转头姿态中,眉毛很可能与头发发生区域联通而难以完整分割,因此本研究将更为稳定的眼睛与鼻孔作为识别对象。具体识别步骤如下:
(1)通过统计设定阈值I(i,j)∈[0,57],获得眼鼻粗区域,其3D灰度分布如图 7所示。
|
| 图7 3D灰度分布 Fig.7 GV-3D distribution |
(2)建立眼鼻粗区域的X-Y平面坐标系,如图 8所示。坐标系中存在7个独立小区域Rlip,Rnose1,Rnose2,Reye1,Reye2,Rbrow1与Rbrow2,分别对应嘴唇,左右鼻孔,左右眼睛与左右眉毛。
|
| 图8眼鼻特征坐标系 Fig.8 Coordinate system of eye-nostril feature |
(3)Rlip~Rbrow2区域中心坐标值分别以灰度质心(Gx,Gy)来表示,算法见式(6)。其中fR(x,y)为各区域的灰度值。

(4)根据五官的相对位置关系,嘴唇Rlip,鼻孔Rnose,眼睛Reye与眉毛Rbrow中心x坐标值为降序。右眼Reye2、右鼻孔Rnostril2、左鼻孔Rnostril1与左眼Reye1中心y坐标值也为降序。因此对Rlip~Rbrow2这7个区域进行x坐标值的降序纵向搜索。再对纵向搜索中x值排名2~5的区域进行y坐标值降序横向搜索,可定位眼睛与鼻孔坐标。眼鼻坐标的搜索模型如表 2所示。
| 纵向 搜索 | x值排名 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 特征 | Rlip | Rnostril | Reye | Rbrow | ||||
| 横向 搜索 | y值排名 | 1 | 2 | 3 | 4 | |||
| 特征 | Reye2 | Rnostril2 | Rnostril1 | Reye1 | ||||
为检验AKF-HSI算法在实际驾驶环境中的有效性与鲁棒性,本试验在不同光照下采集驾驶人的视频图像。数据采集重点考虑以下几个方面:
(1)驾驶人的肤色、面部特征等存在较大的个体差异,测试者的选择应具有一定的普遍性。
(2)为了测试算法对动态光照的适应性能,图像数据应涵盖日间驾驶的光照范围。
(3)驾驶中最常见的头部姿态是左右转动(主要是驾驶人观察外后视镜),头部左右转动姿态对眼鼻识别的影响很大,试验应予以考虑。
(4)摄像装置应获取尽量充分的面部信息,同时不应遮挡驾驶人的正常视野。
基于上述考虑,本文制定试验方案见表 3。
| 计算机 |
| ||||
| 照度仪型号 | TES1332A | ||||
| 摄像头安装 | 仪表盘内,约25°仰视拍摄面部区域 | ||||
| 视频参数 | 640×480像素,帧率20 fps | ||||
| 试验地点 | 露天的道路环境,无建筑与树木遮挡 | ||||
| 试验时间 | 15∶00—18∶30(照度范围:1×104~10×104 lx) | ||||
| 测试人员 | 5男3女,不同肤色,不佩戴眼镜 | ||||
| 规定动作 | 注视左视镜→注视前方→注视右视镜 |
试验制定了kfrontground,kskin和δ三个指标来评价AKF-HSI融合算法对眼鼻的识别能力,如式(7)所示。kfrontground和kskin分别表示驾驶人前景区域和面部肤色区域占整幅图像面积的比值,波动越小表示分割效果越稳定。δ表示眼鼻识别率。

不同照度的驾驶人前景分割率kfrontground、肤色分割率kskin与眼鼻识别率δ见图 9。
|
| 图9 不同照度下的kfrontground,kskin和δ Fig.9 kfrontground,kskin and δ under different illuminancies |
各类照度与头部姿态下眼鼻识别的正确结果见图 10。按照头部转动姿态将所有图像划分为十类,分别进行眼鼻识别测试统计,得到头部姿态、照度E与δ的关系见图 11。
|
| 图10 识别结果 Fig.10 Recognition result |
|
| 图11 不同头部姿态下的眼鼻识别率δ Fig.11Curves of eye-nostril recognition rate δ in different head poses |
(1)驾驶人前景分割:在E=4×104~10×104 lx区间,前景分割率kfrontground波动量小于10%,背景分割效果良好。在低照度区间(0<E<40×103 lx),AKF算法总能够完整提取实际的驾驶人区域,但越来越多的伪前景(包括顶棚的阴影区和车窗区域)被分割为驾驶人前景,对后续肤色分割产生了不利影响,如图 12所示。
|
| 图12驾驶人前景分割(单位:×104 lx) Fig.12 Segmentation of frontground region of driver(unit:×104 lx) |
(2)面部肤色分割:在E=2×104~10×104 lx内肤色分割率kskin波动量小于5%。对比图 9(a)和图 9(b)会发现,虽然低照度区间内驾驶人前景的分割准确度下降严重,但后续的肤色分割率kskin一直保持较稳定状态。这是由于HSI空间可以剔除光照分量,再通过阈值分割算法克服了伪前景增长带来的负面影响。可见在照度E大范围变化时,AKF-HSI融合算法具有稳定的面部识别能力。
(3)眼鼻识别率δ:由图 9(c)可知E=2×104~8×104 lx区间的识别率δ处于较高水平,达到85%~92%,而在E<2×104 lx时δ下降且离散严重。另外δ并不随照度升高而单调递增,照度过高(E=8×104~10×104 lx)反而致使δ下降约4%。影响眼鼻识别率δ的因素主要有以下几点:①照度过低引起肤色区域全局的灰度下降严重,导致眼鼻搜索失败,见图 13(b),(c)。②头部转角越大δ越小。由图 11可知注视右视镜时头部转角最大,眼鼻特征更容易发生自遮挡而无法识别,见图 13(b),(c)。③头部转动过快引起眼鼻灰度离散、区域面积扩大或相互联通,导致眼鼻定位不准确或失败,见图 13(d)。④照度过高会降低眼鼻识别率。这是由于硬件设备的自动增益控制(Automatic Gain Control,AGC)特性与照度E非线性相关,因此HSI各分量在光照过强或过弱的情况下均会发生畸变,导致眼鼻的误检或漏检。AKF-HSI融合算法的关键环节及影响因素见图 14。
|
| 图13 失败的识别案例 Fig.13 Examples of failure recognition |
|
| 图14 AKF-HSI关键环节及影响因素 Fig.14 Key links of AKF-HSI and influencing factors |
(4)处理速度:各帧图像的眼鼻识别时间在78~106 ms之间,具有较好的实时性,有利于特征目标的后续处理与计算。 5 结论
识别驾驶人眼鼻特征是估计头部姿态、判断驾驶行为意图的重要基础。本文针对实际驾驶环境中动态光照的影响,提出了基于AKF背景分割与HSI空间阈值分割的眼鼻识别算法。AKF算法从全局意义上进行驾驶人前景区域的有效分割,克服驾驶室背景干扰的同时缩小了眼鼻目标的搜索范围。在HSI空间进行肤色区域分割与面部特征阈值控制,最终建立眼鼻坐标搜索模型。试验表明AKF-HSI算法对驾驶人面部肤色区域具有稳定的识别能力,在10×104 lx≥E≥4×104 lx照度下眼鼻特征识别率较高,达到85%以上。照度过低(E<2×104 lx)、头部转动过快以及转角过大时的眼鼻识别率较低,需要进一步开展后续研究。
| [1] | 李克强.汽车技术的发展动向及我国的对策[J].汽车工程,2009,31(11):1005-1016. LI Ke-qiang. Development Trend of Automotive Engineering and Countermeasure in China[J]. Automotive Engineering, 2009,31(11): 1005-1016. |
| [2] | 程文冬,付锐,袁伟,等.驾驶人疲劳监测预警技术研究与应用综述[J].中国安全科学学报,2013,23(1):155-160. CHENG Wen-dong,FU Rui,YUAN Wei,et al. Overview of Researches on Driver Fatigue Monitoring and Prewarning Technologies and Their Applications[J].China Safety Science Journal,2013,23(1):155-160. |
| [3] | GHARAVIAN D,SHEIKHAN M,ASHOFTEDEL F, et al. Emotion Recognition Improvement Using Normalized Formant Supplementary Features by Hybrid of DTW-MLP-GMM Model[J]. |
| [4] | KHAN N M, KSANTINI R, AHMAD I S,et al. A Novel SVM+NDA Model for Classification with an Application to Face Recognition[J]. |
| [5] | ZHOU Xiao-fei,JIANG Wen-han,TIAN Ying-jie, et al. Kernel Subclass Convex Hull Sample Selection Method for SVM on Face Recognition [J]. Neurocomputing, 2010,73(10-12):2234-2246. |
| [6] | 郭克友,张春雨.基于视觉的驾驶人疲劳及注意力监测方法[J].公路交通科技,2010,27(5):104-109. GUO Ke-you, ZHANG Chun-yu.A Surveillance Method for Driver's Fatigue and Attention Based on Machine Vsion[J]. Journal of Highway and Transportation Research and Development, 2010,27(5):104-109. |
| [7] | VALENTI R,SEBE N,GEVERS T.Combining Head Pose and Eye Location Information for Gaze Estimation[J]. |
| [8] | 苏宏涛,张艳宁,王晶,等.光照变化条件下的人脸识别研究[J].西北工业大学学报,2004,22(4):426-430. SU Hong-tao,ZHANG Yan-ning,WANG Jing, et al. Face Recognition under Varying Illumination[J]. Journal of Northwestern Polytechnical University, 2004,22(4):426-430. |
| [9] | JIA Ming-xing,XU Heng-yuan,WANG Fei.Research on Driver's Face Detection and Position Method Based on Image Processing[C]//Proceedings of the 2012 24th Chinese Control and Decision Conference.Taiyuan:IEEE,2012:1954-1959. |
| [10] | OMIDYEGANEH M, JAVADTALAB A,SHIRMOHAMMADI S. Intelligent Driver Drowsiness Detection through Fusion of Yawning and Eye Closure[C]//2011 IEEE International Conference on Virtual Environments, Human-Computer Interfaces and Measurement Systems. Ottawa: IEEE , 2011:18-23. |
| [11] | 王晶,苏光大.确定区域的人脸彩色传递[J].光电子·激光,2010,21(1):116-119. WANG Jing,SU Guang-da.Face Color Transfer for Specified Image Region[J].Journal of Optoelectronics·Laser,2010,21(1):116-119. |
| [12] | CHAVES-GONZLEZ J M,VEGA-RODRGUEZ M A, GMEZ-PULIDO J A,et al. Detecting Skin in Face Recognition Systems:A Colour Spaces Study[J]. |
| [13] | 符拯,王书满,刘丙杰.自适应卡尔曼滤波的最新进展[J].战术导弹技术,2009(6):62-66. FU Zheng,WANG Shu-man,LIU Bing-jie.An Overview of the Development of Adaptive Kalman Filtering[J].Tactical Missile Technology,2009(6): 62-66. |
| [14] | VENKATARAMAN V,FAN Guo-liang,HAVLICEK J P,et al.Adaptive Kalman Filtering for Histogram based Appearance Learning in Infrared Imagery [J]. |
| [15] | 李文光,韩萍,吴仁彪.一种改进的卡尔曼滤波背景减除方法[J].信号处理,2009,25(8A):274-279. LI Wen-guang,HAN Ping,WU Ren-biao.An Improved Background Subtraction Algorithm Based on Kalman Filtering[J].Signal Processing,2009,25(8A):274-279. . |
2014, Vol. 31
