文章信息
- 罗瑞奇, 钟忺, 钟珞, 李琳
- LUO Ruiqi, ZHONG Xian, ZHONG Luo, LI Lin
- 一种改进Haar-like特征的车辆识别算法
- A Vehicle Identification Algorithm Based on Improved Haar-Like Feature
- 武汉大学学报(理学版), 2018, 64(3): 244-248
- Journal of Wuhan University(Natural Science Edition), 2018, 64(3): 244-248
- http://dx.doi.org/10.14188/j.1671-8836.2018.03.007
-
文章历史
- 收稿日期:2016-05-19
车辆是视频监控的主要对象,车辆的自动识别对智能交通管理起着极大的作用,如车流量的统计,车辆违章检测,车辆的追踪等.国内外对车辆的识别检测相当关注,这方面的研究已有不少.对车辆进行识别检测的基础是特征提取,目前对于车辆特征提取主要有PCA(principal component analysis),小波,Gabor滤波器,Haar-like等方法.文献[1, 2]分别介绍了基于PCA进行特征提取并实现车辆识别和灰度特征提取的ASM(active shape model)改进算法.文献[3]利用截断小波系数特征结合支持向量机(support vector machine, SVM)来进行车辆识别.文献[4, 5],提出了一种多尺度Gabor滤波器组使得所提取特征有更强的稳定性和尺度不变性.文献[6, 7]基于Haar-like特征进行行人和车辆的识别.文献[8]采用压缩感知理论对目标进行实时快速检测和追踪.以上的算法在对象识别中都有较好的识别性能,但是在识别精度和算法时间复杂度上依然存在一些不足之处:1)由于PCA方法并没有考虑训练集内部的类别,所以它是一种非监督型的特征提取方法.从分类的角度来看,它并没有利用类标号中包含的信息,有可能丢失一些非常重要的区分信息,而且PCA的前提是假设样本符合高斯分布,限制了其描述复杂问题的能力;2) Gabor滤波器在频域和时域上具有最佳分辨率的特点,能很好的兼顾时域和频域信息,但其缺点是数据冗余量大,运算量较大,冗余受噪声影响;3) Haar-like特征算法广泛地应用于目标识别中,具有实时性好、准确率高等优点,但Haar-like特征算法在特征提取过程中仅对图像全局进行特征提取,无法对目标敏感区域进行类加权处理以此来减少非目标区域产生的干扰.
用于图像识别的分类器有很多种,如决策树、SVM以及Adaboost分类器等.在车辆识别中,Haar-like特征结合Adaboost分类器用的较多,也取得了一定的效果[9],但是由于Adaboost分类器在由弱分类器生成强分类器过程中,对样本的判定条件十分苛刻,一旦认定其为非识目标样本就直接将其弃之,这使得一部分蕴含识别目标的特征也缺失了.因此在运用Adaboost分类器识别目标时,需要寻求更加合理的特征提取方法.本文提出了一种类似Haar-like特征提取算法,以此来保证在车辆识别中具有较好实时性和准确性.
本文的特征提取算法通过计算图像中不同区域中矩形框像素差值,最终形成特征空间,采用压缩感知理论对所产生的高维特征空间进行压缩.
1 本文算法 1.1 算法框架特征提取是识别图像的重要步骤,所提取特征直接影响图像识别的准确率.本文的特征提取算法总体框架如图 1所示.
![]() |
图 1 特征提取过程 Figure 1 Feature extraction process |
对图像进行预处理就是计算图像积分图,这样有助于计算速度的提高.
1.2 特征值的计算Haar-like特征提取过程是在图像中随机选定不同的特征矩形框,这种做法保证了特征矩形框在图像区域的随机性,但因为是在整个图像中选取矩形框,可能会出现所选取的特征矩形框不能完全表达需要识别目标的特性的情况.
为保证充分提取图像中的各部分信息,同时使得图像中目标区域特征更加丰富,本文将图像划分为3个不同的区域,这3个区域有一定的重叠部分且覆盖图像全局.如图 2所示,黑色的部分即为划分出的区域.区域划分后,确定矩形的尺寸(矩形框不可超出所在的划分区域),以矩形为矩形框模板,在保证不重复选取的条件下,逐行遍历所在区域,获得的像素序列为:xm1, xm2, …, xmn,其中m=1, 2, 3.令Fi= x3i+ x2j-2x1k (i, j, k=1, 2,…, n),F={F1,F2,…, Fn}, 则F即为特征空间.特征提取示例见图 3.
![]() |
图 2 图像区域划分 Figure 2 Regional division |
![]() |
图 3 特征提取示例 Figure 3 The example of feature extraction |
用本文特征提取算法提取的特征数目巨大.如表 1所示,一张24×24图像, 以16×16作为特征区域,2×2为矩形框模板,矩形特征数达11 390 625.这样大级数的特征空间,会给下一步的图像识别带来维度灾难.为解决此问题,本文采用非稀疏的高斯矩阵和压缩采样定理[10, 11],选取合适的稀疏测量矩阵对其进行降维处理.
图像尺度 | 特征区域 | 矩形框 | 特征数 |
30×30 | 20×20 | 2×2 | 47 045 881 |
24×24 | 16×16 | 2×2 | 11 390 625 |
20×20 | 12×12 | 2×2 | 1 771 561 |
针对特征空间F={F1,F2,…, Fn},将产生的特征值与高斯随机测量矩阵相乘,得到(1)式如下:
![]() |
(1) |
其中,wi为高斯随机测量矩阵中非零权重,Vi={V1,V2,…,Vn}为最终的特征空间.
通过使用满足Johnson-Lindenstrauss[12]准则的高斯随机测量矩阵来对高维特征空间做投影(特征空间与高斯随机测量矩阵相乘),产生压缩后的低维特征空间依然可以保留原特征空间信息.可以将降维后的特征空间用作分类器训练中的样本.
2 基于AdaBoost算法的识别过程为显示本文特征提取算法的优越性,我们选取AdaBoost算法[13, 14]来实现识别的分类过程.输入为经过上述特征提取和压缩后的特征空间.这里仅简单介绍AdaBoost算法的训练过程,针对算法中强弱分类器的生成算法描述如下:
第一步 确定特征初始权重w1, i= D(i);
第二步 对于t =1,2,…,T,
1) 将初始权重统一归化:
2) 针对特征空间中的每个特征向量训练产生一个弱分类器h(x, f, p, q);形成弱分类器后对其进行加权(qt)求和得到弱分类器的误检率βf:
![]() |
3) 误检率越低,其分类效果越好.选取错误率最小的分类器ht(x):
![]() |
4) 依据所选取的弱分类器进行加权调整:
![]() |
当ei = 0说明对应特征Xi被成功分类.当ei = 1则正好相反;
![]() |
第三步 最终所形成的强分类器为:
![]() |
本文实验是在英特尔E5-2603 CPU、4GB内存、戴尔PowerEdge T620 Main Server Chassis平台下用OpenCV 2.4.11在Windows7环境下实现.将本文中算法应用于静态车图像中车辆的识别检测,实验数据来自于作者参与的武汉市八一路隧道监控项目.所收集的图像样本来自于隧道监控系统中录像的片段,图像主要集中于车辆正面的图片.选取13 647张作为训练样本,其中6 873张为正样本(如图 4),6 774张为负样本(如图 5).选取5 040张图片作为测试样本,车辆和非车辆样本分别为3 766和1 274张,选取各种不同型号(小型轿车、大型货运卡车等)的车辆来保证测试的多样性.在非车辆样本中选取了道路中的路灯、车辆行驶路面等可能会造成较大混淆的图像样本.
![]() |
图 4 正样本 Figure 4 Positive samples |
![]() |
图 5 负样本 Figure 5 Negative samples |
实验测试过程中,将检测出的结果的准确率ap和虚警率bp作为算法性能的评价指标.准确率ap和虚警率bp的定义如下
![]() |
其中:NAP表示检测出所选取样本中被正确识别的车辆个数,NBP表示将其他图像识别为非车辆的个数,NTN表示所正确检测出的其他图像的个数,NBN表示将其他图像检测识别为车辆图像的个数.
实验1 本文算法与Haar-like特征提取算法所需训练时间比较,实验结果如表 2所示.
实验2 将本文算法和一些在图像识别领域经典的特征提取算法相比较,以此来验证改进后算法的效果.测试结果如表 3所示.
% | ||
特征提取 | ap | bp |
颜色+纹理 | 96.75 | 5.40 |
Cabor | 96.13 | 6.45 |
Wavelet | 96.34 | 6.43 |
Wavelet+Cabor | 96.81 | 5.64 |
Hog | 97.32 | 6.22 |
Haar-like特征 | 97.09 | 13.19 |
本文算法 | 97.47 | 7.23 |
如表 2所示,在采用了新的特征矩形框模板和非稀疏的高斯矩阵对其进行压缩后,改进后的算法相比于Haar-like特征提取算法在训练时间上减少了10个多小时,在一定程度上降低了算法的时间复杂度.
本文算法中采用的Adaboost分类器,在文中弱分类器ht(x)生成强分类器C(x)的过程中,对样本的判定条件十分苛刻,当不满足条件
![]() |
时,会直接将样本特征抛弃,使得一部分蕴含识别目标特性的样本也被抛弃.针对Adaboost分类器的这一特性,本文的特征提取算法选择性地提取了更多的描述目标特性的特征(如表 1所示),以此来降低识别的虚警率,因此本文中经过改进的特征提取算法相比于现有的一些识别算法具有更高的识别率(如表 3所示).由于特征数量大幅度增加,本文的方法和其他传统的特征提取算法相比,虚警率还有待降低.
在算法的整体性能和复杂度方面,假定训练所选取的采样图像像素为N,所提取的Haar-like特征数为M,采用传统的特征提取算法和Adaboost分类器其复杂度可以表示为O(M×N),本文算法复杂度为
本文基于Haar-like特征提取的思想,提出了一种新的特征提取算法,所提取特征对图像描述更丰富准确,减少了非目标区域对目标区域的干扰,并且考虑到特征数量急剧增多、维度过高的问题,采用压缩采样定理,利用非稀疏的高斯测量矩阵进行压缩降维.在实际数据集上进行测试后表明:本文方法降低了分类器训练的时间开销,提高了识别准确率.
[1] |
ZERGAT K Y, AMROUCHE A. New scheme based on GMM-PCA-SVM modelling for automatic speaker recognition[J]. International Journal of Speech Technology, 2014, 17(4): 373-381. DOI:10.1007/s10772-014-9235-7 |
[2] |
TAGHVAEI S, KOSUGE K. HMM-based state classification of a user with a walking support system using visual PCA features[J]. Advanced Robotics, 2014, 28(4): 219-230. DOI:10.1080/01691864.2013.869482 |
[3] |
LIU D, CAO R, MU X, et al. A Modified greedy algorithm for wavelet coefficients reconstruction [C]// International Conference on Computational Science and Engineering. Piscataway: IEEE, 2015: 835-839. DOI: 10.1109/CSE.2014.170.
|
[4] |
BATOOL N, CHELLAPPA R. Fast detection of facial wrinkles based on Gabor features using image morphology and geometric constraints[J]. Pattern Recognition, 2015, 48(3): 642-658. DOI:10.1016/j.patcog |
[5] |
MA J, WOLLSTEIN A, RUFF C, et al. An automatic 3D facial landmarking algorithm using 2D Gabor wavelets[J]. IEEE Transactions on Image Proce- ssing, 2016, 25(2): 580-588. DOI:10.1109/TIP.2015.2496183 |
[6] |
NABA A, PRATAMA B M, NADHIR A, et al. Haar-like feature based real-time neuro car detection system [DB/OL]. [2017-06-07]. http://ieeexplore.ieee.org/document/7803724/citations. DOI: 10.1109/ISSIMM.2016.7803724.
|
[7] |
MA S, BAI L. A Face Detection Algorithm Based on Adaboost and New Haar-Like Feature[DB/OL]. [2017-06-03]. http://ieeexplore.ieee.org/document/7883152/citations. DOI: 10.1109/ICSESS.2016.7883152.
|
[8] |
ZHANG K, ZHANG L, YANG M H. Real-time compressive tracking [C]// European Conference on Computer Vision. Berlin: Springer, 2012: 864-877. DOI: 10.1007/978-3-642-33712-3_62.
|
[9] |
KARAIMER H C, BACTANLAR Y. Car detection with omnidirectional cameras using Haar-like features and cascaded boosting [C]//Signal Processing and Communications Applications Conference. Piscataway: IEEE, 2014: 301-304. DOI: 10.1109/SIU.2014.6830225.
|
[10] |
SANKARANARAYANAN A C, XU L, STUDER, et al. Video compressive sensing for spatial multip- lexing cameras using motion-flow models[J]. Siam Journal on Imaging Sciences, 2015, 8(3): 1-10. DOI:10.1137/140983124 |
[11] |
WU Y, JIA N, SUN J. Real-time multi-scale tracking based on compressive sensing[J]. Visual Computer, 2015, 31(4): 471-484. DOI:10.1007/s00371-014-0942-5 |
[12] |
PAN J, MANOCHA D. Fast probabilistic collision checking for sampling-based motion planning using locality-sensitive hashing[J]. International Journal of Robotics Research, 2016, 35(12): 128-142. DOI:10.1177/0278364916640908 |
[13] |
KONG K K, HONG K S. Design of coupled strong classifiers in AdaBoost framework and its application to pedestrian detection[J]. Pattern Recognition Letters, 2015, 68: 63-69. DOI:10.1016/j.patrec |
[14] |
RAJESHWARI J, KARIBASAPPA K. Adaboost modular tensor locality preservative projection: Face detection in video using AdaBoost modular-based tensor locality preservative projections[J]. Computer Vision, 2017, 10(7): 670-678. DOI:10.1049/iet-cvi.2015.0406 |