一种改进Haar-like特征的车辆识别算法

文章信息

罗瑞奇, 钟忺, 钟珞, 李琳

LUO Ruiqi, ZHONG Xian, ZHONG Luo, LI Lin

A Vehicle Identification Algorithm Based on Improved Haar-Like Feature

武汉大学学报(理学版), 2018, 64(3): 244-248

Journal of Wuhan University(Natural Science Edition), 2018, 64(3): 244-248

http://dx.doi.org/10.14188/j.1671-8836.2018.03.007

文章历史

收稿日期：2016-05-19

Abstract

PDF

Figures

Tables

引用本文

罗瑞奇, 钟忺, 钟珞, 李琳. 一种改进Haar-like特征的车辆识别算法[J]. 武汉大学学报(理学版),2018, 64(3): 244-248. 复制到剪切板

LUO Ruiqi, ZHONG Xian, ZHONG Luo, LI Lin. A Vehicle Identification Algorithm Based on Improved Haar-Like Feature[J]. Journal of Wuhan University(Natural Science Edition) , 2018, 64(3): 244-248. 复制到剪切板

一种改进Haar-like特征的车辆识别算法

罗瑞奇, 钟忺, 钟珞, 李琳

武汉理工大学计算机科学与技术学院，湖北武汉 430070

收稿日期：2016-05-19

基金项目：国家自然科学基金(61003130);科技部支撑计划(2012BAH33F03);湖北省自然科学基金(2015CFB525)资助项目

作者简介：罗瑞奇，男，博士生，主要从事模式识别、大数据分析方面的研究. E-mail: luoruiqi@whut.edu.cn

通信联系人：钟忺, E-mail:zhongx@whut.edu.cn

摘要：传统的Haar-like特征算法在特征提取过程中仅对图像全局进行特征提取，忽略了目标敏感区域，易受非目标区域的干扰, 导致识别率降低.本文对传统的Haar-like特征提取算法进行了改进，将图像分成三个区域，运用的矩形框模板分别从这三个区域中提取像素值，将其中两个区域的像素值减去两倍的另外一个区域的像素值作为特征值.采用高斯随机测量矩阵对高维度的特征值进行压缩，运用Adaboost分类器训练方法，利用构造好的分类器对压缩后形成的特征空间进行分类识别.实验结果表明，本文的方法不仅减少了分类器所需的训练时间，而且识别性能也优于Haar-like特征、颜色纹理融合等传统算法.

关键词：Haar-like特征特征压缩车辆识别

A Vehicle Identification Algorithm Based on Improved Haar-Like Feature

LUO Ruiqi, ZHONG Xian, ZHONG Luo, LI Lin

School of Computer Science and Technology, Wuhan University of Technology, Wuhan 430070, Hubei, China

Abstract: In the process of feature extraction, the traditional Haar-like feature algorithm only extracts the global features of the image without considering the target sensitive area and can be interfered by the non-target area, so the recognition is not satisfied. This paper improves the traditional Haar-like feature extraction algorithm. The image was divided into three regions, where the rectangular template was used to extract pixel values from each of the three regions respectively and then the pixel values of two regions minus twice the pixel value of the other region, these pixel values were calculated as the eigenvalue. The Gauss random measurement matrix is adopted to compress the high dimensional eigenvalues, and with a pre-constructed classifier, the Adaboost classifier training method is applied to classify and recognize the feature space formed after the compression. The experimental results of the study show that the proposed algorithm can not only reduce the time required for training the classifier, but have better recognition performance than the traditional algorithms such as Haar-like feature and color texture fusion algorithm.

Key words: Haar-like feature feature compression vehicle identification

0 引言

车辆是视频监控的主要对象，车辆的自动识别对智能交通管理起着极大的作用，如车流量的统计，车辆违章检测，车辆的追踪等.国内外对车辆的识别检测相当关注，这方面的研究已有不少.对车辆进行识别检测的基础是特征提取，目前对于车辆特征提取主要有PCA(principal component analysis)，小波，Gabor滤波器，Haar-like等方法.文献[1, 2]分别介绍了基于PCA进行特征提取并实现车辆识别和灰度特征提取的ASM(active shape model)改进算法.文献[3]利用截断小波系数特征结合支持向量机(support vector machine, SVM)来进行车辆识别.文献[4, 5]，提出了一种多尺度Gabor滤波器组使得所提取特征有更强的稳定性和尺度不变性.文献[6, 7]基于Haar-like特征进行行人和车辆的识别.文献[8]采用压缩感知理论对目标进行实时快速检测和追踪.以上的算法在对象识别中都有较好的识别性能，但是在识别精度和算法时间复杂度上依然存在一些不足之处：1)由于PCA方法并没有考虑训练集内部的类别，所以它是一种非监督型的特征提取方法.从分类的角度来看，它并没有利用类标号中包含的信息，有可能丢失一些非常重要的区分信息，而且PCA的前提是假设样本符合高斯分布，限制了其描述复杂问题的能力；2) Gabor滤波器在频域和时域上具有最佳分辨率的特点，能很好的兼顾时域和频域信息，但其缺点是数据冗余量大，运算量较大，冗余受噪声影响；3) Haar-like特征算法广泛地应用于目标识别中，具有实时性好、准确率高等优点，但Haar-like特征算法在特征提取过程中仅对图像全局进行特征提取，无法对目标敏感区域进行类加权处理以此来减少非目标区域产生的干扰.

用于图像识别的分类器有很多种，如决策树、SVM以及Adaboost分类器等.在车辆识别中，Haar-like特征结合Adaboost分类器用的较多，也取得了一定的效果^[9]，但是由于Adaboost分类器在由弱分类器生成强分类器过程中，对样本的判定条件十分苛刻，一旦认定其为非识目标样本就直接将其弃之，这使得一部分蕴含识别目标的特征也缺失了.因此在运用Adaboost分类器识别目标时，需要寻求更加合理的特征提取方法.本文提出了一种类似Haar-like特征提取算法，以此来保证在车辆识别中具有较好实时性和准确性.

本文的特征提取算法通过计算图像中不同区域中矩形框像素差值，最终形成特征空间，采用压缩感知理论对所产生的高维特征空间进行压缩.

1 本文算法 1.1 算法框架

特征提取是识别图像的重要步骤，所提取特征直接影响图像识别的准确率.本文的特征提取算法总体框架如图 1所示.

图 1 特征提取过程 Figure 1 Feature extraction process

图选项

对图像进行预处理就是计算图像积分图，这样有助于计算速度的提高.

1.2 特征值的计算

Haar-like特征提取过程是在图像中随机选定不同的特征矩形框，这种做法保证了特征矩形框在图像区域的随机性，但因为是在整个图像中选取矩形框，可能会出现所选取的特征矩形框不能完全表达需要识别目标的特性的情况.

为保证充分提取图像中的各部分信息，同时使得图像中目标区域特征更加丰富，本文将图像划分为3个不同的区域，这3个区域有一定的重叠部分且覆盖图像全局.如图 2所示，黑色的部分即为划分出的区域.区域划分后，确定矩形的尺寸(矩形框不可超出所在的划分区域)，以矩形为矩形框模板，在保证不重复选取的条件下，逐行遍历所在区域，获得的像素序列为：x_m1, x_m2, …, x_mn，其中m=1, 2, 3.令F_i= x_3i+ x_2j-2x_1k (i, j, k=1, 2，…, n)，F={F₁，F₂，…, F_n}, 则F即为特征空间.特征提取示例见图 3.

图 2 图像区域划分 Figure 2 Regional division

图选项

图 3 特征提取示例 Figure 3 The example of feature extraction

图选项

1.3 特征压缩

用本文特征提取算法提取的特征数目巨大.如表 1所示，一张24×24图像, 以16×16作为特征区域，2×2为矩形框模板，矩形特征数达11 390 625.这样大级数的特征空间，会给下一步的图像识别带来维度灾难.为解决此问题，本文采用非稀疏的高斯矩阵和压缩采样定理^{[10, 11]}，选取合适的稀疏测量矩阵对其进行降维处理.

表1 不同图像尺度的特征数 Table 1 Feature number of different images

图像尺度	特征区域	矩形框	特征数
30×30	20×20	2×2	47 045 881
24×24	16×16	2×2	11 390 625
20×20	12×12	2×2	1 771 561

表选项

针对特征空间F={F₁，F₂，…, F_n}，将产生的特征值与高斯随机测量矩阵相乘，得到(1)式如下：

(1)

其中，w_i为高斯随机测量矩阵中非零权重，V_i={V₁，V₂，…，V_n}为最终的特征空间.

通过使用满足Johnson-Lindenstrauss^[12]准则的高斯随机测量矩阵来对高维特征空间做投影(特征空间与高斯随机测量矩阵相乘)，产生压缩后的低维特征空间依然可以保留原特征空间信息.可以将降维后的特征空间用作分类器训练中的样本.

2 基于AdaBoost算法的识别过程

为显示本文特征提取算法的优越性，我们选取AdaBoost算法^{[13, 14]}来实现识别的分类过程.输入为经过上述特征提取和压缩后的特征空间.这里仅简单介绍AdaBoost算法的训练过程，针对算法中强弱分类器的生成算法描述如下：

第一步确定特征初始权重w₁, i= D(i)；

第二步对于t =1，2，…，T,

1) 将初始权重统一归化：

2) 针对特征空间中的每个特征向量训练产生一个弱分类器h(x, f, p, q)；形成弱分类器后对其进行加权(q_t)求和得到弱分类器的误检率β_f：

3) 误检率越低，其分类效果越好.选取错误率最小的分类器h_t(x)：

4) 依据所选取的弱分类器进行加权调整：

当e_i = 0说明对应特征X_i被成功分类.当e_i = 1则正好相反；

第三步最终所形成的强分类器为：

3 实验

本文实验是在英特尔E5-2603 CPU、4GB内存、戴尔PowerEdge T620 Main Server Chassis平台下用OpenCV 2.4.11在Windows7环境下实现.将本文中算法应用于静态车图像中车辆的识别检测，实验数据来自于作者参与的武汉市八一路隧道监控项目.所收集的图像样本来自于隧道监控系统中录像的片段，图像主要集中于车辆正面的图片.选取13 647张作为训练样本，其中6 873张为正样本(如图 4)，6 774张为负样本(如图 5).选取5 040张图片作为测试样本，车辆和非车辆样本分别为3 766和1 274张，选取各种不同型号(小型轿车、大型货运卡车等)的车辆来保证测试的多样性.在非车辆样本中选取了道路中的路灯、车辆行驶路面等可能会造成较大混淆的图像样本.

图 4 正样本 Figure 4 Positive samples

图选项

图 5 负样本 Figure 5 Negative samples

图选项

实验测试过程中，将检测出的结果的准确率a_p和虚警率b_p作为算法性能的评价指标.准确率a_p和虚警率b_p的定义如下

其中：N_AP表示检测出所选取样本中被正确识别的车辆个数，N_BP表示将其他图像识别为非车辆的个数，N_TN表示所正确检测出的其他图像的个数，N_BN表示将其他图像检测识别为车辆图像的个数.

实验1 本文算法与Haar-like特征提取算法所需训练时间比较，实验结果如表 2所示.

表2 两种算法训练时间 Table 2 Training time of two methods

算法	训练时间/h
Haar-like	113.9
本文算法	102.5

表选项

实验2 将本文算法和一些在图像识别领域经典的特征提取算法相比较，以此来验证改进后算法的效果.测试结果如表 3所示.

表3 几种识别方法的性能 Table 3 Comparison among several recognition methods

%
特征提取	a_p	b_p
颜色+纹理	96.75	5.40
Cabor	96.13	6.45
Wavelet	96.34	6.43
Wavelet+Cabor	96.81	5.64
Hog	97.32	6.22
Haar-like特征	97.09	13.19
本文算法	97.47	7.23

表选项

如表 2所示，在采用了新的特征矩形框模板和非稀疏的高斯矩阵对其进行压缩后，改进后的算法相比于Haar-like特征提取算法在训练时间上减少了10个多小时，在一定程度上降低了算法的时间复杂度.

本文算法中采用的Adaboost分类器，在文中弱分类器h_t(x)生成强分类器C(x)的过程中，对样本的判定条件十分苛刻，当不满足条件

时，会直接将样本特征抛弃，使得一部分蕴含识别目标特性的样本也被抛弃.针对Adaboost分类器的这一特性，本文的特征提取算法选择性地提取了更多的描述目标特性的特征(如表 1所示)，以此来降低识别的虚警率，因此本文中经过改进的特征提取算法相比于现有的一些识别算法具有更高的识别率(如表 3所示).由于特征数量大幅度增加，本文的方法和其他传统的特征提取算法相比，虚警率还有待降低.

在算法的整体性能和复杂度方面，假定训练所选取的采样图像像素为N，所提取的Haar-like特征数为M，采用传统的特征提取算法和Adaboost分类器其复杂度可以表示为O(M×N)，本文算法复杂度为，这里s表示本文算法中高斯随机测量矩阵的压缩比，可以看出本文算法优于Haar-like特征提取算法.

4 结论

本文基于Haar-like特征提取的思想，提出了一种新的特征提取算法，所提取特征对图像描述更丰富准确，减少了非目标区域对目标区域的干扰，并且考虑到特征数量急剧增多、维度过高的问题，采用压缩采样定理，利用非稀疏的高斯测量矩阵进行压缩降维.在实际数据集上进行测试后表明：本文方法降低了分类器训练的时间开销，提高了识别准确率.

参考文献

[1]	ZERGAT K Y, AMROUCHE A. New scheme based on GMM-PCA-SVM modelling for automatic speaker recognition[J]. International Journal of Speech Technology, 2014, 17(4): 373-381. DOI:10.1007/s10772-014-9235-7

[2]	TAGHVAEI S, KOSUGE K. HMM-based state classification of a user with a walking support system using visual PCA features[J]. Advanced Robotics, 2014, 28(4): 219-230. DOI:10.1080/01691864.2013.869482

[3]	LIU D, CAO R, MU X, et al. A Modified greedy algorithm for wavelet coefficients reconstruction [C]// International Conference on Computational Science and Engineering. Piscataway: IEEE, 2015: 835-839. DOI: 10.1109/CSE.2014.170.

[4]	BATOOL N, CHELLAPPA R. Fast detection of facial wrinkles based on Gabor features using image morphology and geometric constraints[J]. Pattern Recognition, 2015, 48(3): 642-658. DOI:10.1016/j.patcog

[5]	MA J, WOLLSTEIN A, RUFF C, et al. An automatic 3D facial landmarking algorithm using 2D Gabor wavelets[J]. IEEE Transactions on Image Proce- ssing, 2016, 25(2): 580-588. DOI:10.1109/TIP.2015.2496183

[6]	NABA A, PRATAMA B M, NADHIR A, et al. Haar-like feature based real-time neuro car detection system [DB/OL]. [2017-06-07]. http://ieeexplore.ieee.org/document/7803724/citations. DOI: 10.1109/ISSIMM.2016.7803724.

[7]	MA S, BAI L. A Face Detection Algorithm Based on Adaboost and New Haar-Like Feature[DB/OL]. [2017-06-03]. http://ieeexplore.ieee.org/document/7883152/citations. DOI: 10.1109/ICSESS.2016.7883152.

[8]	ZHANG K, ZHANG L, YANG M H. Real-time compressive tracking [C]// European Conference on Computer Vision. Berlin: Springer, 2012: 864-877. DOI: 10.1007/978-3-642-33712-3_62.

[9]	KARAIMER H C, BACTANLAR Y. Car detection with omnidirectional cameras using Haar-like features and cascaded boosting [C]//Signal Processing and Communications Applications Conference. Piscataway: IEEE, 2014: 301-304. DOI: 10.1109/SIU.2014.6830225.

[10]	SANKARANARAYANAN A C, XU L, STUDER, et al. Video compressive sensing for spatial multip- lexing cameras using motion-flow models[J]. Siam Journal on Imaging Sciences, 2015, 8(3): 1-10. DOI:10.1137/140983124

[11]	WU Y, JIA N, SUN J. Real-time multi-scale tracking based on compressive sensing[J]. Visual Computer, 2015, 31(4): 471-484. DOI:10.1007/s00371-014-0942-5

[12]	PAN J, MANOCHA D. Fast probabilistic collision checking for sampling-based motion planning using locality-sensitive hashing[J]. International Journal of Robotics Research, 2016, 35(12): 128-142. DOI:10.1177/0278364916640908

[13]	KONG K K, HONG K S. Design of coupled strong classifiers in AdaBoost framework and its application to pedestrian detection[J]. Pattern Recognition Letters, 2015, 68: 63-69. DOI:10.1016/j.patrec

[14]	RAJESHWARI J, KARIBASAPPA K. Adaboost modular tensor locality preservative projection: Face detection in video using AdaBoost modular-based tensor locality preservative projections[J]. Computer Vision, 2017, 10(7): 670-678. DOI:10.1049/iet-cvi.2015.0406