测绘地理信息   2020, Vol. 45 Issue (3): 39-43
0
Haar-like特征在稀疏建筑物检测中的应用[PDF全文]
张夏, 肖启芝, 许凯, 霍佳媛    
中国地质大学(武汉)信息工程学院, 湖北 武汉, 430074
摘要: 以高原无人区稀疏建筑物为研究对象, 将Hough变换、Haar-like特征与AdaBoost算法相结合构造强分类器, 利用高分辨率遥感影像快速精确地从无人区检测出固定稀疏建筑物。首先对影像进行边缘检测、Hough变换的直线提取与几何旋转校正, 将实际可能是任何角度的建筑物旋转成水平或垂直状态, 再将旋转后图像提取Haar-like特征后利用AdaBoost算法进行分类。实验证明, 该算法原理简单, 能有效解决仅用Haar-like特征精度不适应建筑物角度多变的问题, 说明了Hough变换直线特征提取与Haar-like矩形特征提取多角度稀疏建筑物的可行性, 为快速精确检测无人区的稀疏建筑物提供了新思路。
关键词: Haar-like特征    Hough变换    AdaBoost算法    建筑物识别    
Application of Haar-like Features in Sparse Building Detection
ZHANG Xia, XIAO Qizhi, XU Kai, HUO Jiayuan    
Faculty of Information Engineering, China University of Geosciences(Wuhan), Wuhan 430074, China
Abstract: This paper takes the Akesu Xinjiang region as the study object and combines Hough transform, haar-like features and AdaBoost algorithm to form a strong detector.It detected fixed and spare buildings rapidly in the no-man's land by using high-resolution remote sensing images.This algorithm first adopts an edge tracking and extraction.It then use line extraction by Hough transform and geometric rotation correction.This allows the building, which may actually be at any angle, to be rotated to a horizontal or vertical position.Finally, the rotated image is extracted with Haar feature and classified by AdaBoost algorithm.The experiment results prove that the algorithm is simple in principle and can effectively solve the problem that the accuracy of Haar-like features is not adaptable to buildings, and the feasibility of extracting multi-angle sparse buildings by using Hough transform and Haar-like rectangular features is illustrated.It provides new ideas for effective and accurate the spare buildings extraction in the no-man's land.
Key words: Haar-like feature    Hough transfom    AdaBoost algorithm    building detection    

当前,遥感技术已具备高分辨率、全天时、全天候、准实时的对地观察能力,面对海量数据如何快速高精度地对地物进行检验,提取特定有效的地物信息一直是遥感数据处理领域的研究热点。

Haar-like特征在相关领域应用广泛。文献[1]提出了基于Haar-like特征与AdaBoost算法的人脸检测方法, 能够快速计算出检测中用到的Haar-like特征[1-3];利用扩展特征与分类器优化来提高人脸检测的精度或是进行其他目标的检测[4-11]。Haar-like特征与AdaBoost分类器在人脸检测、路人识别、车牌识别、高分辨率遥感影像中识别地物都有较好的效果[12-20]。高原无人区地形复杂,戈壁高原由于长期受到风沙侵蚀容易在地表出现线性特征,仅仅利用直线特征进行筛选容易出现错分。本文利用Hough变换提取直线后,采用最长直线长度和多条直线长度之和来进行建筑物筛选,避免因风沙侵蚀引起的直线特征对建筑物识别出现干扰[21]。Haar-like特征基于灰度特征来识别地物,受光照、状况、姿态影像较大[12],在Hough变换提取直线特征后,先筛选掉部分不含房屋的影像,再对影像做旋转校正,使其方便被提取矩形特征[22-24]。稀疏建筑物分布零散,在边缘检测、Hough变换提取建筑物直线特征与几何旋转之后,将实际可能是任何角度的建筑物旋转成水平或垂直状态,使用Haar-like特征提取建筑物的简单几何结构。

算法分为训练过程与检测过程。训练过程中先对影像使用Hough变换提取建筑物直线特征与图像旋转校正,然后进行海量Haar-like特征的提取,再用AdaBoost分类器来确定最合适的阈值。检测过程是先将高分辨率遥感影像经过切片、Hough变换提取建筑物直线特征与图像旋转校正处理之后提取Haar-like特征,然后将数据输入AdaBoost分类器之中与阈值进行比较来判断是否存在稀疏建筑物。

1 稀疏建筑物检测

Haar-like特征为矩形特征,在丛林、戈壁、雪山上的建筑物与周围环境相比颜色更深,可以用矩形特征表现出来,但矩形特征只对一些简单的图形结构,如边缘、线性比较敏感,所以只能描述特定走向的结构,如果建筑物不处于这些状态,为较为倾斜状态,那么在Haar-like特征前可以通过Hough变换提取建筑物直线特征以及进行旋转校正,然后利用AdaBoost分类器进行分类处理。

1.1 Hough变换提取建筑物特征直线

1) 霍夫直线提取。通过公式xcosθ+ysinθ=ρ将图像空间(x-y平面)中所有点映射到θ-ρ空间(实际上是二维霍夫矩阵),调用峰值函数返回霍夫矩阵的峰值点,即为最可能的直线。通过坐标空间转换极大加快了提取直线的效率。

2) 在每个影像中进行边缘检测。采用prewitt算子通过像素平均(相当于低通滤波)抑制噪声,该算子对提取房屋边缘等线性特征有一定的效果,同时可以去除森林、戈壁等非建筑物短线特征的干扰。简单高效的边缘检测有助于后面的直线提取和房屋检测效率的提升。

1.2 稀疏建筑物粗检验

如果对每个影像都提取Haar-like特征值,耗时较长,可以在提取之前先用Hough变换提取的建筑物直线特征进行粗检,来排除一部分完全不可能含有建筑物的负样本。Hough变换筛选精度的决定性因素是参数的选取和阈值的设定。在实验过程中,本文尝试了3种参数来对影像进行稀疏建筑物粗检:Hough变换提取出的最长直线maxLength、最长4条直线之和sumLength、归一化后某一直线角度的最大出现次数。

最长直线的选择可以避免丛林、灌木、草地、沙漠、荒漠之类的环境下非建筑物地物短线特征的干扰,确定稀疏建筑物的边缘。最长4条直线之和作为阈值是考虑到稀疏建筑物通常会由多条直线所构成,单一最长直线作为阈值难以区分高原、戈壁之类由于风沙在地表出现线性特征的图像与稀疏建筑物图像,在图像中存在稀疏建筑物的情况Hough变换提取的4条直线往往是建筑物边缘,求和的值与戈壁由风沙造成的线性特征有一定区别。角度是由于一般稀疏建筑物中直线的夹角多在90°附近,所以一个建筑物的直线倾角在归一化之后会相近,这样如果一个角度反复出现即可猜测此地有建筑物,而森林、戈壁、沙漠等地方的直线特征的角度一般是比较随机的。

通过对3种参数在不同阈值下进行筛选,绘制出错检数-不同参数阈值的曲线图(图 1),粗检验所用样本中正样本个数870张(含建筑物图像),负样本个数1 366张(不含建筑物图像),总样本个数2 236张。

图 1 Hough变换参数及错检率 Fig.1 Hough Transform Parameters and False Detection Rate

图 1(a)为最长直线阈值与错检率关系的图像,纵轴为错检个数,横轴为选取的最长直线阈值,最长直线长度一般在0~200之间变化。设最长直线阈值为maxThreshold,通过实验选取最合适阈值。检测负样本时,当最长直线长度大于等于所设阈值时,负样本的错检个数+1;检测正样本时当最长直线长度小于所设阈值时,正样本的错检个数+1,红色表示负样本的错检个数,蓝色表示正样本的错检个数,黑色表示正负样本的错检个数和。

图 1(b)为最长4条直线之和阈值与错检率的图像,纵轴为错检个数,横轴为最长直线阈值,与图 1(a)类似,只是用最长4条直线之和替换最长直线。图 1(c)为出现次数最多的直线夹角阈值与错检率的图,纵轴为错检个数,横轴为选取的出现最多的直线夹角的阈值,提取出霍夫变换直线的前100个峰值,将角度θ从原来的-90~89°范围通过旋转90°归一化为0~89°,绘制这100个角度值的图像,选出某一角度出现的最多的次数N,每幅图都有一个次数N。选取出现次数最多的直线夹角阈值HThreshold,一般在1~10变化。检测负样本N >HThreshold时,负样本的错检个数+1;检测正样本N < HThreshold时,正样本的错检个数+1。图 1中紫色表示负样本的错检个数;蓝色表示正样本的错检个数;红色表示正负样本的错检个数和。3次粗检验目的是将完全不为稀疏建筑物的影像通过合适阈值筛除,避免对完全不可能存在稀疏建筑物的影像提取Haar-like特征时浪费时间。

图 1可知,选择合适阈值以后,最长直线与最长4条直线之和筛选结果类似,且明显优于概率最大的直线夹角阈值。这可能是由于森林、戈壁、沙滩之类负样本中直线角度过于随机,在当前训练样本的情况下,难以选出符合预期效果的阈值。然后对最长直线与最长4条直线之和的筛选效果进行比较,得到横轴为最长直线长,纵轴为最长4条直线之和长度的散点图(图 2)。由图 2可知,红点为负样本,蓝点为正样本,在尽量去掉负样本而保留正样本的考虑下,最终选取最长4条直线之和为霍夫筛选的参数。

图 2 Hough变换散点图 Fig.2 Hough Transform Scatter Diagram

1.3 图像旋转校正

根据Hough变换检测出的最长直线与水平方向的夹角a,通过对图像进行旋转变换至a=0,图像中的最长直线(极可能是房屋边线)则为水平状态。图像旋转校正的目的是为了让房屋尽可能保持水平或竖直状态,有助于Haar-like特征提取简单几何结构,最后校正结果如图 3所示。图 3(a)为训练样本原图,利用Hough变换提取直线特征,并利用最长直线和多条直线之和进行建筑物粗检验。图 3(b)由对原图进行旋转得到,使得Hough变换检测出的最长直线保持水平或垂直,使得Haar-like特征能检测建筑物的边缘特征。图 3(c)为旋转校正后图像的最大内接矩形。求得图像旋转校正后最大内接矩形是为了避免旋转后产生的黑色部分对Haar-like特征提取造成影响。

图 3 图像旋转校正 Fig.3 Image Rotation Correction

表 1为Haar-like+AdaBoost和Hough旋转校正+Haar-like+AdaBoost的检测结果。实验所用正样本为稀疏建筑物遥感图像,有870张。负样本为戈壁、森林、河流、海滩、沙漠、运动场。表 1中识别数是指将正负样本成功分类的数量,漏检数是指将稀疏建筑物分错,而错检数是指将稀疏建筑物分为非建筑物的数量。由于Haar-like只能检测水平垂直和对角倾斜的特征,如果建筑物为任意角度则需要进行水平垂直几何校正,校正后Haar-like检测精度明显上升。

表 1 稀疏建筑物检测效果对比 Tab.1 Test Result Comparison of Spare Building Detection

1.4 Haar-like特征与AdaBoost分类器

Haar-like特征反映了图像的灰度变化情况,对于描述特定走向(水平、垂直、对角)的结构,可以便捷地提取位置校正后的房屋边缘、角点等信息。选用三类标准模板主要是考虑到稀疏建筑物与周围环境颜色会有一定区别,稀疏建筑物多为简单结构,但在遥感影像之中角度不一,在考虑旋转角度将建筑物校正后,标准的模板在识别上往往具有较好的通用性。

最初的弱分类器只是一个基本的Haar-like特征,计算输入图像的Haar-like特征值,与阈值进行比较,判断图像是否含有稀疏建筑物[18]。通过多次迭代,每次生成一个新的Haar-like特征(弱分类器),最终通过各弱分类器投票进行判断,即构成一个强分类器。在训练阶段,每个弱分类器对应一个特征矩形,将弱分类器的生成过程迭代30次,共得到30个权重不同的弱分类器(特征矩形)。在检测阶段,通过比较这30个特征矩形的阈值和图像对应位置特征矩形的特征值,可得到30个判断结果,通过加权计算可得到强分类器的分类结果。AdaBoost分类器的训练正样本是稀疏建筑,负样本包括戈壁、森林、沙漠等(图 4)。

图 4 不同样本 Fig.4 Different Samples

2 实验结果与分析

对训练样本集进行边缘检测、Hough变换提取建筑物直线特征、粗检筛选与图像校正,将校正的图像提取Haar-like特征后在检验的AdaBoost分类器中进行识别。Haar-like特征+AdaBoost分类器可以快速提取并利用简单几何特征进行分类,对边缘、线性特征有很好的识别能力,但效果还有待提高。在选取阈值的时候,为了更好地搜索出所有的稀疏建筑物,应可以有少量错检但尽量无漏检。用稀疏建筑物为正样本,戈壁、森林、河流、灌木、沙漠海滩为负样本。在训练过程中经过阈值的选定,最后准确率可以达到76%。与仅使用Haar-like特征与AdaBoost分类器相比,Hough变换与Haar-like特征相结合能通去掉部分不含有房屋的建筑物,排除部分有人工痕迹的图像(如道路),并且能检测出部分不结合Hough变换时漏检的多角度建筑物,经过Hough变换提取直线特征,再旋转校正后,用Haar-like提取矩形特征,能解决仅使用Haar-like特征不适应建筑物角度多变的问题。

最后针对高分辨率遥感影像进行稀疏建筑物检测。将高分辨率图像利用滑块分窗,对每个滑窗进行边缘检测、Hough变换提取建筑物直线特征与图像旋转校正,将校正的图像提取Haar特征后放入检验的AdaBoost分类器中进行识别。图 5是对分辨率达到0.2 m的航空影像进行验证的结果图。图 5中实验区内有两个稀疏建筑物,其余部分为林地与道路,这与算法得出的结果相符。

图 5 高分辨率遥感影像检测稀疏建筑物 Fig.5 Spare Buildings in the High-Resolution Remote Sensing Image

3 结束语

基于建筑物分布稀疏情况下,对几何结构简单、边缘特征明显的状况,结合Haar-like特征对简单几何特征的良好提取效果、Hough变换对边缘的筛选与AdaBoost的合适分类精度等特点,提出了Hough变换直线特征提取与Haar-like矩形特征提取多角度稀疏建筑物的方法。在对高分辨率遥感影像滑窗分块后,考虑在稀疏建筑物的条件下,对每个滑窗采用边缘检测与Hough变换提取建筑物直线特征、粗检验、旋转校正,便于Haar-like特征检验建筑物,同时可以减少部分影像从而提升检验速度。实验证明,该方法在无人区的稀疏建筑物检测中具有较强的可行性,为无人区提取遥感影像建筑物信息提供了一种新思路。

参考文献
[1]
Viola P, Jones M.Rapid Object Detection Using a Boosted Cascade of Simple Features[C].Proceedings of IEEE Computer Society Conference on Computer Vision and Pat Tern Recognition, Kauai, USA, 2001
[2]
Viola P, Jones M. Robust Real-Time Face Detection[J]. International Journal of Computer Vision, 2004, 57(2): 137-154.
[3]
赵楠.基于AdaBoost算法的人脸检测[D].北京: 北京大学, 2005
[4]
Marcum R A, Davis C H, Scott G J. Rapid Broad Area Search and Detection of Chinese Surface-to-Air Missile Sites Using Deep Convolutional Neural Networks[J]. Journal of Applied Remote Sensing, 2017, 11(4): 1-31.
[5]
Tan Chao, Li Menglong, Qin Xin. Study of the Feasibility of Distinguishing Cigarettes of Different Brands Using an AdaBoost Algorithm and Near-Infrared Spectroscopy[J]. Analytical and Bioanalytical Chemistry, 2007, 389(2): 667-674.
[6]
Takashi T, Shinto E. Robustifying AdaBoost by Adding the Naive Error Rate[J]. Neural Computation, 2004, 16(4): 767-787. DOI:10.1162/089976604322860695
[7]
Cohen J P, Ding Wei, Kuhlman C, et al. Rapid Building Detection Using Machine Learning[J]. Applied Intelligence, 2016, 45(2): 443-457.
[8]
江伟坚, 郭躬德, 赖智铭. 基于新Haar-like特征的AdaBoost人脸检测算法[J]. 山东大学学报(工学版), 2014, 44(2): 43-48.
[9]
颜学龙, 任文帅, 马峻. 基于扩展Haar特征的AdaBoost人脸检测算法[J]. 计算机系统应用, 2015, 24(9): 152-155. DOI:10.3969/j.issn.1003-3254.2015.09.026
[10]
Yang Ying, Ma Yugang, Guo Xiaodong, et al. Research on Pedestrian's Detection Based on the Integration of AdaBoost Algorithm and Shape Features[J]. Advanced Engineering Forum, 2011, 2/3: 433-428. DOI:10.4028/www.scientific.net/AEF.2-3.433
[11]
Yang Ming, Crenshaw J, Augustine B, et al. AdaBoost-Based Face Detection for Embedded Systems[J]. Computer Vision and Image Understanding, 2010, 114(11): 1116-1125. DOI:10.1016/j.cviu.2010.03.010
[12]
汤义.智能交通系统中基于视频的行人检测与跟踪方法的研究[D].广州: 华南理工大学, 2010
[13]
文学志, 方巍, 郑钰辉. 一种基于Haar类特征和改进AdaBoost分类器的车辆识别算法[J]. 电子学报, 2011, 39(5): 1121-1126.
[14]
龚健雅, 姚璜, 沈欣. 利用AdaBoost算法进行高分辨率影像的面向对象分类[J]. 武汉大学学报·信息科学版, 2010, 35(12): 1440-1443.
[15]
崔华, 张骁, 郭璐, 等. 多特征多阈值级联AdaBoost行人检测器[J]. 交通运输工程学报, 2015, 15(2): 109-117. DOI:10.3969/j.issn.1671-1637.2015.02.014
[16]
Wang Hai, Cai Yingfeng. Monocular Based Road Vehicle Detection with Feature Fusion and Cascaded AdaBoost Algorithm[J]. Optik-International Journal for Light and Electron Optics, 2015, 126(22): 3329-3334. DOI:10.1016/j.ijleo.2015.08.018
[17]
张山林.基于AdaBoost的人脸检测与跟踪算法研究[D].兰州: 兰州大学, 2013
[18]
Cheng W C, Jhan D M. A Self-Constructing Cascade Classifier with AdaBoost and SVM for Pedestrian Detection[J]. Elsevier Ltd, 2013, 26(3): 1016-1028.
[19]
武勃, 黄畅, 艾海舟, 等. 基于连续AdaBoost算法的多视角人脸检测[J]. 计算机研究与发展, 2005(9): 1612-1621.
[20]
刘晓克, 孙燮华, 周永霞. 基于新Haar-like特征的多角度人脸检测[J]. 计算机工程, 2009, 35(19): 195-197.
[21]
蒋星详, 肖莉. 一种多特征融合的高分辨率遥感影像道路中心线提取算法[J]. 测绘地理信息, 2019, 44(4): 98-101.
[22]
王红, 孙福宝, 杨涛, 等. Jason_2卫星测高数据在长江中游水位监测中的应用[J]. 三峡生态环境监测, 2018, 3(3): 48-54.
[23]
朱琴, 杨英宝, 张宁宁. 利用LiDAR和航空影像的屋顶边缘提取及优化[J]. 地理空间信息, 2018, 16(4): 36-39. DOI:10.3969/j.issn.1672-4623.2018.04.012
[24]
任文艺, 伍丹, 秦林. 无人飞艇低空高光谱遥感数据采集和处理初探[J]. 三峡生态环境监测, 2016, 1(2): 52-57.