2. 安徽大学 电子信息工程学院, 合肥 230601
针对支持向量数据描述多分类中模糊数据域的误判问题, 提出了一种改进的加权小波支持向量数据描述(WWSVDD)多分类方法, 并应用于遥感图像病害松树识别.利用无人机搭载双光谱相机获取高分辨率遥感图像, 提取地物特征, 构建特征向量.用WWSVDD模型描述每类样本, 根据待测样本在特征空间中的不同分布, 分别采用最小相对距离法和隶属度函数法进行决策分类, 从而实现病害松树的识别.实验结果表明, 与传统的K近邻和支持向量数据描述多分类方法相比, 所提方法在识别病害松树方面准确性更高.
2. School of Electronics and Information Engineering, Anhui University, Hefei 230601, China
For the problem of misjudgment in the fuzzy data domain, a modified multi-classification algorithm of weighted wavelet support vector data description (WWSVDD) is proposed and applied to the infected pine recognition in remote sensing images. Firstly, utilizing the high resolution images acquired by the double spectrum camera fixed on the unmanned aerial vehicle, the features of ground objects are extracted to construct the corresponding feature vectors. Secondly, each kind of ground objects samples is described by WWSVDD model. Finally, according to the distribution of test samples in the feature space, the methods of minimum relative distance and membership function are respectively used to decide the labels of the samples, so that the infected pines are recognized ultimately. The experiment results show that the proposed method can recognize the infected pines more effectively than the traditional multi-classification methods of K-nearest neighbor (KNN) and support vector data description (SVDD).
松树是我国重要的森林组成物种之一,近年来受松材线虫的侵染,出现了许多枯死松树.如果不及时采取有效措施予以防范,销毁所有染病松树,松林势必会遭到毁灭性的破坏.因此实现松林中枯死松树及时准确地识别,对预防松树病虫害、保护松林资源具有重大意义.
利用遥感自动监测平台,通过获取地物的光谱特征信息可识别病害松树,其依据是植物受到病虫危害时,绿叶中细胞活性含水量和叶绿素含量等的变化表现为反射光谱特性上的差异[1-4].由于卫星传感器受分辨率、卫星运行周期以及大气环境的影响,所获取的多光谱图像往往不能很好地表征地物类型.另外,采用航拍飞机为遥感探测平台,经费成本大,可操作性不强.以小型无人机为空中飞行平台,通过搭载可见光和近红外双光谱相机获取松林的双光谱图像,利用图像处理和改进的WWSVDD多分类方法,可实现对病害松树的有效识别.
1 研究区与数据源无人机飞行试验由安徽省林业有害生物防治检疫局、安徽双丰农业高新技术有限责任公司和中国人民解放军陆军军官学院等在课题《无人机在松材线虫病监测调查中的应用研究》支持下联合完成.研究区位于安徽省明光市境内管店林业总厂卞庄林场,所用的无人机为某现役无人机的缩比,其体积小、质量轻、飞行稳定性强,所搭载的双光谱相机分别为可见光相机和近红外相机.研究区的地理位置信息以及无人机和双光谱相机的具体参数见文献[5].通过飞行试验,获取了病害松树、健康松树和土壤等其他地物的可见光图像和近红外图像.
2 研究方法与技术路线文献[5]在构建小波支持向量数据描述(WSVDD, wavelet support vector data description)多分类器时,所有样本点均采用最小相对距离法进行决策分类,使得超球重叠区域的样本点出现随机分类,导致部分结果的误判.笔者在此基础上提出一种改进的多分类方法,采用基于K近邻的隶属度函数对重叠区域样本进行判别决策,并将小波函数与WSVDD相结合构建性能更优的WWSVDD多分类器模型.通过对松林图像地物的多种特征进行描述,建立相应样本的特征向量作为WWSVDD分类器的输入向量,对图像中的地物信息进行分类,实现病害松树识别.
2.1 改进WWSVDD多分类方法WWSVDD模型如下.
1) 给定目标函数
(1) |
其中:xi为训练样本,φ(·)为把训练样本映射到特征空间的非线性映射,c和R分别为球心和半径,si为权重系数,ξi为松弛变量,ν∈(0, 1]为相应惩罚参数.
2) 构造决策函数
(2) |
3) 选用小波核函数[6]
(3) |
其中:ai为小波核参数,d为向量y和z的维数.
4) 确定权值函数[5]
(4) |
其中:p≥2;0 < ε < 1;d(xi)为样本点xi到训练样本中心的距离,dmin 、davr、dmax 分别为其最小值、平均值和最大值.
改进的WWSVDD多分类方法的基本思想描述如下.
1) 将训练样本点按类别不同划分为m类,并且为每类样本分别作WWSVDD.
2) 根据样本点在特征空间中的分布,分别提取确定区域(超球非重叠区域)和模糊区域(超球重叠区域)的样本点.
3) 对于确定区域的样本点,分别计算其到m个超球体的相对距离di(i=1, 2, …, m),则该样本点的类别为
(5) |
4) 对于模糊区域的样本点,采用基于K近邻的隶属度函数在相应模糊类别中寻求该样本点的类别.样本x对重叠超球SA的隶属度函数为[7]
(6) |
其中:(xAmix)k为x在相应模糊区域的第k个近邻,NA和NB分别为模糊区域中属于超球SA和SB的训练样本个数.于是,样本类别l为
(7) |
1) 颜色信息
双光谱相机可以同时获取地面的可见光图像和近红外图像,提取像素的各个颜色分量(红、绿、蓝和近红外)信息,作为相应像素的颜色信息描述.
2) 差比指数
定义fxy, z表示颜色分量x和y相对于z的差异性度量,表达式为
(8) |
其中λ∈[0.5, 2]为权重系数.选用frg, h、frb, h、fgb, h作为相应像素的颜色分量间的差异性表达,这里r、g、b、h分别表示红、绿、蓝和近红外颜色分量.
3) 归一化植被指数(VNDVI)
NDVI值是一种能削弱大气辐射、交叉辐射等影响,反映植被光合作用强度的指标.计算公式为
(9) |
其中VNIR和VR分别为近红外和可见光(红色)波段的光谱反射率值.
4) 局部相似性(VSFi)
局部相似性反映图像局部区域的一致性程度,计算公式为[8]
(10) |
其中:Wi为以某像素为中心建立的一个局部图像窗口邻域,NWi为Wi中像素点的个数,Vsfj为Wi内像素点j与邻域中心(像素点i)的局部关系度量.
5) 局部二值模式(VLBP)
传统的LBP算子通过邻域像素值与中心像素值进行比较来对图像的纹理进行描述,受中心像素影响大.采用一种具有旋转不变性的改进LBP算子[9],具体描述如下.
考虑8邻域像素的均值和方差,定义当前像素值为fi,邻域像素均值和标准差分别为fμ和fσ,若fu-fi≥0.5fσ,则将当前像素值赋为0;否则将当前像素值赋为1,以此得到中心像素的二值序列,并不断旋转邻域得到一系列初始LBP值,取其最小值为中心像素的LBP值,可表示为
(11) |
其中:fR(x, i)为旋转函数,即x循环右移i位,VLBP是初始LBP值.
2.3 病害松树识别方法将双光谱相机所拍摄的可见光和近红外遥感图像中的地物类型分为病害松树、健康松树和其他地物.受无人机飞行姿势、自然环境等影响,首先需要对原始图像滤波,去除其中的部分噪声,经过图像配准等预处理,得到待分类的可见光和近红外图像;然后根据颜色特征,利用颜色直方图对图像进行阈值化处理,提取图像中部分健康松树;接着对其他待定地物进行单像素和以其为中心的局部特征提取,构建特征向量,采用改进的WWSVDD多分类方法将其分类;最后对分类的三值结果图像进行区域合并以消除孤立点,得到最终分类结果图像,实现对研究区域病害松树的有效识别.
3 实验结果与分析为了验证本文方法在病害松树识别中的有效性,从研究区域飞行试验获取的可见光图像和近红外图像中截取了3组图像,如图 1、图 3和图 5所示;本文方法与传统的K近邻和SVDD多分类方法作对比分析,实验结果如图 2、图 4和图 6所示.
为了对分类结果进行定量评价,对3组实验均选取500个病害松树像素、1 200个健康松树像素和800个其他地物像素作为检验样本,同样提取基于单像素和以其为中心的局部特征,构建特征向量输入WWSVDD分类模型,采用分类精度和Kappa系数对分类结果进行评价,分类精度越高,Kappa系数越大,结果就越准确.根据混淆矩阵求出的分类精度和Kappa系数如表 1所示.
第1组实验中,K近邻方法和SVDD方法将其他地物判断成病害松树,K近邻方法还把部分健康松树当成了病害松树,而本文方法较准确地识别了不同状态的松树.第2组实验中,本文方法将数棵成片的病害松树有效地识别出来,且对大片健康松树的识别表现出较强的抗噪声能力,而另外2种方法仍然对地物信息出现了误判,其中SVDD方法相比K近邻方法对土壤略加敏感.第3组实验中,K近邻方法和SVDD方法将道路旁边的许多健康松树识别成了其他地物,且不能识别病害松树的完整形状,本文方法准确地识别出病害松树,且清晰地勾勒出道路的轮廓.在定量评价标准上,从表 1中也可以看出本文方法能获得比传统的K近邻和SVDD方法更高的分类精度和Kappa系数.在运行效率上,直接利用K近邻和SVDD方法对整个图像进行分类,由于图像分辨率高、像素多,导致运行效率较低.本文方法根据健康松树的颜色特征,通过阈值法先将部分明显的健康松树单独提取出来,然后采用WWSVDD多分类方法对待定地物进行分类识别;另外本文方法在训练时会舍弃少量权重系数太小(即分类贡献程度极小)的样本,从而在保证识别准确性的情况下,提高识别效率.上述实验结果表明,对搭载在无人机上的可见光和近红外双光谱相机所获取的遥感图像,利用改进的WWSVDD多分类方法,可以实现病害松树的有效识别.
4 结束语小型无人机具有体积小、质量轻、飞行稳定等优点,利用其搭载的双光谱相机,获取高分辨率的遥感图像,对研究区域的病害松树进行识别,可操作性强.笔者在传统SVDD多分类方法的基础上,将处于模糊区域的样本使用K近邻隶属度函数估计法进行判别决策,并结合权重函数和小波核的优点,构建WWSVDD多分类器应用于病害松树的识别,避免了传统SVDD多分类方法中对模糊区域样本决策的随机性,在局部样本中寻求密度高的样本类别,实现对目标的准确识别.下一步将致力于研究满足无人机载荷要求的多光谱相机,提取表征更多地物类型的特征信息,并进行有效选择,包括不同染病程度的松树以及池塘、房屋、杂草等其他地物,最终能在众多地物类型中识别相应的病害松树,为松林病虫害的防治人员提供参考.
[1] | Nidamanuri R R, Zbell B. Normalized spectral similarity score (NS3) as an efficient spectral library searching method for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2011, 4(1): 226–240. doi: 10.1109/JSTARS.2010.2086435 |
[2] |
黄明祥, 龚建华, 李顺, 等. 松材线虫病害高光谱时序与敏感特征研究[J]. 遥感技术与应用, 2012, 27(2): 954–960.
Huang Mingxiang, Gong Jianhua, Li Shun, et al. Study on pine wilt disease hyper-spectral time series and sensitive features[J].Remote Sensing Technology and Application, 2012, 27(2): 954–960. |
[3] |
徐华潮, 骆有庆, 张琴. 松材线虫自然侵染对黑松、马尾松针叶含水量、色素及抗氧化酶活性的影响[J]. 林业科学, 2012, 48(11): 140–143.
Xu Huachao, Luo Youqing, Zhang Qin. Changes inwater content, pigments and antioxidant enzyme activities in pine needles of pinus thunbergii and pinus massoniana affected by pine wood nematode[J].Scientia Silvae Sinicae, 2012, 48(11): 140–143. doi: 10.11707/j.1001-7488.20121123 |
[4] | Meigs G W, Kennedy R E, Cohen W B. A landsat time series approach to characterize bark beetle and defoliator impacts on tree mortality and surface fuels in conifer forests[J].Remote Sensing of Environment, 2011, 115(12): 3707–3718. doi: 10.1016/j.rse.2011.09.009 |
[5] |
胡根生, 张学敏, 梁栋, 等. 基于加权支持向量数据描述的遥感图像病害松树识别[J]. 农业机械学报, 2013, 44(5): 258–263.
Hu Gensheng, Zhang Xuemin, Liang Dong, et al. Infected pine recognition in remote sensing images based on weighted support vector data description[J].Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(5): 258–263. doi: 10.6041/j.issn.1000-1298.2013.05.045 |
[6] | Chih-Chiang Wei. Wavelet kernel support vector machines forecasting techniques: case study on water-level predictions during typhoons[J].Expert Systems with Applications, 2012, 39(5): 5189–5199. doi: 10.1016/j.eswa.2011.11.020 |
[7] |
蔡金燕, 杜敏杰. 多分类SVDD混叠域识别新方法与故障诊断应用[J]. 航天控制, 2012, 30(6): 83–88.
Cai Jinyan, Du Minjie. Anovel approach to discriminate the overlap region of multi-class classification SVDD and fault diagnosis application[J].Aerospace Control, 2012, 30(6): 83–88. |
[8] | Yang Hongying, Wang Xiangyang, Zhang Xianyin, et al. Color texture segmentation based on image pixel classification[J].Engineering Applications of Artificial Intelligence, 2012, 25(10): 1656–1659. |
[9] | Imamverdiyev Y, Teoh A B J, Kim J. Biometric cryptosystem based on discretized fingerprint texture descriptors[J].Expert Systems with Applications, 2013, 40(5): 1888–1901. doi: 10.1016/j.eswa.2012.10.009 |