林业科学  2004, Vol. 40 Issue (1): 154-157   PDF    
0

文章信息

赵茂程, 郑加强, 林小静, 封晓强.
Zhao Maocheng, Zheng Jiaqiang, Lin Xiaojing, Feng Xiaoqiang.
基于BP神经网络的树形识别系统研究
Research on Tree Crown Recognition System Based on BP Networks
林业科学, 2004, 40(1): 154-157.
Scientia Silvae Sinicae, 2004, 40(1): 154-157.

文章历史

收稿日期:2003-03-12

作者相关文章

赵茂程
郑加强
林小静
封晓强

基于BP神经网络的树形识别系统研究
赵茂程1, 郑加强1, 林小静2, 封晓强2     
1. 南京林业大学 南京 210037;
2. 东南大学 南京 210018
摘要: 简要介绍了人工神经网络及分形理论的应用,提出了用分形维数特征即树木图像的灰度曲面分形维数、冠形轮廓分形维数及4个方向的有向维数和树木形状特征即树冠高度方向8等分处所对应的8个冠幅和树冠的高度作为特征来进行树形的识别,并建立了树形识别系统。该系统的输入层分别是图像的维数特征和树木形状特征值,共计15个节点,一个隐含层,输出层则是要判断的6种树形。试验表明该系统能准确地对树形进行识别。
关键词: 人工神经网络    树形    识别    分形维数    
Research on Tree Crown Recognition System Based on BP Networks
Zhao Maocheng1, Zheng Jiaqiang1, Lin Xiaojing2, Feng Xiaoqiang2     
1. Nanjing Forestry University Nanjing 210037;
2. Southeast University Nanjing 210018
Abstract: Applications of BP network and fractional dimension were introduced. Fractional characters such as fractional dimensions of gray scale image surface and tree crown contour, and 4 directional fractional dimensions in different directions, and shape characters of tree crown such as the height of tree crown and 8 crown breadths in 8 equal division place were employed to recognize the tree crown. And a tree crown recognition system was established in which there are 15 nodes of tree crown features and image fractional dimensions in the input layer, 6 nodes of tree crown types in the output layer and 1 node in the implicit layer. The experiment showed that the system could recognize the tree crown precisely.
Key words: ANN    Tree crown    Recognition    Fractional dimension    

人工神经网络(artificial neural networks, ANN)是当代人工智能领域最富有挑战性的研究热点之一。由于它具有大规模并行处理和分布式的信息存储、良好的自适应性、自组织性、很强的学习功能、联想功能和容错功能等优点,在图像处理、模式识别、语音综合及智能机器人控制等领域得到了广泛的应用。

人工神经网络在林业中的应用主要集中在森林规划与管理、预测模型、林业工程中的自动化控制、水土流失的等级划分及立地分类等方面(赵茂程等,2002)。分形理论在图像处理中的应用也已十分广泛,但其在林业图像处理中的应用还仅仅局限在对各种图片的分析、植物形态的模拟上。Zeide(19911998)用分形理论对树木的冠层进行研究,但研究主要集中在树冠的某个具体方面,并未对整个树形进行描述。Noviato等(1999)基于分形理论试图对自然图像进行分割,目标是自然图像中的人造物;但同人造物相比树木等天然物则更规则,且易于描述。在基于树木图像特征的精确农药使用方法研究中,需要分割和识别喷雾目标的树形1),本文将采用分形理论及人工神经网络,利用神经网络自组织能力,完成树形的识别。

1) 郑加强,周宏平,赵茂程.21世纪精确农药使用方法展望.21世纪植物保护发展战略研讨会,2001

1 树形特征及分类

树木图像经分割后是一幅包括树木目标在内的完整图像,要实现目标的识别,必须从中提取树木的一些特征。树木的树形并非永远不变,它随着生长发育过程而呈现出规律性的变化。通常根据树及树叶的种类不同,树形可以分为下列7类:棕榈形、卵形、尖塔形、圆柱形、球形、平顶形、伞形。由于棕榈形非常不规则,且没有典型意义,因此本文选择其余6种树形进行识别和分类。

由于自然及人为的因素,树木个体的树形呈现不规则性。这种不规则性主要反映在树冠高度方向上冠幅的不断变化及冠幅与树冠高度之间关系的多变性,当冠幅及树冠高度与冠幅之间的关系改变时,树形则呈现不同的种类。

图 1所示,h0表示枝下高,d0表示枝下冠幅,h1表示树冠高度,d1d2d3d4d5d6d7d8分别表示8等分树冠高度所对应的冠幅,其中d1d8 8分别与枝下、树顶具有一定的距离,本文就采用树冠及树冠高度方向8等分处所对应的8个冠幅来描述树冠的形状。

图 1 树形轮廓示意图 Fig. 1 Schematic diagram of tree crown contour

但是形状特征值不能提供树木形状复杂性直接度量。树木形状随尺度变化的方式可以用分维来刻划,在跨尺度上一个固定的分维指示着所观察的边界形状具有统计自相似性,而在不同尺度上分维的变化可能意味着在不同尺度上起作用的不同过程或限制因子占据着优势(Wiens,1989)。但现实中的分维不是固定不变的,除非将研究尺度限制在很有限的范围之内(Goodchild,1980)。分维可以使我们在多尺度上描述树木的形状,从而在面对模糊性的情况下实现可预测性。因此除了形状特征值外,本文还用分形特征来识别树形。考虑到实际现象中不同的自然纹理可能具有相近的分形维数,本文还考虑纹理的方向性,因此分形特征包括树木图像的灰度曲面分形维数、冠形轮廓分形维数及4个方向的有向维数。

2 树形识别系统设计 2.1 输入层

输入层选择15个节点分别代表 6个分形维数和9个树形特征值(d1……d8h1)。

设树形轮廓周长为p,面积为A,则二者满足关系(Klinkenberg,1994)

(1)

(2)

其中,D为轮廓边界的分维。

对(2)式两边取对数,得到线性函数

(3)

因此只要求出该直线的斜率,就可求出分形维数D。另外由于盒维数(Box-counting or Box dimension)的数学计算及经验估计相对容易一些,因此本文用这种方法计算树木图像的灰度曲面分形维数和4个有向分维(肯尼思·法尔科内,2002)。

为提取有效的树木纹理分形特征参数,可采用实数域上计算盒子覆盖数的分形维数估计方法(应宇铮等,1997)。设树木图像的大小为M×M,将图像的x-y平面分成大小为δ×δ的格子,设在格子(i, j)里面像素点灰度的最大值和最小值分别为uδ(i, j)和bδ(i, j),二者的差值为dδ(x, y)=uδ(i, j)-bδ(i, j)。对于所有边长为δ的格子,非空的盒子总数Nδ

(4)

对于不同的δ值,即可求得一组点(δk, Nδk),k=1, 2, 3, L, m。显然lgδk与lgNδk成线性关系,利用最小二乘法进行线性回归即可得到直线的斜率,再取负号就是图像曲面的估计分形维数,从而可得到树木图像的灰度维数、有向分形维数估计。本文采用双金字塔式的最大、最小值寻找算法(李庆中等,2000),以减少重复计算,提高分形维数估算算法的速度。

2.2 隐含层

隐含层的单元数太多会导致学习时间过长,误差也不一定最佳。为方便计算,隐含层的节点数选择为1来进行树形的识别,试验表明隐含层节点数为1可以有效地完成对各种树形的识别。

2.3 输出层

为了判断树冠的类型,输出层的数量主要取决于树形的种类,共计6个节点,分别代表 6种树形。标准BP算法收敛速度慢的一个重要原因是学习系数选择不当。学习系数选得太小,收敛太慢;学习系数选得太大,则有可能修正过头,导致振荡甚至发散。本文采用变惯性系数的校正方法,即加入动量项,通过动量因子加入的动量项实质上相当于阻尼项,可减小学习过程的振荡趋势,从而改善收敛性。

(5)
(6)

式中,Δω(n)为本次校正量,Δω(n-1)为前次校正量,d为由本次误差算得的校正量,η(n)为本次的惯性系数,η(n-1)为前次的惯性系数,Δη为惯性系数每次的变化量。

学习系数和动量因子也有一定的取值范围,学习系数大于零,动量因子在[0, 1]之间。结合我们构造的树形识别网络,经过多次的试验得出,学习系数为0.35,动量因子为0.8时,网络收敛最快。

综上所述,设计树形识别网络图如图 2所示,输入层中1~6为分维特征向量,7~15为树形特征值。

图 2 基于BP神经网络的树形识别结构示意图 Fig. 2 Structural diagram of tree crown recognition based on BP neural network
3 试验及结果分析 3.1 样本及试验参数

样本采集于江苏地区的行道树,其中有些已经过修剪。在选择样本时,既考虑树形的不同种类,又考虑背景的典型性,即背景中具有不同的纹理特征,如颜色、形状、平面和边缘等。

首先选择36种(每种树形分别取6种)已知树形作为样本对本文设计的网络进行训练,训练完成后将另外16种(每种树形选择2~3个)未知树形的图像输入该系统进行识别,识别前首先对每个样本图像分别用基于颜色及颜色与分形维数两种方法进行分割。

3.1.1 迭代次数的确定

网络训练是一个反复学习的过程,是期望输出与网络实际输出误差调整的过程。一组训练模式,一般需经过数百次以上的学习过程方能使网络收敛。在网络训练中,为避免“过训练”,采用了以测试集监控训练集的方法。随着训练过程的发展,训练集的均方根偏差总是在下降,而测试集均方根偏差先下降,之后有可能变平或上升。当测试集均方根偏差达到极小,此时不管训练集的均方根下降与否,则停止迭代。结合实际经验,迭代次数选择为10万次,当到达10万次时,则停止迭代。在训练时相应的权重值即为该神经网络模型的权值。

3.1.2 初始值的选取

由于系统是非线性的,初始值对于学习是否达到局部最小或是否收敛的关系很大。为使初始权值在输入累加时使每个神经元的状态值接近于零,以保证一开始不落到那些平坦区上。取的初始权值是随机数,比较小,以保证每个神经元一开始都在它们的转换函数变化最大的地方进行。对于输入样本,同样希望能够归一,使那些比较大的输入仍然在神经元的转换函数梯度大的地方。

3.2 试验结果分析

图 3的左边为其中一样本香樟(Cinnamomum camphora)的图像,在图像左方的人穿着色泽鲜艳的衣服,地面有草坪,在背景有个灰色的房屋,房屋墙面有方形的格子和窗户等,房屋背后还有各种树木。图 3的中间是对该样本识别后的一个界面,在该界面上,中间的对话框是树形识别结果,左边是识别的类型,右边是归一化后的树形的6个分形维数及9个树冠的形状特征参数。右下方是输出的树冠的4个参数,即周长、面积、树冠高、树冠宽及分割和识别的时间等。从图中可以看出经过对树木图像的分割和识别,样本图像中的香樟呈现球形,显然与它本来的树形基本一致。图 3的右边是灰度直方图和调色板。

图 3 原始图像及识别结果 Fig. 3 Original sample and recognition result

表 1为训练后对16个样本的识别结果,从中可以看出,树木图像分割的效果是树形识别的基础。样本8用基于颜色的方法进行分割能够得到完整的分割图像,由于分割的误差较大而不能识别;用基于颜色与分形维数的方法分割时精度高,因此能够识别。样本16用两种方法分割时均未得到目标树木,得到的是图像中面积占优的草坪,并非目标树木,因此不能识别。考虑到树和草坪的形状不一样,在分割时又加入了一些先知的经验如形状等,能够得到完整的树木图像。

表 1 识别结果 Tab.1 Results of recognition
4 结论

本文建立了基于BP神经网络和分形维数的树形识别系统,其中输入层为图像的维数特征和描述树木树形的特征值,输出层则为要判断的6种树形。通过比较样本经BP神经网络学习后的实际输出的误差,反复调整权值和阈值,逐步达到预定的精度。研究表明该系统能用于对树形的识别,不论树木是否进行过修剪,识别率均较高,即能准确地对树形进行识别,结果不带人为因素,具有客观性,在林业中具有非常广阔的应用前景。

参考文献(References)
李庆中, 汪懋华. 2000. 基于分形特征的水果缺陷快速识别方法. 中国图像图形学报, 5(A, 2): 144-148.
[英]肯尼思•法尔科内著. 曾文曲, 刘世耀, 戴连贵等译. 分形几何: 数学基础及其应用。沈阳: 东北大学出版社, 2001, 9
应宇铮, 石青云. 1997. 实数域上的盒数计算与分形维数估计. 模式识别与人工智能, 10(4): 357-361.
赵茂程, 郑加强, 封晓强, 等. 2002. 人工神经网络及其应用研究. 中国制造业及信息化, 32(4): 99-102.
Goodchild M F. 1980. Fractals and the accuracy of geographical measures. Mathematical Geology, 12: 85-98. DOI:10.1007/BF01035241
Klinkenberg B. 1994. A review of methods used to determine the fractal dimension of linear features. Mathematical Geology, 26: 23-46. DOI:10.1007/BF02065874
Novianto S L, Guimaraes Y, Suzuki J, et al. 1999. Multiwindowed approach to the optimum estimation of the local fractal dimension for natural image segmentation. Proceedings of IEEE International Conference on Image Processing, Kobe, (3): 222-226.
Wiens A. 1989. Spatial scaling in ecology. Functional Ecology, 3: 385-397. DOI:10.2307/2389612
Zeide B. 1991. A method for estimation of fractal dimension of tree crowns. Forest Science, 37(5): 1253-1265.
Zeide B. 1998. Fractal analysis of foliage distribution in loblolly pine crowns. Canadian Journal Forest Research, 28(1): 106-114. DOI:10.1139/x97-202