文章信息
- 于海鹏, 刘一星, 刘镇波.
- Yu Haipeng, Liu Yixing, Liu Zhenbo.
- 基于图像纹理特征的木材树种识别
- Wood Species Retrieval on Base of Image Textural Features
- 林业科学, 2007, 43(4): 77-81.
- Scientia Silvae Sinicae, 2007, 43(4): 77-81.
-
文章历史
- 收稿日期:2005-10-10
-
作者相关文章
木材树种识别和检索的传统方法为肉眼观察、经验识别或借助于专家系统的初级识别,但这常受到识别者知识背景和条件因素的影响,表现出一定的局限性,不便于进一步发展和推广。
近年来,随着数字图书馆及多媒体数据库的出现,其日新月异的检索方法和检索效率十分突出,这无疑也为木材树种的检索提供了一种新途径。基于图像内容的目标检索是在计算机图像处理技术基础上发展起来的,综合利用图像所内含的信息来实现目标的匹配。和传统方法相比,它降低了对操作者专业知识的要求,很大程度上摆脱了受人主观性影响过大的问题;它能够极大地利用各种信息量,明显提高识别的准确性(殷泽兴等,1999;刘忠伟等,1999);基于现代计算机的软硬件发展,它的速度快,效率高,不易出错,降低了工作强度。
目前,我国从事木材进出口贸易、木材检验、木材加工的企业和从业人员已突破百万,要求他们全都掌握熟练的木材学知识和木材检验技术是十分困难的,因此需要提供相应的辅助工具和技术。而基于数字图像处理技术的检索方法正提供了这样一种解决问题的可能,开发相应的技术具有设备实现简单、投资少、方便移植、方便操作、方便维护升级等特点,届时将能为改善木材检索和识别提供技术支持,可以预见其发挥作用的空间和潜力。
本文将引入数字图像处理技术,基于图像纹理特征实现对木材树种的快速检索和识别。
1 图像内容的内涵及对应特征参数的提取图像总是包含有颜色、纹理、形状、大小等内容,而其中图像的颜色和纹理是其基本属性。在文献(Bharati et al., 2004;Tomita et al., 1990;Wang et al., 1996)中可以找到有关图像分析算法性能的比较,总结文献可知,各种算法作用的基础都是图像像素的灰度强度值,区别只是处理空间选择在空域、频域还是模型空间,对它们进行组合统计分析、频谱变换还是模型套用。它们的针对性及优势特长为图像分析提供了有效帮助(于海鹏等,2005)。
从纹理的颜色和明度特征考虑,选择与人体视觉及工程学息息相关的HSI色度模型,包括色调(H)、饱和度(S)和亮度(I)3个参数。
基于空域法的灰度共生矩阵选择对比度(CON)、二阶角矩(ASM)、方差和(SV)3个参数来反映木材像素灰度的二阶组合与分布规律信息,体现纹理的强弱、周期变化快慢以及粗细均匀性,整体概括木材纹理的主要特征。根据木材纹理特点,确定共生矩阵的结构参数d取3、θ取0°。
基于空域统计特征,从纹理基元的大小考虑,选择基于行程长度统计的长行程加重因子(LRE),针对木材纹理特点,确定计算特征参数时的行程长度取4、方向取0°。
小波法的优越之处在于将空域和频域结合,进行多尺度的频谱分析,有效提取纹理的低频和高频分量,得出其在水平、垂直和角方向上的频率变化信息,补充其他纹理方法在此方面的不足。根据木材纹理特点,选择纹理图像水平能量分布比重因子(EPLH),确定滤波器长度取8、分解尺度取2。
虽然单纯基于分形盒维法并不足以提取所有的纹理信息,但它计算出的分形维数能够很好地表达木材灰度的粗糙性和复杂性。因此,选择由像素灰度的分形特性统计而来的分形维数(FD)。
综上分析,确定出木材图像内容的综合变量体系:1)色调(H);2)饱和度(S);3)亮度(I);4)对比度(CON);5)二阶角矩(ASM);6)方差和(SV);7)长行程加重因子(LRE);8)分形维数FD);9)小波水平能量分布比重(EPLH)。
2 基于图像内容最大相似性原理的检索判别方法为达到基于图像内容进行检索识别的目的,采用最大相似原理是一种可行的方法。最大相似原理是指每一个物体都具有多项特征,且多个物体之间存在着特征交叉现象,即几个物体可能同时具有某种相同的特征,因此如果不以一项或少数几项特征为依据,而是将未知物体所提取出的所有量化特征与已知同类物体的相关量化特征进行综合比较,会得出一组相似系数。在一组相似系数中总会出现最大值,如果已知的数据库中包含未知物体,且提取的量化参数足够多,则这个最大的相似系数将是唯一的,即达到了检索的目的。
基于“内容"相似原理的树种检索方法主要优点为:1)采用计算机辅助、图像处理等先进手段提取特征量参数,较经验性描述更具客观性;2)用作检索基础的特征可以较多,即使存在个别由偶然因素引起的不正常参数,也不会导致结论的不正确性;3)数据库容量可不断增加,因而检索成功率也将不断提高;4)检索速度快,重现规律好;5)数字化、易修改、可移植程度高。最大相似原理的数学方式可以用2种算法来实现,即最小差值参数判别法、综合特征阈值法(刘镇波等,2004)。
2.1 最小差值参数判别法数学描述最小差值参数判别法是指不考虑未知标本量化特征参数的误差量,直接以已知标本与未知标本参数最接近的值为准,计算已知标本的参数与未知标本最接近的个数,从而确定未知标本为何类属。
从未知的标本上采集n项特征:x1,x2,x3,…,xn,即可表示成集合X(x1,x2,x3,…,xn),已知的标本组成一个集合Y(y1,y2,y3,…,ym),且每一个样本yi(i=1,2,…,m)都具有n项或多于n项的特征。因此所有已知的标本可构成一个二维矩阵Y
式中:m=1,2,…表示数据库中样本的记录号;n=1,2,…表示数据库中样本特征的序号。
将未知标本X与已知标本集合Y进行比较,即两者相减,并取绝对值,用集合A表示
式中:xj为标本的提取特征,j=1,2,…,n;yij为数据库中第i个样本的第j个特征,i=1,2,…,m,j=1,2,…,n。
在二维矩阵A中的aij=|xj-yij|(i=1,2,…,m;j=1,2,…,n),对二维矩阵进行列比较,即对(a11,a21,…,am1)进行比较,并将其中的最小值设为1,其他值设为0。此时矩阵中的每个元素不是1,就是0,而不存在其他的值。
设相似系数的集合为R,则R=|r1,r2,…,rm|T。
集合R中,ri表示未知木材标本与每个已知标本相比较的相似系数,且ri=ai1+ai2+…+aij(i=1,2,…,m;j=1,2,…,n)。
最后根据这一组相似系数来最终确定未知标本的归属。确定的方式为:在集合R中存在着rmax=max(r1,r2,…,ri,…,rm),rmax相对应的样本就是所要识别的。到此,整个识别过程结束。
2.2 综合特征阈值法数学描述综合特征阈值法是指考虑量化参数的提取误差及本身的变异情况,以已知标本与未知标本参数之间的差值在一定的阈值范围内浮动为准,计算已知标本的参数中符合阈值条件时的个数,从而最终确定未知标本为何种树种的识别方法。
同最小差值参数判别法一样,将未知标本X与已知标本集合Y进行比较,在所得到的二维矩阵A中,aij=|xj-yij|(i=1,2,…,m;j=1,2,…,n),再对二维矩阵进行列比较,即对(a11,a21,…,am1)进行比较,将满足“(aij/yij)<阈值"的aij设为1,其他值设为0。同样也可得出相似系数集合R。
最后,同最小差值参数判别法一样,根据这组相似系数可以求出最大的一个或几个相似系数,其所在记录的树种即可确定为未知标本,识别过程结束。
3 基于图像纹理内容的木材树种相似性检索实例及分析选择6个树种的木材纹理图像作为检验样本,其中3个与数据库中已知样本属同一树种,但图面内容不完全相同,检验这3个样本被从数据库中检索出的正确率;另外3个为国外树种,其纹理数据确定未被包括在数据库中,检验从数据库中检索出已知树种的纹理图像与被检图像的相似情况,如果检索得到的结果符合人眼视觉评定的“基本相近或相似"结论,则可认为利用纹理特征、以最大相似性原理进行木材树种图像的内容检索是可行的,效果是可期待的。
3.1 已知树种的识别检索通过最小差值判别法、综合特征阈值法对样本进行检索和判别,以硕桦(Betula costata )径向切面、落叶松(Larix gmelinii)径向切面、漆树(Toxicodendron vernicifluum)弦向切面为例,检索结果如图版Ⅰ-1、2所示。
从图版Ⅰ-1、2的检索结果及其相似系数可以看出,基于纹理特征的检索识别成功率较高;只有当图像纹理较弱或无纹理时,才会出现多项检索对应值的情况,且检索出的图像与被检索图像的整体相似或部位特征相似。在检索结果的基础上,进一步比较从数据库中检出的图像与被检索图像的视觉差异,可明显提高树种识别的准确率。最小差值判别法与综合特征阈值法的检索结果相比较,一般表现为综合特征阈值法的检索正确率与唯一性较好,而最小差值判别法经常返回的是一组相似系数相同的结果,即直接得到检索结论的能力较差,甚至有时会出现检漏的情况。
以硕桦的综合特征阈值法检索结果为例,将检索到数据库图像的原始数据与待识别的硕桦图像测量值比较。如表 1所示,数据库中的原始数据与待识别目标的测量数据并不对应一致,而存在着一定的差异,但利用识别程序基本上可识别出待识别目标的种类或排列出与之相近的种类。
选择确定未被包含在数据库中的树种,以红酸枝木(Dalbergia spp.)径向切面、条纹乌木(Diospyros spp.)径向切面、花梨木(Dalbergia odorifera)弦向切面为例,通过最小差值判别法和综合特征阈值法,对样本的相似性匹配效果进行检验,检索结果如图版Ⅱ-1、2所示。
再以花梨木的综合特征阈值法检索结果为例,将检索到数据库图像的原始数据与花梨木图像的纹理特征测量值比较,如表 2所示。
从图版Ⅱ-1、2和表 2可以看出,当数据库中不包含被检索图像时,检索返回的相似系数最高的结果往往并不唯一,这可以解释为:1)数据库中确实有多幅图像的纹理特征与被检索图像对应相似,因而检索结果不唯一,但这样的结果是令人满意的;2)数据库中没有与被检索图像太相似的图像,所以尽管返回的结果多,但其相似系数都不很高,即检索不算成功,此方面情况通常由数据库内存储的样本量较少或覆盖度不够全面所引起。当被检索图像的纹理特征明显且比较规则时,一般检索的效果较好,被检索图像与检出的图像之间易呈现较高的纹理对应性;当被检索图像的纹理特征不明显或无纹理时,一般会出现较多检索值的情况,但纹理特征的对应性不是很好,被检出的图像与被检索图像基本相似。在以上基础上,为保证检索效果,还需经过目视比对,因为也偶尔会出现检索结果与被检索对象从目视上就能判定不相似的情况。
4 讨论当被检索样本图像的纹理较弱或不呈现纹理特征时,检索结果的唯一性并不理想。当数据库中未包含被检索图像时,返回的相似系数最高的检索结果往往并不唯一,但被检索图像与检出图像间易呈现某些特征相似的情况。综合特征阈值法的检索正确率与唯一性通常要好于最小差值判别法。综合而言,基于图像纹理特征最大相似性的木材树种检索识别较易实现,是一种值得继续发展和应用推广的木材树种识别方法。
刘镇波, 刘一星, 于海鹏. 2004. 基于量化构造特征参数的木材树种计算机识别算法. 福建林学院学报, 24(3): 265-269. DOI:10.3969/j.issn.1001-389X.2004.03.018 |
刘忠伟, 章毓晋. 1999. 综合利用颜色和纹理特征的图像检索. 通信学报, 20(5): 36-40. DOI:10.3321/j.issn:1000-436X.1999.05.007 |
殷泽兴, 李介谷. 1999. 基于纹理特征的图像检索. 红外与激光工程, 28(6): 25-28. DOI:10.3969/j.issn.1007-2276.1999.06.006 |
于海鹏, 刘一星, 刘镇波. 2005. 木材纹理定量化算法探究. 福建林学院学报, 25(2): 157-162. DOI:10.3969/j.issn.1001-389X.2005.02.014 |
Bharati M H, Liu J J, MacGregor J F. 2004. Image texture analysis: methods and comparisons. Chemometrics & Intelligent Laboratory Systems, 72(1): 57-71. |
Tomita F, Tsuji S. 1990. Computer analysis of visual textures. MA: Kluwer Norwell.
|
Wang Z, Guerriero A, Sario M. 1996. Comparison of several approaches for the segmentation of texture images. Pattern Recognition Letters, 17: 509-521. DOI:10.1016/0167-8655(96)00006-2 |