林业科学  2018, Vol. 54 Issue (11): 111-120   PDF    
DOI: 10.11707/j.1001-7488.20181116
0

文章信息

郭慧, 王霄, 刘传泽, 周玉成.
Guo Hui, Wang Xiao, Liu Chuanze, Zhou Yucheng.
基于灰度共生矩阵和分层聚类的刨花板表面图像缺陷提取方法
Research on Defect Extraction of Particleboard Surface Images Based on Gray Level Co-Occurrence Matrix and Hierarchical Clustering
林业科学, 2018, 54(11): 111-120.
Scientia Silvae Sinicae, 2018, 54(11): 111-120.
DOI: 10.11707/j.1001-7488.20181116

文章历史

收稿日期:2018-04-02
修回日期:2018-05-14

作者相关文章

郭慧
王霄
刘传泽
周玉成

基于灰度共生矩阵和分层聚类的刨花板表面图像缺陷提取方法
郭慧1, 王霄1, 刘传泽2, 周玉成1,2     
1. 中国林业科学研究院木材工业研究所 北京 100091;
2. 山东建筑大学信息与电气工程学院 济南 250101
摘要:【目的】提出一种基于灰度共生矩阵和分层聚类的刨花板表面图像缺陷提取方法,根据缺陷部分与正常部分纹理特征不同,利用分层聚类算法将缺陷分离出来,以解决板面缺陷检测系统中刨花板表面纹理导致缺陷提取不准确的问题。【方法】将刨花板表面灰度图像划分成若干个窗口,使用灰度共生矩阵的统计特征参数对各窗口纹理进行表征,通过分层聚类算法将纹理特征不同区域区分开。首先确定灰度共生矩阵构造因子的取值,包括窗口大小、灰度级、方向和步长,构建出各个窗口的灰度共生矩阵;使用Fisher准则和线性相关性对灰度共生矩阵14个统计特征参数的表征能力进行度量,选取出分类能力强且相关性低的特征构成特征向量,所有窗口的特征向量构成样本集。然后运用BIRCH分层聚类算法对样本集进行聚类,为使聚类结果更准确,同时加快计算速度,提出一种优化策略,绘制样本集均值和统计直方图,将其波峰数量作为理想的类别数量,当聚类产生的类别数量大于理想类别数量时,将聚类结果中距离近的簇合并,解决聚类精度过高而导致的过分割问题。最后根据聚类结果,对原图像中各窗口进行标记,提取出缺陷区域。【结果】选择大小为512像素×512像素,带有杂物、油污、胶斑、大刨花和松软5种类型缺陷的刨花板表面图像,使用本研究方法能够准确将缺陷区域提取出来,精确度达92.2%,召回率达91.8%。【结论】基于灰度共生矩阵和分层聚类的刨花板表面图像缺陷提取方法,可解决因刨花板表面纹理导致缺陷提取不准确的问题,为机器视觉板面缺陷检测系统的缺陷度量和识别提供良好支撑。
关键词:灰度共生矩阵    纹理特征    分层聚类    BIRCH算法    缺陷检测    
Research on Defect Extraction of Particleboard Surface Images Based on Gray Level Co-Occurrence Matrix and Hierarchical Clustering
Guo Hui1, Wang Xiao1, Liu Chuanze2, Zhou Yucheng1,2     
1. Research Institute of Wood Industry, CAF Beijing 100091;
2. School College of Information and Electrical Engineering, Shandong Jianzhu University Jinan 250101
Abstract: 【Objective】A method for extracting defect regions on image of particleboards surfaces using gray level co-occurrence matrix and hierarchical clustering was proposed in this paper, which separated the targets from images according to the texture differences between defects and normal parts, in order to solve the problem of inaccurate defect segmentation caused by particle board surface texture in board surface defect detection system.【Method】The surface image was divided into several small windows and the texture of each window was characterized by the statistical textural feature parameters of the gray level co-occurrence matrix. Then, a hierarchical clustering method was used to distinguish the defect windows and the normal windows using the texture feature parameters. Firstly, the values of the four structural factors were chosen to build the gray level co-occurrence matrixes for each window, including the window size, gray level, direction and step. Secondly, the classification ability and correlation of the 14 statistical parametersof textural features for gray level co-occurrence matrix were evaluated using fisher criteria and linear correlation. Bydoing this, the features which have better classification ability and low correlation were chosen. The feature vector of each window was composed of the selected features values and all of the feature vectors constituted a sample set. The sample set was clustered by the BIRCH hierarchical clustering algorithm. In order to obtain an accurate clustering result, an optimization strategy was proposed in this paper. The histogram of sum average was drawn and the number of wave peaks was counted as the target category quantity. When the number of classes generated by the initial clustering was larger than the target category quantity, the clusters having closer distance were merged, which can avoid the over segmentation caused by high clustering precision. Finally, according to the clustering result, the windows in the original image were all marked and the defect areas were extracted.【Result】In the experiment, particleboards with five types of defects including sundries, oil stains, glue spots, big wood shavings and loose regions were used, and the size of the surface images was 512 pixels×512 pixels. Defect regions were extracted by the method proposed in this paper. The result showed that the method can extract the defect area with an accuracy of 92.2% and a recall rate of 91.8%.【Conclusion】The surface defect extraction method based on gray level co-occurrence matrix and hierarchical clustering can be used to solve the problem of inaccurate defect extraction caused by the texture of the particleboard surface, and it provides a good support for the measurement and identification of the defectsinmachine vision board defect detection system.
Key words: gray level co-occurrence matrix    texture feature    hierarchical clustering    BIRCH algorithm    defect detection    

随着数字图像处理技术和模式识别技术的发展,机器视觉已作为一种有效的缺陷检测手段应用于工业生产中。产品表面缺陷检测是机器视觉检测的一个重要部分,基于机器视觉的人造板表面缺陷检测系统能够实现对板材表面缺陷的快速、准确定位和识别。在缺陷检测过程中,由于缺陷面积微小,为了提高检测精度,系统会使用像素在2 000万以上的多个相机对板材表面进行图像采集。刨花板是一种常用的人造板材,是由木材或其他木质纤维材料的碎料胶合而成的,其表面存在细小的刨花,在缺陷检测系统采集到的高清晰度、高分辨率图像中,细小刨花会使图像呈现一定纹理,对图像分割造成干扰,同时噪声对图像分割的影响也更加显著,这些因素常导致无法将缺陷准确地从背景图像中提取出来。

针对复杂纹理背景下目标区域难以提取的问题,基于纹理特征的聚类方法是一种有效的解决手段(于海鹏等,2005Wang et al., 2006任宁等,2007业宁等,2007尹建新等,2011),首先对图像各区域的纹理特征进行表征,然后使用聚类算法对具有不同纹理特征的区域进行分类,从而将目标与背景区分开,其关键在于纹理特征的描述和聚类方法的选择。灰度共生矩阵是一种描述纹理特征的常用方法,使用统计特征参数对图像不同区域的纹理进行表征,其抗噪能力强、稳定性好、受图像质量影响小(杨旭,2016)。吴东洋等(2010)使用灰度共生矩阵和K-means聚类方法对木材缺陷进行了识别,Boss等(2012)白雪冰等(2008)将灰度共生矩阵与FCM模糊聚类方法相结合分别对乳房X光片中的病变区域和木材缺陷进行了识别,还有研究者将AP聚类算法用于基于灰度共生矩阵的纹理特征分析中(杨旭,2016)。

灰度共生矩阵的统计特征参数多达14个,且有些参数计算复杂,以往的通常做法是凭经验选择一部分参数进行研究(尹建新等,2011吴东洋等,2010朱蕾,2011邹丽晖,2007);但针对不同的纹理,每个参数的表征效果并不相同,因此在对刨花板表面图像进行分析时,需要通过科学的手段对各个特征参数的表征能力进行量化评估,挑选出最能反映图像纹理特点的参数。此外,在进行聚类时,常用的K-means、FCM模糊聚类等方法虽然可以得到较高的聚类精度,但均需要进行迭代计算,运算时间较长(Yedla et al., 2010Boss et al., 2012)。

针对以上问题,本研究提出一种基于灰度共生矩阵和分层聚类的刨花板表面图像缺陷提取方法。首先将图像划分成若干个窗口,为每个窗口构建灰度共生矩阵,使用Fisher准则和线性相关性对灰度共生矩阵各统计特征参数的表征能力进行度量,选取出分类能力强且相关性弱的特征构成特征向量。然后运用BIRCH分层聚类方法对特征向量集进行聚类,借助均值和特征的统计直方图对聚类结果进行优化。最后根据聚类结果,对原图像各窗口进行标记,提取出缺陷所在区域。

1 灰度共生矩阵的构建 1.1 灰度共生矩阵及统计特征参数

灰度共生矩阵是一种通过研究灰度的空间相关特性来描述纹理的常用方法,反映的是图像灰度分布关于方向、局部邻域和变化幅度的综合信息(Haralick et al., 1973)。灰度共生矩阵共有14个统计特征参数(Haralick,1979),包括角二阶矩(angular second moment,ASM)、对比度(contrast,CON)、相关(corrlation,COR)、熵(entropy,ENT)、方差(variance,VAR)、均值和(sum of average,SOA)、方差和(sum of variance,SOV)、逆差矩(inverse difference moment,IDM)、差方差(difference of variance, DOV)、和熵(sum of entropy,SOE)、差熵(diffenence of entropy,DOE)、最大相关系数(maximal correlation coefficient,MCC)和2个相关性度量参数(information measures of correlation,IMOC),其中后3个参数是对前11个参数的进一步描述,并非直接对纹理进行表征,且计算过程复杂,因此后3个参数很少被采用(Ulaby et al., 1986)。对图像进行纹理分析时,首先将图像划分成若干个窗口,为每个窗口分别构建灰度共生矩阵并计算各统计特征参数值,然后通过对各窗口的特征参数值进行比较和分析,将图像分成不同的纹理区域。

1.2 构造因子的取值

在构建灰度共生矩阵时,要根据所要表征的纹理特点,合理设置各构造因子的取值,包括步长d、方向参数θ、灰度级Ng和窗口大小S。刨花板表面图像背景部分纹理明显,非常细小,对比度强,杂乱无章,没有方向性和周期性;而缺陷部分纹理不明显,灰度值比较均一,对比度差。本研究在对刨花板表面图像纹理特点进行分析的基础上,结合试验确定各构造因子的取值。

1.2.1 方向参数θ的选择

方向参数θ表示2个像素点之间的角度关系,当纹理显示出一定的方向性时,主方向上的灰度共生矩阵与其他方向具有较大差异,常用的θ取值包括0°、45°、90°和135°等。由于刨花板表面图像纹理不具有方向性,因此参数θ影响较小。为了减小计算量,缩短计算时间,本研究取θ为0°。

1.2.2 窗口大小S和灰度级Ng的选择

由于刨花板表面图像纹理细小且没有明显的周期性,因此为了能够更好地保留细节、提高精度,应尽可能减小窗口大小S,保留较高的灰度级Ng。但S减小会使图像中窗口数量增多,Ng增加会增大灰度共生矩阵维数,从而引起运算时间增加,故要根据系统的实时性要求在S、Ng取值与计算时间上进行权衡。本研究通过试验来确定S和Ng的取值,在分辨率为512像素×512像素的刨花板表面图像中,当S和Ng取不同值时计算0°灰度共生矩阵的11个特征参数,整幅图像的矩阵构造和特征参数计算时间如表 1所示。对表 1进行分析,综合窗口大小S、灰度级Ng和计算时间3方面因素,本研究选择窗口大小S为16×16,灰度级Ng为16。

表 1 不同S、Ng取值的计算时间 Tab.1 The calculate time for different values of S and Ng
1.2.3 步长d的选择

d的取值会影响特征参数的计算结果,本研究通过试验考察步长d对各特征参数的影响情况,最终选择出合适的步长。选择大小为16×16、灰度级为16的正常窗口和带有胶斑、松软、油污、杂物、大刨花5种缺陷的窗口,在步长分别为1~8的情况下构建灰度共生矩阵,计算角二阶矩、熵、对比度、逆差矩、均值和、方差和6个常用特征参数,结果如图 1所示。可以看出,当d小于4时,各特征参数随d的变化比较明显,当d大于4时,大部分特征参数变化比较平稳,且此时各特征参数的离散度较好,有助于进行区分,因此本研究取步长d为4。

图 1 特征参数随步长变化 Figure 1 The change of the textural feature parameters with different step lengths
2 特征参数的评价和选择

灰度共生矩阵共有14个统计特征参数,窗口的特征向量维度较高,存在信息冗杂和重复表述的问题(余丽萍等,2010),通常凭经验选择4~6个特征参数作为研究对象;但每个参数对不同纹理的表征效果并不相同,在对刨花板表面图像进行分析时,要根据其纹理特点对各统计特征参数的表征能力进行度量。本研究提出一种基于Fisher准则和线性相关性分析的特征参数选取方法,使用Fisher准则对参数的分类能力进行量化,计算线性相关系数对参数间的相关程度进行判断,最终结合二者结果选出分类性能好、独立性强的特征参数。

2.1 特征参数分类能力评价

Fisher准则是特征选择的有效方法之一(Lu et al., 2014),其基本思想是鉴别能力较强的特征会使分开的2类类间距离尽可能大,而每类的类内距离尽可能小,Fisher比值越大,说明该特征的分类能力越强。本研究采用单个特征参数的Fisher比值作为判别标准,对参数的分类能力进行排序,筛选出分类能力较强的特征参数。

设将n个样本分为Cw1w2w3wC,其中第iwi包含ni个样本,xkmikmk分别表示在第k维上样本x的值、第i类样本均值和所有样本均值。第k维特征Fisher比值的计算公式为:

$ {J_{{\rm{Fisher}}}}\left(k \right) = S_{\rm{B}}^{(k)}/S_{\rm{W}}^{(k)}。$ (1)

其中,$S_{\rm{B}}^{(k)} $$ S_{\rm{W}}^{(k)}$分别表示第k维特征在样本集上的类间方差和类内方差,计算公式为:

$ S_{\rm{B}}^{(k)} = \sum\limits_{i = 1}^C {} {n_i}n{(m_i^{(k)} - {m^{(k)}})^2}; $ (2)
$ S_{\rm{W}}^{(k)} = \frac{1}{n}\sum\limits_{i = 1}^C {} \sum\limits_{x \in {w_i}} {} {({x^{(k)}} - m_i^{(k)})^2}。$ (3)

选取正常窗口和包含缺陷的窗口共121个,分别按上述确定的构造因子构建灰度共生矩阵。在14个统计特征参数中,由于后3个参数是对前11个参数的进一步描述,因此本研究使用各窗口前11个特征参数作为样本集,计算这11个特征参数的Fisher比值,结果如表 2所示。

表 2 各特征参数Fisher比值 Tab.2 Fisher value of each textural feature parameters
2.2 特征参数相关性评价

线性相关系数是一种比较常用的度量特征之间相关性的方法,其反映了特征之间关系的密切程度(谢娟英等,2014)。本研究通过计算线性相关系数来度量各个特征之间的相关程度,筛选出相关系数低的特征。

εη是2个随机变量,Conv(ε, η)表示2个变量的协方差,DεDη表示2个变量的方差,若Conv(ε, η)存在且Dε>0、Dη>0,则εη的线性相关系数ρ为:

$ \rho = \frac{{{\rm{Conv}}\left( {\varepsilon ,\eta } \right)}}{{\sqrt {{D_\varepsilon } \times {D_\eta }} }}。$ (4)

ρ值反映了2个变量的线性相关程度,ρ的绝对值越接近于1, 则εη的相关性越强,当ρ为0时,2个变量无线性关系。

采用上述相同的方法构造样本集,计算每2个特征参数之间的线性相关系数并取绝对值,得到线性相关系数矩阵如表 3所示。

表 3 特征参数线性相关系数矩阵 Tab.3 Linear correlation coefficient matrix of textural feature parameters

本研究将线性相关系数阈值设为0.85,即2个特征之间的线性相关系数大于0.85则认为有较强的相关性,否则认为相关性较低。分析表 3数据,可将11个特征参数分为5组,每组内各参数相关性较强,而各组间相关性较弱。第1组包括角二阶矩、熵、和熵、差熵、逆差矩,第2组包括对比度、差方差,第3组包括方差、均值和,第4组为方差和,第5组为相关。结合表 2各特征参数的Fisher比值,在每组中选取Fisher比值最高的特征。由于第5组相关特征的Fisher比值过低,因此只从前4组中进行选取,最终选择结果为角二阶矩、对比度、均值和、方差和4个特征参数。

3 基于分层聚类的纹理特征分类

图像中各窗口灰度共生矩阵构建完成后,计算角二阶矩、对比度、均值和、方差和4个特征参数的值作为该窗口的特征向量,所有窗口的特征向量构成样本集,通过对样本集进行分类将正常窗口和含有缺陷的窗口区分开,达到缺陷提取的目的。

聚类分析是一种常用的无监督学习方法,将样本集按某种准则划分成若干类,使相似的样本尽可能归为一类,不相似的样本尽量划分到不同的类中。鉴于人造板表面缺陷检测系统的实时性要求,本研究使用计算复杂度较低、聚类速度更快的BIRCH分层聚类算法,能够在类别数未知的情况下,通过对数据集的单遍扫描完成聚类,算法的时间和空间复杂度都较低(赵玉艳等,2008)。

3.1 BIRCH算法

BIRCH算法是一种基于距离的分层聚类算法(Zhang et al., 1996),通过构建聚类特征树CF-Tree(clustering feature tree)将样本集聚类成若干个簇,CF-Tree的节点由若干个聚类特征CF组成。给定一个聚类中Nd维样本{X1X2,…,XN},CF是对该聚类信息的汇总描述,定义为三元组:${\rm{CF}} = (N, \overrightarrow {{\rm{LS}}}, {\rm{SS}}) $其中,$ \overrightarrow {{\rm{LS}}} = \sum\limits_{i = 1}^N {} {X_i}$是样本的线性和向量,反映了聚类的质心,${\rm{SS}} = \sum\limits_{i = 1}^N {} X_i^2$是各样本的平方和,反映了聚类的直径。CF-Tree是1株高度平衡树,包括分支因子BL和阈值T 3个构建参数,B表示非叶节点所包含的最大CF数,L表示叶节点所包含的最大CF数,T表示叶节点中簇的半径阈值。例如,B=5、L=4的CF-Tree结构如图 2所示。新样本插入时,通过度量与各CF之间的距离,将样本插入到距离最近的叶节点CF所对应的簇中,如果插入后簇的半径超过了阈值T,则对该簇进行分裂。将所有样本插入到CF-Tree后,就完成了对样本集的聚类,得到的各簇就是聚类结果。如果聚类精度达不到要求或者在构建过程中CF-Tree过于庞大,可以调整参数BL和阈值T,对CF-Tree进行重构,从而优化聚类结果。

图 2 CF-Tree结构 Figure 2 Structure of CF-Tree
3.2 纹理特征聚类

将分辨率为512像素×512像素的刨花板表面图像分成1 024个16×16窗口,为每个窗口构建0°灰度共生矩阵,计算二阶矩、对比度、均值和、方差和作为窗口的特征向量,1 024个特征向量构成样本集,使用BIRCH分层聚类算法对样本集进行聚类,区分出正常窗口和含有缺陷的窗口。BIRCH分层聚类算法的关键在于CF-Tree构建参数BL和阈值T的选取以及对聚类结果的优化策略。

3.2.1 CF-Tree构建参数的选取

CF-Tree构建参数BL直接影响CF-Tree的规模,BL取值减小会使CF-Tree规模增大。蒋盛益(2009)通过试验确定BL参数值选择在[2,7]之间聚类效果较好。本研究的样本集属于中等规模大小,因此BL参数值都设置为5。

阈值T决定了聚类结果中每个簇的半径。T越小,同一个簇中各样本的距离越近,簇的数量越多,聚类精度越高,但是CF-Tree的规模会越大,消耗的时间和内存会越多;如果T过大,则会导致不同类别的样本被划分到同一簇中,达不到聚类精度。

选取带有胶斑、杂物、大刨花和油污缺陷的4张刨花板表面图像,形成4个样本集。当T在[10,40]区间取值时,对4个样本集进行聚类,得到的簇数量如表 4所示。

表 4 T取不同值时簇的数量 Tab.4 The number of clusters when T takes different values

对4个样本集进行手工分类,得到的簇数量均为2。从表 4可以看出,当T取30和35时,BIRCH分层聚类算法得到的簇数量与手工分类结果最相近。但当T取35时样本集4分类精度不够,当T取30时样本集3分类精度过高,这2种情况都需要对聚类结果进行优化。为了保证足够的分类精度,本研究阈值T设置为30。

3.2.2 聚类结果优化

聚类完成后,可能存在聚类精度不符合要求或CF-Tree过于庞大的情况,需要对聚类结果进行优化。通常的优化方法是对CF-Tree进行重构,增大或减小T后扫描CF-Tree中所有CF结点,进行分裂或合并;但重构过程计算量较大,T的变化量难以精确把控。为了使聚类结果更准确,同时加快计算速度,本研究提出一种优化策略,对样本集的均值和特征进行统计,绘制直方图,根据波峰数量确定样本集的理想类别数量K,当聚类产生的簇数量大于K时,将聚类结果中距离近的簇合并,从而解决分类精度过高而导致的过分割问题。

1) K的计算  均值和特征反映了窗口纹理的灰度特性。在刨花板表面图像中,缺陷部分的灰度变化较小、相对均一,灰度值与正常部分有一定差异,包含缺陷的窗口均值和比较相近,且与正常窗口相差较大。本研究将各窗口的均值和取整,统计各个值对应的窗口数量,绘制样本集的均值和统计直方图。由于缺陷窗口与正常窗口的均值和有较大差距,因此会在统计直方图中不同位置形成波峰,通过统计直方图中的波峰数量可以得出样本集的理想类别数量K图 3a为带有缺陷的刨花板表面图像,计算其各窗口的均值和,得到统计直方图如图 3b所示,直方图有2个波峰,较大的波峰由正常窗口形成,较小的波峰由缺陷窗口形成。

图 3 K的确定 Figure 3 Confirmation of K value a.刨花板表面图像Surface image of particleboard;b.均值和统计直方图Histogram of SOA.

2) 簇的合并  为了保证足够的分类精度,上述分析中选择了较小的阈值T,但当聚类完成后有可能出现精度过高的情况,即得到的簇数量大于K,需要进行簇的合并,合并过程如下。

① 计算各个簇的质心,计算公式为:

$ {X_o} = \frac{{\sum\limits_{i = 1}^N {} {X_i}}}{N}。$ (5)

式中:N为簇中样本数量;Xi为簇中第i个样本。

② 计算各簇之间的距离,将距离最近的2个簇合并,两簇之间的距离计算公式为:

$ D = {\left[ {{{({X_{o1}} - {X_{o2}})}^2}} \right]^{\frac{1}{2}}}。$ (6)

式中:Xo1Xo2是2个簇的质心。

③ 如果合并后的簇数量与K相同,算法结束;若簇数量仍然大于K,则返回步骤①再次寻找距离最近的2个簇进行合并。

4 试验 4.1 试验步骤

试验使用的计算机硬件配置为Intel Core I7-7500U四核2.7 GHz CPU处理器,8 G内存,采用Java编程实现灰度共生矩阵构建、特征参数计算和聚类。采集30 cm×30 cm刨花板表面图像,得到512像素×512像素灰度图像,提取缺陷区域,提取过程和参数设置如下:

1) 使用直方图均衡法对图像进行预处理,使其纹理特征更加明显;

2) 将每幅图像划分成1 024个16×16的窗口;

3) 构建每个窗口的0°灰度共生矩阵,构造因子d=4,Ng=16;

4) 计算每个窗口灰度共生矩阵的角二阶矩、对比度、均值和、方差和,构成该窗口的四维特征向量,所有窗口的特征向量构成样本集;

5) 绘制样本集的均值和统计直方图,计算波峰数量K

6) 使用BIRCH分层聚类算法对样本集进行聚类,得到初始聚类结果,CF-Tree的构建参数B=5、L=5、T=30;

7) 如果初始聚类结果的簇数量大于K,则通过簇的合并对结果进行优化;

8) 统计每个簇中的样本数量,数量最大的簇为正常窗口,其余为缺陷窗口,根据统计结果对原图像中各窗口进行标记,提取出缺陷区域。

4.2 结果与分析 4.2.1 缺陷提取结果

选取5张分别带有胶斑、松软、油污、杂物、大刨花胶斑混合缺陷的刨花板表面图像,使用4种方法进行缺陷区域提取,其中方法1为Otsu阈值法,方法2为吴东洋等(2010)方法,方法3为Boss等(2012)方法,方法4为本研究方法。4种方法的提取结果如图 4所示。

图 4 缺陷提取结果 Figure 4 Defect extraction results

图 4b可以看出,Otsu阈值法(方法1)无法将缺陷部分与正常部分区分开,其余3种基于灰度共生矩阵的纹理特征聚类方法都可以较好地提取缺陷。方法2使用5个特征参数和K-means聚类,提取出的缺陷面积最小,但存在漏检,松软缺陷提取不完全,没有将胶斑和杂物图像中面积最小的缺陷标识出来。方法3使用14个特征参数和FCM聚类,所有缺陷区域均被标识,且提取完整、边缘平滑,但松软缺陷存在较大面积的误检。本研究方法缺陷区域提取完整,虽然在提取松软缺陷时也存在误检,但较方法3大大减少。漏检往往会比误检造成更加严重的后果,因此在实际应用中更倾向于选择漏检率低的方法。

4.2.2 方法性能分析

1) 分类性能本研究使用精确度(Precision)和召回率(Recall)2个指标评价分类方法性能。精确度反映方法的查准率,召回率反映方法的查全率,指标值越高,表示分类性能越好。采集60张刨花板表面图像,其中带有胶斑缺陷15张、松软缺陷10张、油污缺陷10张、杂物缺陷15张、2种以上缺陷10张,形成5个样本集。设正常窗口为正样本,包含缺陷窗口为负样本,TP表示分类正确的正样本,FP表示分类错误的正样本,TN表示分类正确的负样本,FN表示分类错误的负样本。精确度和召回率的计算公式为:

$ {\rm{Precision = }}\frac{{{\rm{TP}}}}{{{\rm{TP + FP}}}}{\rm{;}} $ (7)
$ {\rm{Recall = }}\frac{{{\rm{TP}}}}{{{\rm{TP + FN}}}}。$ (8)

对各样本图像进行人工缺陷标识作为分类标准,分别使用方法2、方法3和本研究方法对各样本集进行分类,各方法分类结果的精确度和召回率如表 5所示。可以看出,方法2分类精确度最高,召回率最低;方法3分类精确度最低,召回率最高;本研究方法分类精度和召回率都较高。

表 5 各方法的分类性能 Tab.5 Classification performance of each method

2) 执行时间基于纹理特征的缺陷提取方法主要包括纹理特征计算和窗口聚类2个步骤。分别使用方法2、方法3和本研究方法对60张刨花板表面图像进行缺陷提取,计算平均每张图像所消耗的时间,结果如表 6所示。方法2、方法3和本研究方法使用的特征参数数量分别为5、14和4,参数数量越多,计算时间越长。在进行聚类时,本研究使用的BIRCH算法聚类时间最短,方法3使用的FCM方法时间最长。

表 6 各方法用时 Tab.6 The time consumed by each method
5 结论与讨论

本研究基于灰度共生矩阵和分层聚类方法对刨花板表面图像进行缺陷区域提取, 使用Fisher准则和线性相关性对灰度共生矩阵统计特征参数进行评价,选取出4个分类能力强且相关性低的特征构成特征向量,运用BIRCH分层聚类算法对特征向量集进行聚类,并提出一种基于均值和统计直方图的聚类结果优化策略,以解决聚类精度过高而导致的过分割问题。结果表明,基于灰度共生矩阵和分层聚类的刨花板表面图像缺陷提取方法能够准确将缺陷区域提取出来,精确度达92.2%,召回率达91.8%,解决了在高精度、高分辨率情况下刨花板表面缺陷难以准确检测的问题。

下一步,需要进一步提高方法的实时性,使其能够应用到人造板企业的实际生产中。在人造板连续压机生产线上,刨花板规格为240 cm× 480 cm,为了提高检测速度,可以使用多台相机和计算机进行图像采集和并行处理以加快检测速度。此外,由于缺陷面积占板面面积比例极小,可以先将采集到的图像划分成若干个大小合适的子区域,通过计算子区域的灰度均值或方差对缺陷所在子区域进行定位,再使用本研究方法提取出缺陷具体形状,以便后续对缺陷进行分类识别。

参考文献(References)
白雪冰, 王科俊, 邹丽晖. 2008. 基于灰度共生矩阵的木材表面缺陷图像的纹理分割方法. 东北林业大学学报, 36(12): 23-25.
(Bai X B, Wang K J, Zou L H. 2008. Approach to texture segmentation of wood surface defects based on gray level co-occurrence matrix. Journal of Northeast Forestry University, 36(12): 23-25. DOI:10.3969/j.issn.1000-5382.2008.12.010 [in Chinese])
蒋盛益, 李霞. 2009. 一种改进的BIRCH聚类算法. 计算机应用, 29(1): 293-296.
(Jiang S Y, Li X. 2009. Improved BIRCH clustering algorithm. Journal of Computer Applications, 29(1): 293-296. [in Chinese])
任宁, 于海鹏, 刘一星, 等. 2007. 木材纹理的分形特征及计算. 东北林业大学学报, 35(2): 9-12.
(Ren N, Yu H P, Liu Y X, et al. 2007. Fractal character and calculation of wood texture. Journal of Northeast Forestry University, 35(2): 9-12. DOI:10.3969/j.issn.1000-5382.2007.02.004 [in Chinese])
吴东洋, 业宁, 苏小青. 2010. 基于灰度共生矩阵和聚类方法的木材缺陷识别. 计算机与数字工程, 38(11): 38-41.
(Wu D Y, Ye N, Su X Q. 2010. Wood defect recognition based on GLCM and clustering algorithm. Computer & Digital Engineering, 38(11): 38-41. DOI:10.3969/j.issn.1672-9722.2010.11.010 [in Chinese])
谢娟英, 高红超. 2014. 基于统计相关性与K-means的区分基因子集选择算法. 软件学报, 25(9): 2050-2075.
(Xie J Y, Gao H C. 2014. Statistical correlation and K-means based distinguishable gene subset selection algorithms. Journal of Software, 25(9): 2050-2075. [in Chinese])
杨旭. 2016.木材加工自动化中的板材缺陷检测技术研究.南京: 南京林业大学硕士学位论文.
(Yang X. 2016. Research on defect detection technology in wood processing automation. Nanjing: MS thesis of Nanjing Forestry University.[in Chinese])
业宁, 丁建文, 王迪, 等. 2007. 基于LBP特征提取的木材纹理缺陷检测. 计算机研究与发展, 44(suppl): 383-387.
(Ye N, Ding J W, Wang D, et al. 2007. Wood texture defect detection with LBP features. Journal of Computer Research and Development, 44(suppl): 383-387. [in Chinese])
尹建新, 祁亨年, 冯海林, 等. 2011. 一种基于混合纹理特征的木板材表面缺陷检测方法. 浙江农林大学学报, 28(6): 937-942.
(Yin J X, Qi H N, Feng H L, et al. 2011. A method for wood surface defect detection based on mixed texture features. Journal of Zhejiang A & F University, 28(6): 937-942. DOI:10.3969/j.issn.2095-0756.2011.06.017 [in Chinese])
于海鹏, 刘一星, 孙建平. 2005. 基于小波的木材纹理分频信息提取与分析. 林业科学, 41(2): 100-105.
(Yu H P, Liu Y X, Sun J P. 2005. Separated frequency features extraction and analysis of wood texture based on wavelet. Scientia Silvae Sinicae, 41(2): 100-105. [in Chinese])
余丽萍, 黎明, 杨小芹, 等. 2010. 基于灰度共生矩阵的断口图像识别. 计算机仿真, 27(4): 224-227.
(Yu L P, Li M, Yang X Q, et al. 2010. Recognition of fracture image based on gray level co-occurrence matrix. Computer Simulation, 27(4): 224-227. DOI:10.3969/j.issn.1006-9348.2010.04.054 [in Chinese])
赵玉艳, 郭景峰, 郑丽珍. 2008. 一种改进的BIRCH分层聚类算法. 计算机科学, 35(3): 180-182.
(Zhao Y Y, Guo J F, Zheng L Z. 2008. Improved BIRCH hierarchical clustering algorithm. Computer Science, 35(3): 180-182. DOI:10.3969/j.issn.1002-137X.2008.03.055 [in Chinese])
朱蕾. 2011.木材表面缺陷图像识别的算法研究.南京: 南京林业大学硕士学位论文.
(Zhu L. 2011. Research on recognition algorithm of the wood surface defect image. Nanjing: MS thesis of Nanjing Forestry University.[in Chinese])
邹丽晖. 2007.基于纹理特征的木材表面缺陷识别方法的研究.哈尔滨: 东北林业大学硕士学位论文.
(Zou L H. 2007. Research on identification methods of wood surface defects based on texture features. Harbin: MS thesis of Northeast Forestry University.[in Chinese])
Boss R S C, Thangavel K, Daniel D A P, et al. 2012. Mammogram image segmentation using fuzzy clustering. International Conference on Pattern Recognition, Informatics and Medical Engineering (PRIME-2012), 290-295.
Haralick R M, Shanmugam K.1973. Textural features for image classification.IEEE Transactions on Systems Man & Cybernetics, SMC-3(6): 610-621.
Haralick R M. 1979. Statistical and structural approaches to texture. Proceedings of the IEEE, 67(5): 786-804. DOI:10.1109/PROC.1979.11328
Lu J C, Liu F L, Luo X Y. 2014. Selection of image features for steganalysis based on the Fisher criterion. Digital Investigation, 11(1): 57-66. DOI:10.1016/j.diin.2013.12.001
Ulaby F T, Kouyate F, Brisco B, et al. 1986. Textural information in SAR Images. IEEE Transactions on Geoscience and Remote Sensing, 24(2): 235-245.
Wang K Q, Bai X B. 2006. Classification of wood surface texture based on Gauss-MRF model. Journal of Forestry Research, 17(1): 57-61. DOI:10.1007/s11676-006-0014-4
Yedla M, Pathakota S R, Srinivasa T M. 2010. Enhancing K-Means clustering algorithm with improved initial center. International Journal of Computer Science and Information Technologies, 1(2): 121-125.
Zhang T, Ramakrishnan R, Livny M. 1996. BIRCH an efficient data clustering method for very large databases. ACM SIGMOD Record, 25(2): 103-114. DOI:10.1145/235968