南京农业大学学报  2021, Vol. 44 Issue (3): 576-585   PDF    
http://dx.doi.org/10.7685/jnau.202009023
0

文章信息

梁钊董, 熊兴国, 徐东坡, 陆明洲, 沈明霞, 张婉平, 童奇烈
LIANG Zhaodong, XIONG Xingguo, XU Dongpo, LU Mingzhou, SHEN Mingxia, ZHANG Wanping, TONG Qilie
基于形状及纹理特征的淡水鱼种类自动识别方法
An automatic method for freshwater fish species classification using shape and texture features
南京农业大学学报, 2021, 44(3): 576-585
Journal of Nanjing Agricultural University, 2021, 44(3): 576-585.
http://dx.doi.org/10.7685/jnau.202009023

文章历史

收稿日期: 2020-09-28
基于形状及纹理特征的淡水鱼种类自动识别方法
梁钊董1 , 熊兴国1 , 徐东坡2 , 陆明洲1 , 沈明霞1 , 张婉平3 , 童奇烈3     
1. 南京农业大学人工智能学院, 江苏 南京 210031;
2. 中国水产科学研究院淡水渔业研究中心, 江苏 无锡 214128;
3. 杭州市渔政渔港渔船监督管理总站, 浙江 杭州 310008
摘要[目的]本文利用自行搭建的淡水鱼图像采集装置在淡水鱼捕捞现场采集鱼体图像,在图像数据集上提出一种实用的淡水鱼自动识别分类方法。[方法]对14类淡水鱼图像进行预处理、自模板匹配操作,分割出完整的鱼体前景图像;提取鱼体全身、去尾鱼体及鱼尾的16维形状特征,利用灰度-梯度共生矩阵(GLGCM)、局部二值模式(LBP)及Gabor变换提取鱼体纹理特征,采用主成分分析法(PCA)分别筛选GLGCM纹理+形状、LBP纹理+形状和Gabor纹理+形状特征累积贡献率超过85%的特征组合。将降维前后特征集的70%和30%分别作为训练集和验证集,利用朴素贝叶斯、K近邻(KNN)、线性回归、决策树、随机森林、支持向量机(SVM)、梯度提升决策树(GBDT)7种机器学习方法训练淡水鱼品种分类器,并利用验证集数据分析对比各分类器的性能。[结果]鱼体前景图像分割算法测试结果表明,本文提出的自模板匹配方法可在不建立大规模模板库的前提下,以99.79%的正确率分割鱼体图像。分类器性能验证及对比结果表明,基于GLGCM纹理+形状特征的随机森林分类器的淡水鱼识别精度最高,降维获得的5维GLGCM纹理+形状特征向量识别14种淡水鱼的正确率达到99.52%。[结论]提出的自模板匹配方法可以在不构建庞大模板库的前提下实现鱼体前景区域的分割,基于筛选得到的GLGCM纹理+形状特征的随机森林分类器可用于自动识别淡水鱼品种。
关键词机器视觉   淡水鱼分类   纹理   特征降维   随机森林   
An automatic method for freshwater fish species classification using shape and texture features
LIANG Zhaodong1, XIONG Xingguo1, XU Dongpo2, LU Mingzhou1 , SHEN Mingxia1, ZHANG Wanping3, TONG Qilie3    
1. College of Artificial Intelligence, Nanjing Agricultural University, Nanjing 210031, China;
2. Freshwater Fisheries Research Center, Chinese Academy of Fishery Sciences, Wuxi 214128, China;
3. Supervision and Administration Station of Hangzhou for Fishing Industry, Vessels, and Ports, Hangzhou 310008, China
Abstract: [Objectives] An automatic method for freshwater fish species classification was proposed in this paper, based on the fish images collected by using a homemade fish image acquisition device. [Methods] A self-template matching method was developed to segment the fish body region from the binary image, which was obtained after the image pre-processing operations. Then the shape and texture features of the fish body were extracted, where the latter were obtained using three methods, including gray level-gradient co-occurrence matrix(GLGCM), local binary pattern(LBP), and Gabor filter. Principal component analysis(PCA) was carried out to transform a high dimensional feature set of GLGCM texture and shape, LBP texture and shape, or Gabor texture and shape into smaller ones that contained at least 85% of the information in the large feature set. 70% and 30% of the feature sets were used to train and validate species classification models established using seven machine learning methods[Naive Bayes, K-neares neighbors(KNN), linear regression, randow forest, decision tree, support vector machine(SVM), gradient boosting decision tree(GBDT)]. [Results] Fish body segmentation test indicated that the developed self-template matching method could segment the region on interest with a correct rate of 99.79%, which was achieved without the need of an extra fish body template library. Classification models validation results indicated that the random forest classifier using reduced dimensional GLGCM texture and shape feature performed best, and an average accuracy of 99.52% was achieved when it was used to classify all the 14 freshwater fish species. [Conclusions] The self-template matching method developed in this study could extract fish body region well without the need of an extra fish body template library. The reduced dimensional GLGCM texture and shape feature set was suitable for identifying the species of freshwater fish.
Keywords: machine vision    classification of freshwater fish species    texture    feature dimension reduction    random forest   

中国是淡水鱼养殖和消费大国, 水产养殖是国民经济收入的重要来源之一, 不同品种及大小的淡水鱼具有不同的市场及营养价值[1]。目前, 业内对淡水鱼的分级一般以鱼体长、厚及体重为依据, 使用滚筒筛、分级槽及组合输送带等方式实现机械分级, 该方式会给鱼体带来一定程度的损伤[2]。近年来, 研究人员尝试利用机器视觉技术自动测量鱼体尺寸参数, 并针对不同种类的淡水鱼建立基于体尺测量值的体重估算模型[3]。淡水鱼种类的准确识别是提升这些模型的鱼体重估算精度的前提, 而淡水鱼分类是深加工前的必要工序之一。当前, 对淡水鱼分类仍然主要依靠人工作业完成, 该方式作业强度大、耗费时间长且分类结果易受主观判断影响。

随着机器视觉技术在农业领域的广泛应用, 研究人员开始将机器视觉应用于淡水鱼种类的自动识别。White等[4]提取7种比目鱼图像的形状和颜色特征并构建分类器, 实现比目鱼的自动分类, 分类精度达到99.8%。Alsmadi等[5]在鱼体图像上手工定位锚点, 基于锚点提取刻画鱼体形状特征, 构建基于BP神经网络的鱼分类器, 识别正确率为84%。Hu等[6]截取淡水鱼图像局部皮肤块并提取其颜色、纹理等特征, 利用多分类支持向量机识别6种淡水鱼, 识别精度最高的是基于Bior 4.4小波的HSV颜色空间纹理特征, 识别率达到96.3%。吴一全等[7]基于Krawtchouk矩和灰度共生矩阵, 利用蜂群优化多核最小二乘支持向量机对鳊、鳙、鲫、青、草鱼5种鱼进行种类识别, 识别精度超过83.33%。涂兵等[8]提取鲫鱼、草鱼、鳊鱼和鲤鱼图像的背部轮廓, 提出1种基于鱼体背部轮廓相关系数的淡水鱼种类识别方法, 该方法的平均识别精度达到95%。谢忠红等[9]以4种常见的淡水鱼(鲫鱼、鳜鱼、鳊鱼和白鱼)为研究对象, 提出1种基于鱼背和鱼肚形纹理、颜色特征及鱼体、鱼尾形状特征的多特征融合淡水鱼种类识别方法, 在辅助光源和晴天自然光条件下, 对4种鱼的识别正确率均超过98%。

现有的利用机器视觉技术构建的淡水鱼分类器可识别的淡水鱼种类较少, 鱼体大小单一, 有些研究的鱼体图像数据集是在实验室环境下获取, 距离实际生产应用还有一定的距离。本文利用自行搭建的图像采集装置在淡水鱼捕捞现场采集淡水鱼图像, 采用鱼体形状及纹理特征构建淡水鱼分类识别模型, 实现对14种淡水鱼的自动分类。

1 材料与方法 1.1 图像采集装置

搭建的鱼体图像采集装置如图 1所示。该装置由鱼体传送模块、图像自动采集模块及控制模块3部分组成。

图 1 图像采集装置 Fig. 1 Image acquisition device

鱼体传送模块主要包括调速电机、传送带和型材支架。图像自动采集模块由暗箱(60 cm×60 cm×80 cm)、工业相机(MindVision MV-EM E200C)、工业镜头(AFT-1614MP)、相机支架和2个矩形补光灯(24 W)构成。控制模块为一体化工业控制计算机(崇畅科技), 配有Intel CoreTM i5处理器、4 GB内存、128 GB SSD储存容量及Windows 10操作系统, 采用VS2013和OpenCV设计人机交互界面、传送带运动及相机采集图像控制软件。将鱼体及1个标识鱼体编号的二维码放置在黑色托盘上, 传送带将托盘、鱼体及二维码送入暗箱, 完成图像采集。

1.2 淡水鱼图像采集

2020年1月11日至15日在浙江省杭州市萧山区湘湖现场打捞淡水鱼并利用图像采集装置采集鱼体图像。2名实验操作人员分别站立于暗箱鱼体出口的两端, 一端操作员负责将淡水鱼放置在传送带上, 调速电机驱动传送带将鱼体送入暗箱, 相机完成图像采集并将图像数据存入工控机; 另一端操作员负责将图像采集完成的鱼体取下传送带。鱼体图像采集结束后, 从工控机中读取所有图像并转存到PC机中形成鱼体图像数据集, 共获取14类淡水鱼约6 300张图像。其中, 鱼体尺寸覆盖范围较广, 最长、最短、最宽和最窄的鱼体尺寸分别为412、99、106和18 mm。

观察图像数据集中淡水鱼图像外观特征发现, 14种淡水鱼在颜色特征上只有背部灰黑而腹部银白和鱼体银白2类, 因此, 颜色未被选用为分类器的输入特征。在鳞片方面, 不同种类淡水鱼的鳞片密集程度、大小、厚薄等外观特征各异, 主要表现在鱼体纹理具有明显差异, 因此, 将纹理特征作为淡水鱼分类器的输入特征之一。在形状特征方面, 鱼体全身形状(如梭形、椭圆形、刀片形等)与鱼体轮廓拟合椭圆的长短轴比、鱼体长宽比等参数相关, 鱼体胖瘦程度与去尾鱼体拟合椭圆长短轴比及去尾鱼体长宽比相关, 背、腹部是否隆起及隆起部位与去尾鱼体占空比和似圆度相关, 尾部的宽细、长短、叉形等与鱼尾占空比及似圆度相关。因此, 将鱼体、去尾鱼体及鱼尾部分的体尺参数作为鱼品种分类器的输入特征。另外, 考虑到图像数据集中各鱼体大小、摆放角度、在图像中的位置各异, 引入具有平移、尺度及旋转不变性的Hu不变矩刻画鱼体形状特征。

1.3 鱼体前景图像分割

鱼体前景图像分割用于将鱼体前景区域从背景图像中分离出来, 从而便于后续的鱼体形状和纹理参数提取。前景图像分割主要由图像预处理、鱼体自模板匹配2个步骤构成。

1.3.1 鱼体图像预处理

本文采用的预处理操作包括灰度化、直方图均衡化、二值化及形态学处理。首先, 使用平均值法对RGB图像进行灰度化处理, 其计算公式为f(i, j)=(R(i, j)+G(i, j)+B(i, j))/3。其中: f(i, j)为灰度图中位于第i行、第j列的像素灰度值; R(i, j)、G(i, j)、B(i, j)分别为RGB图像中第i行、第j列像素的红色、绿色和蓝色分量值。以鱼体图像数据集中随机选择的一幅图像为例(图 2-a), 利用平均值法获得灰度图(图 2-b)。由于暗箱中亮度较低, 灰度图像中大部分像素的灰度值在0~50, 这使得鱼体和背景传送带之间的区分度低, 采用直方图均衡化的方法可以使灰度图(图 2-c)像素均匀分布在0~255。其次, 针对直方图均衡化后的灰度图采用大津法(OTSU)[10]进行二值化处理, 结果如图 2-d所示。最后, 利用直径为8像素的圆作为结构元素, 对二值图像执行开运算以去除零散的前景小区域, 结果如图 2-e所示, 记该开运算后的二值图为BWori

图 2 鱼体图像预处理 Fig. 2 Fish image preprocessing
1.3.2 鱼体自模板匹配

需要分割的前景鱼体区域是BWori中的连通区域之一, 传统的多模板匹配算法需要针对所有种类鱼体图像建立专属模板[11], 而且一旦待分类鱼的品种增加, 就需要更新模板库。本文提出1种自模板匹配方法, 用于匹配的模板来自待处理图像, 在无需专门模板库的前提下, 高效分割鱼体前景区域。

自模板匹配方法主要包含3个步骤: 候选搜索连通区域提取、候选模板提取以及匹配度计算。统计鱼体图像数据集中最小尺寸鱼体生成的BWori中鱼体连通区域的像素数为960, 设定最小连通区域像素数阈值(Tharea)为600。对BWori提取像素数大于Tharea的连通区域作为候选搜索连通区域, 记为ImgRegioncandi, 图 2-e对应的ImgRegioncandi图 3-a所示。

图 3 鱼体自模板匹配 Fig. 3 Fish body self-template matching S1:非连通域; S2、S5:传送带反光形成的连通域; S3、S7:暗箱漏光形成的连通域; S4:鱼体连通域; S6:LED读数屏连通域。 S1:The unconnected region; S2, S5:The connected domain formed by the reflection of the conveyor belt; S3, S7:The connected domain formed by the light leakage of the obscura; S4:The connected domain of fish body; S6:The connected domain of LED screen.

图 3-a中, 不同的候选搜索连通区域用不同的标号及颜色标识, S2、S5区域对应于图 2-a中的传送带。记候选搜索连通区域为S={S1, S2, …, Sm}, 其中, m为候选搜索连通区域的数量。暗箱的引入使得图像数据集中所有图像中托盘上下的传送带区域颜色特征比较稳定, 统计图像数据集中所有图像暗箱内传送带区域的RGB像素值范围(记为RangeBK)为[0, 0, 0]—[20, 70, 50]。连通域S6为图 2-a中的电子秤的蓝色LED读数屏, 统计图像数据集中LED读数屏的HSV值范围(记为RangeBE)为[100,150,43]— [255,255,255]。分别利用RangeBKRangeBE提取图 2-a中的黑色和蓝色掩膜图像并分别记为maskBKmaskBE, 然后利用式(1)获取去除黑色、蓝色掩膜区域后的图像(记为Img_candi_temple), 该图像中的连通区域即为候选模板。

(1)

式(1)中的运算符&及~分别对二值图像数值矩阵做逻辑与及非运算。针对图 2-a所示原始图像执行式(1)后获取候选模板图像如图 3-b所示, 提取其中的连通区域并形成候选模板集合T={T1, T2, …, Tn}, 其中: n为候选模板的数量。逐个提取候选模板Ti(i∈[1, n])并计算Ti和所有候选搜索连通域Sj(j∈[1, m])的匹配度, 形成维度为n×m的匹配度矩阵M, M的最大值对应的候选搜索连通区域即为鱼体区域掩膜。利用自模板匹配方法获取图 2-a对应的鱼体区域掩膜如图 3-c所示。将该鱼体区域掩膜与图 2-a中的原始图像做与运算, 即可分割得到如图 3-d所示的鱼体前景图像。

1.4 鱼体图像特征提取 1.4.1 鱼体形状特征提取

本文提取鱼体全身及尾部形态特征来描述不同品种淡水鱼的外形差异, 需要提取的体尺参数包括: 鱼体长(L)、体宽(W)、鱼尾长(D)、鱼体前景面积(S)、鱼体轮廓拟合椭圆长短轴长度等, 基于上述体尺参数, 计算鱼体占空比、似圆度、Hu不变矩等指标。

1) 体尺参数提取: 体尺参数提取的第1步是对鱼体前景二值图做水平校正。首先针对鱼体前景二值图做基于最小二乘法的直线拟合, 然后计算拟合直线的斜率及倾斜角, 最后以鱼体前景二值图中心点为旋转中心, 旋转前景二值图倾斜角的角度, 完成水平校正。以图 2-a原图为例, 其鱼体前景二值图的拟合直线如图 4-a所示, 水平校正后的结果如图 4-b所示。

图 4 鱼体体尺参数提取 Fig. 4 Extraction of fish body size parameters

统计鱼体前景区域像素数, 即为鱼体面积(Swhole)。提取鱼体前景区域最小外接矩形的长和宽, 即为鱼体长(Lwhole)和鱼体宽(Wwhole)。利用基于最小二乘的椭圆拟合算法拟合鱼体前景区域椭圆, 并分别记椭圆长、短轴长为awholebwhole。使用Suzuki等[12]方法提取水平校正后的鱼体图像轮廓, 结果如图 4-c蓝色轮廓所示。按列扫描鱼体轮廓得到鱼体背腹距离散点图, 将散点图拟合成高阶曲线, 得到如图 4-c中的黄色曲线。定位拟合曲线上的极小值点(图 4-c黄色曲线上的红色点), 该极值点对应的垂直于鱼体主轴线(图 4-c蓝色鱼体轮廓中的红色直线)的垂线即为鱼身和鱼尾的分界线, 利用分界线将鱼体分为去尾鱼体(图 4-d)和鱼尾(图 4-e)。

统计去尾鱼体像素数量及去尾鱼体轮廓像素数量, 即为去尾鱼体面积(Sbody)及去尾鱼体周长(Cbody), 利用最小外接矩形和拟合椭圆分别提取去尾鱼体长(Lbody)、去尾鱼体宽(Wbody)、去尾鱼体拟合椭圆长轴长(abody)和短轴长(bbody)。统计鱼尾区域及轮廓像素数量, 即为鱼尾面积(Stail)和鱼尾周长(Ctail), 鱼尾最小外接矩形长即为鱼尾长(Ltail)。基于上述体尺参数, 分别利用式awhole/bwholeLwhole/WwholeSwhole/(Lwhole×Wwhole)计算鱼体拟合椭圆长短轴比(k1, whole)、鱼体长宽比(k2, whole)及鱼体占空比(k3, whole)。分别利用式abody/bbody、Lbody/Wbody、Sbody/(Lbody×Wbody)及4π× Sbody/(Cbody×Cbody)计算去尾鱼体拟合椭圆长短轴比(k1, body)、去尾鱼体长宽比(k2, body)、去尾鱼体占空比(k3, body)及去尾鱼体似圆度(ebody)。利用Ltail/Lwhole及4π× Stail/(Ctail×Ctail)计算鱼尾占鱼体长度比(k4)及鱼尾似圆度(etail)。

2) 鱼体图像Hu不变矩提取: Hu矩是一种正规化中心距, 具有平移、尺度和旋转不变性[13], 本文提取Hu矩刻画鱼体形状特征。记图 4-b所示鱼体图像为I(x, y), 则I(x, y)的正规化中心距ηpqμpq/μ00r。其中: r=(p+q+2)/2;∀p+q≥2。μpq定义为 , 其中: x=m10/m00; y=m01/m00。而mpq的定义如式(2)所示:

(2)

基于正规化中心距ηpq, 计算得到7个Hu不变矩特征值(Φ1Φ2、…、Φ7)[13]。综合基于体尺参数的9个形状特征描述算子以及7个Hu不变矩特征值, 得到用于淡水鱼分类的16维形状特征向量。

1.4.2 鱼体表面纹理特征提取

淡水鱼的鳞片在大小、形状、光滑程度上存在差异, 这些差异可用鱼体鳞片纹理特征描述[14-15]。自动选取鱼体质心周围1块100像素×50像素的矩形区域内的纹理作为淡水鱼分类识别的特征之一。由于鱼鳞兼具边缘特征和灰度差异特征, 因此, 选用基于规范化的灰度-梯度共生矩阵(gray level-gradient co-occurrence matrix, GLGCM)[16]提取鱼体鱼鳞纹理特征。记图 3-d所示的鱼体前景灰度图像为f(M, N), MN分别为灰度图像对应的二维矩阵的行数和列数。通过以下3个步骤计算其GLGCM。

1): 计算f(M, N)的归一化梯度矩阵。采用3×3窗口的Sobel算子提取f(M, N)的梯度矩阵g(M, N), 其第(k, l)个像点的梯度值计算公式为 , 其中: gxgy分别采用式(3)和(4)计算得到。

(3)
(4)

式中: k=1, 2, …, M; l=1, 2, …, N。利用公式G(k, l)=INT(g(k, lNg/gmax)+1, 计算得到归一化的梯度矩阵。其中: INT为取整运算; gmaxg(M, N)中最大的梯度值; Ng是将梯度值归一化后期望的最大值, 本文Ng取值为16。

2): 利用式F(k, l)=INT(f(k, lNf/fmax)+1, 计算f(M, N)的归一化灰度矩阵。其中: fmaxf(M, N)中的最大灰度值; Nf是将灰度值归一化后期望的最大值, 本文取Nf为16。

3): 统计归一化灰度矩阵和梯度矩阵中同时使F(k, l)=i(i∈[1, Nf])和G(k, l)=j(j∈[1, Ng])的像点对数, 该对数即为灰度梯度共生矩阵的元素值H(i, j), 利用式(5)获取归一化后的GLGCM

(5)

最后, 利用表 1所示的公式提取鱼体鱼鳞的15个纹理参数。

表 1 基于灰度梯度共生矩阵的15个纹理参数提取方法 Table 1 Formula for gray level-gradient co-occurrence matrix based texture parameters extraction
参数名称
Parameter name
计算公式
Calculation formula
参数名称
Parameter name
计算公式
Calculation formula
小梯度优势
Small gradientdominance
大梯度优势
Large gradientdominance
灰度分布不均匀性
Gray distribution nonuniformity
梯度分布不均匀性
Gradient distribution nonuniformity
能量
Energy
灰度均值
Mean gray value
梯度均值
Mean gradientvalue
灰度标准差
Gray standarddeviation
梯度标准差
Gradient standarddeviation
相关性
Correlation
灰度熵
Grey entropy
梯度熵
Gradient entropy
混合熵
Entropy of mixing
差分矩
Difference matrix
逆差分矩
Inverse differencemoment
1.5 最优特征参数筛选

采用主成分分析(PCA)[17]对1.4节部分提取的31维特征(16个形状及15个纹理特征)进行降维, 在保持方差贡献最大的特征前提下, 减少特征集维数, 降低分类器计算量。利用PCA降维鱼体图像31维特征后获取的新正交特征的累积贡献率[18]图 5所示。

图 5 鱼体特征的主成分分析 Fig. 5 Principle component analysis of fish body characteristics 柱状图的高度表示各特征的贡献占比, 折线图表示所有特征的累积贡献率, 水平黑色点划线表示85%的累积贡献率。 The height of each column represents the contribution ratio of each individual feature, and each line chart represents the cumulative contribution rate of each feature, the black horizontal dot-dash line represents the cumulative contribution rate of 85%.

图 5显示: 每个类别的前5维特征参数的累积贡献率均高于85%, 可以认为PCA得到的前5维特征包含了整体特征的主要信息。因此, 可以将原来31维特征降到5维, 作为淡水鱼分类模型的输入进行淡水鱼种类识别。

2 结果与分析 2.1 基于自模板匹配的鱼体前景区域分割正确率分析

从图像数据集中分别为14类淡水鱼随机选择图像100张作为鱼体分割算法测试图像集, 利用1.3节提出的基于自模板匹配的鱼体分割算法及传统的多模板匹配算法处理测试集图像并对比分割正确率。在传统的多模板匹配算法中, 分别从14种淡水鱼各取1张图像并以最小外接矩形框选图像中的鱼体部分, 为各类淡水鱼分别创建1个鱼体匹配模板, 利用获得的14个模板构建多模板匹配所需的模板库。从模板库中依次选择模板以滑动窗口方式遍历待匹配图像, 在各个遍历位置旋转、缩放模板并计算模板与待匹配图像之间的相关系数, 选择相关系数最大值对应的匹配结果作为分割结果。利用2种分割方法处理1 400张淡水鱼图像, 其分割前景鱼体的正确率对比结果如表 2所示。

表 2 自模板匹配正确率 Table 2 Correct rate of self template matching
分割方法
Segmentation method
分割正确率/% Segmentation accuracy
鲌氏鲹
Caranx heberi

Caranx
大鳍鱊
Acheilognathus macropterus
刀鲚
Coilia ectenes
达氏鲌
Culter dabryi
红鳍原鲌
Redfin culter
花魤
Lateolabrax japonicus
多模板匹配
Multi-template matching
78 80 90 74 76 82 78
自模板匹配
Self-template matching
100 98 100 100 100 100 99
分割方法
Segmentation method
分割正确率/% Segmentation accuracy
黄尾鲴
Xenocypris davidi
鲫鱼
Crucian
蒙古鲌
Culter mongolicus
翘嘴鲌
Culter alburnus
三角鲂
Megalobrama terminalis
似鳊
Pseudobrama simoni
细鳞鲴
Xenocypris microlepis
多模板匹配
Multi-template matching
71 85 83 79 88 74 70
自模板匹配
Self-template matching
100 100 100 100 100 100 100

统计表 2数据得到, 多模板匹配算法和自模板匹配算法对于测试图像集中各前景鱼体分割综合正确率分别为79.14%和99.79%, 这表明, 自模板匹配算法能够在不建立匹配模板库的前提下, 取得更高的鱼体前景区域分割正确率。

2.2 分类模型训练与测试

除灰度-梯度共生矩阵外, 常用的图像纹理特征提取方法还包括局部二值模式(local binary pattern, LBP)[19]和Gabor滤波[20]等。针对2.1节正确分割前景鱼体区域的图像, 将鱼体质心周围100像素×50像素的矩形区域分为8个不重叠图像块。使用等价旋转不变LBP算法[19]为每个图像块提取9个灰度直方图特征进行串联组合, 得到72维LBP纹理特征。为每个图像块选择4个尺度、4个方向组成16个Gabor滤波器, 共得到144维Gabor纹理特征。利用PCA筛选LBP纹理+形状特征(共88维)和Gabor纹理+形状特征(共160维)中累积贡献率超过85%的特征维度, 获取13维LBP纹理+形状特征以及11维Gabor纹理+形状特征。分别将GLGCM+形状、LBP+形状和Gabor+形状特征集以7∶3的比例划分为淡水鱼分类识别训练与测试特征样本集。利用训练样本集分别训练7种分类模型(朴素贝叶斯、K近邻、线性回归、随机森林、决策树、支持向量机、梯度提升决策树), 并用测试样本集测试各分类模型性能, 引入准确率(accuracy)、精度(precision)、召回率(recall)、微平均[21](micro-F1)、宏平均(macro-F1)来验证模型的性能, 结果如表 3所示。

表 3 各特征向量集的分类模型性能评价 Table 3 Evaluation index of each classification model
分类模型
Classification model
特征向量集
Feature vectors set
准确率/%
Accuracy
精度/%
Precision
召回率/%
Recall
微平均/%
Micro-F1
宏平均/%
Macro-F1
朴素贝叶斯
Naive Bayes
GLGCM+形状特征
LBP+形状特征
Gabor+形状特征
98.57
92.34
96.55
98.69
93.45
95.77
98.42
94.23
95.88
98.49
95.44
96.78
98.57
94.43
95.76
K近邻
KNN
GLGCM+形状特征
LBP+形状特征
Gabor+形状特征
98.80
93.18
95.44
98.70
94.15
95.67
98.81
93.78
95.79
98.69
93.46
95.16
98.80
94.12
94.89
线性回归
Linear regression
GLGCM+形状特征
LBP+形状特征
Gabor+形状特征
88.80
85.66
87.88
87.91
86.16
86.96
88.45
85.88
87.15
87.38
86.77
87.66
88.80
85.96
86.55
随机森林
Random forest
GLGCM+形状特征
LBP+形状特征
Gabor+形状特征
99.52
97.56
98.66
99.52
97.66
98.45
99.57
97.88
98.88
99.53
97.44
98.69
99.52
97.85
98.75
决策树
Decision tree
GLGCM+形状特征
LBP+形状特征
Gabor+形状特征
99.76
96.88
98.55
99.68
97.15
98.69
99.76
97.25
98.35
99.72
96.96
97.96
99.76
96.79
98.22
支持向量机
SVM
GLGCM+形状特征
LBP+形状特征
Gabor+形状特征
99.28
98.66
99.15
99.16
98.33
98.88
99.25
98.75
98.69
99.18
98.56
99.15
99.28
98.62
99.28
梯度提升决策树
GBDT
GLGCM+形状特征
LBP+形状特征
Gabor+形状特征
98.80
96.88
97.77
99.01
96.96
97.88
98.89
7.229
8.56
98.90
96.55
98.64
98.80
97.68
98.78
Note: GLGCM: Gray level-gradient co-occurrence matrix; LBP: Local binary pattern; KNN: K-neares neignbors; SVM: Support vector machine; GBDT: Gradient boosting decision tree. 形状特征: Shape feature.

表 3数据表明, 基于GLGCM+形状特征的随机森林分类模型综合性能最优。为验证分类特征降维是否会影响淡水鱼种类识别的准确率, 将测试集的未降维的31维GLGCM+形状特征和降维后的5维GLGCM+形状特征分别投入到随机森林分类模型中, 得到如图 6所示的降维前、后特征的分类混淆矩阵[22]

图 6表明, 降维前基于GLGCM+形状特征的随机森林模型的分类准确率为100%;与此相比, 降维后的特征获得的分类正确率达到了99.52%。因此, 特征降维操作可以在保证高识别正确率的前提下, 降低淡水鱼分类器的计算量。

图 6 用降维前、后特征获得的分类混淆矩阵 Fig. 6 Confusion matrix obtained by random forest with using character vector
3 结论

1) 本文利用自行搭建的图像自动采集装置在渔场基地采集淡水鱼图像, 对鱼体摆放角度、方向不进行限定。在此图像数据集上研发的鱼体形状、纹理特征提取算法以及淡水鱼分类识别模型实用性较高;

2) 提出了一种自模板匹配算法, 在不需要额外构建鱼体模板库的前提下, 以99.79%的平均正确率提取鱼体前景区域;

3) 从鱼体全身、去尾鱼体及尾部3个尺度提取鱼体形状特征共16个描述算子, 分别与灰度-梯度共生矩阵、局部二值模式和Gabor纹理特征构建淡水鱼分类特征向量, 并比较不同纹理+形状特征在不同分类器上的淡水鱼识别性能。结果表明, 基于灰度-梯度共生矩阵纹理+形状特征的31维特征向量的随机森林模型可以100%正确识别14种淡水鱼。为提升分类器计算速度, 使用主成分分析法将31维灰度-梯度共生矩阵纹理+形状特征筛选为5维最佳特征, 筛选后的特征对14种淡水鱼的分类整体正确率达到99.52%。表明, 筛选后的灰度-梯度共生矩阵纹理+形状特征能以较低的计算量, 获得理想的淡水鱼分类正确率。

需要指出的是, 本文提出的自模板匹配算法综合利用了连通区域像素数及图像颜色空间阈值确定候选搜索连通区域和候选模板, 算法对图像采集环境的稳定性具有一定的要求。如果调整鱼体图像采集装置的设计(如相机与传送带的距离、传送带颜色等), 则需要根据新的图像数据集调整自模板匹配算法所需的连通区域像素数及图像颜色空间阈值。另外, 本文建立的淡水鱼分类模型接近100%的识别精度是使用与训练集同属的图像数据集中30%的图像测试获得, 也就是说模型已经学习了测试图像中的所有14种的淡水鱼形状及纹理特征。如果使用包含这14种以外的淡水鱼图像来测试模型, 模型分类精度必然会有所下降。因此, 后期模型实际使用之前, 需要针对需要分类识别的所有的淡水鱼种类采集一定数量的图像, 训练模型学习其GLGCM+形状特征, 进而确保模型的高效和实用。

参考文献(References)
[1]
王坤殿. 淡水鱼种类识别与重量在线检测方法研究及装备设计[D]. 武汉: 华中农业大学, 2015.
Wang K D. Study of Freshwater fish species identification and on-line weight detection and equipment design[D]. Wuhan: Huazhong Agricultural University, 2015(in Chinese with English abstract).
[2]
李玲, 宗力, 王玖玖, 等. 大宗淡水鱼加工前处理技术和装备的研究现状及方向[J]. 渔业现代化, 2010, 37(5): 43-46, 71.
Li L, Zong L, Wang J J, et al. Research status and development trend of massive freshwater fish pre-treatment processing technology and equipment[J]. Fishery Modernization, 2010, 37(5): 43-46, 71 (in Chinese with English abstract). DOI:10.3969/j.issn.1007-9580.2010.05.011
[3]
张志强. 基于机器视觉的淡水鱼品种识别及重量预测研究[D]. 武汉: 华中农业大学, 2011.
Zhang Z Q. Research on freshwater fish species recognition and weight prediction based on machine vision[D]. Wuhan: Huazhong Agricultural University, 2011(in Chinese with English abstract).
[4]
White D J, Svellingen C, Strachan N J C. Automated measurement of species and length of fish by computer vision[J]. Fisheries Research, 2006, 80(2/3): 203-210.
[5]
Alsmadi M, Omar K B, Noah S A, et al. A hybrid memetic algorithm with back-propagation classifier for fish classification based on robust features extraction from PLGF and shape measurements[J]. Information Technology Journal, 2011, 10(5): 944-954. DOI:10.3923/itj.2011.944.954
[6]
Hu J, Li D L, Duan Q L, et al. Fish species classification by color, texture and multi-class support vector machine using computer vision[J]. Computers and Electronics in Agriculture, 2012, 88: 133-140. DOI:10.1016/j.compag.2012.07.008
[7]
吴一全, 殷骏, 戴一冕, 等. 基于蜂群优化多核支持向量机的淡水鱼种类识别[J]. 农业工程学报, 2014, 30(16): 312-319.
Wu Y Q, Yin J, Dai Y M, et al. Identification method of freshwater fish species using multi-kernel support vector machine with bee colony optimization[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(16): 312-319 (in Chinese with English abstract). DOI:10.3969/j.issn.1002-6819.2014.16.040
[8]
涂兵, 王锦萍, 王思成, 等. 基于背部轮廓相关系数算法的淡水鱼种类识别研究[J]. 计算机工程与应用, 2016, 52(16): 162-166.
Tu B, Wang J P, Wang S C, et al. Research on identification of freshwater fish species based on fish back contour correlation coefficient[J]. Computer Engineering and Applications, 2016, 52(16): 162-166 (in Chinese with English abstract). DOI:10.3778/j.issn.1002-8331.1512-0082
[9]
谢忠红, 郭小清, 程碧云, 等. 基于多特征的淡水鱼种类识别研究[J]. 扬州大学学报(农业与生命科学版), 2016, 37(3): 71-77.
Xie Z H, Guo X Q, Cheng B Y, et al. Species recognition of fishes based on multiple features[J]. Journal of Yangzhou University(Agricultural and Life Science Edition), 2016, 37(3): 71-77 (in Chinese with English abstract).
[10]
Mala C, Sridevi M. Multilevel threshold selection for image segmentation using soft computing techniques[J]. Soft Computing, 2016, 20(5): 1793-1810. DOI:10.1007/s00500-015-1677-6
[11]
Mahalakshmi T, Muthaiah R, Swaminathan P. An overview of template matching technique in image processing[J]. Research Journal of Applied Sciences, Engineering and Technology, 2012, 4(24): 5469-5473.
[12]
Suzuki S, Be K. Topological structural analysis of digitized binary images by border following[J]. Computer Vision, Graphics, and Image Processing, 1985, 30(1): 32-46. DOI:10.1016/0734-189X(85)90016-7
[13]
Andalo F A, Miranda P A V, Torres R D S, et al. Shape feature extraction and description based on tensor scale[J]. Pattern Recognition, 2010, 43(1): 26-36. DOI:10.1016/j.patcog.2009.06.012
[14]
Mohanaiah P, Sathyanarayana P, Gurukumar L. Image texture feature extraction using GLCM approach[J]. International Journal of Scientific and Research Publications, 2013, 3(5): 1-5.
[15]
Hubara I, Courbariaux M, Soudry D, et al. Quantized neural network: training neural networks with low precision weights and activations[J]. Journal of Machine Learning Research, 2017, 18: 1-30.
[16]
洪继光. 灰度-梯度共生矩阵纹理分析方法[J]. 自动化学报, 1984, 10(1): 22-25.
Hong J G. Gray level-gradient cooccurrence matrix texture analysis method[J]. Acta Automatica Sinica, 1984, 10(1): 22-25 (in Chinese with English abstract).
[17]
秦立峰, 何东健, 宋怀波. 词袋特征PCA多子空间自适应融合的黄瓜病害识别[J]. 农业工程学报, 2018, 34(8): 200-205.
Qin L F, He D J, Song H B. Bag of words feature multi-PCA subspace adaptive fusion for cucumber diseases identification[J]. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(8): 200-205 (in Chinese with English abstract).
[18]
丁天华, 卢伟, 张超, 等. 基于MUSIC功率谱和CPNN的鸡蛋散黄无损检测方法[J]. 南京农业大学学报, 2015, 38(6): 1009-1015.
Ding T H, Lu W, Zhang C, et al. A nondestructive detection method of scattered eggs based on MUSIC power spectrum and CPNN[J]. Journal of Nanjing Agricultural University, 2015, 38(6): 1009-1015 (in Chinese with English abstract). DOI:10.7685/j.issn.1000-2030.2015.06.021
[19]
Ahonen T, Hadid A, Pietikäinen M. Face description with local binary patterns: application to face recognition[C].//IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006: 2037-2041.
[20]
高梓瑞. Gabor滤波器在纹理分析中的应用研究[D]. 武汉: 武汉理工大学, 2012.
Gao Z R. The research of the Gabor filter in the texture analysis applications[D]. Wuhan: Wuhan University of Technology, 2012(in Chinese with English abstract).
[21]
AlBeladi A A, Muqaibel A H. Evaluating compressive sensing algorithms in through-the-wall radar via F1-score[J]. International Journal of Signal and Imaging Systems Engineering, 2018, 11(3): 164-171. DOI:10.1504/IJSISE.2018.093268
[22]
米爱中, 张盼. 一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版), 2017, 36(2): 116-121.
Mi A Z, Zhang P. A method of classifier selection based on confusion matrix[J]. Journal of Henan Polytechnic University(Natural Science Edition), 2017, 36(2): 116-121 (in Chinese with English abstract).