Fittings detection in transmission line images with occlusion relation inference
-
摘要: 实现输电线路图像典型金具的精准检测是进行其缺陷检测的前提。针对通用目标检测模型对密集分布、遮挡严重的金具检测精度较低、易出现漏检等问题,提出了一种结合金具间遮挡结构信息和场景关联信息的典型金具检测方法。基于经典的Faster R-CNN模型提取金具特征作为节点,提取整张图像特征作为金具场景关联信息,学习金具标注框间相交区域信息作为金具遮挡关系信息,并采用图同时建模金具特征、场景关联信息和遮挡关系信息,通过门控循环单元信息传递机制构建结构推理模块完成金具类别和位置的联合推理检测。为了验证所提方法的有效性,选取了8类存在遮挡连接关系的金具进行实验,其中,原始Faster R-CNN模型的mAP值为81.30%,改进模型的mAP值为84.15%。实验结果表明,本文方法一定程度上提高了遮挡严重金具的检测精度,为后续的金具故障诊断奠定良好的基础。Abstract: The accurate detection of typical fittings in transmission line images is the premise of fault detection. This study proposes a typical fittings detection method that combines occlusion structure information and scene association information to address the problems of low detection accuracy and missed detection of the common target detection model, such as dense distribution and serious occlusion of the fittings. Based on the classical Faster R-CNN detection model, the method extracts features of the entire image of fittings as scene association information, learns the intersecting area information between the marking frames as occlusion structure information, uses a graph to model the feature of fittings, scene-related information and occlusion structure information, and constructs a structure reasoning module through the information transmission mechanism of the gated recirculating unit to complete the joint inference detection of the category and position of fittings. Experiments with eight types of fittings with occlusion relationships are chosen to validate the effectiveness of the proposed method. The Faster R-CNN model shows an mAP value of 81.30%, while the proposed model has an mAP value of 84.15%. The experiments show that the proposed method can improve the detection accuracy of serious occlusion fittings to some extent and that it has laid a good foundation for the subsequent fault diagnosis of the fittings.
-
输电线路作为电力系统的重要基础设备之一,其运行状态的安全稳定是电力传输的重要前提保障。金具[1-2]作为输电线路上种类繁多且应用广泛的金属附件,主要用于支持、固定、接续裸导线和其他导体。输电线路长期暴露在野外恶劣环境下,一些金具部件极易产生锈蚀、破损和脱落等故障,就会对整个电力系统的稳定运行造成威胁,因此对金具部件进行定期检修可以有效保障线路的正常运行。传统的金具检修方式为人工巡检,费时费力且检修效率较低,目前电力系统已广泛采用安全系数较高的直升机和无人机进行输电线路上金具巡检工作[3-4]。但由于拍摄角度的多变性和金具所处背景的复杂性,必须利用鲁棒性较强的图像处理算法,并结合金具的背景信息处理其检测问题,这能够很大程度地提高输电线路自动化巡检的效率。
目前,输电线路图像金具检测工作也取得了一定的进展,以防振锤、线夹和均压环等金属部件为研究对象,相关的检测算法研究主要以传统图像处理、机器学习方法为代表和以深度学习算法为代表两大类。基于传统方法的输电线路金具识别研究中,文献[5]通过提取图像边缘,根据防振锤、绝缘子等部件中存在的圆形边缘进行识别分类。文献[6]提出一种利用层次模型“与或图”对目标进行分解表达,建立部件之间的约束关系,构建多向的判别路径的方法,该方法在少量样本的条件下,能有效地实现若干输电线路部件的缺陷判别。文献[7]基于图像灰度变换、Otus算法分割和Hough变换实现了物体的精确识别。为实现对防振锤锈蚀的识别,文献[8]结合了形态学处理和RGB彩色模型,通过图像色区的不同检测防振锤锈蚀缺陷。这类算法主要针对单一金具识别,并不适用于复杂背景下输电线路的多类部件检测,并且很难达到输电线路部件检测的精度和效率之间的平衡,其具有一定的局限性。随着深度学习研究的逐渐深入,基于深度学习的金具检测算法越来越多,文献[9]提出一种将多尺度特征融合方法与输电线路关键部件的检测相结合的算法,提高了算法在具有边缘计算能力的移动端ARM设备上的运行速度和部件的检测精度。文献[10]提出了一种基于改进SSD模型的金具检测方法,通过嵌入关系模块有效提升了小目标金具的检测精度,但模型检测精度较低且参数量较大。文献[11]提出了一种结合KL散度和形状约束的 Faster R-CNN 典型金具检测方法,有效地提高了模型定位金具目标的准确性。基于深度学习的检测算法虽然一定程度上可以检测出金具目标,但由于仅仅关注图像内目标感兴趣区域附近的局部信息,忽略了图像内丰富的场景信息和目标间的关系信息,这不可避免地会限制所检测物体的准确性,容易导致模型出现漏检、误检等问题,故直接使用以上算法检测效果不佳。相比于公共数据集,输电线路金具数据集的特殊之处在于,最初安装金具时需要遵循一定的安装规则,即多类金具间的隐式位置关系信息,进而造成巡检图像中金具间的遮挡现象,故通过结合场景关联信息和金具间的关系信息有助于更好地实现复杂场景中多类金具检测的精准定位[12-14]。
本文针对在巡检图像中金具所处背景复杂且金具间存在复杂遮挡问题,提出了一种基于遮挡关系推理的金具检测方法,选取综合目标检测效率和精度平衡的超快速区域卷积神经网络(faster region-based convolutional neural networks, Faster R-CNN)模型[15]作为基础模型,构建结合金具间遮挡关系信息的图,并以金具所处场景信息作为图迭代更新的指导信息,进行输电线路金具位置和类别的联合推理检测。其中,金具目标作为图的节点,金具间的遮挡关系信息和金具所处的背景信息作为金具节点状态更新的指导信息,以提高金具的检测精度,从而为输电线路典型金具运行状态的智能检测提供新的思路。
1. Faster R-CNN模型
Faster R-CNN模型是Ren等[16]在Fast R-CNN模型的基础上改进提出的,主要分为4个部分,分别为卷积层提取特征、生成候选区域 (region proposal networks,RPN)、感兴趣区域池化(RoI pooling)[17]及分类/回归预测。在检测目标时,先将整幅图像输入卷积神经网络中提取图像特征,特征提取部分采用的是VGG16网络,通过卷积和池化输出后续用于分类和预测的特征图;将生成的特征图输入到RPN中用于生成候选区域,即在特征图上以每个点为中心生成9种不同大小的锚框,然后通过3×3的滑动窗口生成特征向量,并基于全连接层和分类层输出参考框作为前景的置信度;由于RPN中提取出的区域建议框和特征图上区域形状差异较大,为保持卷积神经网络输入尺度固定,采用ROI pooling将输入中任意尺度的特征图转化成统一尺度的特征向量;最后使用全连接层以及softmax分类器计算出不同区域建议的类别,其损失函数为交叉熵函数,再通过边界框回归对目标框进行微调,得到精确的边界框位置,其损失函数为Smooth L1函数,Faster R-CNN模型的整体框架如图1所示。
Faster R-CNN模型的主要创新在于提出RPN网络。RPN是全卷积网络,可以和Faster R-CNN模型的主干网络共享全局特征,实现了端到端的目标检测。但是,Faster R-CNN模型在分类和位置回归时,只利用了金具感兴趣区域内的视觉特征,导致金具检测器出现图2的漏检情况(如虚线框所示),图(a)漏检了与联板相连的提包式悬垂线夹和被均压环遮挡的线夹,图(b)漏检了与调整板相连的U型挂环。如果能够利用金具间的连接关系,即巡检图像中金具标注框间的遮挡关系,可以一定程度上改善输电线路金具漏检现象。
2. 基于遮挡关系推理的输电线路图像金具检测方法
本文的主要研究任务是在海量的输电线路航拍巡检图像中更加精准地检测多类金具,选取Faster R-CNN作为基础模型进行输电线路图像金具检测。为了构建以金具间遮挡区域关系信息作为边信息的图,首先需要学习金具目标间关于遮挡区域的位置关系表达,借鉴数学几何中相交区域的位置描述思想,本文提出了金具目标间遮挡关系信息的描述方法,即将学习目标标注框间相交区域的位置信息作为其遮挡关系信息,并采用基础模型提取金具目标特征作为节点,提取整张图像特征作为场景关联信息,与遮挡关系信息一起作为推理检测过程的指导信息,并基于节点的最优状态完成金具目标的检测。图3为整体检测框架图,其中虚线框为金具图建模后的结构推理检测部分。
2.1 基于金具遮挡关系信息描述的边建模
为了完成基于金具遮挡关系信息描述的图的设计,首先需要构建基于金具遮挡关系信息描述的边。具体为,在一张巡检图像中,基于两金具标注框相交区域的坐标位置描述,完成对两金具间包含遮挡关系信息的边建模。其主要作用为,可以帮助检测模型充分地学习到金具间的遮挡关系信息,而不再仅仅关注金具目标信息。在公共检测数据集中,由于目标间存在较少的遮挡情况,在构建以目标为节点的图的边时,通常以目标标注框的相对位置关系表达式来描述两者的几何位置关系,对图片中所有目标计算了几何关系,这并未体现目标间的相交情况。区别于公共检测数据集,输电线路的金具由于在最初安装时遵循一定的安装规则,进而造成了金具间的遮挡现象,具体示例见图4。图4(a)从上往下依次为重锤和提包式悬垂线夹的遮挡区域示意图、U型挂环被其他金具的遮挡区域示意图和联板与线夹的遮挡区域示意图;图4(b)为金具遮挡关系,从上往下依次为重锤与线夹、均压环与线夹、联板与线夹、均压环与联板、U型挂环与调整版。通过分析输电线路图像中金具间存在的遮挡区域可知,两两相交的区域通常包含两类目标的部分特征信息,具有一定的相似性,相对于金具的固定位置关系,金具间的相互遮挡信息具有代表性且遮挡区域具有一定的结构化,故完成金具节点间的边结构设计之前,需要完成对金具间的遮挡关系描述,以替代原有的相对位置关系表描述。
基于输电线路中金具安装规则的先验知识,实际输电线路场景中金具间的遮挡关系与人工标注的输电线路图像中金具标注框的相交关系密切相关,且标注框相交区域具有一定的相似性,故金具目标间遮挡关系描述可以转换成金具标注框相交区域的位置关系描述。输电线路图像中两两金具标注框间存在相交与未相交两种关系,描述标注框间的相交区域前需要判断两者之间是否存在相交,若满足判断条件,则判定两者存在相交关系,即目标间存在遮挡关系。
通过数据集标注信息可知金具目标标注框的左上角和右下角坐标,通过几何数学关系可求得标注框的几何坐标为
$(x,\;y)$ ,即标注框的中心坐标,w和h分别代表标注框的宽和高,则目标m和目标n的遮挡判断条件为$$ \left\{\begin{split} &\left| {{x_m} - {x_n}} \right| \leqslant 1/2({w_m} + {w_n}) \\ &\left| {{y_m} - {y_n}} \right| \leqslant 1/2({h_m} + {h_n}) \end{split}\right.$$ (1) 式中:
${x_{m}}$ 、${y_{m}}$ 、${w_{m}}$ 、${h_{m}}$ 为目标m的标注框的几何坐标;${x_{n}}$ 、${y_{n}}$ 、${w_{n}}$ 、${h_{n}}$ 为目标n的标注框的几何坐标。当目标m和目标n同时满足式(1)时,即可判断两者存在相交即遮挡。当目标m、n的标注框存在相交区域时,可通过式(2)求得相交区域的几何坐标为(
${x_{mn}}$ ,${y_{mn}}$ ,${w_{mn}}$ ,${h_{mn}}$ )。当两者未存在相交时,其相交区域坐标为$ (0,0,0,0) $ 。$$ \left\{ \begin{split} &{x_{mn}} = \max ({x_m},{x_n}) \\ &{y_{mn}} = \max ({y_m},{y_n}) \\ &{w_{mn}} = \min ({w_m} + {x_m},{w_n} + {x_n}) - {x_{mn}} \\ &{h_{mn}} = \min ({h_m} + {y_m},{h_n} + {y_n}) + {y_{mn}} \end{split}\right.$$ (2) 根据上述矩形框相交区域的几何坐标描述方法可知,输电线路巡检图片中金具间的遮挡关系信息可通过式(1)、(2)得到的相交区域几何坐标进行描述,为了使其具有平移旋转不变性特征[10],对相交区域矩形坐标进行变换,产生关联几何空间特征向量,通过遮挡关系描述构建基于金具遮挡信息的边向量
${{\boldsymbol{R}}_{n \to m}}$ ,其数学表达式为$$ \begin{gathered} {R_{n \to m}} = \left[{w_{mn}},{h_{mn}},{s_{mn}},{w_n},{h_n},{s_n},\dfrac{{{x_{mn}} - {x_n}}}{{{w_n}}},\frac{{{y_{mn}} - {y_n}}}{{{h_n}}}, \right.\\ \left.\dfrac{{{{({x_{mn}} - {x_n})}^2}}}{{{w_n}^2}},\dfrac{{{{({y_{mn}} - {y_n})}^2}}}{{{h_n}^2}},\log \left(\dfrac{{{w_{mn}}}}{{{w_n}}}\right),\log \left(\dfrac{{{h_{mn}}}}{{{h_n}}}\right)\right] \\ \end{gathered} $$ (3) 式中s代表标注框的面积。
2.2 基于金具遮挡关系信息的图建模
本文通过提取巡检图像中不同标注框的相对遮挡关系信息构建金具节点间的边,进而完成构建包含金具遮挡关系信息的图,接下来将阐述图的具体设计方法。
一般地,图主要包括目标节点和节点间的边[18],对于输电线路图像金具目标而言,考虑到巡检图像的金具目标包含丰富的场景上下文信息,对一张巡检图像上所有的金具目标特征、金具间的遮挡关系边和金具所处的场景信息建模。即图主要包括3部分,即金具节点、金具节点间的边和场景关联信息,用数学表达式描述为
${\boldsymbol{G}} = ({{{\boldsymbol{V}}, {\boldsymbol{E}}, {\boldsymbol{c}}}})$ ,其中,G为图,V为图中所有金具节点向量,E为每对金具节点之间的边向量,c为金具所处场景向量,如图5所示。其作用为,通过构建包含场景信息和多类金具遮挡信息的图,帮助模型充分地学习到金具特征信息,提升多类金具的检测精度。完成基于金具遮挡关系信息的图建模之前,首先需要进行金具节点特征和金具场景信息的提取,综合考虑模型的检测精度和效率,选择目前的主流检测模型Faster R-CNN作为基础模型,并选用特征提取能力较强的VGG16作为骨架网络进行金具特征提取。通过RPN网络获得了金具的多个区域提取框,使用NMS方法选择固定数量(128个)的感兴趣区域,对于每个ROI (vm∈V),基于池化层生成固定尺寸的特征图,并通过全连接层提取金具的视觉特征作为金具节点特征向量
$ {\boldsymbol{f}}_m^v $ 。由于整张巡检图像没有真实场景标签c,采用上述相同方法提取整张图像特征向量作为场景关联信息$ {{\boldsymbol{f}}^c} $ ,提取ROIs的几何坐标向量并通过遮挡关系信息描述方法转换为遮挡关系向量$ {{\boldsymbol{R}}_{n \to m}} $ 进而构成包含金具遮挡关系信息的边向量$ {\boldsymbol{e}}_{n \to m}^{} $ (具体见式(4)),完成基于金具遮挡关系的图建模。$$ {{\boldsymbol{e}}_{n \to m}} = {\text{relu}}({{\boldsymbol{W}}_p}{\boldsymbol{R}}_{n \to m}^p) \times {\text{tanh}}({{\boldsymbol{W}}_v}{\text{[}}{\boldsymbol{f}}_m^v,{\boldsymbol{f}}_n^v{\text{]}}) $$ (4) 式中:
$ {\boldsymbol{e}}_{n \to m}^{} $ 为金具图结构中金具目标n与目标m之间的边,代表节点vn对节点vm的影响;fmv、fnv分别为节点vm、vn的特征向量;$ {\boldsymbol{R}}_{n \to m}^p $ 为两金具节点的遮挡关系向量,通过式(3)求得;Wp和Wv为模型训练学习得到的权重矩阵。2.3 基于金具遮挡关系信息的推理检测
完成基于金具遮挡关系信息的图建模之后,需要对图的每个金具节点状态进行更新,并基于节点的最优状态完成金具的检测。通过分析一张巡检图片的金具分布情况,可知存在多类金具且金具间存在复杂的遮挡关系的情况下,金具的状态更新即为基于该巡检图片中其他所有金具和巡检图片场景传递的信息编码。由于节点需要接收来自多个节点的信息,为了减少金具节点状态更新时的信息冗余和复杂度,选择门控循环单元(gated recurrent unit, GRU)[19]作为信息传递单元。GRU作为常用的存储长序列信息的记忆单元,可以根据其他金具节点和场景的信息传递情况,丢弃无用的信息并选择与该金具节点相关的部分来更新其状态,进而完成金具节点的状态更新,即图推理为基于场景门控循环单元和边门控循环单元对图中金具节点状态进行更新,多次的信息传递更新可以更鲁棒地表示金具节点的状态,直至迭代到最优状态并基于该节点信息完成金具的推理检测。其作用在于,通过构建两种门控循环单元信息传递机制,借助基础检测框架完成金具节点推理检测,帮助金具节点在训练迭代中充分学习来自场景信息和其他金具节点传递信息,丰富该金具节点自身特征信息,从而提升其检测效率。
由于巡检图像中的金具处于复杂的输电线路背景中,并且金具间具有复杂的遮挡连接关系,因此选择两种门控循环单元构建结构推理模块完成金具的推理检测,即场景门控循环单元和边门控循环单元。在场景关联信息指导下,金具节点之间基于遮挡关系程度进行信息传递,进而完成节点状态更新,每个节点需要在保留当前状态重要信息的同时接收多个节点传递的信息。对于金具节点vm,场景关联信息向量
$ {\boldsymbol{f}}_{}^c $ 作为场景GRU的输入,该节点集合其他节点的信息量te作为边GRU的输入,即通过遮挡关系程度计算不同节点传递的信息,并池化整合信息,其输出用数学表达式描述为$$ {{\boldsymbol{t}}_e} = \mathop {\max }\limits_{n \in {\boldsymbol{V}}} {\text{pooling}}({{\boldsymbol{e}}_{n \to m}} \times {\boldsymbol{f}}_n^v) $$ (5) 式中:节点vm的特征向量主要通过聚合其他节点到该节点传递的信息,并采用最大池化操作提取重要特征信息。场景GRU和边GRU的输出信息通过均值池化表达为节点更新后的状态,多次的信息传递更新可以更鲁棒地表示金具节点的状态,直至迭代到最优状态并基于该节点信息进行金具类别和边界框预测。
3. 实验结果及分析
基于深度学习的目标检测模型的准确性很大程度上依赖于一定规模的数据集。考虑到模型的可识别性和建库的可操作性,借鉴PASCAL VOC数据集[20]的构建方法,基于人工经验标注构建专业的输电线路金具检测数据集,为后续的研究工作提供重要的数据准备。综合考虑巡检图像中金具数量级、金具间遮挡关系和金具形态特征[21]等因素,本文实验最终选取提包式悬垂线夹、均压环、间隔棒、重锤、U型挂环、防振锤、调整板、联板8类金具目标作为研究对象,这8类是目前课题组拥有的样本数量最多、易发生故障、且与其他金具普遍存在连接关系的金具。由于原始图像尺寸较大,一般为6000×4000像素,在检测过程中会给GPU工作站带来巨大的负担,为此本文在尽量不损失金具图像重要信息的前提下,对原始样本进行裁剪并将尺寸固定为3000×2000像素。文中实验使用的金具训练集和测试集样本数分别为1166和290张,其中,训练集和测试集中所包含每类金具的数量情况统计如图6所示。
本文的软件运行环境是基于Python2.7的tensorflow1.3.0深度学习框架,硬件环境为Ubuntu 16.04以及8 GB内存,显卡为NVIDIA GeForce TITAN Xp,超参数批处理大小为128,初始学习率为0.001,当训练迭代次数达到60 000时,学习率降为0.0001,直到达到最大迭代次数80000次。为了验证遮挡关系推理模块的有效性,在Faster R-CNN模型的基础上嵌入其模块,其中,原始Faster R-CNN模型作为文中实验对比分析的基线,并且改进前后模型的参数设置保持一致。
本文采用目前主流的目标检测模型评价指标AP (average precision) 值、mAP (mean average precision) 值和recall值对模型性能进行评估。其中,AP为平均精度,即通过度量模型输出框与Ground truth的距离计算单类目标的检测准确率;mAP值为平均精度均值,即多类目标的检测准确率的平均值;recall为召回率,即测试集所有正样本样例中,被正确识别为正样本的比例。
表1为加入遮挡关系推理模块前后的模型检测结果。从表1可以明显看出,加入遮挡关系推理模块一定程度上提升了金具的检测准确率,相较于微调的Faster R-CNN模型,改进后模型的mAP值提升2.85%,recall值提高3.1%,针对原检测模型并未考虑到金具间的遮挡关系和金具所处的复杂背景信息,导致模型产生漏检和低精度等问题。本文将金具检测问题形式化为金具图推理,通过引入遮挡关系推理模块,建模以金具为节点、金具间遮挡关系信息为边指导信息的图,采用门控循环单元消息传递机制对巡检图像中金具类别和位置进行联合推理,使模型检测时更依赖金具间的遮挡信息,显著提高了模型对于典型金具数据集的检测精度。
方法 mAP recall Faster R-CNN 81.30 90.15 本文方法 84.15 93.25 表2为基于原始Faster R-CNN模型和基于引入遮挡关系推理模块后模型的单类金具检测的AP值。从表2可以看出,巡检图像中的重锤通常与3个及以上悬垂线夹组装,且两类金具遮挡度较高,故通过学习遮挡信息可以有效提高被遮挡的悬垂线夹的检测精度,相对地,重锤检测精度提升不明显。此外,与均压环、调整板存在遮挡连接关系的U型挂环和联板等连接金具的检测精度也有不同程度的提升。其中,U型挂环金具目标尺度较小且在图像中分布十分密集,与其他金具间存在明显的遮挡关系,调整板和联板这两类金具的被遮挡程度同样较高,通过学习该类金具与其相连接金具的遮挡关系信息可以有效提升该类金具的检测精度。此外,输电线路中存在大量用于防止导线振动的防振锤,由于防振锤在图像中存在同类别遮挡情况易导致防振锤出现漏检等情况。实验结果表明,通过嵌入遮挡关系推理模块进行防振锤间的遮挡关系信息学习,即隐式学习防振锤成对成群安装规则,一定程度上提升了对防振锤的检测性能。
金具类型 Faster R-CNN 本文方法 重锤 90.80 90.69 均压环 90.50 91.64 U型挂环 60.08 66.58 联板 72.20 76.59 调整板 71.57 74.58 提包式悬垂线夹 88.50 91.77 间隔棒 89.28 90.14 防振锤 87.48 91.23 为了更好地验证结合遮挡关系推理模块的Faster R-CNN检测模型对金具数据集的有效性,在相同的网络优化参数设置和相同的骨干网络VGG16的基础上,本文不仅纵向比较了改进前后模型在金具数据集上的检测性能,还采用目前主流的单阶段检测模型SSD[22]和两阶段检测模型Faster R-CNN与本文方法进行横向对比分析。实验结果如表3所示,通过纵向对比分析表3中的mAP值可以看出,相较于单阶段检测SSD模型,本文方法的mAP值提高了5.65%,相较于微调后的Faster R-CNN模型,其mAP值提高了2.85%,这表明联合考虑金具间的遮挡关系信息和所处背景信息[23-25]有助于提升金具检测的准确率,可以一定程度上减弱仅考虑金具感兴趣区域内特征带来的金具误检、漏检等现象,尤其对于输电线路中具有连接关系的小尺度金具性能提升明显。
方法 mAP SSD 78.50 Faster R-CNN 81.30 本文方法 84.15 使用本文方法的金具检测可视化结果如图7所示,所给出的可视化结果为测试集中具有代表性的部分图像测试结果,包含金具目标检测的得分、类别和边界框,其中图(a)、(c)、(e)为迭代130000次的微调Faster R-CNN模型的检测结果,图(b)、(d)、(f)为迭代130000次引入遮挡关系推理模块的Faster R-CNN模型检测结果,其中虚线框为模型漏检金具目标。可以看出,在原始Faster R-CNN模型检测结果中,图(a)中均压环下方的提包式悬垂线夹由于被遮挡未被原始模型检测,与联板相连的线夹由于拍摄角度被模型漏检,图(c)漏检了与均压环相连的联板,图(e)漏检了与调整板连接的U型挂环,引入遮挡关系推理模块后,相关金具的检测精度有所提升,一定程度上改善了原始模型的漏检、误检和低检测精度等问题。
4. 结束语
为了满足输电线路智能化巡检高精度的要求,针对输电线路图像金具间存在不同程度遮挡导致金具检测出现漏检和误检的问题,本文提出了遮挡关系推理模块和Faster R-CNN模型相结合的金具检测方法。在遮挡关系推理模块建模阶段,基于矩形框相交区域的数学描述方法学习金具标注框与其他金具标注框的相交区域信息,即学习与其他金具的遮挡关系信息。实验结果表明,结合金具遮挡关系推理的Faster R-CNN检测mAP值较原始模型有2.7%的提升,其中U型挂环、联板和调整板等遮挡较为严重且尺度较小的金具提升尤为明显,这在一定程度上证实了学习金具间的遮挡关系信息,可以有效提升模型的检测性能,同时为后续的金具缺陷检测和金具上的螺栓检测奠定了良好的基础。
-
表 1 遮挡关系推理模块加入前后的模型检测结果
Table 1 Model detection results with and without the occlusion relationship reasoning module
% 方法 mAP recall Faster R-CNN 81.30 90.15 本文方法 84.15 93.25 表 2 改进模型前后单类金具的AP值
Table 2 AP value of single-type fittings before and after the improved model
% 金具类型 Faster R-CNN 本文方法 重锤 90.80 90.69 均压环 90.50 91.64 U型挂环 60.08 66.58 联板 72.20 76.59 调整板 71.57 74.58 提包式悬垂线夹 88.50 91.77 间隔棒 89.28 90.14 防振锤 87.48 91.23 表 3 各方法检测性能比较
Table 3 Comparison of detection performance of each methods
% 方法 mAP SSD 78.50 Faster R-CNN 81.30 本文方法 84.15 -
[1] 赵强, 左石. 输电线路金具理论与应用[M]. 北京: 中国电力出版社, 2013: 2−12. [2] 苏奕辉, 梁伟放. 架空输电线路隐患、缺陷及故障表象辨识图册[M]. 北京: 中国电力出版社, 2017. [3] DENG Chuang, WANG Shengwei, HUANG Zhi, et al. Unmanned aerial vehicles for power line inspection: a cooperative way in platforms and communications[J]. Journal of communications, 2014, 9(9): 687–692. doi: 10.12720/jcm.9.9.687-692 [4] TONG Weiguo, YUAN Jinsha, LI Baoshu. Application of image processing in patrol inspection of overhead transmission line by helicopter[J]. Power system technology, 2010, 34(12): 204–208. [5] 胡彩石, 吴功平, 曹珩, 等. 高压输电线路巡线机器人障碍物视觉检测识别研究[J]. 传感技术学报, 2008, 21(12): 2092–2096. doi: 10.3969/j.issn.1004-1699.2008.12.028 HU Caishi, WU Gongping, CAO Heng, et al. Research of obstacle recognition based on vision for high voltage transmission line inspection robot[J]. Chinese journal of sensors and actuators, 2008, 21(12): 2092–2096. doi: 10.3969/j.issn.1004-1699.2008.12.028 [6] 付晶, 邵瑰玮, 吴亮, 等. 利用层次模型进行训练学习的线路设备缺陷检测方法[J]. 高电压技术, 2017, 43(1): 266–275. FU Jing, SHAO Guiwei, WU Liang, et al. Defect detection of line facility using hierarchical model with learning algorithm[J]. High voltage engineering, 2017, 43(1): 266–275. [7] YAN Shujia, JIN Lijun, DUAN Shaohui, et al. Power line image segmentation and extra matter recognition based on improved Otsu algorithm[C]//2nd International Conference on Electric Power Equipment-Switching Technology. Shenzhen: China, 2013: 1−4. [8] 宋伟, 左丹, 邓邦飞, 等. 高压输电线防震锤锈蚀缺陷检测[J]. 仪器仪表学报, 2016, 37(S1): 113–117. SONG Wei, ZUO Dan, DENG Bangfei, et al. Corrosion defect detection of earthquake hammer for high voltage transmission line[J]. Chinese journal of scientific instrument, 2016, 37(S1): 113–117. [9] 杨罡, 孙昌雯, 张娜, 等. 基于多尺度特征融合的输电线路关键部件检测[J]. 电测与仪表, 2020, 57(3): 54–59. YANG Gang, SUN Changwen, ZHANG Na, et al. Detection of key components of transmission lines based on multi-scale feature fusion[J]. Electrical measurement & instrumentation, 2020, 57(3): 54–59. [10] 赵振兵, 江爱雪, 戚银城, 等. 嵌入遮挡关系模块的SSD模型的输电线路图像金具检测[J]. 智能系统学报, 2020, 15(4): 656–662. doi: 10.11992/tis.202001008 ZHAO Zhenbing, JIANG Aixue, QI Yincheng, et al. Fittings detection in transmission line images with SSD model embedded occlusion relation module[J]. CAAI transactions on intelligent systems, 2020, 15(4): 656–662. doi: 10.11992/tis.202001008 [11] 赵振兵, 李延旭, 甄珍, 等. 结合KL散度和形状约束的Faster R-CNN典型金具检测方法[J]. 高电压技术, 2020, 46(9): 3018–3026. ZHAO Zhenbing, LI Yanxu, ZHEN Zhen, et al. Typical fittings detection method with faster R-CNN combining KL divergence and shape constraints[J]. High voltage engineering, 2020, 46(9): 3018–3026. [12] HU Han, GU Jiayuan, ZHANG Zheng, et al. Relation networks for object detection[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 3588−3597. [13] LIU Yong, WANG Ruiping, SHAN Shiguang, et al. Structure inference net: object detection using scene-level context and instance-level relationships[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018 : 6985−6994. [14] 汤踊, 韩军, 魏文力, 等. 深度学习在输电线路中部件识别与缺陷检测的研究[J]. 电子测量技术, 2018, 41(06): 60–65. TANG Yue, HAN Jun, WEI Wenli, et al. Research on component identification and defect detection in power transmission lines using deep learning[J]. Electronic measurement technology, 2018, 41(06): 60–65. [15] REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(6): 1137–1149. doi: 10.1109/TPAMI.2016.2577031 [16] GIRSHICK R. Fast R-CNN[C]//2015 IEEE International Conference on Computer Vision. Santiago: IEEE, 2015: 1440−1448. [17] JIANG Borui, LUO Ruixuan, MAO Jiayuan, et al. Acquisition of localization confidence for accurate object detection[C]//Proceedings of the European Conference on Computer Vision (ECCV). Munich: Springer Cham, 2018: 816−832. [18] XU Danfei, ZHU Yuke, CHOY C B, et al. Scene graph generation by iterative message passing[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE, 2017: 3097−3106. [19] TANG Duyu, QIN Bing, LIU Ting. Document modeling with gated recurrent neural network for sentiment classification[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. Lisbon: ACL, 2015: 1422−1432. [20] EVERINGHAM M, ESLAMI S M A, GOOL L, et al. The pascal visual object classes challenge: a retrospective[J]. International journal of computer vision, 2015, 111(1): 98–136. doi: 10.1007/s11263-014-0733-5 [21] 顾晓东, 唐丹宏, 黄晓华. 基于深度学习的电网巡检图像缺陷检测与识别[J]. 电力系统保护与控制, 2021, 49(5): 91–97. GU Xiaodong, TANG Danhong, HUANG Xiaohua. Defect detection and recognition of power grid inspection images based on deep learning[J]. Power system protection and control, 2021, 49(5): 91–97. [22] LIU Wei, ANGUELOV D, ERHAN D, et al. SSD: single shot MultiBox detector[C]//Proceedings of the 14th European Conference on Computer Vision. Amsterdam: Springer Cham, 2016: 21−37. [23] SONG Yifeng, WANG Lin, JIANG Yong, et al. A vision-based method for the broken spacer detection[C]//2015 IEEE International Conference on Cyber Technology in Automation, Control, and Intelligent Systems. Shenyang: IEEE, 2015: 715−719. [24] 戚银城, 武学良, 赵振兵, 等. 嵌入双注意力机制的Faster R-CNN航拍输电线路螺栓缺陷检测[J]. 中国图象图形学报, 2021, 26(11): 2594–2604. QI Yincheng, WU Xueliang, ZHAO Zhenbing, et al. Faster R-CNN aerial photography transmission line bolt defect detection with embedded dual attention mechanism[J]. Chinese journal of image and graphics, 2021, 26(11): 2594–2604. [25] WANG Hongchao, SHAO Yunfeng, ZOU Suli, et al. Detection of cotter pins missing of connection fittings on transmission lines of power system[C]//2021 40th Chinese Control Conference. Shanghai: IEEE, 2021: 6873−6879.