2. 华北电力大学 控制与计算机工程学院,河北 保定 071003
2. School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, China
输电线路故障是造成电网大面积停电事故的重要原因之一,线路运维是保证电力系统安全的重要环节。金具是输电线路中起到固定、防护、接续等作用的电力部件[1],其长期处于野外恶劣环境中,极易发生锈蚀、变形、破损等缺陷,从而影响输电线路正常运行。目前图像识别技术已应用于电力线路巡检工作中[2],但拍摄角度和视距的多变性以及输电线路背景复杂性,增加了图像识别输电线路运行状态任务的难度,必须利用适用性强的图像处理算法来解决该问题。通过对巡检图像的处理可得到输电线路的基本状况,发现设备缺陷和故障隐患,将极大地提高输电线路巡检的自动化水平。
输电线路巡检图像检测算法在过去的几十年研究历程中,主要有3类算法:基于传统特征描述子的算法、基于经典机器学习的算法和基于深度学习的算法。利用目标的纹理[3]、形态学特征[4]、图形基元[5]和多特征融合[6]进行输电线路部件检测的基于传统特征描述子的算法主要针对单一类别金具识别,方法的有效性和可靠性表现一般,不具有扩展性。基于经典机器学习算法主要思路是通过人工特征描述子和线性分类器的结合完成部件检测任务[7-9],不适用于复杂背景下输电线路部件检测,没有很好地利用无人机巡线采集到的大规模巡检数据,检测结果不会随着样本增加而有进一步提升,且无法适应跨巡线导致背景和目标形态变化的巡检图像处理。在深度学习浪潮的推进下,采用在通用目标检测领域表现良好的目标检测模型用于高压线缆目标检测[10]和输电线路部件检测方法研究成为热点,后者主要在均压环[11]、绝缘子[12-14]、防震锤[15]等在巡检图像中占比大且目标形态单一的金具检测中取得一定的效果,输电线路航拍图像背景复杂,目标多尺度,直接使用以上算法检测效果不佳。输电线路遍布着种类繁多且形态各异的金具,因此能够综合检测多类金具和细小金具算法的研究具有极高价值。
单次多框检测器(single shot multibox detector, SSD)[16-17]是深度学习目标检测模型中的经典模型,SSD模型输出离散化的多尺度[18]、多比例的提取框,采用多尺度的特征图和在多个特征图上同时进行分类和回归任务,实现了速度和准确度的综合提升。
本文关注深度学习目标检测算法在输电线路巡检图像金具检测应用的问题,选取综合图像处理速度和精度平衡的SSD模型,主要针对在巡检图像中金具目标广泛存在遮挡的问题,提出了目标间遮挡关系的描述方法,设计了遮挡关系模块,并将其嵌入SSD模型中,实现了输电线路巡检图像中金具的检测。
1 研究方法计算机视觉领域,普遍认为上下文信息或物体间的关系信息有助于更好地实现目标精确检测定位[19-21]。现有通用目标检测模型由于场景的复杂性、多类目标共有的上下文信息少、难以实现规则性描述上下文信息,大多数模型还是针对每个物体单独地进行检测,没有很好地利用到场景中的上下文信息。区别于通用目标检测场景,输电线路金具具有所处背景较为单一、组装具有一定规则性等特点,故结合金具上下文信息可以有助于更好实现金具检测。
在输电线路中金具的组装具有一定的规则性,比如重锤作为增加绝缘子串垂直荷重或防止导线振动的防护金具,通常通过3个及以上的提包式悬垂线夹与导线连接,现有金具检测数据集中大部分的重锤目标的标注框中都包含了部分提包式悬垂线夹目标。在对金具数据集的分析中发现,金具目标标注框间不可避免地存在广泛的相交,金具数据集中部分目标标注框相交区域具有一定的相似性。图1给出了在金具数据集中部分目标标注框相交区域的相似性,其中图1(a)是提包式悬垂线夹与重锤标注框的相交区域,图1(b)是提包式悬垂线夹与联板标注框的相交区域。可以看出两两相交的标注框具有一定的相似性,相交区域往往包含两类目标的部分特征信息。
Download:
|
|
为了实现以相交区域的相似性作为金具目标的上下文信息指导深度模型训练,首先需要完成对金具目标间关于遮挡的上下文信息表达,其次需要解决上下文信息与深度模型结合的相关问题。本文受文献[22]中位置关系模块启发,提出了金具目标间遮挡关系的描述方法,设计了描述目标标注框间遮挡信息的关系模块,使用关系模块提取目标间遮挡关系并嵌入SSD模型中,实现了融合金具目标间遮挡关系的深度目标检测。
1.1 遮挡关系描述由图1可知,金具标注框相交区域与金具的连接关系相关,为了完成遮挡关系模块的设计,需要对多类金具目标遮挡关系进行描述。
单张图片中标注框m相对于标注框n的遮挡关系描述为
${\left[\dfrac{{2{x_{mn}}}}{{{x_m} + {x_n}}}\; \dfrac{{2{y_{mn}}}}{{{y_m} + {y_n}}}\; \dfrac{{{w_{mn}}}}{{{w_m}}}\; \dfrac{{{h_{mn}}}}{{{h_m}}}\right]^{\rm{T}}}$ | (1) |
式中:
1)输入为目标m和n坐标
2)判断目标m和n存在相互遮挡的条件为
$ \begin{array}{l} \left| {{x_{mo}} - {x_{no}}} \right| \leqslant {\dfrac{1}{2}}({w_m} + {w_n})\\ \left| {{y_{mo}} - {y_{no}}} \right| \leqslant {\dfrac{1}{2}}({h_m} + {h_n}) \end{array} $ | (2) |
若同时满足式(2)、(3),则目标m和n存在相互遮挡。
3)输出相交区域坐标
$ \begin{array}{c} {x_{mn}} = \max ({x_m},{x_n})\\ {y_{mn}} = \max ({y_m},{y_n})\\ {w_{mn}} = \min ({w_m} + {x_m},{w_n} + {x_n}) - {x_{mn}}\\ {h_{mn}} = \min ({h_m} + {y_m},{h_n} + {y_n}) + {y_{mn}} \end{array} $ | (3) |
本文通过设计遮挡关系模块提取图像中不同标注框的相对遮挡程度,并通过升维操作将提取到的遮挡信息转换为可以与全连接层提取到的特征图进行融合的遮挡关系模块层。接下来将阐述遮挡关系模块的具体设计方法。
假设SSD模型输入中有N个目标框,那么N个目标框有2种特征集合
借鉴基本注意力模块scaled dot-product attention[23]的思想,设计遮挡关系模块描述第n个目标和其他目标的遮挡关系特征
${f_R}(n) = \displaystyle \sum\limits_m {{\omega ^{mn}} \cdot ({W_V} \cdot f_A^m)} $ | (4) |
式中:
其中遮挡关系权重通过式(5)实现:
${\omega ^{mn}} = \frac{{\omega _G^{mn} \cdot \exp (\omega _A^{mn})}} {{ \displaystyle \sum\nolimits_k {\omega _G^{kn} \cdot \exp (\omega _A^{kn})} }}$ | (5) |
式中主要通过几何特征权重
$\omega _A^{mn} = \dfrac{{{\rm{dot}}({W_K}f_A^m,{W_P}f_A^n)}}{{\displaystyle \sqrt {{d_k}} }}$ | (6) |
式中
$\omega _G^{mn} = \max \{ 0,{W_G} \cdot {\displaystyle \varepsilon _G}(f_G^m,f_G^n)\} $ | (7) |
式中
在文献[22]中,
${\left[\lg \Bigg(\dfrac{{\left|{x_m} - {x_n}\right|}}{{{w_m}}}\Bigg)\;\;\; \lg \Bigg(\dfrac{{\left|{y_m} - {y_n}\right|}}{{{h_m}}}\Bigg)\;\;\; \lg \Bigg(\dfrac{{{w_n}}}{{{w_m}}}\Bigg)\;\;\; \lg \Bigg(\dfrac{{{h_n}}}{{{h_m}}}\Bigg)\right]^{\rm{T}}}$ | (8) |
该方式仅仅描述了目标m相对于n的距离,仅能体现简单的距离关系描述,不具有目标的相对方位等信息,且对一张图像中的所有目标都计算了几何关系,而在输电线路巡检图像中,由于无人机巡检拍摄位置环境的不确定,金具间的相对位置关系容易受拍摄角度影响,远距离的金具目标间往往不存在连接关系,原始关系模块不适用于金具目标检测任务。相对于金具间的固定位置关系,金具标注框的相互遮挡信息更具代表性且其遮挡区域具有一定的结构化特点。在本文设计的遮挡关系模块中,将原有关系模块中描述距离关系的式(8)改进为描述具有相互遮挡的两个目标框间的遮挡关系,计算方法见式(1)。
根据式(1)~(8)即可得到第n个目标的关系特征
$\hat f_A^n = f_A^n + {\rm{Contact}}[f_R^1(n),f_R^{\rm{2}}(n),\cdots,f_R^N(n)]$ | (9) |
遮挡关系模块结构如图2[22],图中
Download:
|
|
已设计的遮挡关系模块能够遍历目标集合中其他目标与该目标的遮挡关系,通过一系列维度变换等操作,可以得到基于目标检测遮挡关系特征。图3给出了遮挡关系模块提取的关系特征层嵌入两层全连接层中间的示意图,在遮挡关系模块设计中,可以选取合适的矩阵变换使得生成的关系特征层与两个全连接层(FC)大小相同,因而可以作为附加特征与前一层全连接层输出图像特征相加作为最终用于目标分类和回归的特征图层。
Download:
|
|
SSD模型以VGG16网络[24]为基础模型,并且在基础模型后新增了卷积层以获得丰富的特征图用于目标检测,最后基于模型的Conv4_3、Conv6(FC6)、Conv7(FC7)、Conv8_2、Conv9_2、Conv10_2、Conv11_2这7个层提取的特征图分别做分类和回归,其中Conv6(FC6)和Conv7(FC7)两个卷积层大小维度相同。基于此,将遮挡关系模块灵活地嵌入这两个层之间,完成遮挡关系模块的嵌入,最终SSD模型可以在融合遮挡关系模块的Conv7层进行分类和回归,其示意如图4。
Download:
|
|
实验选取金具检测数据集中均压环、调整板、联板、重锤、U型挂环、挂板、提包式悬垂线夹、防震锤8类金具作为实验对象。实验使用的金具训练集和测试集样本数分别为1 167和288张,分别包含了6 271和1 713个金具目标。
本文中运行环境是基于Python3.5的tensorflow1.8.0框架,硬件环境为Ubuntu16.04以及8 GB内存,显卡为NVIDIA GeForce TITAN Xp。为了验证遮挡关系模块的有效性,在SSD300的基础上加入关系模块。本文采用主流的目标检测模型的评价指标平均精度均值(mean average precision, mAP)对模型进行评估,其中平均精度 (average precision, AP)是通过度量模型输出与Ground truth的距离来计算单类目标的检测准确率,mAP是多目标检测模型中的通用评价指标,即对检测任务中所有类目标的AP计算平均值。表1给出了加入遮挡关系模块前后的SSD模型的金具AP的结果。表中所有的实验结果都是在同一台机器上进行,并且使用相同的网络优化超参数,学习率设为0.001,最大迭代次数为12万次,批样本处理数为16。
从表1中可以看到,遮挡关系模块的嵌入对实验选用的8类金具的AP都有了2%~9%的提升。其中在输电线路中起到连接作用的挂板、U型挂环均达到了9%左右的提升。在输电线路中起到防止导线震动的防护金具防震锤,由于其在巡检图像中成群出现,数据集中防震锤标注框存在同类别相互遮挡,使用本文方法检测的AP值有了6.58%的提升。重锤和均压环作为巡检图像中相对较大的金具,使用本文方法其AP值虽然没有明显提升,但与之存在广泛遮挡连接关系的提包式悬垂线夹、挂板、U型挂环等金具的准确率都有了明显的提升。
为了更好地评估本文方法,在相同的网络优化参数设置、相同的骨干网络VGG16的基础上,对比了SSD、DSSD(deconvolutional single shot detector)[25]和本文方法的模型性能,实验中使用的训练超参数相同,且输入均为300×300,实验结果见表2。
表2分别比较了模型的mAP、召回率和时长,其中第3列是模型的召回率recall,即正确检测出样本的概率,第4列是模型在检测速度上的比较,以模型在检测一张图片中所需的时长为标准。可以看出,与原始SSD和DSSD相比,本文具有更高的mAP,而DSSD模型由于使用了对称的反卷积结构,模型在小目标检测中表现更好,具有更高的召回率,但模型的检测速度也随之降低。
图5给出了基于遮挡关系模块的SSD模型的检测结果,为了便于观察,在图中标示了白色圆角矩形框为误检目标,黑色圆角矩形框为漏检目标。可以看出,在原始SSD模型检测结果中,图5(a)中将塔材误检为联板,图5(c)中漏检了与左侧均压环上球头挂环连接的U型挂环,图5(e)中右下角被重锤遮挡的提包式悬垂线夹也没被原始SSD模型检测出来,而在图5(b)、(d)、(f)中,这些图像在嵌入了遮挡关系模块的SSD模型进行测试的结果均有了很好的改善,验证了遮挡关系模块的有效性。
Download:
|
|
针对由于金具在输电线路中组装具有一定规则性导致的输电线路巡检图像中金具目标存在普遍遮挡、巡检图像金具检测数据集中目标标注框相交且相交区域存在相似性的问题,本文提出了金具检测数据集中目标标注框间遮挡信息的描述方法,设计了基于遮挡关系描述的遮挡关系模块,并将该模块嵌入SSD模型中。通过在包含8类金具的数据集上进行实验,嵌入遮挡关系模块的SSD的检测平均准确率较原始SSD模型有了4.46%的提升,单类目标的AP提升最多达到9.77%。实验表明,结合金具目标中广泛存在的遮挡问题,提升模型在遮挡情况下的检测能力是实现金具检测效果进一步提升的有效思路。此外,在金具标注框的重叠区域分析中,发现大部分的重叠区域包含螺栓组件的部分信息,这为进一步研究金具上的螺栓及其缺陷奠定了坚实的基础。
[1] | 赵强, 左石. 输电线路金具理论与应用[M]. 北京: 中国电力出版社, 2013: 2−12. (0) |
[2] |
傅博, 姜勇, 王洪光, 等. 输电线路巡检图像智能诊断系统[J]. 智能系统学报, 2016, 11(1): 70-77. FU Bo, JIANG Yong, WANG Hongguang, et al. Intelligent diagnosis system for patrol check images of power transmission lines[J]. CAAI transactions on intelligent systems, 2016, 11(1): 70-77. DOI:10.11992/tis.201503043 (0) |
[3] |
王身丽, 黄力, 侯金华, 等. 基于最大熵的复合绝缘子表面水珠图像分割算法研究[J]. 通信电源技术, 2018, 35(1): 48-50. WANG Shenli, HUANG Li, HOU Jinhua, et al. Study on segmentation method of water drops image on composite insulator based on maximum entropy[J]. Telecom power technology, 2018, 35(1): 48-50. (0) |
[4] |
金立军, 胡娟, 闫书佳. 基于图像的高压输电线间隔棒故障诊断方法[J]. 高电压技术, 2013, 39(5): 1040-1045. JIN Lijun, HU Juan, YAN Shujia. Method of spacer fault diagnose on transmission line based on image procession[J]. High voltage engineering, 2013, 39(5): 1040-1045. DOI:10.3969/j.issn.1003-6520.2013.05.003 (0) |
[5] |
陈晓娟, 吴英石, 赵亮. 基于随机Hough变换的OPGW防震锤识别[J]. 黑龙江电力, 2010, 32(1): 1-2. CHEN Xiaojuan, WU Yingshi, ZHAO Liang. Identification of OPGW vibration damper based on random Hough transformation[J]. Heilongjiang electric power, 2010, 32(1): 1-2. DOI:10.3969/j.issn.1002-1663.2010.01.001 (0) |
[6] |
江慎旺, 许廷发, 张增, 等. 基于无人机的输电网故障跳线联板识别[J]. 液晶与显示, 2016, 31(12): 1149-1155. JIANG Shenwang, XU Tingfa, ZHANG Zeng. Recognition algorithm for fault jumper connection plate of transmission network based on UAV[J]. Chinese journal of liquid crystals and displays, 2016, 31(12): 1149-1155. DOI:10.3788/YJYXS20163112.1149 (0) |
[7] |
翟永杰, 王迪, 赵振兵. 基于目标建议与结构搜索的绝缘子识别方法[J]. 华北电力大学学报, 2016, 43(4): 66-71. ZHAI Yongjie, WANG Di, ZHAO Zhenbing. Recognition method of insulator based on object proposals and structure research[J]. Journal of North China Electric Power University, 2016, 43(4): 66-71. (0) |
[8] |
王森. 输电线路图像上防震锤检测算法研究[D]. 北京: 北京交通大学, 2017: 21−44. WANG Sen. Research on algorithms of vibration damper detection on power line image[D]. Beijing: Beijing Jiaotong University, 2017: 21−44. (0) |
[9] |
刘永姣. 输电线路绝缘子视觉跟踪技术应用研究[D]. 成都: 电子科技大学, 2017: 35−45. LIU Yongjiao. Research on application of visual tracking technology of insulator for transmission line[D]. Chengdu: University of Electronic Science and Technology of China, 2017: 35−45. (0) |
[10] |
刘召, 张黎明, 耿美晓, 等. 基于改进的Faster R-CNN高压线缆目标检测方法[J]. 智能系统学报, 2019, 14(4): 627-634. LIU Zhao, ZHANG Liming, GENG Meixiao, et al. Object detection of high-voltage cable based on improved Faster R-CNN[J]. CAAI transactions on intelligent systems, 2019, 14(4): 627-634. DOI:10.11992/tis.201905026 (0) |
[11] |
汤踊, 韩军, 魏文力, 等. 深度学习在输电线路中部件识别与缺陷检测的研究[J]. 电子测量技术, 2018, 41(6): 60-65. TANG Yong, HAN Jun, WEI Wenli, et al. Research on part recognition and defect detection of transmission line in deep learning[J]. Electronic measurement technology, 2018, 41(6): 60-65. (0) |
[12] |
高强, 廉启旺. 航拍图像中绝缘子目标检测的研究[J]. 电测与仪表, 2019, 56(5): 119-123. GAO Qiang, LIAN Qiwang. Research on target detection of insulator in aerial image[J]. Electrical measurement and instrumentation, 2019, 56(5): 119-123. (0) |
[13] |
赵振兵, 崔雅萍, 戚银城, 等. 基于改进的 R-FCN 航拍巡线图像中的绝缘子检测方法[J]. 计算机科学, 2019, 46(3): 159-163. ZHAO Zhenbing, CUI Yaping, QI Yincheng, et al. Detection method of insulator in aerial inspection image based on modified R-FCN[J]. Computer science, 2019, 46(3): 159-163. DOI:10.11896/j.issn.1002-137X.2019.03.024 (0) |
[14] |
赵文清, 程幸福, 赵振兵, 等. 注意力机制和Faster RCNN相结合的绝缘子识别[J]. 智能系统学报, 2020, 15(1): 92-98. ZHAO Wenqing, CHENG Xingfu, ZHAO Zhenbing, et al. Insulator recognition based on attention mechanism and Faster RCNN[J]. CAAI transactions on intelligent systems, 2020, 15(1): 92-98. DOI:10.11992/tis.201907023 (0) |
[15] |
张东, 邱翔, 曹成功, 等. 结合聚合通道和复频域特征的防震锤检测算法[J]. 计算机技术与发展, 2020(2): 1-7. ZHANG Dong, QIU Xiang, CAO Chenggong, et al. Algorithm of vibration damper detection combined with aggregation channel and complex frequency domain features[J]. Computer technology and development, 2020(2): 1-7. DOI:10.3969/j.issn.1673-629X.2020.02.001 (0) |
[16] | LIU W, ANGUELOV D, ERHAN D, et al. SSD: single shot multibox detector[C]//European Conference on ComputerVision. Amsterdam, Netherlands, 2016: 21−37. (0) |
[17] |
赵文清, 周震东, 翟永杰. 基于反卷积和特征融合的SSD小目标检测算法[J]. 智能系统学报, 2020, 15(2): 310-316. ZHAO Wenqing, ZHOU Zhendong, ZHAI Yongjie. SSD small target detection algorithm based on deconvolution and feature fusion[J]. CAAI transactions on intelligent systems, 2020, 15(2): 310-316. DOI:10.11992/tis.201905035 (0) |
[18] |
伍鹏瑛, 张建明, 彭建, 等. 多层卷积特征的真实场景下行人检测研究[J]. 智能系统学报, 2019, 14(2): 306-315. WU Pengying, ZHANG Jianming, PENG Jian, et al. Research on pedestrian detection based on multi-layer convolution feature in real scene[J]. CAAI transactions on intelligent systems, 2019, 14(2): 306-315. DOI:10.11992/tis.201710019 (0) |
[19] | CHEN X, GUPTA A. Spatial memory for context reasoning in object detection[C]//Proceedings of the IEEE International Conference on Computer Vision, Venice, Italy, 2017: 4086−4096. (0) |
[20] | MOTTAGHI R, CHEN X, LIU X, et al. The role of context for object detection and semantic segmentation in the wild[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Columbus, USA, 2014: 891−898. (0) |
[21] | LIU Y, WANG R, SHAN S, et al. Structure inference net: object detection using scene-level context and instance-level relationships[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, USA, 2018: 6985−6994. (0) |
[22] | HU H, GU J, ZhANG Z, et al. Relation networks for object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, USA, 2018: 3588−3597. (0) |
[23] | VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[C]//Advances in Neural Information Processing Systems. Long Beach, USA, 2017: 5998−6008. (0) |
[24] |
葛园园, 许有疆, 赵帅, 等. 自动驾驶场景下小且密集的交通标志检测[J]. 智能系统学报, 2018, 13(3): 366-372. GE Yuanyuan, XU Youjiang, ZHAO Shuai, et al. Detection of small and dense traffic signs in self-driving scenarios[J]. CAAI transactions on intelligent systems, 2018, 13(3): 366-372. DOI:10.11992/tis.201706040 (0) |
[25] | FU C Y, LIU W, RANGA A, et al. DSSD: deconvolutional single shot detector[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Hawaii Convention Center, USA, 2017: 2881−2890. (0) |