基于改进YOLOv4算法的高压输电线路异物检测

张秋雁; 朱傥; 肖书舟; 杨忠; 曾华荣; 张驰; 李国涛

doi:10.11991/yykj.202204017

基于改进YOLOv4算法的高压输电线路异物检测

doi: 10.11991/yykj.202204017

1.
贵州电网责任有限公司电力科学研究院，贵州贵阳 550002;
2.
南京航空航天大学自动化学院，江苏南京 211106

基金项目: 贵州省科技计划项目（黔科合支撑[2020]2Y044）.

详细信息

作者简介:
张秋雁，男，硕士;

杨忠，男，教授，博士生导师.

通讯作者:
杨忠，E-mail： YangZhong@nuaa.edu.cn.

中图分类号: TP391
出版历程
- 收稿日期: 2022-04-14
- 网络出版日期: 2023-05-08

Foreign object detection of high voltage transmission line based on improved YOLOv4 algorithm

1.
Electric Power Research Institute, Guizhou Power Grid Co., Ltd., Guiyang 550002, China;
2.
College of Automation Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China

摘要

摘要: 针对传统输电线异物检测精度较低、误检率高等问题，提出了一种基于改进YOLOv4的高压输电线路异物检测算法，通过深度学习中的卷积神经网络让模型自主地关注和学习高压输电线上的异物特征。首先采集输电线路上异物图像，并采取多种数据增强方式构建高压输电线异物检测数据集；其次采用k-means聚类生成适配本数据集的锚点框，提升模型鲁棒性；再将网络的空间金字塔池化(spatial pyramid pooling，SPP)模块设计优化为快的空间金字塔池化(spatial pyramid pooling-fast，SPPF)模块，更高效地完成特征融合，加快网络运行速度；最后结合标签平滑、余弦退火衰减算法，在路径聚合网络和预测层部分采用Sigmoid加权线性单元（Sigmoid weighted linear unit，SiLU）激活函数替代普通卷积中的Leaky ReLU激活函数，更有利于模型收敛，使模型性能得到进一步提升。结果表明，模型在不增加参数量的前提下，精度提高到了97.57%，帧传输率达到42.4 f/s，满足实时检测的要求。
- 输电线路 /
- 异物检测 /
- YOLOv4 /
- 数据增强 /
- K-means聚类 /
- 空间金字塔池化 /
- Sigmoid加权线性单元
Abstract: Aiming at the problems of low detection accuracy and high false detection rate of traditional transmission lines, a foreign object detection algorithm based on improved YOLOv4 is proposed in this paper, which makes the model autonomously pay attention to and learn the features of foreign objects on high-voltage transmission lines. It first collects images of foreign objects on the transmission line, and adopts a variety of data enhancement methods to construct a foreign object detection data set; then uses K-means clustering to generate an anchor frame adapted to this data set to improve the robustness of the model. Next, the algorithm optimizes the design of the spatial pyramid pooling (SPP) module of the network to a spatial pyramid pooling-fast(SPPF) module, which completes the feature fusion more efficiently and speeds up the network operation. Finally, the label smoothing and cosine annealing decay algorithms are combined, and the Sigmoid weighted linear unit (SiLU) activation function is used in the path aggregation network and prediction layer to replace the Leaky ReLU activation function in standard convolution, which is more conducive to model convergence, and further improves the performance. The result shows that the accuracy of the model is increased to 97.57% without increasing the amount of parameters, and the frame transmission rate reaches 42.4 f/s , which meets the requirement of real-time detection.
- transmission line /
- foreign objects detection /
- YOLOv4 /
- data augmentation /
- K-means clustering /
- SPP /
- SiLU

HTML全文

在电能传输过程中保障输电线路安全稳定高效运行具有重要意义^[1]。近些年来，因为放风筝、气球等人为活动导致产生输电线路异物、进而影响电力系统稳定运行的事件络绎不绝，严重的甚至造成了跳闸事故，致使部分片区电力系统陷入瘫痪，因为输电线路悬挂的异物会使电力线发生短路，放电距离缩短^[2]。因此，采取措施来发现并清除这些异物具有重要意义。输电线路上悬挂的异物主要有风筝、气球、塑料薄膜类的垃圾以及鸟类在杆塔上搭建的巢穴。早期的清障任务由人工来完成，但有些异物位于比较偏远的地区，且多附着在高压线上，人工来清除这些输电线路异物存在极大的安全隐患，并且清除操作难度也很大。之后提出采用爬行机器人、无人机等方式清障。携带喷火装置的无人机^[3]清理异物对操作人员的技术是一项挑战，突然急剧上升的温度会加速线路的劳损，影响输电效率。再后来提出用传统的人工特征提取方法识别出异物后采用物理抓取来清障：文献[4]通过检测输电导线外形轮廓判断异物存在与否；文献[5]通过梯度法获取电力线边缘，并选取霍夫变换累加器中局部极大值个数与最终检测到的线路数量作为异物特征向量来检测异物，检测效果受复杂背景、噪声等因素影响，精度较低。

近年来深度学习成为了热点技术，摆脱了传统机器学习带来的一些弊端。神经网络不易受检测目标的几何变换、形变、光照等因素影响，降低了异物附着在输电线上产生的形变带来的识别难度^[6]；且它能自动生成检测目标所对应的特征，避免了人工设计特征的烦琐，相较于传统目标检测算法具有显著优势。基于深度学习的目标检测算法分为一阶段和二阶段2类，二阶段算法需要生成大量候选框，计算量极为庞大，检测速度很慢，在实际工业应用上完全无法达到实时检测的程度，这类算法的代表是快速区域卷积神经网络（faster region-convolutional neural network，Faster R-CNN）^[7]。文献[8]采用图像合成技术扩充数据集，并采用Faster R-CNN实现输电线异物识别，但是该方法生成的数据集质量较差，模型训练效果不佳。沈茂东等^[6]优化了候选框，设计了一种名为TLFOD Net的网络结构，提高了模型性能，但最终的模型运算速度仍然很慢。而一阶段算法则通过神经网络训练后不产生候选框，直接回归目标的类别置信度和位置坐标，因此可获得较快速度，这类算法的代表是一阶段多框检测（single shot multibox detector，SSD）^[9]和YOLO^[10-13]系列算法。文献[14]改进了YOLOv4的特征金字塔和损失函数，改进的YOLOv4针对输电线路异物检测性能得到了提升。文献[15]将Darknet-53网络插入了RepVGG模块并添加了多尺度检测，提升了检测性能，但精度和速度仍然有限。

YOLOv4是目前的主流目标检测算法，具有较好的检测效果。它在初步特征提取网络采用CSPDarkNet53^[16]作为骨干网络，加强特征提取网络加入了空间金字塔池化(spatial pyramid pooling，SPP)^[17]模块和路径聚合网络(path aggregation network，PAN)^[18]模块，进一步提取有效特征。由于本文构建的输电线路异物数据集大部分为小目标，且尺度上存在一定程度的扭曲，导致原先默认规范的尺度框无法完全准确标定异物目标，因此本文利用K-means聚类生成新的锚点框，提升模型鲁棒性；同时采用优化的快的空间金字塔池化（spatial pyramid pooling-fast，SPPF）模块替代原始的SPP模块，加快运行检测速度；最后引入在深层网络中更具优势的SiLU激活函数替换原始的全部激活函数，进一步提升了模型性能。

1. 输电线异物数据集

1.1 数据集采集

由于针对高压输电线路的异物检测没有公开数据集，因此本文自建了该类检测的数据集，主要通过网络采集图像、无人机拍摄、视频逐帧分解以及Adobe Photoshop（PS）技术等方式生成相关图像，图像背景基本都是高压输电线路场景。图1为构建数据集的流程。最终获得数据集共包含4579张图片，分为4类，其中鸟巢2541张、气球704张、风筝691张、垃圾643张。将数据集按照7∶2∶1划分为训练集、验证集和测试集。训练集用于模型拟合样本；验证集用于验证模型拟合效果，从而调整超参数；测试集用于最终测试模型在该检测任务中的泛化性。

图 1 构建数据集流程

下载: 全尺寸图片

1.2 数据集标注

本文数据集采用Labelimg标注，得到的XML文件记录了每张图片中异物种类、矩形框坐标，用于模型训练。

1.3 数据集在线增强

由于模型对于数据量的需求极大，越多的数据投入生成的模型可获得的性能越好、泛化性越强。为了增大数据集规模，采用了多种数据增强方式，具体见表1。考虑到部分图片背景涉及到电线杆塔，故不采用随机垂直翻转。

表 1 在线数据增强方法

方法	选取图片方式或具体操作
水平翻转	随机选取50%图片
色域变换	随机调整图片色调、饱和度、明度
随机缩放	随机调整图片大小至0.25~2倍
Mosaic操作	所有图片

2. 改进YOLOv4异物检测算法

2.1 网络结构

如图2所示，输入尺寸大小416×416的图片，依次通过骨干网络、加强特征提取网络向检测头输出13×13、26×26、52×52这3种不同尺度大小的特征层；参考CSPNet改进的CSPDarkNet53^[19]作为其骨干网络，使用ResNet的残差边思想修改了残差块CSP-X，添加了一条大的残差边来保留浅层信息，其中X代表残差组件的数量。在骨干网络中使用Mish^[20]激活函数替代Leaky ReLU激活函数，颈部部分设计了SPP空间金字塔池化模块和路径聚合网络来对不同尺度的信息进行提取和融合。最后通过探测头进行分类回归，输出检测结果。

图 2 改进YOLOv4网络结构

下载: 全尺寸图片

2.2 训练技巧

2.2.1 Mosaic数据增强

YOLOv4算法的数据增强方法除了采用了常规的随机水平翻转、缩放、色域变换等操作，还根据Cutmix的原理提出了一种Mosaic数据增强方式。其具体实施方法是从数据集中随机选取4张图片，将4张图片分别进行缩放，放置于4个不同方向对应的角落，空白区域用灰色填充，最后将其拼接在一起构成一张新图片，如图3所示。生成的新图片丰富了检测背景，同时由于采用了不同程度的缩放，加强了对小目标的检测。而我们的数据集中主要标注的为大目标，小目标样本匮乏，因此采取Mosaic数据增强十分必要，能使鲁棒性更好，并且在批标准化的计算过程一次性计算4张图片，减轻了图像处理单元（graphic processing unit，GPU）的负担。

图 3 图像缩放与图像拼接

下载: 全尺寸图片

2.2.2 标签平滑

标签平滑采用惩罚机制。当分类过于准确时给予惩罚，避免模型过度自信，两端极值往中间靠一点，避免出现过拟合。训练数据的过程中，一方面考虑到准备的数据集并不算大，无法覆盖实际生活中的所有情况；另一方面数据集规模越大，越难以保证标注目标均正确，一旦标注错误，会对模型的训练带来不利影响。因此，采用标签平滑技术训练出来的模型对于样本量不足和少量标注错误都具有一定的“容忍度”，提高了模型的泛化性。策略公式为

1 $ y' = (1 - \varepsilon ) \cdot y + \frac{\varepsilon }{c} $

式中： $ y' $ 为标签平滑后的类别真实值标签； $ \varepsilon $ 为标签平滑因子，用于控制标签平滑的程度； $ y $ 为类别真实值标签； $ c $ 为总类别数。

采用标签平滑后，模型不仅要考虑训练样本中正确分类标签的类别损失，还会添加一个错误类别标签的损失，导致最终的类别损失增大、训练难度提升；因此改进模型要训练到原来模型的最低损失值，就需要学习训练得更好，加强模型的学习能力。为此设置了对比实验如表2所示，采用YOLOv4网络，仅调整标签平滑因子 $ \varepsilon $ 的取值，其他训练参数不变。其中平均精度均值（mean average precision，mAP）指标越高代表网络模型整体的检测精度越高。由实验结果可知，标签平滑因子 $ \varepsilon $ 取值为0.005时最合适。

表 2 标签平滑因子取值对比实验

$ \varepsilon $	mAP/%
0	95.35
0.005	96.34
0.010	96.28

2.2.3 余弦退火衰减

在文献[21]中引入了余弦退火的学习率下降方式。在优化过程中，为了找到全局最优解，避免训练过程中梯度下降算法陷入局部最优，通过余弦退火衰减算法（图4）在学习率下降到一定程度后，通过重启突然提高学习率跳出局部最优，重新去寻找全局最优解。给定一个较大的学习率后，学习率先缓慢下降然后加速下降，再缓慢下降，下降到一定程度后通过重启操作，学习率重新回到一个较大的值，再重复之前的学习率衰减方式，这种下降模式配合学习率能产生较好学习效果。其实现方法为

图 4 余弦退火衰减

下载: 全尺寸图片

2 $ {\eta _t} = {\eta _{\min }} + \frac{1}{2}({\eta _{\max }} - {\eta _{\min }})\left(1 + \cos \left(\frac{{{T_{{\text{cur}}}}}}{{{T_i}}}\pi \right )\right) $

式中： $ {\eta _t} $ 为学习率， $ {\eta _{\max }} $ 和 $ {\eta _{\min }} $ 分别为最大和最小学习率， $ {T_{{\text{cur}}}} $ 为当前迭代次数， $ {T_i} $ 为第i轮的迭代次数。当 $ {T_{{\text{cur}}}} = {T_i} $ 时，表明已经迭代到最后一轮，此时学习率为最小值 $ {\eta _t} = {\eta _{\min }} $ ；每次重启后当 $ {T_{{\text{cur}}}} = 0 $ 时，学习率为最大值 $ {\eta _t} = {\eta _{\max }} $ 。

2.3 K-means聚类优化目标框

原模型采用的3种尺寸的锚点框是由COCO数据集中80类目标聚类得到，参数具有普适性。但是本文构建的输电线路异物数据集大部分均为小目标，且尺度上存在一定程度的扭曲等情况，导致原先默认的规范的尺度框无法完全准确标定异物目标，因此采用K-means聚类，对数据集不同尺寸大小目标进行聚类分析，通过生成的聚类来重新选择更合适的宽高尺寸。传统的K-means聚类通过计算两者之间的欧式距离来衡量2个对象是否属于同一簇，但这么做存在的问题是当进行锚点计算时会促使大的边界框相应产生大的误差，因此本文通过采用计算聚类中心和异物目标的IOU值来衡量聚类结果：

3 $ d{\text{(}}{B_{{\text{box}}}}{\text{,}}{C_{{\text{centroid}}}}{\text{) = 1}} - {\text{IOU(}}{B_{{\text{box}}}}{\text{,}}{C_{{\text{centroid}}}}{\text{)}} $

式中： $ {B_{{\text{box}}}} $ 为聚类框， $ {C_{{\text{centroid}}}} $ 为簇中心框，IOU代表两者之间的交并比。最终通过聚类生成的锚点框如表3所示，并给出了不同锚点框的mAP。

表 3 不同大小锚点框

锚点框选取	小尺寸	中尺寸	大尺寸	mAP/%
COCO聚类锚点框（原始）	(12,16),(19,36),(40,28)	(36,75),(76,55),(72,146)	(142,110),(192,243),(459,401)	96.34
异物数据集聚类锚点框	(14,24),(24,33),(32,48)	(37,86),(52,31),(55,99)	(57,64),(80,85),(132,167)	95.78
最终锚点框	(14,24),(24,33),(32,48)	(37,86),(52,31),(55,99)	(142,110),(192,243),(459,401)	97.06

由于本文数据集大部分标记框大小接近，尺寸比较集中，因此通过K-means聚类算法产生的锚点框也较为集中，从大、中、小尺寸对应的锚点框大小就可以看出来其相差并不大，而这也无法体现模型在多尺度输出的优势。进一步分析发现，数据集中标注框尺寸也有较多比得到的锚点框尺寸要大，这样在训练时对模型的要求也更高，那么最终得到的输出也会因为这些误差而使损失值更大。因此考虑到本文目标多为小中尺寸，因此采用K-means聚类后生成的小中尺寸的锚点框，保留原始大尺寸的锚点框，构成最终的9组锚点框。由表3数据看到测精度得到明显提升，证明了该方法的可行性。

2.4 优化的SPPF模块

原始的SPP是使用不同尺寸的池化核对卷积后的输出进行最大池化，从而产生不同尺度的更大的感受野，获得的上下层特征更显著，从而能提取出更丰富的图像特征。输入并行通过4条支路，分别对应于最大池化核1、3、9和13，然后拼接在一起进一步融合，能在一定程度上解决目标多尺度问题。

如图5所示，本文设计了SPPF模块来代替原始的SPP模块。SPPF模块设置了1条主线通道，将输入串行通过多个5×5池化核。第1条支路直接连接到输出，相当于1个1×1大小的池化核；第2条支路经过了1个5×5的卷积核，再连接到输出；第3条支路通过2个5×5的池化核，再连接到输出，其中2个5×5池化核可达到1个9×9池化核的效果；最后一条支路通过3个5×5的池化核，再连接到输出，3个5×5的池化核可发挥1个13×13池化核的效果。最终将4条支路的输出堆叠起来，实际的池化效果与原先的SPP模块相同，但实现更高效。每当需要进入下一个最大池化核时，前一个池化核已经提前完成了部分池化操作，因此可以节省时间。改进后的SPPF模块在发挥同等作用的前提下实现了更高的效率，可以将运算速度提高2倍，加快模型的收敛。

图 5 SPP模块和SPPF模块

下载: 全尺寸图片

2.5 SiLU激活函数

原模型在路径聚合网络和预测层部分采用的激活函数为Leaky ReLU，其公式如下：

4 $ f(x) = \left\{ {\begin{array}{*{20}{l}} {x,}\qquad{x \geqslant 0} \\ {0.1x,}\qquad{x < 0} \end{array}} \right. $

原模型中当 $ x < 0 $ 时，系数设置为0.1，而ReLU激活函数在取值为负时梯度为0，Leaky ReLU为了保证输入信息小于0时不会完全丢失，设置了一个较小的梯度，但是该函数曲线不够平滑。而本文采用的Sigmoid加权线性单元（Sigmoid weighted linear unit，SiLU)激活函数是Swish^[22]激活函数的特例，表达式为

$$ f(x) = x \cdot {\text{sigmoid}}(x) $$

(1)

式（1）对应的曲线如图6所示，可以看出曲线相当平滑，无上界有下界，并且是非单调的，对性能可以发挥有利作用，效果相较Leaky ReLU函数更好，特别是在深层网络中优势更加明显。

图 6 SiLU激活函数

下载: 全尺寸图片

3. 模型训练与结果分析

3.1 实验环境

本文实验平台的配置如下。操作系统：Windows 10；中央处理器：Intel Core i7-8700K，3.6 GHz；内存：32 GB；图像处理器：NVIDIA GeForce Titan Xp，12 GB；图像处理器加速库：CUDA 11.1，cudnn 8.0；深度学习框架：Pytorch。

3.2 实验参数

输入尺寸大小为416×416，批处理大小为8，初始学习率设置为0.001，之后采用余弦退火衰减算法阶段性改变当前学习率，平滑标签大小设置为0.005，迭代训练100个世代。

3.3 损失函数及其变化曲线

本文在自建数据集的基础上分别训练了原始YOLOv4模型以及叠加了不同改进后的YOLOv4模型，图7给出不同训练条件下的损失曲线。从图7中可以看出，改进后的模型拥有更快的收敛速度和更好的鲁棒性，同时最终的损失值更低。

图 7 模型不同训练条件下的损失曲线

下载: 全尺寸图片

3.4 实验结果及分析

3.4.1 消融实验

性能指标以mAP、帧率和存储空间为代表，最终结果如表4所示。文中选择的基准模型为目前主流的目标检测模型YOLOv4，采用K-means聚类后模型获得了更合适的锚点框，mAP提高了0.72%，锚点框的改动不改变模型参数，因此模型速度保持不变；之后采用SPPF模块用于提升SPP部分池化效率，增强模型特征提取能力，mAP提升了0.4%，并且帧率也相应提高了0.3；最后通过改变路径聚合网络部分和预测层部分的激活函数，采用更先进的SiLU激活函数，在模型速度不变的情况下精度再次提升了0.11%。整个YOLOv4模型改进的过程中，可以发现模型在不增加参数量的情况下，精度得到了逐步地提升，且速度并没有减慢，满足实际工业场景中对于实时性的要求。

表 4 改进YOLOv4的消融实验

算法	mAP/%	帧率/(f/s)
YOLOv4	96.34	42.1
YOLOv4+K-means	97.06	42.1
YOLOv4+K-means +SPPF	97.46	42.4
YOLOv4+K-means +SPPF +SiLU	97.57	42.4

3.4.2 对比实验

除了设置消融实验，本文还与该类算法同属一个系列的YOLOv5模型进行对比实验，其中YOLOv5选取的是精度最高的x版本。精度对比如表5所示，由表5可知，原版YOLOv4与YOLOv5在精度上都不如本文提出的模型，且YOLOv5的帧率较低，不过YOLOv5内存占用相对较少。其中YOLOv4在风筝和垃圾2类异物的检测中平均精度（average precision，AP）相对较低，YOLOv5在风筝这类样本的学习中AP较差，而本文模型的改进使得4类目标的检测精度都得到了一定程度的提升，且速度和内存占用不因精度提升而受到影响。

表 5 不同算法对比实验

算法	骨干网络	尺寸	AP/%				mAP/%	帧率/(f/s)	存储空间/MB
算法	骨干网络	尺寸	气球	风筝	鸟巢	垃圾	mAP/%	帧率/(f/s)	存储空间/MB
YOLOv4	CSPDarkNet53	416	97.05	95.13	98.84	94.36	96.34	42.1	244.0
YOLOv5-x	改进CSPNet	640	88.10	94.40	98.60	96.90	94.50	26.9	175.1
改进YOLOv4	CSPDarkNet53	416	98.46	96.70	99.21	95.90	97.57	42.4	244.0

3.4.3 检测效果对比

为了比较3种算法实际检测效果，随机选取了2张输电线路缠绕异物的图片进行测试，检测效果如图8所示。由图8可以看出，第1个场景下原模型YOLOv4算法存在漏检，第2个场景下原模型YOLOv4算法检测的置信度仅为0.57，YOLOv5-x算法模型检测出了异物且取得了不错的效果，但文中改进的YOLOv4算法模型的检测效果最佳，以极高的置信度框选出了输电线路上的异物。一方面说明本模型提升了在复杂背景下的适应性，另一方面说明改进后的模型精度得到了显著提升。

图 8 检测效果对比

下载: 全尺寸图片

4. 结论

本文针对输电线路上的异物检测，研究了基于改进YOLOv4算法的实时检测模型。

1）为了提升模型的精度，改进了针对自建数据集生成的锚点框，改进了空间金字塔池化层，优化了模型的激活函数。改进后的模型在不增加模型原有参数量的条件下，检测精度得到了提升，速度几乎不变，可以满足实时检测的要求。

2）自建数据集用于模型的训练与验证，最终训练出的模型能较好地检测出输电线路上存在的各类异物，但由于异物种类和尺寸的特殊性以及图片像素问题，仍存在一定的漏检情况。之后可不断扩充数据集，增强模型泛化性，以适应更多变的情况。

未来工作可以继续细分异物数据集检测的类别，以便于工作人员针对不同种类异物采用不同清障方法。

图 1 构建数据集流程

下载: 全尺寸图片

图 2 改进YOLOv4网络结构

下载: 全尺寸图片

图 3 图像缩放与图像拼接

下载: 全尺寸图片

图 4 余弦退火衰减

下载: 全尺寸图片

图 5 SPP模块和SPPF模块

下载: 全尺寸图片

图 6 SiLU激活函数

下载: 全尺寸图片

图 7 模型不同训练条件下的损失曲线

下载: 全尺寸图片

图 8 检测效果对比

下载: 全尺寸图片

表 1 在线数据增强方法

方法	选取图片方式或具体操作
水平翻转	随机选取50%图片
色域变换	随机调整图片色调、饱和度、明度
随机缩放	随机调整图片大小至0.25~2倍
Mosaic操作	所有图片

表 2 标签平滑因子取值对比实验

$ \varepsilon $	mAP/%
0	95.35
0.005	96.34
0.010	96.28

表 3 不同大小锚点框

锚点框选取	小尺寸	中尺寸	大尺寸	mAP/%
COCO聚类锚点框（原始）	(12,16),(19,36),(40,28)	(36,75),(76,55),(72,146)	(142,110),(192,243),(459,401)	96.34
异物数据集聚类锚点框	(14,24),(24,33),(32,48)	(37,86),(52,31),(55,99)	(57,64),(80,85),(132,167)	95.78
最终锚点框	(14,24),(24,33),(32,48)	(37,86),(52,31),(55,99)	(142,110),(192,243),(459,401)	97.06

表 4 改进YOLOv4的消融实验

算法	mAP/%	帧率/(f/s)
YOLOv4	96.34	42.1
YOLOv4+K-means	97.06	42.1
YOLOv4+K-means +SPPF	97.46	42.4
YOLOv4+K-means +SPPF +SiLU	97.57	42.4

表 5 不同算法对比实验

算法	骨干网络	尺寸	AP/%				mAP/%	帧率/(f/s)	存储空间/MB
算法	骨干网络	尺寸	气球	风筝	鸟巢	垃圾	mAP/%	帧率/(f/s)	存储空间/MB
YOLOv4	CSPDarkNet53	416	97.05	95.13	98.84	94.36	96.34	42.1	244.0
YOLOv5-x	改进CSPNet	640	88.10	94.40	98.60	96.90	94.50	26.9	175.1
改进YOLOv4	CSPDarkNet53	416	98.46	96.70	99.21	95.90	97.57	42.4	244.0

参考文献(22)

[1]	邓益民, 汤智谦, 李红兵, 等. 基于LOD的大规模输电线路场景实时渲染算法优化[J]. 计算机与现代化, 2017(1): 115−118. doi: 10.3969/j.issn.1006-2475.2017.01.023
[2]	KATRASNIK J, PERNUS F, LIKAR B. A survey of mobile robots for distribution power line inspection [J]. 2009, 25(1): 485-493.
[3]	胡敬波, 崔健. 多旋翼无人机输电线路飘挂物清障技术概述[J]. 电子世界, 2019(13): 48−49. doi: 10.19353/j.cnki.dzsj.2019.13.018
[4]	CAI W, LE J, JIN C, et al. Real-time image-identification-based anti-manmade misoperation system for substations [J]. IEEE transactions on power delivery, 2012, 27(4): 1748-1754.
[5]	ISHINO R, TSUTSUMI F J T, WORLD D. CRIEPI's aerial inspection of transmission conductor[J]. Transmission and distribution world, 2004, 56(12): 52, 54-55.
[6]	沈茂东, 裴健, 付新阳, 等. 一种新的输电线路异物检测网络结构——TLFOD Net[J]. 计算机与现代化, 2019(2): 118−122.
[7]	REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(6): 1137−1149. doi: 10.1109/TPAMI.2016.2577031
[8]	FAN Wen, LIAO Yuan. Wide area measurements based fault detection and location method for transmission lines [J]. Protection and control of modern power systems, 2019, 4(1): 1-12.
[9]	LIU W, ANGUELOV D, ERHAN D, et al. Ssd: Single shot multibox detector[C]// 14th European Conference on Computer Vision–ECCV 2016. Amsterdam: Springer International Publishing, 2016: 21-37.
[10]	BOCHKOVSKIY A, WANG C Y, MARK LIAO H Y. YOLOv4: optimal speed and accuracy of object detection[EB/OL]. (2021–05–30)[2022–01–05]. https://doi.org/10.48550/arXiv.2004.10934.
[11]	REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 779–788.
[12]	REDMON J, FARHADI A. YOLO9000: better, faster, stronger[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE, 2017: 6517–6525.
[13]	REDMON J, FARHADI A. YOLOv3: An incremental improvement[EB/OL]. (2020–10–25)[2022–01–06]. https://arxiv. org/abs/1804.02767.
[14]	唐翔翔, 沈薇, 朱明, 等. 基于改进YOLOv4的输电线路异物检测算法[J]. 安徽大学学报(自然科学版), 2021, 45(5): 58−63.
[15]	周豪. 电力输电线路异物检测方法研究 [D]. 重庆: 重庆理工大学, 2021.
[16]	WANG C Y, LIAO H Y M, WU Y H, et al. CSPNet: A new backbone that can enhance learning capability of CNN[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. Long Beach: IEEE, 2020: 390-391.
[17]	HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9): 1904-1916.
[18]	LIU Shu, QI Lu, QIN Haifang, et al. Path aggregation network for instance segmentation[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 8759-8768.
[19]	朱傥, 杨忠, 周国兴, 等. 一种轻量化网络的火焰烟雾检测算法[J]. 应用科技, 2022, 49(2): 1−7.
[20]	MISRA D. Mish: A self regularized nonmonotonic neural activation function[EB/OL]. (2019–8–23)[2022–01–13]. https://doi.org/10.48550/arXiv.1908.08681.
[21]	LOSHCHILOV I, HUTTER F. Sgdr: Stochastic gradient descent with warm restarts[EB/OL]. (2016–8–13) [2022–01–15]. https://doi.org/10.48550/arXiv.1608.03983.
[22]	RAMACHANDRAN P, ZOPH B, LE Q V. Searching for activation functions[EB/OL]. (2017–11–16)[2022–01–15]. https://doi.org/10.48550/arXiv.1710.05941.

点击查看大图

图(8) / 表(5)

摘要

基于改进YOLOv4算法的高压输电线路异物检测

doi: 10.11991/yykj.202204017

作者简介: 张秋雁，男，硕士; 杨忠，男，教授，博士生导师.

通讯作者: 杨忠，E-mail： YangZhong@nuaa.edu.cn.

出版历程

Foreign object detection of high voltage transmission line based on improved YOLOv4 algorithm

1. 输电线异物数据集

1.1 数据集采集

1.2 数据集标注

1.3 数据集在线增强

2. 改进YOLOv4异物检测算法

2.1 网络结构

2.2 训练技巧

2.2.1 Mosaic数据增强

2.2.2 标签平滑

2.2.3 余弦退火衰减

2.3 K-means聚类优化目标框

2.4 优化的SPPF模块

2.5 SiLU激活函数

3. 模型训练与结果分析

3.1 实验环境

3.2 实验参数

3.3 损失函数及其变化曲线

3.4 实验结果及分析

3.4.1 消融实验

3.4.2 对比实验

3.4.3 检测效果对比

4. 结论

出版历程

目录

作者简介:
张秋雁，男，硕士;

杨忠，男，教授，博士生导师.

通讯作者:
杨忠，E-mail： YangZhong@nuaa.edu.cn.