舰船科学技术  2023, Vol. 45 Issue (21): 213-216    DOI: 10.3404/j.issn.1672-7649.2023.21.042   PDF    
基于机器学习的舰船通信网络流量异常检测方法
潘志安, 庞国莉, 刘庆杰     
防灾科技学院 信息工程学院,河北 三河 065201
摘要: 针对舰船通信网络流量易受噪声成分影响,导致流量异常检测精度下降问题,提出基于机器学习的舰船通信网络流量异常检测方法。该方法使用基于小波变换的网络流量预处理方法,细化舰船通信网络原始流量数据,由小波阈值将细化后流量数据进行去噪处理后,通过基于机器学习的流量异常检测模型,以前向传播训练、反向传播训练的方式,训练稳定的卷积循环神经网络,将去噪后流量数据样本输入网络中,分类检测通信网络流量数据是否异常。实验结果显示:所提方法有效去除舰船通信网络流量噪声成分后,可提高舰船通信网络流量异常检测精度,无错检情况,且检测范围更全面。
关键词: 机器学习     舰船通信     网络流量     异常检测     小波变换     卷积循环神经网络    
A machine learning based traffic anomaly detection method for ship communication networks
PAN Zhi-an, PANG Guo-li, LIU Qing-jie     
School of Information Engineering, Institute of Disaster Prevention, Sanhe 065201, China
Abstract: To address the issue of reduced accuracy in detecting traffic anomalies in ship communication networks due to the susceptibility of noise components, a machine learning based method for detecting traffic anomalies in ship communication networks is studied. This method uses a network traffic preprocessing method based on wavelet transform to refine the original traffic data of the ship communication network. After denoising the refined traffic data using wavelet thresholding, a machine learning based traffic anomaly detection model is used to train a stable convolutional recurrent neural network through forward propagation and backward propagation training. The denoised traffic data samples are input into the network, classify and detect whether communication network traffic data is abnormal. The experimental results show that the proposed method can effectively remove the noise component of ship communication network traffic, improve the accuracy of ship communication network traffic anomaly detection, have no false detections, and have a more comprehensive detection range.
Key words: machine learning     ship communication     network traffic     abnormal detection     wavelet transform     convolutional recurrent neural network    
0 引 言

随着舰船通信网络的快速发展和广泛应用,舰船通信网络流量异常检测成为一个重要的问题。舰船通信网络是舰船运行的重要组成部分,其流量异常通常与各种安全问题相关联[1-2]。麻文刚等[3]利用LSTM与改进残差网络优化方法,该方法能够更准确地检测出异常流量。但此方法训练需要大量的计算资源,计算复杂度较高,对于大规模的网络流量数据可能需要进行较长时间的计算。董书琴等[4]使用堆叠降噪自编码器,检测不平衡数据的异常网络流量,但该方法中很多技术需要合适的参数才能有效运行,如采样比例、欠采样阈值等。这些参数的调整可能会很复杂,需要大量的实验和经验。机器学习技术能够自动学习和自适应,根据数据的变化进行模型调整,从而更好地适应新型的网络攻击和异常行为[5]。为此提出了基于机器学习的舰船通信网络流量异常检测方法,为舰船通信网络安全提供有效的技术支持。

1 舰船通信网络流量异常检测方法 1.1 基于小波变换的网络流量预处理方法

舰船通信网络中可能存在各种安全威胁,例如网络攻击、病毒传播等。这些威胁可能利用噪声数据掩盖其恶意行为,因此对流量进行去噪处理,可以帮助识别异常流量。小波变换是当下数据处理常用技术之一,能够细化舰船通信网络原始流量数据,再由小波阈值将细化后流量数据进行去噪处理,优化原始流量数据质量,降低噪声对流量异常检测结果的负面影响。详细步骤如下:

1)设置小波变换分解尺度。分解尺度对舰船通信网络原始流量数据细化水平存在直接影响,若分解尺度不足,流量数据便不能全面细化;若分解尺度太大,通信网络流量数据便细化过度。假如小波变换的分解层数为 $ V $ ,舰船通信网络原始流量数据为 $ g $ ,则

$ V = \sum\limits_m {Bg\left( {h - 2r} \right)}。$ (1)

式中: $ B $ 为通信网络流量数据分解所用小波系数; $ m $ $ h $ 分别为随机数与原始网络流量数据; $ r $ 为干净的流量数据小波系数。

2)小波变换多尺度分解 $ h $ 时,利用小波阈值处理小波系数,小于阈值的小波系数设成0,便可抵御噪声干扰。大于小波阈值的小波系数无需变动,阈值为:

$ \alpha = \sqrt {2\lg \left( V \right)} /\ln \left( {h + r - 1} \right) 。$ (2)

3)把不等于0的小波系数,采用小波逆变换的方式,获取干净的原始网络流量数据 $ r $

1.2 基于机器学习的流量异常检测模型

卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)是一种在机器学习中应用广泛的深度学习模型。它结合了卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)的特性,可以处理具有序列结构的数据。卷积循环神经网络结构主要分为输入层、卷积层、池化层、循环层、全连接层、输出层。设置预处理完毕的 $ K $ 组存在同一五元组的流量数据包为 $ {r_1},{r_2},\cdots,{r_K} $ ,卷积循环神经网络的输入是大小为 $ N $ 、数量为 $ M $ 的舰船通信网络流量样本数据包,则基于机器学习的流量异常检测模型的操作步骤如下:

1)划分 $ {r_1},{r_2},\cdots,{r_K} $ 。针对 $ {r_1},{r_2},\cdots,{r_K} $ 中各组舰船通信网络流量数据rj而言,各 $ M $ 个数据包看作一个样本,获取 $ {r_j} = \left| M \right|\parallel {r_j} $ 个样本, $ \parallel $ 代表整除后向下取整。在rj中提取各个舰船通信网络流量样本,运算总字节数目N0。如果N0大于 $ N $ ,把样本截断为 $ N $ 字节。反之在样本末尾补充16位进制数,将其补充为 $ N $ 字节。此环节可得到各组去噪后流量数据rj的字节样本Yij $ i $ $ j $ 分别代表分组编码、样本编码。

2)把步骤1中获取的各个舰船通信网络流量字节样本数据Yij,输入卷积循环神经网络。设置 $ {Y_{ij}} = y_1^{}{y_2} \cdots {y_b} \cdots {y_N} $ $ {y_a}\left( {a \in N} \right) $ 代表通信网络流量每个字节Yij的十进制值,字节索引为 $ a $ 。输入首层卷积神经网络获取的舰船通信网络流量特征值为:

$ x_{az}^1 = \varepsilon \left( {\sum\limits_{r = 1}^R {\varpi _{R,z}^0y_{a + R - 1,z}^0 + A_z^0} } \right) 。$ (3)

式中: $ \varepsilon $ $ z $ 分别为ReLU函数、卷积特征图索引; $ R $ $ \varpi $ 分别为过滤器大小,卷积核权值; $ A_z^0 $ 为舰船通信网络流量第 $ z $ 个特征图偏置。第 $ \theta $ 层卷积层输出的是舰船通信网络流量特征提取结果为:

$ x_{az}^\theta = \varepsilon \left( {\sum\limits_{r = 1}^R {\varpi _{R,z}^{\theta - 1}y_{a + R - 1,z}^{\theta - 1} + A_z^{\theta - 1}} } \right),$ (4)

各层卷积完毕,设计最大池化层,可降低卷积循环神经网络参数计算难度,提高运算效率,且能够避免出现拟合过度问题。最大池化方法为:

$ D_{az}^\theta = \max x_{az}^{\theta - 1} ,$ (5)

经池化处理后,设定双向LSTM为循环神经网络层。双向LSTM层从正反2个方向处理输入样本后,将处理结果整合,深度捕捉流量数据内在特征。各个LSTM层都具备控制数据流动的门控模块,在获取第 $ \theta $ 层输出 $ D_{az}^\theta $ 后,将 $ D_{az}^\theta $ 输入LSTM层。如果LSTM层的流量数据内在特征输出向量为pt,则

$ {p^t} = \varepsilon \left( {{u^t}} \right) \times {\eta ^t}D_{az}^\theta 。$ (6)

式中: $ {\eta ^t} $ $ {u^t} $ 分别为此层时间步 $ t $ 的更新结果、流量数据内在特征信息状态更新结果。

双向LSTM层的输出提取完毕,输入全连接层,使用Sigmoid函数分类器分类。Sigmoid函数分类器对流量异常检测结果为:

$ S\left( {{p^t}} \right){\text{ = }}\frac{1}{{1{\text{ + }}{e^{ - {p^t}}}}} ,$ (7)

式中, $ e $ 为误差指数。

$ {O_p} = - \frac{1}{K}\sum\limits_{j = 1}^K {S\left( {{p^t}} \right)\log \left( {S\left( {{p^t}} \right) + \left( {1 - S\left( {{p^t}} \right)} \right)\log \left( {1 - S\left( {{p^t}} \right)} \right)} \right)} 。$ (8)

式中:如果S(pt)数值为0,则通信网络流量样本是正常流量;如果通信网络流量样本是异常流量,则其数值为1。

4)将通信网络流量样本的测试集合输入网络模型,获取通信网络流量样本异常检测结果。训练时使用前向训练、反向训练方法。

前向传播训练:在通信网络流量训练样本集合中提取一个样本,把其输入卷积循环神经网络,此网络中上层输出为下层输入,以此类推传递,最终获取Sigmoid函数分类器的分类结果为S(pt)。S(pt)为三维向量,表示pt被检测为异常流量的概率。

后向传播训练:计算S(pt)和验证样本集的流量类型的二分类交叉熵损失函数,调节权重,剩下层误差需要在输出层方向逐层计算。

利用前向训练、反向训练方法,能够获取此网络全部层的权重参数,构建性能最优的卷积神经网络模型后,使用式(3)~式(7)检测舰船通信网络流量是否异常。

2 结果与分析

为测试本文方法的使用效果,构建如图1所示的卷积循环神经网络。为避免出现过拟合问题,卷积循环神经卷积层使用Sigmoid函数分类器,将舰船通信网络流量进行异常检测。

图 1 卷积循环神经网络结构 Fig. 1 Convolutional recurrent neural network structure
2.1 舰船通信网络流量去噪效果测试

图2所示舰船通信网络流量样本为例,此流量样本存在噪声成分,导致干净的流量数据受到影响,出现流量数据失真问题。为此,使用本文基于小波变换的网络流量预处理方法,对此样本进行去噪,处理后效果如图3所示。从图3可知,本文方法使用基于小波变换的网络流量预处理方法,对此样本进行去噪后,流量数据中噪声成分被有效滤除,预处理后的流量数据与实际有效成分相符。

图 2 原始的舰船通信网络流量样本 Fig. 2 Original ship communication network traffic samples

图 3 舰船通信网络流量去噪后效果 Fig. 3 Effect of denoising on ship communication network traffic
2.2 舰船通信网络流量异常检测效果测试

证明本文方法具备舰船通信网络流量去噪效果后,以图4所示舰船通信网络结构为例,测试本文方法的异常检测效果。

图 4 舰船通信网络结构 Fig. 4 Ship communication network structure

舰船通信网络中节点1、节点4、节点8、节点14的流量数据的划分情况如表1所示。

表 1 舰船通信网络数据的划分情况 Tab.1 Classification of ship communication network data

本文方法对舰船通信网络流量的检测效果如表2所示。从表2可知,本文方法利用前向训练、反向训练方法,能够获取此网络全部层的权重参数,构建性能最优的卷积神经网络模型,正常、异常网络流量的检测结果准确,错检的样本数量为0,验证了本文方法在网络流量异常检测中的准确性。

表 2 本文方法对异常流量的检测效果 Tab.2 Detection effect of this method on abnormal traffic

舰船通信网络流量异常检测过程中,使用本文方法前后,异常流量样本的检测范围如图5图6所示。对比图5图6可知,使用本文方法前后,异常流量样本的检测范围存在差异,本文方法的检测范围更全面,漏检率也随之更小。

图 5 使用本文方法前异常流量样本的检测范围 Fig. 5 Detection range of abnormal traffic samples before using the method proposed in this article

图 6 使用本文方法后异常流量样本的检测范围 Fig. 6 Detection range of abnormal traffic samples after using the method proposed in this article
3 结 语

舰船通信网络流量异常可能导致网络拥塞、丢包、延迟等问题,严重时甚至可能引发通信中断、指挥失效等后果。此外,流量异常还可能隐藏着网络攻击、病毒传播等安全风险。针对此问题,本文提出基于机器学习的舰船通信网络流量异常检测方法,本文方法在舰船通信网络流量异常检测中,对于保障舰船通信网络安全、维护网络正常运行具有重要意义。

参考文献
[1]
李华峰, 刘炎, 徐凯, 等. 基于异构网络的物联网海洋大气腐蚀加速实验平台[J]. 中国舰船研究, 2021, 16(4): 224-231.
LI Hua-feng, LIU Yan, XU Kai, et al. Marine atmospheric accelerated experimental corrosion platform based on IoT technology through heterogeneous network[J]. Chinese Journal of Ship Research, 2021, 16(4): 224-231.
[2]
孟永伟, 秦涛, 赵亮, 等. 利用残差分析的网络异常流量检测方法[J]. 西安交通大学学报, 2020, 54(1): 42-48+84.
MENG Yong-wei, QIN Tao, ZHAO Liang, et al. Network Anomaly Detection Method Based on Residual Analysis[J]. Journal of Xi'an Jiaotong University, 2020, 54(1): 42-48+84.
[3]
麻文刚, 张亚东, 郭进. 基于LSTM与改进残差网络优化的异常流量检测方法[J]. 通信学报, 2021, 42(5): 23-40.
MA Wen-gang, ZHANG Ya-dong, GUO Jin. Abnormal traffic detection method based on LSTM and improved residual neural network optimization[J]. Journal on Communications, 2021, 42(5): 23-40.
[4]
董书琴, 张斌. 面向不平衡数据的网络流量异常检测方法[J]. 系统仿真学报, 2021, 33(3): 679-689. DOI:10.16182/j.issn1004731x.joss.19-0573
[5]
展鹏, 陈琳, 曹鲁慧, 等. 基于特征符号表示的网络异常流量检测算法[J]. 浙江大学学报(工学版), 2020, 54(7): 1281-1288.
ZHAN Peng, CHEN Lin, CAO Lu-hui, et al. Network traffic anomaly detection based on feature-based symbolic representation[J]. Journal of Zhejiang University (Engineering Science), 2020, 54(7): 1281-1288.