舰船科学技术  2025, Vol. 47 Issue (11): 165-169    DOI: 10.3404/j.issn.1672-7649.2025.11.029   PDF    
改进C均值聚类算法识别船用网络异常信息研究
赵晓华1, 赵树升2     
1. 河南大学濮阳工学院,河南 濮阳 457000;
2. 厦门工学院 数据科学与计算机学院,福建 厦门 361000
摘要: 针对船用网络中流量和异常模式随着时间、船舶运行状态等因素而动态变化的特点,为判断网络的异常信息,提出基于改进C均值聚类算法的船用网络异常信息识别方法。该方法结合船用网络传输特性,分析该网络的传输流量情况,结合分析结果通过功率密度谱函数提取船用网络流量信息特征包络值,将提取结果输入基于模态稳定函数的模糊C均值聚类算法中,识别船用网络异常信息。测试结果显示,依据流量数据的包络特征值能够较好的描述网络信息的变化情况,信息识别后的分离性结果均在0.94以上;能够结合稳定函数完成船用网络异常信息分类识别,并且能够依据该函数确定不同异常信息的类别。
关键词: C均值聚类     船用网络     异常信息识别     传输流量    
Research on identifying abnormal information in marine networks by improving C-means clustering algorithm
ZHAO Xiaohua1, ZHAO Shusheng2     
1. Puyang Institute of Technology, Henan University, Puyang 457000, China;
2. School of Data Science and Computer Science, Xiamen Institute of Technology, Xiamen 361000, China
Abstract: In response to the dynamic changes in traffic and abnormal patterns in marine networks over time, ship operation status, and other factors, a method for identifying abnormal information in marine networks based on an improved C-means clustering algorithm is proposed to determine the network's abnormal information. This method combines the transmission characteristics of the marine network to analyze the transmission traffic situation of the network. Based on the analysis results, the power density spectrum function is used to extract the characteristic envelope value of the marine network traffic information. The extraction results are input into the fuzzy C-means clustering algorithm based on modal stability function to identify abnormal information in the marine network. The test results show that the envelope feature values based on traffic data can better describe the changes in network information, and the separability results after information recognition are all above 0.94; Being able to combine stable functions to classify and identify abnormal information in marine networks, and being able to determine the categories of different abnormal information based on this function.
Key words: C-means clustering     marine network     identification of abnormal information     transmission traffic    
0 引 言

船用网络主要是依据卫星通讯、无线网络等技术,实现船舶内部各设备之间、设备与陆地数据中心之间的通讯,以此保证船舶在任何位置都能够进行数据传输和通讯。该网络涵盖船舶监控系统、船舶维护系统、船舶安全管理系统以及导航系统等,是保证船舶航行安全的重要支撑。然而,复杂的网络环境下,当受到网络攻击、设备故障、软件漏洞等影响后,会导致船舶网络出现异常信息[1],如数据包丢失、延迟增加、非法访问等;这些异常信息如果得不到及时识别和处理,可能会引发严重的后果,如船舶失控、数据泄露、系统瘫痪等。因此,必须及时发现船用网络异常信息,采取有效的处理措施保证网络的通信安全。

杨春霞等[2]设计基于深度学习算法的舰船网络安全状态识别方法,该方法能深度挖掘网络数据潜在特征以实现状态识别,然而在实际应用中,面对复杂多变的网络环境时,其识别结果可靠性欠佳;车丽娜等[3]通过环境干扰因子识别滑动窗口中的异常数据、计算异常度、判断异常数据来源,再结合通信半径划分和相对熵计算结果完成异常节点检测,此方法能有效应对环境不确定性进行异常检测,但网络环境动态变化时,算法稳定性受影响,进而影响检测效果;张兵等[4]利用时间滑动窗口划分处理数据流以去除误差值,再采用主成分分析方法降低数据维度,并借助FW-PSO算法提取数据有效特征,该方法可有效处理网络数据流并提取关键特征,不过该算法在应用时需进行参数设计以满足网络动态变化检测需求,参数设计过程会降低算法实时性;李道全等[5]通过互信息进行特征筛选,将筛选后的特征输入机器学习算法并结合集成投票完成异常检测,该算法能利用多种特征和集成策略提高检测准确性,但集成投票适用于固定结构网络检测,当网络拓扑变化时,无法可靠检测网络异常流量变化情况。

改进C均值聚类算法是在基础的C均值聚类算法上,对其初始聚类中心的选择进行改进后形成的一种优化聚类算法[6],该算法可在没有先验标注信息的情况下对网络流量数据进行聚类分析,发现数据中的潜在结构,并且具备多维特征的处理能力,对异常模式敏感,从而识别出异常信息。因此,本文提出基于改进C均值聚类算法的船用网络异常信息识别方法。

1 船用网络异常信息识别 1.1 船用网络传输特性

船用网络通常结合有线和无线2个网络组成,2个网络通过网关和总线相连接,以此保证不同距离下船舶的通信需求[7]。无线网络部分主要用于短距离通信,并且能够结合船用需求灵活组网,而有线网络部分则主要用于保证船舶远距离通信,确保远程通信的稳定性。船用网络传输特性示意图如图1所示。

图 1 船用网络传输特性示意图 Fig. 1 Schematic diagram of transmission characteristics of marine network

船用网络在进行数据通信时,具备多输入多输出特点,则网络流量$ x\left( t \right) $传输模型式为:

$ x\left( t \right) = {Re} \left[ {{f_n}\left( t \right){e^{ - 2{\text{π}}{f_o}\Delta t}}s\left( {t - \Delta {t_n}} \right){e^{ - 2{\text{π}}{f_o}\Delta t}}} \right] 。$ (1)

式中:$ n $为传输链路;$ t $为时刻;fn(t)为船用网络流量主频特征;$ \Delta {t_n} $为网络传输时延;s(t)为单分量传输数据。

船用网络的通信节点能够通过多个传输链路进行通信,则网络的多链路流量传输函数式为:

$ \xi \left( t \right) = \sum\limits_{i = 1}^M {{L_i}M\left( {t - {t_i}} \right)}。$ (2)

式中:$ M $为传输链路数量;Li为链路$ i $在通信时产生的损失;ti为该链路的传输时延。

结合上述式可计算船用网络的流量传输函数$ \tilde \xi \left( t \right) $,其式为:

$ \left\{ \begin{gathered} \tilde \xi \left( t \right) = x\left( {t - {t_0}} \right) \Rightarrow {\eta _{\tilde \xi }}\left( {t,k} \right) = {T_\xi }\left( {t - {t_0},k} \right),\\ \tilde \xi \left( t \right) = x\left( t \right){e^{2{\text{π}}{k_0}t}} \Rightarrow {\eta _{\tilde \xi }}\left( {t,k} \right) = {T_\xi }\left( {t,k - {k_0}} \right)。\\ \end{gathered} \right. $ (3)

式中:$ {T_\xi } $为时间窗口函数;$ k $$ {k_0} $分别为中心网络带宽和初始带宽;$ {t_0} $为网络初始传输时刻;$ {\eta _{\tilde \xi }} $为网络流量时间序列的频域伸缩尺度。

通过重构的方式对船用网络流量特征分布空间进行处理,分析该网络的流量传输过程,其式为:

$ \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\xi } \left( t \right) = {\tilde f^{\frac{1}{2}}}x\left( {\tilde ft} \right),\tilde f > 0,$ (4)
$ {T_{\tilde \xi }}\left( {t,k} \right) = {T_\xi }\left( {\tilde ft,\frac{k}{{\tilde f}}} \right) 。$ (5)

式中:$ \tilde f $为船用网络流量采集频率;$ \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{\xi } \left( t \right) $为网络流量时间序列的时域伸缩尺度。

如果船用网络发生异常,各个传输链路的损失和时延均会发生改变 ,从而导致x(t)的传输流量发生变化,因此,为保证船用网络异常信息识别,获取网络在通信过程中的流量数据x(t),构建流量数据集$ X = \left[ {{x_1},{x_2},...,{x_d}} \right] $,依据该数据集实现异常信息识别,其中$ d $表示数据流总数量。

1.2 船用网络信息特征提取

对船用网络传输特性进行分析后,为保证网络异常信息的识别效果,以$ X = \left[ {{x_1},{x_2},...,{x_d}} \right] $为依据,提取$ X $中能够描述异常信息变化的特征。为保证特征的提取效果,采用功率密度谱函数进行特征提取,通过随机的方式在$ X $中抽取部分数据,形成聚类中心聚集,将该集合定义为网络输入变量,用$ \left[ {{{\tilde x}_1},{{\tilde x}_2},...,{{\tilde x}_m}} \right] $表示,将其输入异常网络数据的功率密度谱中,以此检测数据频率,其式为:

$ {f_z} = \frac{{{{\tilde x}_m}}}{{\left( {1 - \chi } \right){{\bar f}_n}\sigma }}。$ (6)

式中:$ \chi $为随机常数;$ {\bar f_n} $为船用网络流量主频特征平均值;$ \sigma $为标准差;$ z $为窗口大小。

Fz定义为船用网络传输数据原始频率进行异常特征挖掘,获取船用网络传输数据流量特征的信号的包络值Yz,其式为:

$ {Y_z} = \frac{{{{\tilde x}_m}{{\left( {1 - \frac{1}{z}} \right)}^q}}}{{{f_z}}} 。$ (7)

式中:$ q $为网络流量数据维度。

依据上述内容完成$ X = \left[ {{x_1},{x_2},...,{x_d}} \right] $yz计算后,将所有的包络值计算结果作为船用网络的异常特征$ Y $,依据该特征实现异常信息识别。

1.3 基于模糊聚类的网络异常信息识别

完成船用网络传输数据流量特征的信号的包络值特征$ Y $提取后,依据该特征进行网络异常信息识别。为保证异常信息识别的可靠性,并且适应船用网络中流量和异常模式随着时间、船舶运行状态等因素而动态变化的特点,采用基于模态稳定函数的模糊C均值聚类算法进行网络异常信息识别。该算法在识别时,能够较好地处理船用网络异常信息的模糊性和重叠性,精准完成异常信息类别的划分。将船用网络传输数据流量特征的信号的包络值特征$ Y $输入模态稳定函数的模糊C均值聚类算法中,如果该特征的第$ i $个聚类中心和隶属度分别用$ {c_i} $$ {g_{i,m}} $表示,以此构建隶属度矩阵,该矩阵需满足约束:

$ \left\{ \begin{gathered} {g_{i,m}} \in \left[ {0,1} \right] ,\\ \sum\limits_{i = 1}^s {{g_{i,m}}} = 1。\\ \end{gathered} \right. $ (8)

式中:$ s $为类别数量。

为更好地描述包络值特征$ Y $,定义特征稳定函数Fm,以此描述特征点的稳定程度,该函数的式为:

$ {F_m} = \frac{{{N_m}}}{{{N_{\max }}}} 。$ (9)

式中:Nm为包络值特征点数量;Nmax为特征的最高模态阶次。

结合Fm设定船用网络异常信息的聚类识别目标函数,其式为:

$ {H_m}\left( {G,c} \right) = \sum\limits_{i = 1}^c {\sum\limits_{s = 1}^n {{F_m}g_{i,m}^s} } {\left\| {{y_s} - {c_i}} \right\|^2}。$ (10)

式中:$ \boldsymbol G $为隶属度矩阵;ys为包络值特征点。

确定船用网络异常信息聚类识别目标函数后,在满足式(8)的条件下,获取最小Hm(G,c)值,对式(10)进行拉格朗日乘数法和偏微分计算,结合Fm获取最佳的包络值特征ys的隶属度gi,m和聚类中心的结果ci,其式为:

$ {g_{i,m}} = {\sum\limits_{i = 1}^c {\left( {\frac{{{{\left\| {{y_s} - {c_i}} \right\|}^2}}}{{{{\left\| {{y_s} - {c_j}} \right\|}^2}}}} \right)} ^{ - \frac{2}{{m - 1}}}},$ (11)
$ {c_i} = \frac{{\sum\limits_{s = 1}^n {{F_m}g_{i,m}^s{y_s}} }}{{\sum\limits_{s = 1}^n {{F_m}g_{i,m}^s} }} $ (12)

依据式(11)和式(12)进行算法迭代,满足设定的最大迭代次数后确定包络值特征ys的隶属度gi,m和聚类中心的结果ci后,即可得出最佳的Hm(G,c)值,依据该最佳值即可完成所有包络值特征$ Y $的类别划分,从而实现船用网络异常数据分类识别。

2 测试结果分析 2.1 试验内容与参数说明

为验证本文方法在船舶网络异常信息识别中的应用效果,以大型集装箱货船中的通信网络为例展开相关测试。该船舶船长为141.93 m,船宽为22.5 m,型深为11.4 m,航行速度约为18 kn。该船舶需通过船用网络实现整体通信覆盖,实现机舱系统、航行系统、作业系统、安防系统以及中心控制系统之间的全面通信,保证船舶整体航行安全和运输情况。该船舶的网络拓扑结构如图2所示,网络的相关参数如表1所示。

图 2 船舶的网络拓扑结构 Fig. 2 Network topology of ships

表 1 网络的相关参数 Tab.1 Relevant parameters of the network
2.2 特征提取能力测试

本文方法在进行船用网络异常信息识别时,需提取网络流量数据的信号包络特征。为测试本文方法的特征提取结果,获取相同采集周期内的流量数据,通过本文方法提取其包络特征值,提取结果如图3所示。可知,本文方法提取船用网络流量的包络特征后,能够获取该特征的变化情况,并且特征中涵盖重叠流量突变流量的变化趋势。因此,本文方法具备较好的包络特征提取能力,并且,依据流量数据的包络特征值能够较好地描述网络信息的变化情况。

图 3 网络流量数据的信号包络特征提取结果 Fig. 3 Signal envelope feature extraction results of network traffic data
2.3 异常信息识别性能测试

本文方法利用模态稳定函数的模糊C均值聚类算法进行船用网络异常信息识别,为分析该算法的分类识别性能,本文采用分离性作为评价指标,该指标能够衡量算法对流量数据类别的划分能力,值在0~1之间,值越大表示分类效果越佳。因此,在不同的流量数据重叠程度下,通过本文方法进行异常信息识别,获取识别后各个类别的分离性结果,如表2所示。可知,通过文中方法进行不同大小数据流信息异常时,数据流中数据重叠程度的不断增加,本文方法的异常信息识别后的分离性结果均在0.94以上。因此,该方法能够较好地完成船用网络异常信息识别。

表 2 各个信息类别的分离性结果 Tab.2 Separability results of various information categories

为进一步验证文中方法的船用网络异常信息识别效果,在网络传输动态波动下,通过文中方法进行异常信息识别,获取其在不同通信时间下,船用网络异常信息识别结果,如图4所示。可知,通过文中方法在进行异常信息识别时,能够结合稳定函数完成船用网络异常信息分类识别,并且能够依据该函数确定不同异常信息的类别。

图 4 船用网络异常信息识别结果 Fig. 4 Identification results of abnormal information in marine network
2.4 方法应用场景与普适性阐述

本文方法适用于各类船舶通信网络,无论是大型集装箱货船,还是其他类型船舶,只要存在类似的网络通信需求,如保障各系统间通信以实现航行安全与任务执行,均可应用该方法进行异常信息识别。该方法不局限于特定的网络拓扑结构或参数设置,对于不同的网络初始能量、节点数量、数据分组长度、通信量以及传输协议等条件,均能通过调整相关参数实现有效的异常信息识别。此外,在面对网络流量动态变化、数据重叠等复杂情况时,该方法依然能保持较高的识别准确率,具有良好的普适性,可为船舶网络的安全稳定运行提供有力保障。

3 结 语

本文围绕船用网络异常信息识别展开研究,提出将功率密度谱函数与改进模糊C均值聚类算法相结合的方法。测试结果显示,该方法在特征提取上表现出色,能精准获取船用网络流量包络特征变化,涵盖多种流量变化趋势。在异常信息识别性能方面,以分离性为指标,在不同流量数据重叠程度下,识别分离性结果均超0.94,且在网络传输动态波动时,能结合稳定函数完成分类识别并确定异常类别。此外,该方法应用场景广泛、普适性强,不局限于特定网络拓扑与参数,面对复杂网络情况仍能保持高识别准确率。综上所述,本文方法有效满足了船用网络异常信息识别需求,为船舶网络安全管理提供了可靠支撑,具有重要应用价值。

参考文献
[1]
陶华宁, 刘荣才, 刘荣超. 基于5G通信技术的船用网络防拥塞机制研究 [J]. 舰船科学技术, 2024, 46 (16): 166−169.
TAO H N, LIU R C, LIU R C. Research on anti congestion mechanism of ship network based on 5G communication technology [J]. Ship Science and Technology, 2024, 46 (16): 166−169.
[2]
杨春霞, 陶可瑞, 宋永生. 深度学习算法的舰船网络安全状态识别 [J]. 舰船科学技术, 2023, 45 (21): 193−196.
YANG C X, TAO K R, SONG Y S. Deep learning algorithm for ship network security state recognition [J]. Ship Science and Technology, 2023, 45 (21): 193−196.
[3]
车丽娜, 任秀丽. 基于滑动窗口和置信度的无线传感器网络异常检测算法[J]. 传感技术学报, 2023, 36(11): 1801-1807.
CHE L N, REN X L. Anomaly detection algorithm based on sliding windows and confidence for WSN[J]. Chinese Journal of Sensors and Actuators, 2023, 36(11): 1801-1807. DOI:10.3969/j.issn.1004-1699.2023.11.019
[4]
张兵, 卞利. 基于FW-PSO的大区域无线传感网络流量异常检测算法[J]. 传感技术学报, 2023, 36(7): 1116-1121.
ZHANG B, BIAN L. Traffic anomaly detection algorithm for large area wireless sensor network based on FW-PSO[J]. Chinese Journal of Sensors and Actuators, 2023, 36(7): 1116-1121. DOI:10.3969/j.issn.1004-1699.2023.07.016
[5]
李道全, 李腾, 李玉秀. 基于机器学习的SDN异常流量检测架构[J]. 计算机工程与设计, 2023, 44(7): 1928-1936.
LI D Q, LI T, LI Y X. SDN abnormal traffic detection architecture based on machine learning[J]. Computer Engineering and Design, 2023, 44(7): 1928-1936.
[6]
刘东, 焦玉超, 宋晓男. 基于AHP-灰色聚类模型的舰艇自身抗损能力评估方法 [J]. 船舶工程, 2024, 46 (4): 54−59.
LIU D, JIAO Y C, SONG X N. A method for evaluating the self damage resistance of naval vessels based on AHP grey clustering model [J]. Ship Engineering, 2024, 46 (4): 54−59
[7]
叶志祥. 基于模糊聚类的情报侦察指挥要素能力评价 [J]. 舰船电子工程, 2024, 44 (2): 14−19.
YE Z X. Evaluation of intelligence reconnaissance command element capability based on fuzzy clustering [J]. Ship Electronic Engineering, 2024, 44 (2): 14−19