舰船科学技术  2022, Vol. 44 Issue (19): 146-149    DOI: 10.3404/j.issn.1672-7649.2022.19.029   PDF    
基于数据挖掘的船舶通信网络失效节点自动识别方法
陈文庆1,2     
1. 江苏师范大学 计算机科学与技术学院,江苏 徐州 221000;
2. 中国劳动关系学院 应用技术学院,北京 100048
摘要: 目前提出的舰船通信网络失效节点自动识别方法耗时时间较长,冗余节点关闭率较低。为了解决上述问题,提出基于数据挖掘的舰船通信网络失效节点自动识别方法。确定目标数据集,得到特征提取最优解集合和整体最优解集合,识别提取异常数据特征,建立异常数据聚类集合,引入数据密度系数计算 $ i $ 节点数据聚类结果优化数值。构建失效节点自动识别函数,得到检索半径的适应目标函数,深入挖掘数据,通过统一化处理实现网络失效节点自动识别。实验结果表明,基于数据挖掘的舰船通信网络失效节点自动识别方法的识别准确率在99%以上,耗时时间低于4 s。
关键词: 数据挖掘     舰船通信     通信网络     失效节点     自动识别     识别方法    
Automatic identification method of failure node of ship communication network based on data mining
CHEN Wen-qing1,2     
1. School of Computer Science and Technology, Jiangsu Normal University, Xuzhou 221000, China;
2. School of Applied Technology, China University of Labor Relations, Beijing 100048, China
Abstract: The current proposed method for automatic identification of failed nodes in ship communication network is time-consuming, and redundant nodes have a low shutdown rate. In order to solve the above problems, a new method for automatic identification of failed nodes in ship communication network is studied based on data mining. Determine the target data set, obtain the feature extraction optimal solution set and the overall optimal solution set, identify and extract the abnormal data features, establish the abnormal data clustering set, and introduce the data density coefficient to calculate the optimal value of the node data clustering result. The automatic identification function of the failed node is constructed, the adaptive objective function of the retrieval radius is obtained, the data mining is carried out, and the automatic identification of the network failure node is realized through unified processing. The experimental results show that the time-consuming time of the automatic identification method of the failure node of the ship communication network based on data mining is less than 4 s.
Key words: data mining     ship communication     communication network     failed node     automatic identification     identification method    
0 引 言

船舶通信网络数据异常会导致信息传输故障、数据处理失误和系统任务失效等问题,因此,加强通信网络失效节点异常数据检测识别技术越发重要。

文献[1]以船舶通信网络拓扑结构为基础构建数据模型,计算各个节点综合数值判断是否存在异常。但该方法计算量过大且操作复杂,误差率较高。文献[2]通过建立多层通信网络结构模型,根据探测策略对节点信息进行检测。但该方法自动化程度较低,工作难度较高。

针对传统方法存在的不足,本文提出一种基于数据挖掘的船舶通信网络失效节点自动识别方法。通过聚类算法对船舶通信网络中的数据进行识别检测和特征提取,构建自动检测目标函数判断异常数据信息节点,采用离散序列算法对失效节点进行数据挖掘,具有良好的灵活性和精准性。

1 船舶通信网络失效节点自动识别方法具体设计 1.1 节点特征提取

基于数据挖掘技术中的聚类算法对船舶通信网络失效节点进行自动识别,首先需要检测提取通信网络中的信息数据,将所有特征数据按照既定序列整合到数据处理系统中形成样本合集,设定为系统需要进行识别检测的数据点集合[3-4]。根据系统设定的船舶通信节点异常数据阈值,对数据属性和特征密度进行分类提取,通过聚类运算得到不同特征数据集[5-6]。为了进一步提高通信网络数据特征聚类结果,本文选取高阶统计量算法对特征提取进行优化。设目标数据集为 $ M = \left\{ {{m_1},{m_2}, \cdots ,{m_m}} \right\} $ ,单个数据特征提取最优解集合为 $ {U_m} = \left\{ {{u_{m1}},{u_{m2}}, \cdots {u_{mm}}} \right\} $ ,整体最优解集合为 $ {U_a} = \{ {u_{a1}}, {u_{a2}}, \cdots ,{u_{am}} \} $ ,则异常数据特征识别提取方法如下:

$ {e_i} = \alpha * {r_1}\left( {{u_{mm}} - {e_{im}}} \right) + \beta * {r_2}\left( {{u_{am}} - {e_{im}}} \right)。$ (1)

其中: $ {e_i} $ 为检测数据集中第 $ i $ 个节点的失效异常数据; $ \alpha ,\beta $ 分别为不同特征序列的特征提取加速优化系数; $ {r_1},{r_2} $ 为随机参数。

经过优化后的特征提取结果具有更好的相关性,更能够突出网络数据的特征值,有利于进一步实现聚类分析运算[7-8]

1.2 节点分类检测

特征提取后的异常节点数据传输到分类检测程序,采用聚类算法对样本数据属性进行检测处理。设定优化后的数据集为 $ M' $ ,异常数据权值为 $ K $ ,则将异常数据聚类到对应聚类中心可表示为:

$ L\left( 1 \right) = \sum\limits_{i = 1}^K {{\mu _{ij}}{L_j} + } \sum\limits_{j = 1}^{K'} {{\mu _{ij}}{L_i}'} 。$ (2)

式中: $ L\left( 1 \right) $ 为异常数据聚类集合; $ {\mu _{ij}} $ 为异常数据样本映射到聚类中心的模糊隶属度; $ {L_i},{L_j} $ 为异常数据对应聚类数值[9-10]

设定存在多维度异常数据特征集合,选取不同特征点数据集重复上述计算过程,多次进行聚类运算,得到多项异常数据特征检测分类结果。为了进一步提高聚类效果,可引入数据密度系数进行检验:

$ {X_i} = - \delta \frac{{{{\left\| {{x_1} - {x_2}} \right\|}^2}}}{{({r_b}/2)}}。$ (3)

其中: $ {X_i} $ $ i $ 节点数据聚类结果优化数值; $ \delta $ 为聚类数据集密度系数; $ {r_b} $ 为数据特征密度指标半径。

聚类后的通信网络节点如图1所示。

图 1 聚类后的通信网络节点 Fig. 1 Communication network nodes after clustering

根据图1可对特征阈值进行分选,所得比值结果越小,说明聚类效果越好。

2 船舶通信网络失效节点数据挖掘

船舶通信网络失效节点数据挖掘流程如图2所示。

图 2 船舶通信网络失效节点数据挖掘流程 Fig. 2 The data mining process of the failure node of the ship communication network
2.1 失效节点自动识别函数

基于上述数据特征识别提取和优化分类,对船舶通信网络失效节点数据进行挖掘。由于导致通信网络失效的原因各不相同,不能采用单一的方差和平方差运算方式进行识别,容易造成较大误差。选用基于熵目标函数的数据检测方法构建目标函数,由于船舶通信网络失效节点存在较强的随机性,需要引入熵值对异常数据不确定性进行描述。将待检测的数据按照聚类结果依次导入目标函数识别系统,设定 $ t $ 时刻异常数据特征为 $ x\left( t \right) $ ,第 $ i $ 个样本的特征属性为 $ {x_i}\left( t \right) $ ,则构建的目标函数为:

$ F\left( {x\left( t \right)} \right) = \sum\limits_{i = 1}^n {\gamma {S^2}{x_i}\left( t \right) + \lambda S{x_i}\left( t \right)}。$ (4)

式中: $ S $ 为引入的熵值; $ {S^2} $ 为熵的样本平方差; $ \gamma ,\lambda $ 为目标函数的权重系数,该函数即为失效节点异常数据自动检测识别的目标函数。

将经过聚类运算整合后的初始数据集按照时间序列载入函数运算程序,算法自动检索半径为 $ R $ ,表示运算数据覆盖范围,根据特征聚类结果,设定异常信息数据特征阈值 $ Y $ 和运算迭代次数 $ i $ ,则适用于检索半径的适应目标函数为:

$ f\left( {R,\phi } \right) = \frac{1}{{1 + {e^{ - F\left( {{x_i}\left( t \right)} \right)}}}}。$ (5)

其中: $ \phi $ 为设定的目标值; $ e $ 为随机样本失效节点数值。

导入检索半径后代入样本数值,进行多次迭代运算,通过多次迭代后能够得到趋近于最优解的数据识别结果。所有特征集合数据按照上述步骤依次在运算程序中循环迭代,输出后的结果进入自动检测循环。输出的数据需要与设定标准数值值域进行比较,不满足任意值域条件的数据,则判断为对应问题所在的异常数据。若满足值域要求,则重复上述计算步骤再次检验数据是否存在异常,若检测判定数据为异常数据,则结束循环,判定该数据为失效节点产生的异常数据。

3 实验结果与分析

为了验证基于数据挖掘的船舶通信网络失效节点自动识别方法的实际应用效果,设定对比实验,选用传统的基于智能定位的船舶通信网络失效节点自动识别方法、船舶无线通信网络故障节点自动定位方法进行实验对比。通信网络原始节点分布状态如图3所示。

图 3 通信网络原始节点分布状态 Fig. 3 Distribution of original nodes of communication network

同时选用3种方法,对通信网络内部的节点进行分类,得到的分类结果如图4所示。可知,传统的基于智能定位的船通信网络失效节点自动识别方法对失效节点识别的准确率较低,无法准确区分出失效节点,船舶无线通信网络故障节点自动定位方法对正常节点的识别准确率较低,本文提出的识别方法能够精准地检测出异常失效节点,实现自动识别。

图 4 通信网络原始节点识别结果 Fig. 4 Identification results of original nodes of communication network

根据图4分类结果,得到不同的识别方法的识别准确率实验结果如表1所示。由表1可知,本文提出的基于数据挖掘的船舶通信网络失效节点自动识别方法的识别准确率在99%以上,基于智能定位的识别方法准确率低于72.69%,基于自动定位的识别方法准确率低于86.02%,识别能力较低。

表 1 识别准确率实验结果 Tab.1 Experimental results of recognition accuracy

识别耗时实验结果如图5所示。可知,本文提出的基于数据挖掘的船舶通信网络失效节点自动识别方法的耗时时间低于4 s,能够在短时间内实现节点识别。

图 5 识别耗时实验结果 Fig. 5 Recognition time-consuming experiment results
4 结 语

本文提出基于数据挖掘的船舶通信网络失效节点自动识别方法,得出以下结论:

1)通过聚类算法对船舶通信网络中的海量数据进行识别提取,根据时间序列划分数据节点,引入优化系数提高特征提取的相关性,再通过聚类运算对节点特征数据进行分类检测,多次迭代和密度系数检验也有利于进一步提高聚类分析的效果。

2)以聚类结果为初始数据构建熵目标函数,在自动检索半径内对异常数据进行自动识别检测,具有良好的灵活性。

3)采用离散序列算法对通信网络失效节点进行数据挖掘,能够提高数据处理效率和精准度。

综上所述,本文研究方法具有良好的应用效果,能够有效提高失效节点自动检测的效率。后续:因数据干扰因素较多,应加强对数据识别和提取过程中干扰因素的筛除,减少数据的复杂性,从而进一步提高数据检测精准度。

参考文献
[1]
高宇鹏, 吕淑芳. 舰船通信网络脆弱节点智能定位方法[J]. 舰船科学技术, 2021(3): 103-105.
GAO Yupeng, LV Shufang. Intelligent location method of vulnerable nodes in ship communication network[J]. Ship Science and Technology, 2021(3): 103-105.
[2]
王盟. 舰船无线通信网络故障节点自动定位方法[J]. 舰船科学技术, 2020, 42(20): 98–100.
WANG Meng. Automatic location method of fault node in ship wireless communication network[J]. Ship Science and Technology, 2020, 42(20): 98–100
[3]
刘国强, 林叶锦, 张志政, 等. 基于粗糙集和优化DAG-SVM的船舶主机故障诊断方法[J]. 中国舰船研究, 2020, 15(1): 68–73.
LIU Guoqiang, LIN Yejin, ZHANG Zhizheng, et al. Fault diagnosis method of marine main engine based on rough set and optimized DAG-SVM[J]. China Ship Research, 2020, 15(1): 68–73
[4]
游兰, 韩雪薇, 何正伟, 等. 基于改进Seq2Seq的短时AIS轨迹序列预测模型[J]. 计算机科学, 2020, 47(9): 169–174.
YOU Lan, HAN Xuewei, HE Zhengwei, et al. Short time AIS trajectory sequence prediction model based on improved Seq2Seq[J]. Computer Science, 2020, 47(9): 169–174
[5]
魏国东, 朱石坚, 罗忠, 等. 基于数据挖掘的装备维修性定量分析与研究[J]. 海军工程大学学报, 2020, 32(2): 87–91.
WEI Guodong, ZHU Shijian, LUO Zhong, et al. Quantitative analysis and research of equipment maintainability based on data mining[J]. Journal of Naval University of Engineering, 2020, 32(2): 87–91
[6]
李忠, 靳小龙, 王亚杰, 等. 属性网络中基于变分图自编码器的异常节点检测方法[J]. 模式识别与人工智能, 2022, 35(1): 17–25.
[7]
刘明. 基于数据挖掘技术的网络控制系统建模与分析[J]. 沈阳工业大学学报, 2022(4): 446–450.
LIU Ming. Modeling and Analysis of Networked Control System Based on Data Mining Technology[J]. Journal of Shenyang University of Technology, 2022(4): 446–450
[8]
张磊, 吴昊, 赵强, 等. 基于数据挖掘技术的地下工程目标毁伤效应计算方法[J]. 爆炸与冲击, 2021, 41(3): 1–10.
[9]
任伟, 徐子立, 宋晓林, 等. 基于数据挖掘的配网数字化计量系统运行特性监测和评价方法研究[J]. 高压电器, 2020, 56(8): 183–191.
[10]
韩建富, 肖春, 宋小兵, 等. 基于GA-BP神经网络的能源互联网窃电行为识别方法[J]. 电气传动, 2022, 52(14): 38–44.