舰船科学技术  2023, Vol. 45 Issue (5): 136-139    DOI: 10.3404/j.issn.1672-7649.2023.05.025   PDF    
基于大数据挖掘的船舶通信系统关键设备状态分析
杨青1,2, 吴松丽2     
1. 河南师范大学 计算机科学与技术系,河南 新乡 453007;
2. 驻马店职业技术学院,河南 驻马店 463000
摘要: 以保障船舶通信系统联络通畅为目的,提出基于大数据挖掘的船舶通信系统关键设备状态分析方法。该方法使用北向接口和通信关键设备直连相结合方式,采集船舶通信系统关键设备运行信息后,利用大数据挖掘技术中的自组织映射神经网络,挖掘船舶通信系统关键设备状态信息随时间变化规律,得到时间变化序列。以关键设备状态信息时间变化序列为基础,使用大数据挖掘技术中区间集聚类分析方法,经过划分关键设备状态信息时间变化序列区间集、计算区间集子序列相似度和子序列异常值评分等步骤,分析得到船舶通信系统关键设备运行时的异常状态。实验结果表明:该方法采集船舶通信系统关键设备状态信息能力较好,可有效分析关键设备当前运行状态,应用效果较为显著。
关键词: 大数据挖掘     船舶通信系统     关键设备     状态分析     信息采集     区间集聚类    
Research on status analysis of key equipment of ship communication system based on big data mining
YANG Qing1,2, WU Song-li2     
1. Henan Normal University, Department of Computer Science and Technology, Xinxiang 453007, China;
2. Zhumadian Vocational and Technical College, Zhumadian 463000, China
Abstract: In order to ensure the smooth communication of the ship communication system, the state analysis method of the key equipment of the ship communication system based on big data mining is studied. This method uses the combination of northbound interface and direct connection of key communication equipment to collect the operation information of the key equipment of the ship communication system, and uses the self-organizing mapping neural network in big data mining technology to mine the rule of the state information of the key equipment of the ship communication system changing with time to obtain the time change sequence, which is based on the time change sequence of the state information of the key equipment, Using the cluster analysis method of inter-area set in big data mining technology, the abnormal state of the key equipment of the ship communication system during operation is analyzed by dividing the interval set of the time change sequence of the key equipment status information, calculating the similarity of the interval set subsequence and scoring the outlier of the subsequence. The experimental results show that this method has a good ability to collect the status information of the key equipment of the ship communication system, and can effectively analyze the current operation status of the key equipment, the application effect is significant.
Key words: big data mining     ship communication system     key equipment     status analysis     information collection     interval set clustering    
0 引 言

船舶通信系统内设备种类较多,包含有线、无线等多种通信设备,其在航行过程中的信息流通量较大。船舶通信系统内各种设备共享通信结构[1-2],使船舶通信高度自动化,保障信息传输安全可靠、联络通畅。但受船舶通信系统设备之间的兼容性以及航行过程中不可控因素影响,船舶通信系统内关键设备一旦出现问题,会导致船舶与地面站连接中断,接收不到地面指令,同时影响其雷达导航、避障等多个功能,为船舶航行带来潜在威胁,因此分析船舶通信系统关键设备状态意义重大。现在也有很多学者致力于分析船舶通信系统关键设备状态,如蓝志威等[3]使用大数据挖掘技术,从入侵监测角度分析船舶通信系统关键设备运行状态,该方法通过采集船舶通信系统关键设备运行异常时的信息后,将其转换成频域信号,在分析该频域信号特征,使用聚类算法实现其设备运行状态监测。但该方法受聚类算法参数选择存在主观性影响,导致其分析结果不够准确,因此应用效果不佳。王瑞涵等[4]以机器学习算法为基础,使用流形学习方式获取船舶通信系统关键设备运行时的有效数据特征后,将其输入到机器学习算法内,通过训练构建检测器,实现船舶通信系统关键设备状态分析。但该方法在提取数据有效特征时,受数据维度影响提取结果不佳,影响其应用效果。在信息时代,大数据挖掘技术是从海量信息内,挖掘出信息之间存在的关联关系,通过用户容易理解的方式呈现出来[5],用于监测、识别、预警等。本文以大数据挖掘技术为基础,研究基于大数据挖掘的船舶通信系统关键设备状态分析方法,为提升船舶通信系统通信质量提供技术支持。

1 船舶通信系统关键设备状态分析方法 1.1 船舶通信系统关键设备运行状态信息采集

采集船舶通信系统关键设备运行信息过程为:用户通过PC端登录船舶通信系统关键设备运行信息采集控制中心,将北向接口和设备直连协议封装到协议栈内,通过协议栈向船舶通信系统关键设备发出连接请求,判断当前关键设备是否为北向接口,若是则连接北向设备接口,反之则直接连接设备;然后判断设备是否连接成功,若是,则向采集控制中心返回关键设备运行信息采集结果,反之则重新判断是否为北向接口,重新连接设备。

1.2 关键设备状态时间序列变化过程挖掘

利用运行状态信息构建数据集X=[x1,x2,···,xn], $ n $ 表示数据集内状态信息总数,使用大数据挖掘算法中的自组织映射神经网络(SOM)挖掘船舶通信系统关键设备运行信息的时间序列变化过程,得到其运行状态变化规律,详细过程如下:

X=[x1,x2,···,xn]输入到自组织映射神经网络后,神经网络将该信息映射成神经元,然后使用一阶转移概率 $ P $ 描述神经元之间的关系。Qt表示经过该神经网络量化后的船舶通信系统关键设备运行状态信息时间序列, $ t $ 为时刻,则第 $ n $ 个自组织神经网络模型AR(n)内,神经元之间的一阶转移概率可由 $P\left[ {q_{t + 1}}\left| {q_t},\right. \cdots , {q_{t - n + 1}} \right]$ 表示 $ {q_t} \in {Q_t} $ 。时间序列[Q1,Q2,···,Qt]的取值为[1,2,···,N],则在 $ t $ 时刻,qt取值为Qi的概率计算式如下:

$ P\left[ {{q_t} = {Q_I}} \right] = P\left[ {i({x_t}) = I} \right]。$ (1)

式中:QI为时间序列[Q1,Q2,···,Qt]内的第 $ I $ 个时间状态;i(xt)表示第 $ i $ 个船舶通信系统关键设备运行信息单量时间状态。

计算i(xt)的概率密度,表达公式如下:

$ \left\{ \begin{gathered} P\left[ {i({x_t}) = I} \right] = P\left[ {\arg \mathop {\min }\limits_i \left\| {{x_t} - {Q_I}} \right\| = I} \right], \\ P\left[ {\left\| {{x_t} - {Q_I}} \right\| \leqslant \left\| {{x_t} - {Q_j}} \right\|\forall j \ne I} \right]。\\ \end{gathered} \right. $ (2)

式中:Qj为[Q1,Q2,···,QN]内任意时间状态;||·||为欧式距离。

状态信息 $ x $ 和时间状态 $ q $ 均为一维数组,且状态信息满足正态分布规律[5],则可用正态分布函数简化公式(2),其变更如下:

$ \begin{gathered} P\left[ {i({x_t}) = I} \right] = P\left[ {b < {x_t} < a} \right] = \\ \varPhi \left( {\frac{{a - \mu }}{\sigma } - \frac{{b - \mu }}{\sigma }} \right)。\\ \end{gathered} $ (3)

式中: $ a = \dfrac{{{Q_I} + {Q_{I + 1}}}}{2} $ $ b = \dfrac{{{Q_I} + {Q_{I - 1}}}}{2} $ $ \varPhi $ 为随机变数; $\ \mu $ $ \sigma $ 均为模型拟合参数。

$ I $ 数值分别等于1和等于 $ N $ 时,则式(3)变更为:

$ \left\{ \begin{gathered} P\left[ {i({x_t}) = I} \right] = \varPhi a - \varPhi \frac{\mu }{\sigma }\mathop {}\limits^{} \mathop {}\limits^{} \mathop {}\limits^{} I = 1, \\ P\left[ {i({x_t}) = I} \right] = 1 - \varPhi \frac{{b - \mu }}{\sigma }\mathop {}\limits^{} I = N。\\ \end{gathered} \right. $ (4)

自组织映射神经网络迭代过程具备平稳性,在其内部距离较近的神经元之间转移概率较大,因此其神经元二阶概率分布函数表达公式如下:

$ P\left[ {{q_t} = {Q_{I1}},{q_{t + k}} = {Q_{I2}}} \right] = P\left[ {{x_t}({b_1},{a_1}),{x_{t + k}} \in ({b_2} + {a_2})} \right] 。$ (5)

式中: $ {Q_{I1}},{Q_{I2}} \in \left[ {{Q_1},{Q_2}, \cdots ,{Q_N}} \right] $ $ I_1 = ({a_1},{b_1}) $ $ I_2 = ({a_2},{b_2}) $

以式(5)结果为基础,船舶通信系统关键设备运行状态信息的二阶正态密度分布函数为:

$ \begin{split} P\left[ {{q_{t + 1}} = {Q_{I2}}\left| {{q_t} = {Q_{I1}}} \right.} \right] =& P\left[ {{q_{t + 1}} = {Q_{I2}},{q_t} = {Q_{I1}}} \right] \times \\ & \frac{1}{{P\left[ {{q_t} = {Q_{I1}}} \right]}} 。\end{split} $ (6)

自组织映射神经网络对船舶通信系统关键设备运行状态信息进行拟合,得到神经网络模型参数,再将船舶通信系统关键设备运行状态信息输入到训练好的模型内,依据式(6)二阶正态密度分布函数对船舶通信系统关键设备运行状态信息进行量化,输出船舶通信系统关键设备运行状态信息随着时间变化的向量序列 $ X' = \left[ {x_1',x_1', \cdots ,x_n'} \right] $

1.3 基于区间集聚类分析的关键设备状态分析方法

$ X' = \left[ {x_1',x_1', \cdots ,x_n'} \right] $ 作为基础,利用大数据挖掘技术中的区间集聚类分析方式得到船舶通信系统设备状态异常结果,其步骤如下:

步骤1 建立 $ X' $ 的区间集, $ \delta = \left[ {r,w} \right] $

步骤2 使用长度为 $ m $ 的滑动窗口,将 $ X' $ 等长划分成为 $ H $ 个子序列,其中第 $ k $ 个子序列由 $X_k' = \{ {x_p}, {x_{p + 1}}, \cdots ,{x_{p + m - 1}} \}$ 表示, $ p $ $ p + m - 1 $ 分别为子序列起点和终点。

步骤3 建立第 $ k $ 个子序列区间集, $ {\delta _k} = \left[ {{r_k},{w_k}} \right] $

步骤4 任意选择2个子序列 $ X_i' $ $ X_j' $ ,计算它们相似度,具体为

$ {S_{{\delta _{ij}}}} = \left\| {{\delta _i} \cap {\delta _j}} \right\| \times \frac{1}{{\left\| {{\delta _i} \cup {\delta _j}} \right\|}} 。$ (7)

式中: $ {S_{{\delta _{ij}}}} $ 为子序列 $ X_i' $ $ X_j' $ 之间的相似度; $ {\delta _i} $ $ {\delta _j} $ 分别为子序列 $ X_i' $ $ X_j' $ 的区间。

步骤5 计算多个子序列的相似度。选择 $ s $ 个任意连续滑动的子序列区间集,将该 $ s $ 个连续滑动子序列区间集看作一个整体,计算该整体与另一个 $ s $ 个连续滑动子序列区间集的相似度,前者标记为 $ i $ ,后者标记为 $ j $ ,该2个子序列区间集相似度计算式如下:

$ {S_{ij}} = \sum\limits_{k = 0}^{s - 1} {{S_{{\delta _{(i + k)(j + 1)}}}}} ,$ (8)

式中,Sij为第 $ i $ 个和第 $ j $ 个具备 $ s $ 个连续滑动子序列区间集相似度。

步骤6 计算上一步中第 $ i $ 个子序列和不包含第 $ i $ 个子序列公共元素其他子序列之间的最大相似度,该最大相似度被称为第 $ i $ 个子序列的相似度评分,其表达式如下:

$ {\eta _i} = \max {S_{ij}}\mathop {}\limits^{} (\left| {i - j} \right| > s), $ (9)

式中,ηi为第 $ i $ 个子序列的相似度评分。

步骤7 计算序列异常值评分,则第 $ i $ 个序列异常值评分表达式如下:

$ {F_i} = 1 - \frac{{{\eta _i}}}{s}。$ (10)

式中,Fi为第 $ i $ 个序列异常值评分。

步骤8 经过上述步骤得到船舶通信系统关键设备运行状态信息时间序列所有子区间异常值评分,筛选出异常值评分大于0.55的子区间,在该自区间内的船舶通信系统关键设备运行状态信息即为该设备运行异常分析结果。

2 仿真实验

以某船上的通信系统关键设备作为实验对象,该船通信系统包含维修通信船站、AIS船舶自动识别设备、GPS电子海图仪、中高频接收机、气象传真机、卫星接收发送设备、电视卫星天线、SSB电话通信设备、WHF设备以及不同功率接收机等。该船舶执行远洋航行任务,运行环境较为复杂,因此会出现某些关键通信设备失灵情况。将本文方法应用在该船通信系统关键设备状态分析过程中,检验本文方法应用效果。

2.1 关键设备状态信息采集测试

以该船通信系统内某信号接收机作为实验对象,通过本文方法采集该信号接收机运行时的信号频宽信息,采集结果如图1所示。分析可知,该通信系统信号接收机呈现运行状态,其通信信号频宽呈现不断变化趋势,而本文方法可采集到其信号频宽随着时间变化曲线信息,说明本文方法可有效采集船舶通信系统关键设备运行信息,为后续分析其运行状态打下良好的基础。

图 1 通信系统关键设备运行信息采集结果 Fig. 1 Operation information collection results of key equipment of communication system
2.2 关键设备状态时间序列挖掘测试

以该船舶系统某关键设备作为实验对象,该设备24 h不间断运行,设备自身温度呈现不断变化趋势,使用本文方法采集该设备运行温度信息,挖掘其随时间变化规律,并以向量的方式呈现,结果如图2所示。由图可知,该设备运行时,温度随着时间呈现波动变化趋势,波动区间为25℃~30℃之间。而本文方法对该船舶通信系统关键设备温度序列进行挖掘后,可将其温度序列量化到1.5~4.5量化值区间内,且在量化区间内的温度序列曲线分布状态与其时间序列曲线分布状态极其吻合。上述结果说明:本文方法可有效量化船舶通信系统关键设备运行状态信息,其挖掘船舶通信系统关键设备运行状态随时间变化规律能力较好,也从侧面说明本文方法分析船舶通信系统关键设备运行状态能力较好。

图 2 关键设备状态时间序列挖掘测试结果 Fig. 2 Test results of mining time series of key equipment status
2.3 应用性测试

以该船通信系统内的中高频接收机作为实验对象,在不同时刻时中断中高频接收机信号接收器连接线,测试在不同实验次数情况下,本文方法分析该中高频接收机运行状态结果如表1所示。分析可知,在10次中高频接收机运行状态分析过程中,本文方法分析结果与实际运行状态结果均完全相同,说明本文方法分析船舶通信系统关键设备状态较为准确,可应用在船舶通信系统关键设备状态分析过程中。

表 1 中高频接收机运行状态分析结果 Tab.1 Analysis results of operation status of medium and high frequency receiver
3 结 语

本文研究基于大数据挖掘的船舶通信系统关键设备状态分析方法,在其中应用到了大数据挖掘技术中的自组织映射神经网络和区间集聚类分析方法,分别得到船舶通信系统关键设备运行信息时间序列和状态分析结果。经过实际验证,本文方法可有效采集船舶通信系统关键设备运行状态信息,分析关键设备状态精度较高,应用效果较佳。

参考文献
[1]
吴海洋, 缪巍巍, 郭波, 等. 基于改进决策树的电力通信设备状态预测算法研究[J]. 计算机与数字工程, 2021, 49(1): 17-20,74.
WU Haiyang, MIAO Weiwei, GUO Bo, et al. Research on State Prediction Algorithms of Electric Power Communication Equipment Based on Improved Decision Tree[J]. Computer and Digital Engineering, 2021, 49(1): 17-20,74. DOI:10.3969/j.issn.1672-9722.2021.01.004
[2]
董彦磊, 关俊鹏, 张建君, 等. 基于决策融合的多卫星通信系统态势分析技术[J]. 河北工业科技, 2022, 39(4): 320-327.
DONG Yanlei, GUAN Junpeng, ZHANG Jianjun, et al. Situation analysis technology of multi-satellite communication system based on decision fusion[J]. Hebei Journal of Industrial Science & Technology, 2022, 39(4): 320-327.
[3]
王若龙. 大数据分析技术在通信网络系统优化中的应用研究[J]. 电视技术, 2021, 45(8): 4-6,9.
WANG Ruolong. Application of big data analysis in communication network system optimization[J]. Video Engineering, 2021, 45(8): 4-6,9.
[4]
王瑞涵, 陈辉, 管聪. 基于机器学习的船舶机舱设备状态监测方法[J]. 中国舰船研究, 2021, 16(1): 158-167.
WANG Ruihan, CHEN Hui, GUANG Cong. Condition monitoring method for marine engine room equipment based on machine learning[J]. Chinese Journal of Ship Research, 2021, 16(1): 158-167. DOI:10.19693/j.issn.1673-3185.02150
[5]
马莉莉, 刘江平. 基于数据挖掘的光纤通信网络异常数据检测研究[J]. 应用光学, 2020, 41(6): 1305-1310.
MA Lili, LIU Jiangping. Research on abnormal data detection of optical fiber communication network based on data mining[J]. Journal of Applied Optics, 2020, 41(6): 1305-1310. DOI:10.5768/JAO202041.0608003