2. 青海交通职业技术学院,青海 西宁 810016
2. Qinghai Communications Technical College, Xining 810016, China
通过估计通信网络流量,可精准发现其未来的发展趋势,及时发现通信网络存在的不足,加以改进,提升通信网络的稳定性与服务质量,确保通信网络不会出现拥塞[1-2],实时传递舰船通信数据,保证舰船航行的安全性。姚立霜等[3]利用经验模态分解获取各尺度网络流量的分量,利用改进K均值聚类算法聚类网络流量分量,在自回归移动平均模型内输入聚类结果,输出网络流量估计结果。该方法网络流量估计速度较快,有效提升网络流量估计精度,但该方法并未提取网络流量特征,易受不同特征影响,降低网络流量估计精度。李校林等[4]改进粒子滤波算法过滤网络流量,抑制流量内部噪声,利用长短期记忆循环网络处理过滤后的网络流量,输出网络流量估计结果。该方法具备较高的网络流量估计精度,且收敛速度较快。该方法对网络流量展开噪声抑制,但计算开销较大,影响网络流量估计的实时性。大数据驱动和分析利用科学的方法将数据应用至各个任务中,并持续作出正向反馈,得到精准的数据分析结果[5]。为此研究大数据驱动和分析的舰船通信网络流量智能估计方法,提升通信网络流量智能估计效果,为舰船航行提供更好的服务。
1 舰船通信网络流量智能估计 1.1 基于数据驱动的有效舰船通信网络流量数据提取舰船通信网络流量历史大数据库为D,记录集为H,即
$ {S_d}\left( {{H_i},{H_j}} \right) = {\left( {\sum\limits_{h = 1}^p {\lambda {{\left| {{x_{ih}} - {x_{jh}}} \right|}^2}} } \right)^{\frac{1}{2}}}。$ | (1) |
其中,p为舰船通信网络流量数值型特征数量,
令舰船通信网络流量字符型属性数量是q,同时
$ {S_c}\left( {{H_i},{H_j}} \right) = \sum\limits_{h = 1}^q {\lambda S\left( {{x_{ih}},{x_{jh}}} \right)}。$ | (2) |
其中,第h个字符属性
因此,
$ S\left( {{H_i},{H_j}} \right) = {S_d}\left( {{H_i},{H_j}} \right) + {S_c}\left( {{H_i},{H_j}} \right) 。$ | (3) |
令具有标志性的有效舰船通信网络流量数据聚类集是
$ M_{i'}^d = \frac{{\displaystyle\sum\limits_{j = f}^g {{S_d}\left( {{H_i},{H_j}} \right)} }}{r}。$ | (4) |
$ M_{i'}^c = \max \left( {{S_c}\left( {{H_i},{H_j}} \right)} \right)。$ | (5) |
利用其余聚类中心
$ S\left( {{H_i},{M_{j'}}} \right) = {S_d}\left( {{H_i},{M_{j'}}} \right) + {S_c}\left( {{H_i},{M_{j'}}} \right) 。$ | (6) |
最小距离
$ \min \left( {S\left( {{H_i},C} \right)} \right) = \min \left( {S\left( {{H_i},{C_{j'}}} \right)} \right)。$ | (7) |
$ {S_{\min }} = \min \left( {S\left( {{M_{i'}},{M_{j'}}} \right)} \right),i' \ne j'。$ | (8) |
存在r条舰船通信网络流量数据对象的
$ {\bar S_{i'}} = Avg\left( {\sum\limits_{h = 1}^{r - 1} {\sum\limits_{j = h + 1}^r {S\left( {{H_h},{H_j}} \right)} } } \right) 。$ | (9) |
选择和具有标志性的有效舰船通信网络流量数据记录类型相似度最大的一类,将其当成标准,展开归类[6-8]。最大相似度距离是
$ {\rho _{i'}} = \frac{{\displaystyle\sum\limits_{i' = 1j' \ne 1}^l {\frac{1}{{S\left( {{H_i},{H_j}} \right)}}} }}{{\displaystyle\sum\limits_{j' = 1}^l {\sum\limits_{i' \ne 1j' = 1}^l {\frac{1}{{S\left( {{H_i},{H_j}} \right)}}} } }}。$ | (10) |
其中:l为数据子集数量;
选择合理M的样本点ρ较高,同时类中心间S较大的聚类,并考虑该类S与ρ对初始聚类中心的影响,在D内随机选择一个数据子集
通过函数
具有标志性的有效舰船通信网络流量数据聚类时,以动态形式更新K值,输出具有标志性的有效舰船通信网络流量数据聚类结果
通过领域粗糙集算法提取通信网络流量数据时间序列特征,避免关键流量数据丢失情况出现,提升舰船通信网络流量智能估计精度。令
$ R = \int {V \cdot \frac{\beta }{{{\sigma ^2}}} \cdot \eta }。$ | (11) |
其中:σ为计算函数;η为常数;β为领域转换函数。
具有标志性的有效舰船通信网络流量数据时间序列特征提取过程如下:
$ D'' = \int {{A_\mu } \cdot \frac{{D'}}{\varepsilon } \cdot R}。$ | (12) |
其中,
利用随机森林算法,剔除多余与无关舰船通信网络流量数据时间序列特征,实现舰船通信网络流量数据时间序列特征降维。令训练数据集是
步骤1 输入G与
步骤2 通过Bagging策略,在G内有放回地任意选择O组训练样本,其容量为N,记作
步骤3 建立回归树,回归树数量为O,与各组样本集一一对应,记作
步骤4 在袋外数据是
$ E\left( {{B_1}} \right) = \frac{{\displaystyle\sum\limits_{i'' = 1}^N {\lambda {{\left[ {{y_{i''}} - z\left( {{{D''}_{i''}},{\theta _1}} \right)} \right]}^2}} }}{2}。$ | (13) |
式中:λ为修正系数;输入
步骤5 第
步骤6 反复操作步骤4与步骤5,求解与
步骤7 第
$ Scor{e_{j''}} = \sum\limits_{\zeta = 1}^O {\frac{{\left| {E\left( {{B_\zeta }} \right) - E'\left( {{B_\zeta }} \right)} \right|}}{O}}。$ | (14) |
其中,第
步骤8 反复操作步骤4~步骤7,求解全部
步骤9 按照Score降序排列全部
利用基于长短期记忆(long short term memory,LSTM)神经网络,智能估计舰船通信网络流量,在LSTM网络内输入1.3小节获取的降维后舰船通信网络流量数据时间序列特征
$ {Q^t} = \phi \left( {{W_{X'}}{D''}_P^t + {W_Q}{Q^{t - 1}} + b} \right)。$ | (15) |
其中,
t时刻,舰船通信网络流量估计结果如下:
$ {Y^t} = {W_Y}{Q^t} + {b_Y}。$ | (16) |
其中,Y的偏置项为
在舰船通信网络流量数据集内,随机选择一个文件内的部分舰船通信网络流量数据,利用本文方法在该部分通信网络流量数据内,提取具有标志性的有效舰船通信网络流量数据,不同信噪比时的有效舰船通信网络流量数据提取结果如图1所示。
可知,本文方法有效在不同信噪比时的舰船通信网络流量数据集内,提取具有标志性的有效舰船通信网络流量数据,剔除无效数据,为后续通信网络流量数据时间序列特征提取缩减数据,减少特征提取计算量。
以突变数据源的流量模式为例,利用本文方法智能估计,智能估计结果如图2所示。可知,本文方法可有效智能估计舰船通信网络流量,估计的通信网络流量与实际流量整体变化趋势大致相同,仅有微小差距,说明本文方法可精准智能估计舰船通信网络流量。
利用决定系数分析本文方法流量智能估计效果,该系数代表估计结果与实际结果间的偏离度,其值越接近1,说明本文方法智能估计效果越佳,分析本文方法在不同链路负载时,3种流量模式下的舰船通信网络流量智能估计效果,如图3所示。可知,随着链路负载的增长,3种流量模式下,本文方法智能估计舰船通信网络流量时的决定系数均呈下降趋势,其中突变数据源流量模式决定系数下降幅度最大;当链路负载达到0.6时,3种流量模式下的决定系数均趋于稳定,最低决定系数在0.92左右,接近1,说明本文方法的智能估计结果与实际结果间的偏离度较小。实验证明,在不同链路负载及流量模式下,本文方法智能估计时的决定系数与1较为接近,即智能估计效果较佳。
舰船通信网络流量估计属于舰船通信网络的主要研究方向之一,为精准发现舰船通信网络流量变化规律,研究大数据驱动和分析的舰船通信网络流量智能估计方法,精准智能估计通信网络流量,及时发现网络流量存在的问题,保证舰船通信网络质量,确保舰船航行安全。
[1] |
赵龙文, 苌道方, 朱宗良, 等. 基于SARIMA-BP模型的港口船舶交通流量预测[J]. 中国航海, 2020, 43(1): 50-55+94. DOI:10.3969/j.issn.1000-4653.2020.01.010 |
[2] |
薛晗, 邵哲平, 潘家财, 等. 基于文化萤火虫算法-广义回归神经网络的船舶交通流量预测[J]. 上海交通大学学报, 2020, 54(4): 421-429. |
[3] |
姚立霜, 刘丹, 裴作飞, 等. 基于EMD聚类的实时网络流量预测模型[J]. 计算机科学, 2020, 47(S2): 316-320. |
[4] |
李校林, 吴腾. 基于PF-LSTM网络的高效网络流量预测方法[J]. 计算机应用研究, 2019, 36(12): 3833-3836. |
[5] |
赵敏. 数据驱动下交互网络群智感知任务分配仿真[J]. 计算机仿真, 2021, 38(1): 476-480. |
[6] |
阳杰, 白晓伟, 颜巍, 等. 基于分层数据搜索的数据驱动算法研究[J]. 固体力学学报, 2021, 42(3): 241-248. |
[7] |
赵雅兰, 续欣莹, 任密蜂. 数据驱动框架下的非高斯批次过程最小熵性能评估算法[J]. 太原理工大学学报, 2019, 50(2): 251-254. |
[8] |
麻文刚, 张亚东, 郭进. 基于LSTM与改进残差网络优化的异常流量检测方法[J]. 通信学报, 2021, 42(5): 23-40. |
[9] |
李佳, 云晓春, 李书豪, 等. 基于混合结构深度神经网络的HTTP恶意流量检测方法[J]. 通信学报, 2019, 40(1): 24-33. |