基于HHT-LSTM的冬奥会临时设施运行趋势预测方法研究

常明煜 田乐 郭茂祖

常明煜, 田乐, 郭茂祖. 基于HHT-LSTM的冬奥会临时设施运行趋势预测方法研究 [J]. 智能系统学报, 2024, 19(1): 228-237. doi: 10.11992/tis.202303003
引用本文: 常明煜, 田乐, 郭茂祖. 基于HHT-LSTM的冬奥会临时设施运行趋势预测方法研究 [J]. 智能系统学报, 2024, 19(1): 228-237. doi: 10.11992/tis.202303003
CHANG Mingyu, TIAN Le, GUO Maozu. Research on the HHT-LSTM-based operation trend prediction method of temporary facilities for the Winter Olympic Games [J]. CAAI Transactions on Intelligent Systems, 2024, 19(1): 228-237. doi: 10.11992/tis.202303003
Citation: CHANG Mingyu, TIAN Le, GUO Maozu. Research on the HHT-LSTM-based operation trend prediction method of temporary facilities for the Winter Olympic Games [J]. CAAI Transactions on Intelligent Systems, 2024, 19(1): 228-237. doi: 10.11992/tis.202303003

基于HHT-LSTM的冬奥会临时设施运行趋势预测方法研究

doi: 10.11992/tis.202303003
基金项目: 科技部科技冬奥重点专项(2021YFF0306303);国家自然科学基金项目(62271036).
详细信息
    作者简介:

    常明煜,硕士研究生,主要研究方向为人工智能、计算机网络和大数据处理。E-mail:changmingyu258@163.com;

    田乐,副教授,博士,主要研究方向为计算机网络、无线通信和大数据处理。主持国家重点研发子项目、北京市教委项目 10 余项,授权发明专利 4 项,获中国发明协会一等奖。发表学术论文 20 余篇,出版专著 1 部。E-mail:tianle@bucea.edu.cn;

    郭茂祖,教授,博士生导师,中国计算机学会生物信息学专委会副主任、中国人工智能学会机器学习专委会常委、中国建筑学会计算性设计学术委员会常委、中国自动化学会智能健康与生物信息专委会委员、国家自然基金委重大研究计划指导专家组成员,主要研究方向为机器学习与人工智能、智能建造与智慧城市、生物信息学与计算生物学。主持国家重点研发项目、国家自然科学基金重点和面上项目等国家、省部级项目 20 余项,获教育部自然科学奖、吴文俊人工智能自然科学奖、省自然科学奖(均排名第 1),北京市优秀教师、宝钢优秀教师奖、校教学名师获得者。发表学术论文300 余篇。E-mail:guomaozu@bucea.edu.cn.

    通讯作者:

    郭茂祖. E-mail:guomaozu@bucea.edu.cn.

  • 中图分类号: TP911.7

Research on the HHT-LSTM-based operation trend prediction method of temporary facilities for the Winter Olympic Games

  • 摘要: 针对冬奥会延庆赛区临时设施的安全性和可使用性,本文充分结合信号处理算法与深度神经网络,提出了一种由希尔伯特黄变换(Hilbert-Huang transform,HHT)对时序数据进行信号分解和信号特征提取,长短期记忆网络(long short-term memory,LSTM)进行临时设施运行趋势预测2部分构成模型。该模型基于受严寒天气和大客流诱发的看台振动等一系列外因影响所测得的真实振动和倾角数据,实现对设施进行有效的预测,以避免发生安全问题,解决了由于受数据中一些无关特征因素的干扰导致预测准确度低的问题。论文提出的方法与循环神经网络(recurrent neural network, RNN)、门控循环网络(gated recurrent neural network,GRU)、双向RNN和双向GRU等运行趋势预测方法进行比较,验证了本文方法的可行性和有效性,实验结果也说明所提出的模型在此类任务中表现非常出色。

     

    Abstract: For the safety and availability of temporary facilities in the Yanqing area of the Winter Olympic Games, by sufficiently combining signal processing algorithm and deep neural network, this paper proposes a brand-new model that consists of two parts: Hilbert-Huang transform (HHT) used for signal decomposition and extraction of signal feature for time-series data, and long short-term memory (LSTM) for prediction of the operation trend of temporary facility. Based on the real vibration and tilt angle data measured while it is affected by a series of exogenous factors such as grandstand vibration induced by severe cold weather and heavy passenger flow, the model realizes effective prediction for facilities, so as to avoid safety problems and solve the problem of low prediction accuracy due to the interference of some irrelevant feature factors in the data. By comparing with such operational trend prediction methods as recurrent neural network (RNN), gated recurrent neural network (GRU), bi-directional RNN and bi-directional GRU, the feasibility and effectiveness of the method was demonstrated. The experimental results also show that the proposed model performs very well in such tasks.

     

  • 临时设施故障预测是学界研究重点之一,通过提前预判相关设施的状态和未来一段时间的变化趋势,有助于提高其安全性。在大型体育赛事中,因临时设施具有安装方便、拆卸容易、能重复使用的特点,因此会有大量修建的临时设施,其中就包括临时看台、转播塔、临时桥架以及为偏远赛场电力运营所建造的输电塔等临时设施结构。由此可见,临时设施在我国建设体育强国中有着愈发重要的地位。

    本文研究主要是基于2022年举办的北京冬奥会。为举办绿色奥运,勤俭办奥,大量易于搭建和重复利用的临时设施被大范围采用,其中就有临时看台以及放置转播设备的转播塔等。临时看台主要承受人群荷载,当人群拥挤、摇摆、跳跃时,容易引发强烈振动,直接影响看台结构的整体强度和刚度,导致该类结构安全事故可能发生,而转播塔也可能由于施工缺陷、各种复杂荷载的作用或者杆件老化等原因,转播塔结构在运行中会存在疲劳裂纹、螺栓松动等损伤。除此之外,转播塔结构比较高耸,而且其最上面的平台会放置转播设备,使得转播塔对风荷载、雪荷载、低温环境等具有很强的敏感性。因此,有必要对看台、转播塔等临时设施结构进行荷载和损伤识别,从而能够为建立冬奥临时设施结构安全智能预警提供关键技术支撑。

    本文提出了以希尔伯特黄变换(Hilbert-Huang transform, HHT)和长短期记忆网络(long short-term memory network, LSTM)为基础的一种全新的组合模型。希尔伯特黄变换由经验模态分解(empirical mode decomposition, EMD)和希尔伯特变换(Hilbert)两部分组成,通过EMD将给定信号分解成若干固有模态函数(intrinsic mode function, IMF),这些函数是满足特定条件的分量;然后再对各个分量进行Hilbert变换得到瞬时频率。相比于传统的时频分析方法,瞬时频率和幅度都可以通过HHT得到,而且该方法所得时频矩阵更精细,同时也不存在频谱泄漏风险。

    HHT具有自适应性和清晰的物理含义,是一种适合处理突变信号的方法,可以有效解决线性和平稳性束缚问题,可以有效提取到信号的时间、频率、能量分布特征。

    LSTM网络也可以有效避免长期依赖性问题。所谓长期依赖的问题指的是随着时空距离的增加,信号之间的相关性常常变得越来越弱,不确定性越来越大。传统的神经网络没有记忆功能,而循环神经网络(recurrent neural network, RNN)能够连续不断地进行信息循环,保证信息存在,RNN可以利用以前的信息对当前任务进行相应的操作,如果这次任务的有用信息与需要进行处理信息的地方之间距离较远,容易导致RNN不能学习到有用的信息,导致推导任务失败,造成梯度消失或梯度爆炸。LSTM可以避免RNN梯度消失解决长依赖问题,因此本文采用LSTM来解决临时设施未来趋势预测问题。该算法为临时设施运行趋势预测提供了一种有效的方法,实现临时设施倾斜、振动等状态信息的监测与智能分析需求,及时捕捉到异常点,最大限度降低安全隐患。

    对于临时设施趋势预测主流方法包括时间序列预测、智能算法和组合模型等。其中,传统的时间序列预测方法虽然对线性数据处理效果良好,但是处理非线性数据时该类算法的效果不佳。智能算法目前主要有机器学习和深度学习2类,其中常见的主要包括随机森林算法[1]、BP神经网络[2]、时频分析[3]与特征融合方法、小波变换[4]、傅里叶变换[5]等。文献[6]利用粒子群算法(particle swarm optimization,PSO)优化的BP神经网络来对办公建筑视觉舒适度进行预测,提供了一种高效准确的办公建筑预测方法。在日常工作中,机械设备会产生特征性的振动、噪声等信息,因此出现了很多以数据驱动和信号处理为基础的方法。文献[7]通过峭度解卷积降噪与经验小波变换的方法,达到了诊断滚动轴承故障的目的。文献[8]采取了时频变换和特征融合策略,达到了诊断内燃机故障的目的。文献[9]深入研究了以自适应经验傅里叶分解为基础的故障识别策略。文献[10]以小波变换为基础,实现了诊断液压缸泄漏故障的目的。利用智能算法虽然能很好地处理非线性问题,但在处理大样本数据时计算速度慢、计算效率低。就原理而言,组合模型通过对各个单一模型的组合,可以充分发挥各自优点,在提高效率的同时提高预测精度。此外,通过组合模型所得到的结果,比单一模型更加稳定可靠,这也是它能够广泛运用于经济、工业等诸多领域的原因所在。文献[11]通过人工神经网络和卡尔曼滤波达到了诊断浮式风力机桨距系统故障的目的。文献[12]充分结合了多点最优最小熵解卷积和增强倒频谱技术,并将其运用到诊断风电机组齿轮箱多故障中。很多预测方法不仅应用于机电设备故障预测和办公建筑领域,而且在电力负荷预测和价格数据预测领域应用也十分广泛。文献[13]利用PSO优化长短期记忆神经网络(LSTM)模型的参数,大大提高了预测精度。文献[14]结合LSTM模型处理长时间序列的优势和支持向量机回归(support vector machine regression, SVR)模型处理非线性问题的优点,并利用果蝇优化算法优化参数建立组合模型,预测了烟用白卡纸价格和短期卷烟销量,并取得显著成果。

    除了设计各种模型,一些学者还结合了时频分析丰富信号原始信息,最终达到增强预测准确性的目的。如Giulia等[15]提出了经验模态分解与人工神经网络(empirical mode decomposition-artificial neural network, EMD-ANN)分解−集成模型,大幅提高了预测准确性;Tayyab 等[16]则构建了离散小波变换−神经网络(discrete wavelet transform-back propagation, DWT-BP)和离散小波变换−径向基神经网络(discrete wavelet transform-radial basis function network, DWT-RBF)组合模型,预测效果也明显提升;刘艳等[17]提出的传统时序建模方法(auto regressive integrated moving average, ARIMA)组合模型也拥有不错的预测效果;赵力学等[18]通过变分模态分解−反向传播神经网络(variational mode decomposition- back propagation, VMD-BP)模型完成了水位流量的非线性拟合,所得效果也很好;詹可等[19]针对海洋环境中非线性、非平稳的实际波高时间序列,提出了一种经验模态分解与长短期记忆网络(empirical mode decomposition-long short-term memory, EMD+LSTM)短期预报模型,相比于传统的时间序列预测模型具有更高的精度;姚洪刚等[20]针对金融序列高噪声以及非线性的特点,提出了一种EMD+LSTM的金融时间序列预测模型,取得了很好的预测效果。

    在设计引入时频分析的模型时,可能会存在以下不足[21]

    1)传统的时频分析方法在积分变换的过程中会产生频谱泄漏,局部细节无法被很好地刻画出来。

    2)对一维信号进行转化时,虽然可以得到丰富的特征,但是特征空间的维度也会增加,这样就需要采用复杂的神经网络去进行特征提取和处理,会导致梯度消失,不收敛等问题。

    因此本文采用了HHT和LSTM构建了一种预测模型。通过HHT将一维信号转换成二维的时频矩阵。HHT与传统的基于积分变换时频分析方法相比,能获得瞬时频率和幅度,时频矩阵更好地展示信号在不同时间和频率上的特征而且不会发生频谱泄漏。所以,HHT可以弥补传统时频分析方法的缺陷,更好地刻画信号的局部细节。

    本文实验所使用的数据源于北京冬奥会延庆赛区高山滑雪中心临时看台支撑架上的加速度传感器,所测得的数据信号有不同的振幅、形态和频率存在。此数据的信号属于一类非线性非稳态的信号时间序列。如果采用传统的时频分析方法,无法有效地提本文到此类非平稳信号的特征。HHT结合了EMD和希尔伯特变换,可以计算瞬时频率和幅度,对于此类信号处理属于最佳的选择。因此,HHT的作用是将时域的信号进行转换进而得到包含时域和频域对应关系的时频图。首先采用EMD将振动信号进行分解,得到若干个内涵模态分量(IMF),然后通过希尔伯特变换计算出每个IMF的瞬时频率和幅值。最后采用LSTM来处理精细的时频特征信息完成最终的预测。

    HHT+LSTM的预测模型整体框架如图1所示。在HHT+LSTM的预测模型中,可以通过EMD把原始信号分解为诸多子序列,将分解后的IMF进行希尔伯特变换,该方法所得时频分布的信号能量更加完整、精确,同时,还可以继续得到信号的Hilbert边际谱,从而达到精确反映信号幅值随频率变化规律的目的。通过信号处理方法得到的时频特征,将其作为输入送到LSTM网络进行训练和预测。下面将展开介绍希尔伯特黄变换和长短期记忆网络。

    图  1  HHT+LSTM的预测模型整体框架
    Fig.  1  Overall framework of HHT+LSTM prediction model
    下载: 全尺寸图片

    对于希尔伯特黄变换[22]而言,经验模态分解和希尔伯特变换是其最重要的部分,这个信号处理方法利用了信号的局部信息,从而获得信号某一时刻的瞬时状态。信号处理的本质都是将接收的高频实信号,结合已知的载频信息,还原出基带的复信号。在自然界中实际观测到的都是实信号,复信号是观测不到的。而在对信号处理方面,复信号相比于实信号处理起来非常容易。所以在趋势预测的任务上,本文首先采用对采集到的信号数据进行处理,将其与深度神经网络进行结合来实现更加准确的预测。

    2.2.1   经验模态分解

    将原始信号${x{(t)}}$通过EMD分解,得到若干个IMF分量,所有IMF分量都需满足下述条件:1)极值点与零点数量之差应小于等于1;2)局部最大值与最小值的包络线间均值必须是0。具体EMD计算过程如下:

    1)用一条连续的光滑曲线将时间序列信号${x{(t)}}$中全部极大值点进行串联,形成上包络线$\mathop x\nolimits_{\max} (t) $,同上所述确定下包络线$\mathop x\nolimits_{\min} (t)$。定义2条包络线的平均线$ {m_1}(t) $

    $$ {m_1}(t) = \frac{{{x_{\max} (t)} + {x_{\min} (t)}}}{2} $$ (1)

    利用原始序列${x{(t)}}$$ {m_1}(t) $之差得到第1个分量${h_1}(t)$

    $$ {h_1}(t) = x(t) - {m_1}(t) $$ (2)

    2)对于不同的信号,${h_1}(t)$可能是一个IMF分量,一般来说它并不满足IMF所需要的条件,此时将${h_1}(t)$当作原信号,重复上述步骤,则有:

    $$ {h_{1k}}(t) = h_{1{(k - 1)}}(t) - {m_{1(k - 1)}}(t) $$ (3)

    3)判断是否满足IMF分量的条件,如果不满足返回到极值计算,重新对信号进行极值和包络运算;如果满足条件,则得到IMF分量和差值。

    4)判断一个差值信号是否为IMF分量,需要有一个筛选过程终止的原则,通过利用2个连续的处理结果之间的标准差SD作为判断依据:

    $$ S_{{D}} = \sum\limits_{t = 0}^T {\left| {\frac{{{{\left| {{h_{1(k - 1)}}(t) - {h_{1k}}(t)} \right|}^2}}}{{h_{1{(k - 1)}}{O^2}}}} \right|} $$ (4)

    5)当${h_{1k}}(t)$满足SD的值要求时,称${h_{1k}}(t)$为第1阶IMF,记为$ {c_1}(t) $

    $$ {c_1}(t) = {h_{1k}}(t) $$ (5)

    6)从原信号${x{(t)}}$中减去${c_1}(t)$得到剩余信号,即残差$ {r}_{1}(t)$

    $$ {r}_{1}(t)=x(t)-{c}_{1}(t) $$ (6)

    然后将$ {r}_{1}(t)$看作一组新的“原信号”,重复上述经验模态过程,通过多次运算得到全部的IMF和残差${r_i}(t)$

    $$ {r_i}(t) = {r_{i - 1}}(t) - {c_i}(t) $$ (7)

    式中:i=1, 2, ···, n,当${r_i}(t)$满足判断条件之一时,经验模态分解过程终止,则原始的时间序列为

    $$ {x{(t)}} = \displaystyle\sum\limits_{i = 1}^{n - 1} {{c_i}(t) + {r_i}(t)} $$ (8)
    2.2.2   希尔伯特变换

    EMD分解后,对每一个IMF(${c_i}(t)$)分量进行希尔伯特变换,从而得到瞬时频率和幅度[23]

    $$ {d_i}(t) = \frac{1}{\text{π} }P\int_{ - \infty }^{ + \infty } {\frac{{{c_i}(t)}}{{t - \tau }}} {\rm{d}}\tau $$ (9)

    式中:P为柯西主值,t$ \mathrm{\tau } $为时间。

    从式(9)中再得到相应IMF瞬时频率和幅值:

    $$ {\omega _i}(t) = \frac{{{\rm{d}}{\theta _i}(t)}}{{{\rm{d}}t}} $$ (10)
    $$ a_i(t) = \sqrt {{c_i^2}{{(t)}} + {d_i^2}{{(t)}}} $$ (11)

    式中:${\omega _i}(t)$${a_i}(t)$分别为第i个IMF的瞬时频率和幅度。通过对所得全部数据的归纳,就能够得到所需的二维时频图。

    本文利用LSTM[24]来处理得到的二维时频图。LSTM可以避免长期依赖问题,能很好地解决时间间隔较长和延迟时间等问题,图2为具体结构。在操作过程中,首先把不同序列输入到LSTM,然后就可以利用门控单元读取、调整隐含状态向量和记忆状态向量,最终达到对各序列进行预测的目的。LSTM是一种特殊网络结构,依靠3个“门”结构可以令信息选择性对循环神经网络中每个时刻的状态产生影响。相关计算如下:遗忘门是将上一层信息与输入数据信息的加权之和,激活函数是Sigmoid,输出0~1的值,直接控制了信息传递的比例。

    图  2  LSTM神经元结构示意
    Fig.  2  Schematic structure of LSTM neurons
    下载: 全尺寸图片
    $$ {F_t} = \sigma ({{\boldsymbol{W}}_f} \cdot [{H_{t - 1}},{X_t}] + {b_f})$$ (12)

    输入门也有一个激活函数Sigmoid,决定了哪些信息会被传递:

    $$ {I_t} = \sigma ({{\boldsymbol{W}}_i} \cdot [{H_{t - 1}},{X_t}] + {b_i} $$ (13)

    tanh激活层用于创建隐藏层的候选值:

    $$ \tilde C = \tanh ({{\boldsymbol{W}}_c} \cdot [{H_{t - 1}},{X_t}] + {b_c}) $$ (14)

    最后记忆层:获取隐藏层,是基于上一个隐藏层与现隐藏层的候选值,这2个值通过与遗忘门和输入门相乘,决定通过多少信息:

    $$ {C_t} = {F_t}^*{C_{t - 1}} + {I_t}^* \tilde C_t $$ (15)

    输出门也有一个激活函数Sigmoid,决定输出哪些信息:

    $$ {O_t} = \sigma ({{\boldsymbol{W}}_o} \cdot [{H_{t - 1}},{X_t}] + {b_o}) $$ (16)

    最后隐藏层:先经过一个激活函数,让值控制在[−1,1],防止梯度爆炸,然后再与输出层相乘决定输出哪部分信息,即最后仅仅输出我们确定输出的那部分:

    $$ {H_t} = {O_t}^*\tanh ({C_t})$$ (17)

    式中:σ为Sigmoid函数,${F_t}$t 时刻遗忘门,${x_t}$t时刻的输入,W为权重矩阵,$ {{I}}_{{t}} $t时刻输入门,${H_{t - 1}}$t−1时刻隐含层状态,${\tilde C} _{t - 1}$为记忆更新向量,b为偏置向量,tanh为双曲余弦函数,${C_t}$t 时刻的记忆单元状态变量,${O_t}$t时刻的输出门,${H_t}$t时刻隐含层状态。

    本实验所使用的数据源于北京冬奥会延庆赛区高山滑雪中心临时看台支撑架上的加速度传感器,在比赛现场,该传感器的主要作用是检测观众对看台的施力状态,所得数据是真实多元时间序列数据集,从占比来看,训练集占比最大,为60%,测试集、验证集则均为20%。

    本数据集涵盖了4个不同位置加速度传感器在X轴、Y轴、Z轴方向的三维传感器数据。采用的数据集长度为53 217,传感器采样频率为500 Hz。相关设备每间隔10 min 采集10 s数据,并将所得数据上传到云端。

    为合理评价模型性能,本文采用均方根误差(root mean square error, RMSE)、平均绝对误差(mean absolute error, MAE)和平均绝对百分比误差(mean absolute percentage error, MAPE)3个评价指标。其中RMSE描述的是预测值和真实值之差的平方的均值开方,代表了预测的离散程度,能够很好地反映出实验数据具有更好的精度,使误差的结果和数据是一个单位级别,可以更好地描述数据。MAE描述的是预测值和真实值之差的绝对值求平均,其值越小越好。MAPE用预测值与实际值之间的差去与实际值相比,看其中占比有多大,对预测的准确度表示更加直观。上述性能指标定义为

    $$ {M_{{\rm{AE}}}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{P_{{\rm{Mi}}}} - {P_{{\rm{Pi}}}}} \right|} $$ (18)
    $$ {M_{{\rm{APE}}}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {\frac{{{P_{{\rm{Mi}}}} - {P_{{\rm{Pi}}}}}}{{{P_{\rm{Mi}}}}}} \right|} $$ (19)
    $$ {R_{{\rm{MSE}}}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{({P_{{\rm{Mi}}}} - {P_{{\rm{Pi}}}})}^2}} } $$ (20)

    式中:n为测试样本,${P_{{\rm{Mi}}}}$i时刻的实际数据,$P_{{\rm{Pi}}}$i时刻网络的输出数据预测值。

    本文实验数据集的划分为训练集、测试集和验集比例为3∶1∶1。训练模型使用的是Adam优化器,基本参数设置分别为学习率为0.000 8,一阶矩估计的指数衰减率参数为0.9,二阶矩估计的指数衰减率参数为0.999,权重衰减参数为1×105,训练轮次为60,批处理训练参数为512,将训练集输入到模型中进行训练。本实验均在Ubuntu系统上进行,GPU为Tesla V100,内存为128 GB。编程语言使用的是Python3.6,神经网络的构建框架为Pytorch;数据的读取和计算使用的是numpy和pandas库;希尔伯特黄变换使用的是pyhht库。

    本文实验数据采用的是冬奥会现场测得的私有数据集,本文选择24个历史数据来预测下一个时刻点的3个维度上的值。

    通过HHT算法处理相关数据,再对所得数据进行经验模态分解,可以获得一个残余分量r和12个固有模态函数IMF1~IMF12,IMF0定义为原始信号。分量IMF1不规则主要是因为数据序列存在非线性和非平稳性的情况。分解所得IMF1频率和振幅都最大,且原始序列主要信息也被包含在其中,分量IMF2~IMF12的频率和振幅都逐渐下降,只能展现原始序列局部特征,结果如图3所示。

    图  3  经验模态分解
    Fig.  3  Empirical mode decomposition
    下载: 全尺寸图片

    然后用HHT算法对每一个IMF分量进行希尔伯特变换,得到各分量的时频图,每个IMF分量均与相应频谱图对应,具体见图4

    图  4  各IMF分量平均频率
    Fig.  4  Average frequency of each IMF component
    下载: 全尺寸图片

    表1~3列出了各分量平均瞬时频率。从表1~3中可得,EMD分解所得IMF分量的频率表现出逐步下降趋势,而且进一步观察还可以发现各分量平均频率近似2倍关系依次降低。这样就可以将原信号分解出高频、中频和低频3种不同的信号。这也充分展示了希尔伯特的一个重要作用——频分复用。简单来说就是各个原信号在时域上共用,但在频域上相互独立的一个方式。这个方法能将各个原信号调制至不同的频率段,使得它们互不干扰,并且通过之前类似的方法总能将调制信号中的各个原信号解调出来。EMD分解出来的信号处于高频、中频和低频3种不同频率,希尔伯特变换也能很好地处理不同频率段的信号并且不会互相影响,避免了对后续预测的结果精度产生影响和偏差。

    表  1  高频分量频率
    Table  1  High frequency component frequency
    高频分量IMF0IMF1IMF2IMF3
    频率/Hz123.25165.3088.4648.12
    表  2  中频分量频率
    Table  2  Intermediate frequency component frequency
    中频分量IMF4IMF5IMF6IMF7
    频率/Hz25.1917.2516.1212.87
    表  3  低频分量频率
    Table  3  Low frequency component frequency
    低频分量IMF8IMF9IMF10IMF11IMF12
    频率/Hz4.993.310.621.944.06

    在得到高频、中频和低频3种分量后,将其输入到LSTM网络中进行预测,得到了XYZ轴3个维度的预测值,该组合模型预测结果如图5所示。

    图  5  组合模型在X, Y, Z轴上的预测结果
    Fig.  5  Prediction results of the combined model on the X, Y, and Z axes
    下载: 全尺寸图片

    采用所建立的组合模型以2021年11月19日20时26分前25个采样点来预测精度,如图5所示,组合模型在XYZ轴3个维度上的预测精度较高,效果很好,这一结果说明此模型预测精度较高。

    同时本文也将循环神经网络(recurrent neural network, RNN)、长短期记忆网络(long short-term memory, LSTM)、门控循环网络(gated recurrent neural network, GRU)、双向循环神经网络(bi-directional recurrent neural networks, BiRNN)、双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)、双向门控循环网络(bi-directional gated recurrent units, BiGRU)等传统预测模型作为竞争模型进行了比较,同时为了验证HHT法的贡献,考虑了部分竞争模型在HHT作用下的预测性能,得到预测误差结果如表4所示。

    表  4  预测模型结果对比
    Table  4  Comparison of prediction model results
    方法均方根
    误差
    平均绝对
    误差
    平均绝对
    百分比误差/%
    RNN0.00500.003277.80
    GRU0.00510.003850.60
    BiRNN0.01140.0105234.30
    BiLSTM0.00860.0074176.10
    BiGRU0.00450.002547.30
    HHT+RNN0.00530.004012.59
    HHT+BiRNN0.00640.00453.70
    LSTM0.00370.001826.60
    HHT+BiLSTM0.00970.00752.60
    Informer[25]0.18430.247727.20
    HHT+LSTM0.00150.00114.40

    相比较于RNN、GRU、双向RNN、双向GRU和LSTM等竞争模型,HHT+LSTM的RMSE分别下降了0.003 5、0.003 6、0.009 9、0.003、0.002 2;MAE下降了0.002 1、0.002 7、0.009 4、0.006 3、0.000 7;MAPE下降了73.4%、46.2%、229.9%、42.9%、22.2%。本文模型还与Informer进行了实验对比,但是从指标结果来看,Informer虽然是目前很流行的时间序列预测模型,但是对于本实验中真实数据集预测并没有达到很好的效果,反而本文提出的模型在各项指标中表现得十分出色,达到了很高的预测精度。证明了该组合模型较其他预测模型在临时设施运行趋势预测任务中更加具有可行性和有效性。

    本文还将RNN、双向RNN和双向LSTM与HHT算法进行了结合,与本文提出的组合模型进行比较,综合表4结果来分析,证明了HHT与LSTM结合更加适用于此类任务,在预测精度结果方面具有更高的精度,效果更好。相比而言,本文提出的方法更有效地利用特征,并且根据表4中结果分析,HHT+LSTM性能优于其他传统预测模型,本文方法的综合性能也是最优的。算法中加入了时频分析的方法,使原始信号的信息更加丰富,预测算法的性能得到了很大改善。与传统的时频分析方法不同,HHT可以获得瞬时频率和幅度且不会产生频谱泄露,可以很好地刻画局部细节。通过将一维信号进行时频转换得到更加精细的二维的时频矩阵,丰富其特征。基于此引入LSTM有效地传递和表达长时间序列中的信息,并且可以解决梯度消失或梯度爆炸问题。将两者算法的优势结合,通过对比实验可以直观发现,本文提出的模型在临时设施预测方面具有一定的可行性和有效性,并比传统的预测模型表现得更加出色。不过,尽管该方法可以通过HHT时频图提供精细的信号信息,但相关模型训练所需算力也更大。

    本文进行消融实验以验证加入希尔伯特黄变换的有效性,实验结果如表5。本文在LSTM中先加入EMD模块时,实验效果反而降低。在加入了希尔伯特变换后,预测精度得到很大提升,评价指标也进一步的提升,证明了希尔伯特黄算法提升了模型的性能,提高了预测精度。

    表  5  消融实验
    Table  5  Ablation experiment
    方法均方根
    误差
    平均绝对
    误差
    平均绝对
    百分比误差/%
    LSTM0.00370.001826.60
    EMD+LSTM0.00187.8433446.29
    EMD+Hilbert+LSTM0.00150.00114.40

    本文针对冬奥会临时设施运行趋势预测问题,提出了一种结合HHT和LSTM的方法,使用HHT来进行信号分解和提取时频域特征, 应用LSTM神经网络进行最终预测。本文通过运用HHT,将一维信号转换为二维时频图,可以更加深入地挖掘信号的时间和频率信息。通过利用LSTM可以有效解决长期依赖问题的优势来进行临时设施运行趋势预测。利用冬奥会现场真实数据集的验证,通过与多种传统预测算法进行比较,证明了本文方法具有一定的有效性和可行性。但相比而言,本文方法需要相对较大的算力,在未来的研究中会继续对其整体结构进行优化,提高其时频域分析方法的性能,并将其应用于其他领域。

  • 图  1   HHT+LSTM的预测模型整体框架

    Fig.  1   Overall framework of HHT+LSTM prediction model

    下载: 全尺寸图片

    图  2   LSTM神经元结构示意

    Fig.  2   Schematic structure of LSTM neurons

    下载: 全尺寸图片

    图  3   经验模态分解

    Fig.  3   Empirical mode decomposition

    下载: 全尺寸图片

    图  4   各IMF分量平均频率

    Fig.  4   Average frequency of each IMF component

    下载: 全尺寸图片

    图  5   组合模型在X, Y, Z轴上的预测结果

    Fig.  5   Prediction results of the combined model on the X, Y, and Z axes

    下载: 全尺寸图片

    表  1   高频分量频率

    Table  1   High frequency component frequency

    高频分量IMF0IMF1IMF2IMF3
    频率/Hz123.25165.3088.4648.12

    表  2   中频分量频率

    Table  2   Intermediate frequency component frequency

    中频分量IMF4IMF5IMF6IMF7
    频率/Hz25.1917.2516.1212.87

    表  3   低频分量频率

    Table  3   Low frequency component frequency

    低频分量IMF8IMF9IMF10IMF11IMF12
    频率/Hz4.993.310.621.944.06

    表  4   预测模型结果对比

    Table  4   Comparison of prediction model results

    方法均方根
    误差
    平均绝对
    误差
    平均绝对
    百分比误差/%
    RNN0.00500.003277.80
    GRU0.00510.003850.60
    BiRNN0.01140.0105234.30
    BiLSTM0.00860.0074176.10
    BiGRU0.00450.002547.30
    HHT+RNN0.00530.004012.59
    HHT+BiRNN0.00640.00453.70
    LSTM0.00370.001826.60
    HHT+BiLSTM0.00970.00752.60
    Informer[25]0.18430.247727.20
    HHT+LSTM0.00150.00114.40

    表  5   消融实验

    Table  5   Ablation experiment

    方法均方根
    误差
    平均绝对
    误差
    平均绝对
    百分比误差/%
    LSTM0.00370.001826.60
    EMD+LSTM0.00187.8433446.29
    EMD+Hilbert+LSTM0.00150.00114.40
  • [1] 李焱, 贾雅君, 李磊, 等. 基于随机森林算法的短期电力负荷预测[J]. 电力系统保护与控制, 2020, 48(21): 117–124.

    LI Yan, JIA Yajun, LI Lei, et al. Short term power load forecasting based on a stochastic forest algorithm[J]. Power system protection and control, 2020, 48(21): 117–124.
    [2] 王帅哲, 王金梅, 王永奇, 等. 基于改进遗传算法的BP神经网络短期电力负荷预测[J]. 国外电子测量技术, 2019, 38(1): 15–18.

    WANG Shuaizhe, WANG Jinmei, WANG Yongqi, et al. BP neural network short-term power load forecasting based on improved genetic algorithm[J]. Foreign electronic measurement technology, 2019, 38(1): 15–18.
    [3] DONG Haoran, YU Gang, LIN Tianran, et al. An energy-concentrated wavelet transform for time-frequency analysis of transient signal[J]. Signal processing, 2023, 206: 108934. doi: 10.1016/j.sigpro.2023.108934
    [4] LEE H Y, BEH W L, LEM K H. Forecasting with information extracted from the residuals of ARIMA in financial time series using continuous wavelet transform[J]. International journal of business intelligence and data mining, 2023, 22(1/2): 70. doi: 10.1504/IJBIDM.2023.127313
    [5] AMIRI M, AGHAEINIA H, AMINDAVAR H R. Automatic epileptic seizure detection in EEG signals using sparse common spatial pattern and adaptive short-time Fourier transform-based synchrosqueezing transform[J]. Biomedical signal processing and control, 2023, 79: 104022. doi: 10.1016/j.bspc.2022.104022
    [6] 孙澄, 曲大刚. 基于神经网络的自然采光办公空间视觉舒适度预测方法研究[C]//数智赋能: 2022全国建筑院系建筑数字技术教学与研究学术研讨会论文集. 厦门, 2022: 357−362.

    SUN Cheng, QU Dagang. Research on prediction method of visual comfort in office spaces with natural daylighting based on neural networks [C]// Empowering with Data Intelligence: Proceedings of the National Academic Seminar on Architectural Digital Technology Teaching and Research in Architecture Colleges and Universities 2022. Xiamen, 2022: 357−362.
    [7] 李政, 张炜, 明安波, 等. 基于IEWT和MCKD的滚动轴承故障诊断方法[J]. 机械工程学报, 2019, 55(23): 136–146. doi: 10.3901/JME.2019.23.136

    LI Zheng, ZHANG Wei, MING Anbo, et al. A novel fault diagnosis method based on improved empirical wavelet transform and maximum correlated kurtosis deconvolution for rolling element bearing[J]. Journal of mechanical engineering, 2019, 55(23): 136–146. doi: 10.3901/JME.2019.23.136
    [8] 蔡艳平, 范宇, 陈万, 等. 改进时频分析和特征融合在内燃机故障诊断中的应用[J]. 中国机械工程, 2020, 31(16): 1901–1911.

    CAI Yanping, FAN Yu, CHEN Wan, et al. Applications of improved time-frequency analysis and feature fusion in fault diagnosis of IC engines[J]. China mechanical engineering, 2020, 31(16): 1901–1911.
    [9] 郑近德, 潘海洋, 程军圣, 等. 基于自适应经验傅里叶分解的机械故障诊断方法[J]. 机械工程学报, 2020, 56(9): 125−136.

    ZHENG Jinde, PAN Haiyang, CHENG Junsheng, et al. Adaptive empirical Fourier decomposition based mechanical fault diagnosis method[J]. Journal of mechanical engineering, 2020, 56(9): 125−136.
    [10] YAZDANPANAH GOHARRIZI A, SEPEHRI N. A wavelet-based approach to internal seal damage diagnosis in hydraulic actuators[J]. IEEE transactions on industrial electronics, 2010, 57(5): 1755–1763.
    [11] CHO S, CHOI M, GAO Zhen, et al. Fault detection and diagnosis of a blade pitch system in a floating wind turbine based on Kalman filters and artificial neural networks[J]. Renewable energy, 2021, 169: 1–13.
    [12] 胡爱军, 严家祥, 白泽瑞. 基于MOMEDA和增强倒频谱的风电机组齿轮箱多故障诊断方法[J]. 振动与冲击, 2021, 40(7): 268–273.

    HU Aijun, YAN Jiaxiang, BAI Zerui. Multi-fault diagnosis method for wind turbine gearbox based on MOMEDA and enhanced cepstrum[J]. Journal of vibration and shock, 2021, 40(7): 268–273.
    [13] 魏腾飞, 潘庭龙. 基于改进PSO优化LSTM网络的短期电力负荷预测[J]. 系统仿真学报, 2021, 33(8): 1866–1874.

    WEI Tengfei, PAN Tinglong. Short-term power load forecasting based on LSTM neural network optimized by improved PSO[J]. Journal of system simulation, 2021, 33(8): 1866–1874.
    [14] 余晓晓. 基于改进LSTM-SVR的预测模型及其在烟草行业的应用研究[D]. 武汉: 华中科技大学, 2020.

    YU Xiaoxiao. An improved forecasting model using long short-term memory and support vector regression and its applications in the tobacco industry[D]. Wuhan: Huazhong University of Science and Technology, 2020.
    [15] NAPOLITANO G, SERINALDI F, SEE Linda. Impact of EMD decomposition and random initialisation of weights in ANN hindcasting of daily stream flow series: an empirical examination[J]. Journal of hydrology, 2011, 406(3/4): 199–214.
    [16] TAYYAB M, ZHOU J, DONG Jianzhong, et al. Rainfall-runoff modeling at Jinsha River basin by integrated neural network with discrete wavelet transform[J]. Meteorology and atmospheric physics, 2017: 1–11.
    [17] 刘艳, 杨耘, 聂磊, 等. 玛纳斯河出山口径流EEMD-ARIMA预测[J]. 水土保持研究, 2017, 24(6): 273–280, 285.

    LIU Yan, YANGYUN, NIE Lei, et al. The EEMD-ARIMA prediction of runoff at mountain pass of manas river[J]. Research of soil and water conservation, 2017, 24(6): 273–280, 285.
    [18] 赵力学, 黄解军, 程学军, 等. 基于VMD-BP模型的河流流量预测方法[J]. 长江科学院院报, 2020, 37(7): 47–52.

    ZHAO Lixue, HUANG Jiejun, CHENG Xuejun, et al. A method of river flow prediction based on VMD-BP model[J]. Journal of Yangtze River scientific research institute, 2020, 37(7): 47–52.
    [19] 詹可, 朱仁传. 基于EMD-LSTM的波高时间序列预测模型[C]//中国力学学会, 《水动力学研究与进展》编委会, 中国造船工程学会, 中国船舶科学研究中心. 第十六届全国水动力学学术会议暨第三十二届全国水动力学研讨会论文集(上册). 北京: 海洋出版社, 2021: 871−878.

    ZHAN Ke, ZHU Renchuan. Wave height time series prediction model based on EMD-LSTM [C]// Chinese Society of Theoretical and Applied Mechanics, Journal of Research and Progress in Hydrodynamics Hydrodynamics Editorial Board, Chinese Society of Naval Architecture and Marine Engineering, China Ship Science Research Center. Proceedings of the 16th National Hydrodynamics Academic Conference and the 32nd National Hydrodynamics Seminar (Volume 1). Beijing: China Ocean Press, 2021:871−878.
    [20] 姚洪刚, 沐年国. EMD-LSTM模型对金融时间序列的预测[J]. 计算机工程与应用, 2021, 57(5): 239–244.

    YAO Honggang, MU Nianguo. Prediction of financial time series by EMD-LSTM model[J]. Computer engineering and applications, 2021, 57(5): 239–244.
    [21] 邹红星, 周小波, 李衍达. 时频分析: 回溯与前瞻[J]. 电子学报, 2000, 28(9): 78–84.

    ZOU Hongxing, ZHOU Xiaobo, LI Yanda. Which time-frequency analysis—a survey[J]. Acta electronica sinica, 2000, 28(9): 78–84.
    [22] LIU Xinyu. Fault detection model based on FFT-HHT analysis method[C]//2022 7th International Conference on Intelligent Computing and Signal Processing. Piscataway: IEEE, 2022: 972−975.
    [23] OLGA P, ALEXEY P, NATALIA S. Hilbert envelope extraction from real discrete finite signals considering the nonlocality of Hilbert transform[C]//2020 22th International Conference on Digital Signal Processing and its Applications (DSPA). Piscataway: IEEE, 2020: 1−4.
    [24] ZHANG Tianjun, SONG Shuang, LI Shugang, et al. Research on gas concentration prediction models based on LSTM multidimensional time series[J]. Energies, 2019, 12(1): 161. doi: 10.3390/en12010161
    [25] ZHOU Haoyi, ZHANG Shanghang, PENG Jieqi, et al. Informer: beyond efficient transformer for long sequence time-series forecasting[J]. Proceedings of the AAAI conference on artificial intelligence, 2021, 35(12): 11106–11115. doi: 10.1609/aaai.v35i12.17325
WeChat 点击查看大图
图(5)  /  表(5)
出版历程
  • 收稿日期:  2023-03-06
  • 网络出版日期:  2023-07-31

目录

    /

    返回文章
    返回