舰船科学技术  2025, Vol. 47 Issue (8): 161-165    DOI: 10.3404/j.issn.1672-7649.2025.08.027   PDF    
极地船舶结构监测数据异常诊断与处理研究
孙慧1, 王燕舞2, 张帅1, 张敏1, 王嘉其1     
1. 上海中船船舶设计技术国家工程研究中心有限公司,上海 201114;
2. 中国船舶及海洋工程设计研究院,上海 200011
摘要: 针对极地船舶结构健康监测系统中包含一些异常监测数据的情况,提出异常数据诊断与处理的方法。首先,根据“雪龙2”极地破冰船的实测数据,对异常数据类型进行归纳;然后,针对不同类型的异常数据,选用合适的方法进行诊断,进而对异常点进行处理;最后,根据诊断与处理后的数据反演冰载荷,对本文提出的诊断处理方法进行验证。分析结果表明,DBSCAN方法可较好地识别离群值,基于平均标准差的数据标准化处理方法可较好地处理幅度异常的情况。研究结果可为船舶结构健康监测系统的数据治理提供参考。
关键词: 结构健康监测     异常数据诊断     极地船舶     冰载荷    
Research on abnormal diagnosis and processing of structure monitoring data for polar ships
SUN Hui1, WANG Yanwu2, ZHANG Shuai1, ZHANG Min1, WANG Jiaqi1     
1. Shanghai Zhongchuan Nerc-Std Co., Ltd., Shanghai 201114, China;
2. Marine Design and Research Institute of China, Shanghai 200011, China
Abstract: A method for diagnosing and processing abnormal data of the polar ship structural health monitoring system was proposed. Firstly, based on the measured data of “Xuelong 2” polar icebreaker, the types of abnormal data was summarized. Then, appropriate methods were selected to diagnose different types of abnormal data, and the abnormal points were processed accordingly. Finally, the diagnostic processing method proposed in this paper was validated by inverting the ice load based on the diagnosed and processed data. The results indicate that the DBSCAN method can effectively identify outliers, and the data normalization method based on mean standard deviation can effectively handle cases of amplitude anomalies. The research can provide reference for the data governance of ship structural health monitoring systems.
Key words: structural health monitoring     abnormal data diagnosis     polar ships     ice load    
0 引 言

海冰是影响极地船舶作业安全的重要因素,极地船舶和冰之间的碰撞可能会导致结构的严重破坏。通过在极地船舶上安装结构健康监测系统,可以使船员及时了解船体健康状态,判断结构隐患,提升船体本身及人员货物安全。长期积累的实船冰区走航数据,可以为极地船舶的维修保养计划制定提供参考依据,为后续极地破冰船的设计、冰区船舶规范制定与修改、极地冰力学的发展等提供重要价值。

极地船舶结构监测设施在运行过程中,每天都会产生海量的结构应变、加速度数据。由于复杂冰况、船上设备振动、温度变化、信号传输干扰、监测设施自身的运行故障和老化等原因,数据集不可避免地出现异常数据,干扰结构的安全评估并引起误判。

针对实船结构安全监测数据异常诊断的研究相对较少。孙梦丹等[1]利用Z-score异常检测方法识别船舶结构应力数据中的异常信号跳变现象;周学谦等[2]利用BP神经网络对结构应变传感器的误差进行补偿。针对高楼、桥梁、风机等结构安全监测数据异常诊断的研究较多,高珂等[3]基于335 m超高层建筑结构监测数据对6种异常数据进行了识别;Bao等[4~5]采用原始数据图像化处理并结合深度学习方法检测了我国一座大跨度桥梁监测系统中的7种异常数据;吴永斌等[6]对风机异常数据的识别与清洗研究进行综述。

本文利用“雪龙2”极地破冰船冰载荷反演区域的结构监测数据[7],分析常见的数据异常类型,提出各类异常数据的诊断和处理方法,利用实测数据对诊断处理方法进行了验证,为船体结构监测数据的治理提供了较好的思路和方法。

1 异常数据分类 1.1 实船冰激应变测量情况

为了反推计算“雪龙2”在冰区航行时遭遇的外部冰载荷情况,“雪龙2”右舷首肩部的10号压载舱内布置了88个光纤应变测点,布置方式为8×11矩阵式,共包含85个单向应变测点(每个测点含1个光纤应变计)与3个直角应变花测点(每个测点含3个光纤应变计与1个光纤温度计),如图1所示[7]。传感器通过点焊方式安装在肋骨腹板,测量距外板内壁200 mm处、垂直于外板的应变。

图 1 冰载荷反演测点分布示意图 Fig. 1 Schematic diagram of the measurement points distribution for ice load inversion
1.2 异常数据分类

根据“雪龙2”各个极地航次积累的冰激应变测量数据,对主要的异常数据类型进行归纳。图2所示为应变时域信号中的正常数据样本以及6种常见的异常数据样本,包括数据0值、短时数据突变重复、数据缺失、数据漂移、幅度异常和离群值。

图 2 实船应变测量数据样本 Fig. 2 Strain data samples in field monitoring

数据0值是指样本数据零星出现一些为0的数,原因主要是数据解析错误。

短时数据突变重复是指样本数据突然远离正常范围且保持一段时间不变,之后又回归正常,一般是由于信号传输阻塞干扰、数据解析错误等原因导致。

数据缺失是指样本数据的一部分或全部由于信号中断、丢包或设备故障等原因未能被采集,造成数据空白。

数据漂移表现为在正常信号中包含了低频变化,数据漂移可能是线性漂移,也可能是非线性漂移。漂移主要受温度变化、传感器老化、传感器误差累积、传感器焊点虚焊、被测结构残余应力释放等影响。

幅度异常是指样本中的数据在一个较大的范围内波动,原因可能是传感器松动、敏感元件老化、传感器故障等。

离群值是指样本中存在一个或多个远离正常范围的数据点。产生孤点类型的离群值,原因一般为信号受到瞬时干扰或数据解析错误;产生数据簇类型的离群点,一般为结构受到突然的外部载荷作用。

需要说明的是,并不是所有的异常值是错误的。图2(h)所示的离群数据簇是由于船体撞冰导致,正是监测系统关注的数据类型。

每一类异常数据都存在一种或多种特征,通过统计学和机器学习的方法识别这些特征,可以区分和处理不同类型的异常数据。

2 异常数据诊断与处理 2.1 数据初步筛查

数据0值可以设置为缺失值。对于短时数据重复,可以对时间序列进行向前或向后差分,差分结果为0则认为采样数据出现短时重复,重复值均设置为缺失值[8]

一般情况下,数据漂移是缓慢的状态。样本数据的时间跨度较短时,数据漂移可以视为线性变化,可以通过移动平均法去除趋势项。

对于离群值和幅度异常的情况,以上方法筛查能力有限,可通过统计分析和机器学习等方法查找。

2.2 离群值检测

离群值检测方法主要有2类:基于统计分析的离群值检测和基于机器学习的离群值检测。常用的统计分析方法有3$ \mathrm{\sigma } $准则、四分位法、统计量法。常用的机器学习异常值检测方法有K-Means聚类、基于密度的空间数据聚类(DBSCAN)、局部异常因子(LOF)和孤立森林等。

3$ \mathrm{\sigma } $准则适合用于呈现正态分布的数据,对有趋势变化的数据效果较差,当异常数据偏离整体分布幅度较大时也会影响检测效果。四分位法利用数据按大小排列后的四分位数检测异常数据,不需要事先假定数据服从某种分布,能够应对部分偏离幅度较大的异常数据,但异常数据较多时检测效果将变差,针对整体偏稠密的数据可能会过度检测。统计量法根据数据子集均值、方差或方差变化率等的变化识别异常数据,其阈值设计相对困难。

K-Means聚类算法需预先确定类簇数目K,并选取K个聚类中心,以迭代方式分配数据点至最近距离的类簇,不断更新聚类中心后实现聚类。初始聚类中心和类簇数目较难确定,且对噪声较为敏感。DBSCAN是基于密度的聚类方法,克服了传统聚类方法仅适用于球形或类球形分布数据的缺点,能发现空间中任意形状的类簇。DBSCAN算法不需要预先设定类簇数目,但邻域半径和核心点阈值需合理设定。LOF是基于密度的离群点检测方法,适用于离散型异常数据,对堆积型异常数据的检测效果欠佳。孤立森林算法通过二叉树结构随机分割数据集,直至所有样本点孤立,早期被分割出的数据可能为异常数据,对离散型异常数据和远离正常数据的堆积型异常数据均有较好识别效果,但需设定合理的异常阈值来判断异常数据。

在计算效率方面,基于统计分析的离群值检测方法速度快,基于机器学习的离群值检测方法速度偏慢。本文选取DBSCAN方法识别离群值。

DBSCAN方法[9~10]将符合一定密度条件的数据分配到一个类簇中,主要涉及2个参数:邻域半径Eps、最小邻域点数目阈值MinPts

数据点可分为3类:核心点,即在半径Eps内含有超过MinPts数目的点;边界点,即在半径Eps内点的数量小于MinPts,但是落在核心点的邻域内的点;噪声点,即不是核心点也不是边界点的点。

针对应变或加速度时间序列数据$ X= [{x}_{1},{x}_{2}, \cdots , {x}_{n}] $,DBSCAN算法流程如下:

步骤1 任选一个数据点$ {x}_{i} $

步骤2 如果对于参数Eps和MinPts$ {x}_{i} $为核心点,则找出所有从$ {x}_{i} $密度可达的数据点,形成一个簇;

步骤3 如果$ {x}_{i} $为边界点,选取另一个数据为对象点;

步骤4 重复步骤2、步骤3,直到所有点被处理。

通过DBSCAN算法识别离群值后,可以提取离群值在时间序列中的序列号,序列号孤立出现,则该离群值为孤点,可设置为缺失值;序列号连续或间断扎堆出现,则该离群值为数据簇型离群值,很可能是船体撞冰所致。

在实船结构健康监测中,通过对撞冰事件或其他突发类载荷作用事件的自动化识别和打标签,可以在海量低价值的结构监测数据中提取出对结构安全评估、科学研究等有高价值的数据。

2.3 幅度异常检测与处理

幅度异常检测与处理有故障传感器识别和数据标准化处理2个作用。

2.3.1 故障传感器识别

对于局部区域的船体结构,监测数据之间存在着密切的空间相关性。临近位置的船体结构,受到的外部载荷特征相似,若结构形式也一致,则外载作用下的应变响应也类似。

冰载荷反演测点分布在临近高度、临近肋位的肋骨腹板,在经过数据初筛、剔除孤立离群值和撞冰事件导致的离群数据簇后,可假设冰载荷反演区的各传感器数据标准差类似。若某个传感器的监测数据标准差远离其他传感器的监测数据标准差,则认为该传感器的幅度异常,可将该传感器标记为故障。判断标准差是否异常可采用DBSCAN方法。

2.3.2 基于平均标准差的数据标准化处理

剔除掉故障传感器数据后,剩余传感器的采集数据可认为有效,但幅度大小还是有差异。幅度较高的传感器在冰载荷反演分析中的作用会被放大,幅度较低的传感器在冰载荷反演中的作用会被削弱。对于有效传感器的数据,通过式(1)可将各传感器的数据幅度调整到相同的水平,完成数据的标准化处理。需要注意的是,计算传感器的监测数据标准差时,考虑到外部冰载荷作用在局部区域,对临近区域的各传感器影响差异较大,因此剔除了撞冰事件导致的离群数据簇,在进行数据幅度调整时,需要恢复撞冰事件导致的离群数据簇。

$ {{x}_{mi}}^{{'}}=\frac{{x}_{mi}-{\mu }_{m}}{{\sigma }_{m}}\times \stackrel-{\sigma }。$ (1)

式中:$ {x}_{mi} $$ m $号传感器数据经初筛、离群值检测后的第$ i $个值;$ {\mu }_{m} $$ m $号传感器的数据均值,由于数据初筛时去除了数据趋势项,此处为0;$ {\sigma }_{m} $$ m $号传感器的数据标准差;$ \stackrel{-}{\sigma } $为各个有效传感器的标准差的均值;$ {{x}_{mi}}^{{'}} $$ m $号传感器数据幅度调整后的值。

2.4 缺失值处理

根据缺失值数量占样本总量的比例,建立缺失率$ {R}_{\rm{null}} $指标。

$ {R}_{\rm{null}}=\frac{{N}_{\rm{null}}}{N}。$ (2)

式中:$ {N}_{\rm{null}} $为一个样本中缺失数据点的数量;$ N $为样本中数据点总数;缺失率$ {R}_{\rm{null}} $在0~1之间。

对于缺失率较小的样本,可以利用均值、临近值、样条插值、回归模型预测值等进行填充;对于缺失率较大的样本,填充不具有可行性,可以认为该时段的该传感器为故障状态,相应测点的数据直接放弃使用。

3 实船结构监测数据异常诊断实例分析 3.1 离群值诊断分析

选取“雪龙2”在(UTC)2022.11.23 13:00-24:00之间,9号冰载荷反演传感器的应变数据对孤点型离群值诊断情况进行分析,该时段的船舶航速变化情况如图3所示。

图 3 船舶航速曲线(2022.11.23 Fig. 3 Ship speed curve(2022.11.23

选取“雪龙2”在(UTC)2023.8.11 11:00-20:00之间,72号冰载荷反演传感器的应变数据对数据簇型离群值诊断情况进行分析,该时段的船舶航速变化情况如图4所示。

图 4 船舶航速曲线(2023.8.11 Fig. 4 Ship speed curve(2023.8.11

以上2个时段的海冰密集度均为8~10成。以1 min为时间窗口将原始监测数据划分为各个样本,应变采样频率50 Hz,每个样本数据量约3000条。第一段数据得到有效数据样本660个,第二段数据得到有效数据样本482个。

首先,通过人工手段对每个样本是否出现孤点型离群值和数据簇型离群值打标签;然后,采用DBSCAN方法对样本进行自动化离群值检测。人工打标签和DBSCAN方法识别的结果如表1所示。

表 1 实船应变测量数据样本 Tab.1 Strain data samples in field monitoring

可知,DBSCAN方法对孤点类型的离群值检测准确率达100%,对数据簇型的离群值检测准确率约88.3%。未检测出的数据簇型离群值主要是离群族群与正常数据比较接近所导致,如图5所示。这些未检测出的离群簇在极地船舶上,表征为海冰对船体的一些较弱的作用载荷,算法未检测出这些载荷不会对结构安全评估造成较大影响。

图 5 未检测出的数据簇型离群值 Fig. 5 Undetected outliers type of data cluster
3.2 幅度异常诊断处理

选取“雪龙2”在(UTC)2022.11.23 22:45-22:50之间的冰激应变测量数据,经数据初筛、离群值检测、故障传感器识别、缺失值处理后,分别采用标准化处理和不采用标准化处理,对船体外板所受冰压进行反演并提取该时段所受的最大冰压。

图6为采用标准化处理时,提取的最大冰压为13号传感器对应的区域,最大冰压为3.3 MPa,单个冰压作用时长约0.5 s;当不进行标准化处理时,对应时段的13号传感器对应区域冰压时历如图7所示。

图 6 最大冰压(标准化处理) Fig. 6 Maximum ice pressure(normalized)

图 7 13号测点冰压(不采用标准化处理) Fig. 7 Ice pressure of No.13 point(un-normalized)

图8为不采用幅度调整的方法时,提取的最大冰压为66号传感器对应的区域,最大冰压为3.5 MPa,看不出明显的冰压作用时长;当进行标准化处理时,对应时段的66号传感器对应区域的冰压时历如图9所示。

图 8 最大冰压(不采用标准化处理) Fig. 8 Maximum ice pressure(un-normalized)

图 9 66号测点冰压(标准化处理) Fig. 9 Ice pressure of No.66 point(normalized)

“雪龙2”设计吃水为7.85 m,在冰区航行时所受冰压主要集中在下5排的监测点位。经统计,海冰对船体的一个载荷作用周期约0.5~2 s。

图6提取的最大冰压的作用周期与统计情况相符。图8没提取出明显的冰压作用周期,与统计情况不符,且66号传感器是第2排的监测点位,实际所受冰压并不明显。图6图7图8图9的冰压时历曲线形状一致,仅幅度有所差异。因此,本文提出的幅度异常诊断处理方法可较好地对监测数据的幅度做标准化处理,有利于提高冰压极值统计结果的精度。

4 结 语

本文利用“雪龙2”破冰船多个航次的结构监测数据,对船体结构安全监测系统中存在的数据异常类型及相应诊断处理方法进行研究,得出以下结论:

1)船舶结构监测数据中的异常数据类型主要包括数据0值、短时数据突变重复、数据缺失、数据漂移、幅度异常和离群值等;对于不同的异常数据类型,可采用合适的方法进行诊断处理。

2)DBSCAN方法既可有效剔除干扰安全评估的孤值跳点,也可有效识别外载作用于船体导致的数据簇型离群值。

3)幅度异常检测可用于识别故障传感器,基于平均标准差的数据标准化处理方法可较好地对监测数据的幅度做标准化处理。

本文介绍的方法主要针对船舶结构安全监测系统中的应变数据,为船体结构监测数据的治理提供较好的思路和方法。实船结构安全监测系统还包含加速度、温度、运动姿态、航速、液位等结构化数据,也包括图像、视频等非结构化数据。开展多源异构数据的融合清洗,利用各类数据进行互补,提升异常数据检测与处理的准确性,从而准确识别船体结构的非安全状态,将是下一步的研究重点。

参考文献
[1]
孙梦丹, 汪雪良, 吴国庆, 等. 基于实船结构监测数据的异常检测及处理方法[J]. 装备环境工程, 2023, 20(9): 152-159.
[2]
周学谦, 杨禹, 李陈峰, 等. 船舶结构应力监测传感器误差特性及补偿算法研究[C]//中国造船工程学会船舶力学学术委员会测试技术学组2021年学术会议论文集, 2021.
[3]
高珂, 翁顺, 陈志丹, 等. 基于模式识别的结构健康监测异常数据诊断[J]. 建筑结构学报, 2024, 45(3): 113-122.
[4]
BAO Y Q, TANG Z Y, LI H, et al. Computer vision and deep learning-based data anomaly detection method for structural health monitoring[J]. Structural Health Monitoring, 2018, 18(2): 1-21.
[5]
孙利民, 尚志强, 夏烨. 大数据背景下的桥梁结构健康监测研究现状与展望[J]. 中国公路学报, 2019, 32(11): 1-20.
[6]
吴永斌, 张建忠, 袁正舾, 等. 风电场风功率异常数据识别与清洗研究综述[J]. 电网技术, 2023, 47(6): 2367-2380.
[7]
孙慧, 赵炎平, 汪大立, 等. “雪龙2”船体监测及辅助决策系统设计[J]. 舰船科学技术, 2019, 41(15): 55-58.
SUN H, ZHAO Y P, WANG D L, et al. Design of “Xuelong 2”Ship structure monitoring and assistant decision-making system[J]. Ship Science and Technology, 2019, 41(15): 55-58.
[8]
郝爽, 李国良, 冯建华, 等. 结构化数据清洗技术综述[J]. 清华大学学报(自然科学版), 2018, 58(12): 1037-1050.
[9]
单豪良, 陈永高, 孙泽阳. 基于DBSCAN算法的改进确定-随机子空间模态参数识别算法[J]. 振动与冲击, 2022, 41(11): 156-163.
[10]
钟国强, 柳尚, 徐润, 等. 考虑异常监测数据影响的桥梁拉索振动频率识别方法研究[J]. 中南大学学报(自然科学版), 2023, 54(12): 4870-4881.