时频系统故障预测
王玲玲1,2, 苟伟1     
1. 中国科学院上海天文台,上海 200030;
2. 上海市空间导航与定位技术重点实验室,上海 200030
摘要: 甚长基线干涉测量(Very Long Baseline Interferometry, VLBI) 观测站的氢原子钟和时间比对系统(简称时频系统) 为测站提供稳定可靠的时间和频率基准,系统信号的质量直接影响观测数据的质量。其中,氢原子钟是时频系统的关键设备,一旦出现故障,对数据的破坏是致命的。因此,时频系统在设计建设之初就对氢原子钟及周边各参数状态进行实时监测并记录保存,一旦发现异常,技术人员需要快速进行处理。中国VLBI网(Chinese VLBI Network, CVN) 建成至今,目前共有5个测站,每个测站的时频系统配有两台或以上氢原子钟,系统长期运行积累了大量数据。通过对这些数据的分析,我们可以研究氢原子钟状态变化、性能变化及环境变化之间关系,然后建立故障预测模型,从而对设备故障进行预测。描述创建时频系统数据仓库,利用数据挖掘技术预测系统故障的测试过程,从测试结果可知,聚类模型能够成功预测系统故障。
关键词: 时频系统    氢原子钟    故障预测    数据驱动    
Timing System Failure Prediction
Wang Lingling1,2, Gou Wei1     
1. Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China;
2. Shanghai Key Laboratory of Space Navigation and Positioning Techniques, Shanghai 200030, China
Abstract: The hydrogen maser and time comparison system (timing system for short) of the VLBI observatory provides a stable and reliable time and frequency reference for the observing station. The quality of the system signal will directly affect the quality of the observation data. Among them, the hydrogen maser is the key equipment of the timing system. Once it fails, its damage to data is fatal. Therefore, at the beginning of the design and construction of the VLBI station timing system, the state of the hydrogen maser and its surrounding parameters are monitored and recorded in real time. Once an abnormality is found, the technicians need to deal with it quickly. Chinese VLBI Network (CVN) has been established so far. There are currently five stations. The timing system of each station is equipped with two or more hydrogen masers. The system has accumulated a large amount of data since its long-term operation. Through the analysis of these data, we can study the relationship between state changes, performance changes, and environmental changes of the hydrogen maser, and then establish a failure prediction model to predict failures. This article describes the test process of creating a timing system data warehouse and using data mining technology to predict system failures, and we find the clustering model can be used to make good predictions in this project.
Key words: timing system    hydrogen maser    failure prediction    data-driven    

时频系统为甚长基线干涉测量站提供稳定可靠的时间标准,输出信号的质量直接影响观测质量。时频系统包括氢原子钟和其他时间比对设备,氢原子钟作为其中最关键的设备,是一种高精度的频率标准,但由于微波谐振腔输出频率易受外界环境因素干扰,所以性能也容易受外界环境影响。针对整个时频系统状态和性能变化的研究目前主要集中在环境变化对氢原子钟性能的影响,为此,国内外的学者都做了若干工作[1-4]。研究结果表明,在环境控制较差的情况下,氢原子钟的频率稳定度显著下降。因此,对于环境状态的有效控制是确保氢原子钟乃至整个时频系统可靠运行的前提。

另一方面,作为用户,针对氢原子钟的运行,除了提高设备本身的可靠性之外,对发生故障的预测是减少故障发生及尽早处理的有效方法。因为氢原子钟的运行是一个动态过程,伴随复杂的物理和化学状态变化,其中一些变化最终导致氢原子钟性能指标变化甚至故障发生,观察和分析这种变化之间的关系有助于实现故障预测。这首先需要对设备状态进行监视,然后通过对相关数据进行分析处理,得出预测模型,从而达到精准预测设备状态的目的。

1 数据收集

故障预测是一门多学科综合信息处理技术,是故障诊断技术的一种拓展和延伸[5],是在设备正常工作的前提下,利用历史数据和相关技术,结合当前状态对可能发生的故障趋势进行预测的一个过程[6]。预测方法大致可以分为3类:基于模型、基于数据驱动和基于统计可靠性[5]。中国VLBI网建立已有十多年的历史,运行至今积累了大量的数据,具有进行相关研究的数据基础。本文选用基于数据驱动的故障预测技术进行研究。该技术近年来广受重视并快速发展,成为重要研究热点[7]

甚长基线干涉测量站时频系统的主要设备包括氢原子钟、分频钟/台站钟、时间间隔计数器、切换器、倍频器、频率/脉冲分配器、全球定位系统/北斗导航系统时间服务器等,另外还有提供周边服务的设备,包括不间断电源(Uninterruptible Power Supply, UPS)、恒温恒湿空调、室内数字温度计、室外气象站等。根据《实用型氢原子钟技术说明书》,甚长基线干涉测量站使用的主动型氢原子钟提供类似小型钟的状态监控系统[8],用户可以通过串口采集数据,利用数据分析钟的状态,其他设备的数据采集同样可以通过设备自带的串口或网络通信协议接口并配合对应的采集软件完成,也可以根据需要通过专用串口/网口转换设备将接口转换后采集,数据采集频率根据需求设定。

时频系统的监测数据包括氢原子钟内部各参数的状态、钟差、钟房环境温湿度、外部环境温湿度、气压、风向风速等,不同的数据来自不同的设备,比如氢钟状态来自氢钟,钟房温湿度来自钟房温湿度计等。这些数据为预测模型的研究提供了第一手资料,使得研究具有可行性。经过多年建设及持续维护和改造,各时频系统中运行过或正在运行的设备众多,其中,氢原子钟的型号包括MHM2010,VCH-1003M,SHOM-3,SHOM-4和SHOM-A等多种,具体的设备编号也有所变动。数据存储的内容和格式有不同程度的差异,而且存储方式及数据格式不完全相同,有的以数据库的形式存储,有的以文件存储,想要进行数据分析,第一步工作是对数据进行整理,建成时频系统数据仓库。

2 数据整理

典型的基于数据驱动的故障预测方法有人工神经网络、模糊系统和其他的计算智能方法[5]。本文采用一种基于数据挖掘思想的预测算法展开研究。

时频系统的主要设备如前所述,经过业务分析,时频系统数据仓库的实体联系图如图 1

图 1 时频数据仓库的实体联系图 Fig. 1 E-R diagram for timing system data warehouse

接下来,根据数据仓库建设的步骤,分别进行逻辑建模和物理建模,逻辑模型如图 2,部分数据表设计如表 1~表 6

图 2 时频数据仓库的逻辑模型图 Fig. 2 Logical model diagram for timing system data warehouse
表 1 氢钟信息 Table 1 Maser information
Column name Data type Allow nulls
StationID char (10) N
MaserNO nchar (7) Y
Type char (50) Y
ID char (20) N pk
DateStart datetime Y
表 2 钟差数据 Table 2 Clock offset
Column Name Data Type Allow Nulls
MaserNO nchar (7) N
Time datetime N pk
Offset numeric (18, 15) Y
表 3 氢钟运行状态 Table 3 Maser status
Column name Data type Allow nulls
MaserNO nchar (7) N
Time datetime N pk
Chan (1) decimal (8, 2) N
Chan (…) decimal (8, 2) N
Chan (32) decimal (8, 2) N
Freq nchar (20) Y
表 4 室外环境 Table 4 Outdoor environment
Column name Data type Allow nulls
StationID char (10) N
Time datetime N pk
Temperature numeric (3, 1) N
Humidity numeric (4, 1) N
Pressure numeric (5, 1) N
WindDir int N
WindSpeed numeric (3, 1) N
表 5 室内环境 Table 5 Indoor environment
Column name Data type Allow nulls
StationID char (10) N
Time datetime N pk
Temperature numeric (3, 1) N
Humidity numeric (4, 1) N
表 6 系统运行状态 Table 6 System status
Column name Data type Allow nulls
StationID char (10) N
Time datetime N pk
StatusNO char (10) Y
Descrip char (100) Y

由于数据的多样性和复杂性,我们首先需要对数据进行整理,整理的步骤包括数据清洗及数据格式转换等。数据清洗即剔除原始数据中的错误数据和无效数据,经格式转换后统一入库。

时频系统的数据记录有数据库、文本文件两种形式,清洗的过程中需要注意时间格式有北京时间和世界时的区别,为后续统一关系,这里全部换算成统一的世界时。台站的设备时有更换,有型号升级或同型号更换,这些信息有的完整,有的错误,有的缺失,缺失的补空,错误的需要修正。数据记录有混合,即同样的数据表格里,可能混合了不同时期、不同型号或编号的设备数据,这种情况需要根据当时的日志文件对数据进行拆分及重新补录。另外,由于源数据量较大,为方便测试,本文对数据进行了均匀缩减抽样。

3 数据分析

由于在所有数据中,能够最直观反映时频系统状态的是氢原子钟的状态数据,所以本文以SHOM-4型氢原子钟为例,重点分析有关氢原子钟的状态数据及当时的环境温度数据。根据氢原子钟技术说明书,钟的常规状态参数有32个,除去1个备用及8个隔离放大器的数据,其他均可以实时反映运行状态。图 3是2019年编号为88#的氢钟状态及当时的环境温度信息,其中纵坐标表示各参数的数值。

图 3 2019年数据(部分数据有缺失) Fig. 3 Data in 2019 (some data are missing)

氢钟的这些状态参数可以根据物理模块分为电源、恒温、离子泵、接收机、隔离放大器等几部分,其中接收机中频信号的数值代表钟信号,若小于1.5则表示钟输出信号消失,属于严重故障,本文重点对该参数进行分析。在对数据进行细化之后,根据氢钟技术手册,结合以往的经验,可以得到11个参数与中频信号密切相关,具体如图 4。因为数据值相差比较大,为了让读者看得更清晰,我们把数据分成两幅图显示,上半部分显示OSCI的值,下半部分显示另外10个参数值。进一步细化可以看到更多细节,比如从图 5两个数据曲线形状判断,两者有很强的相关性,可以说,曲线的弯曲方向大致相反,也就是温度升高时OVN1和OVN2值下降,温度下降时OVN1和OVN2值升高,即OVN1,OVN2和温度数据相关度最高,这是因为OVN1和OVN2是钟恒温部分中外炉位置电压值,直接受环境温度变化的影响。

图 4 部分相关参数状态 Fig. 4 Part of the relevant parameters status
图 5 外炉电压与温度数据关系 Fig. 5 The relationship between OVN1&2 and temperature
4 故障预测模型 4.1 几种挖掘算法的比较

信息化社会之下,日益增长的各类数据隐含着大量价值,数据挖掘技术是为了满足获取此价值的要求,从大量随机数据中提取有用信息和知识的技术。在数据挖掘技术发展的过程中,大量算法应运而生,但同时各有各的局限,多种算法融合是解决具体事务的发展趋势[9]。本文以2019年数据为例,采用几种典型算法分别进行分析处理,并比较其性能。

根据每种算法在传统上的应用,结合特定场景,本文选择决策树、聚类、关联和时序等算法进行测试研究。其中各算法的有关参数可以调整,比如在决策树模型中,我们可以看到各参数的依赖关系网络(图 6),选择中频信号节点,显示所有链接,IFL与OVN1,OVN2,FLUX,DIO及温度数据有关,而调整到显示较强链接,与DIO的关系链断开。关联算法中多个参数由于是连续数据而被忽略,而时序算法需要连续的数据,不允许出现空白,因为测试中选定的数据有缺失,所以需要指定用来填充空白的方法,这样可以使用前面的值、平均值或特定的常量。由各挖掘算法创建的挖掘模型如图 7

图 6 参数间依赖关系网络 Fig. 6 Dependency network between parameters
图 7 各挖掘模型 Fig. 7 Data mining models

我们可以使用提升图对各算法模型的准确性进行查看,如图 8,蓝色线为理想模型,图中x轴表示用于比较预测的测试数据集的百分比,y轴表示准确预测的百分比。因此,理想线是一条对角线,用于显示在50%的数据中,模型准确预测50%的事例(即预计的最大值)。由图 8可知,各模型都接近理想模型,其中,决策树模型表现最优。

图 8 各模型挖掘准确性提升图 Fig. 8 Data mining accuracy lift chart of the models

然而,我们仔细查看预测结果时发现,虽然绝大部分值预测成功,但是数据中实际存在的一个异常值并没有成功预测,即图 9中鼠标选中的数值0.38,因为小于1.5,所以是实际的异常值,但是这个值3个模型都没有预测到,可能原因是该异常值在15 130个数据中只出现了一次,即测试数据不够典型,在实际预测中的效果不好。时序算法中的测试存在同样的问题,所以接下来的测试对数据进行重新选择。

图 9 各模型的分类矩阵 Fig. 9 Classification matrix of the models
4.2 模型优化及预测

新的测试数据选自2013年编号43#氢钟,其中,中频信号的数据如图 10,可以看出期间发生了多次信号消失现象,本文摘取这段数据进行模型构建展示。

图 10 2013年43号钟的中频信号数据 Fig. 10 IFL data of 43# in 2013

这次模型测试中,聚类模型的分数高过决策树,达到0.88 (图 11),所以选用该模型对测试数据的后半段进行预测,将预测数据中的预测值IFL置空(NULL)。从预测分类矩阵(图 12) 可以看出,对于预测值IFL,其各类数据的预测结果都比较均匀,与实际数据相符,结果中预测到值为0.06 (故障值) 的数据15条,与实际数据的14条非常接近,预测概率从0.51提高到0.857,准确率也很高。由此可知,此模型故障预测成功。

图 11 各模型准确性提升图 Fig. 11 Data mining accuracy lift chart of the models
图 12 聚类模型分类矩阵 Fig. 12 Classification matrix of the clustering model

本文同时对时序算法进行了测试。时序算法用于预测一系列连续数据点的未来值,要求必须包含时间键,而本文的数据正是以时间序列采集的,符合要求。实际的预测结果如图 13,可以看到左侧实线是实际值,右侧虚线是预测值,比对实际数据,即从图 10中可以看到3月19日5: 17: 10之后附近的数据确实是在3左右,由此可知预测部分非常准确。然而,重新选择预测开始点,预测结果如图 14,并不能令人满意,因为数据的周期性不明显,因此使用的时序算法并不是最理想。这有待于后续继续分析研究。

图 13 聚类模型预测结果 Fig. 13 Prediction results of the clustering model
图 14 时序模型预测结果 Fig. 14 Prediction results of the time series model
5 总结

本文针对时频系统故障预测进行了一些方法探索,利用数据挖掘技术对历史数据进行分析和测试。从测试结果可知,结合设备本身状态数据及运行环境数据可以分析预测设备状态趋势,从而对可能发生的故障进行预警。

分析的难点在于算法的选择和设计,模型构建过程是算法不断优化的过程。本文测试得知聚类模型可以很好地进行预测,后续可以通过更多的数据进行验证,同时下一步需将此预测模型集成到时频系统软件,从而实现系统实时故障预测。

另外,分析所用的预测模型需要有大量原始数据进行训练,用于训练的数据越多越能覆盖所有可能,模型越准确越健壮,然而如何在有限的算力下高效处理这些数据成为难题,后续有必要进行专门研究。

参考文献
[1] 杨军, 李世光, 徐月青, 等. 环境温度对氢原子钟性能的影响[J]. 测试技术学报, 2014, 28(2): 93–97
YANG J, LI S G, XU Y Q, et al. Effect of temperature on hydrogen maser performance[J]. Journal of Test and Measurement Technology, 2014, 28(2): 93–97.
[2] 柯熙政, 刘宏良. 原子钟相位-时间起伏周期的小波分析[J]. 电子科技, 1997, 39(1): 13–18
KE X Z, LIU H L. Wavelet analysis of atomic clock phase-time periodic variations[J]. Electronic Science and Technology, 1997, 39(1): 13–18.
[3] DRAGONETTE R A, SUTER J J. Barometric pressure-induced frequency offsets in hydrogen masers[C] // Proceedings of the 45th Annual Symposium on Frequency Control. 1991: 586-590.
[4] 李树洲, 王茂磊, 肖胜红. 环境温度对氢原子钟稳定度的影响[J]. 现代导航, 2017, 8(2): 118–121
LI S Z, WANG M L, XIAO S H. Frequency stability of hydrogen maser affected by environment temperature[J]. Modern Navigation, 2017, 8(2): 118–121.
[5] 彭宇, 刘大同, 彭喜元. 故障预测与健康管理技术综述[J]. 电子测量与仪器学报, 2010, 24(1): 1–9
PENG Y, LIU D T, PENG X Y. A review: prognostics and health management[J]. Journal of Electronic Measurement and Instrument, 2010, 24(1): 1–9.
[6] 左宪章, 康健, 李浩, 等. 故障预测技术综述[J]. 火力与指挥控制, 2010, 35(1): 1–5
ZUO X Z, KANG J, LI H, et al. Overview of fault prediction technology[J]. Fire Control & Command Control, 2010, 35(1): 1–5.
[7] 彭宇, 刘大同. 数据驱动故障预测和健康管理综述[J]. 仪器仪表学报, 2014, 35(3): 481–495
PENGY, LIU D T. Data-driven prognostics and health management: a review of recent advances[J]. Chinese Journal of Scientific Instrument, 2014, 35(3): 481–495.
[8] 陈丛军, 林传富. 小型氢原子钟监控系统的研制[J]. 中国科学院上海天文台年刊, 2007(1): 151–159
CHEN C J, LIN C F. The development of the monitor system for the miniature hydrogen atomic clock[J]. Annals of Shanghai Astronomical Observatory, 2007(1): 151–159.
[9] 邹志文, 朱金伟. 数据挖掘算法研究与综述[J]. 计算机工程与设计, 2005, 26(9): 2304–2307
ZOU Z W, ZHU J W. Research and summary of data mining algorithms[J]. Computer Engineering and Design, 2005, 26(9): 2304–2307.
由中国科学院国家天文台主办。
0

文章信息

王玲玲, 苟伟
Wang Lingling, Gou Wei
时频系统故障预测
Timing System Failure Prediction
天文研究与技术, 2022, 19(4): 386-395.
Astronomical Research and Technology, 2022, 19(4): 386-395.
收稿日期: 2021-07-03
修订日期: 2021-08-05

工作空间