2. 中国科学院国家天文台,北京 100101
2. National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100101, China
结构健康监测是通过布设大量传感器,监测并评估结构当前状态的一种技术,在工程结构的安全监测中有广泛应用。500 m口径球面射电望远镜是具有主动反射面的大型钢结构工程[1]。文[2]讨论了FAST结构受力复杂性,由于结构特殊、空间跨度大且环节众多,在观测过程中主动反射面受控变形导致结构受力复杂,为保证其安全工作,建设了主动反射面健康监测系统,通过监测关键结构的应力和环境信息,实现FAST的健康状态评估。文[3]指出,在索网施工过程中,该系统监测的圈梁实时应力最大约60 Mpa,始终小于设计安全值201.5 Mpa,保持在安全范围内,并指出温度信号对应力分析的重要性。
在FAST工作过程中,索网主动变形使结构受力更为复杂,以2019年7月的监测数据为例,所有圈梁格构柱测点应力最大值为137.37 Mpa,最小值为-135.88 Mpa,仍处于安全范围内,但部分测点应力变化范围较大,应力变化最大的测点极差为167.17 Mpa。在望远镜后续工作中,应力的监测对结构实时健康状态评估、长期疲劳损伤评估等具有重要意义。
大型工程结构空间尺寸大,不同部位温度升高不同,温差与温度效应会使结构应力发生较大变化。文[4]指出,FAST结构中,温度荷载对圈梁结构的刚度起控制作用,分布测点温度信息是评估结构状态的重要依据[5]。FAST应用了416只光纤Bragg光栅(Fiber Bragg Grating, FBG)应变传感器[6]监测应力,共包含圈梁及格构柱应力测点100只,主索索力测点316只,虽然测点分布位置不同,但所有测点需根据不同测点的实际温度补偿应变传感器的温度应变交叉敏感问题。文[7]进一步讨论了分离结构应力的温度效应对状态评估的必要性,温度信息缺失将直接导致测点应变信息不可靠。
实际工程现场环境复杂,大量传感器长期工作,传感器及数据通道存在一定故障率。检修发现,FAST主动反射面健康监测系统已有个别光纤光栅解调仪出现故障,且存在数只传感器数据异常,已确定异常测点数目约为5%,部分监测数据无法正常获取。但受限于现场施工条件,以及部分测点安装位置特殊,故障传感器无法第一时间修复,数据的缺失将导致健康监测系统性能下降,形成安全隐患。
使用临近测点值代替故障测点温度信息,就FBG传感器而言,因其串联布设,若数据通道损坏,临近的一组传感器均失效。使用较远传感器监测值代替,存在距离过远,光照影响温差较大,代替不准确等问题,这也是每测点布设温度传感器的原因。实现故障测点的温度信号准确估测,对提高健康监测系统可靠性有着重要意义。
1 传感器布设与数据提取分析FAST使用FBG温度传感器监测主动反射面结构健康监测系统圈梁格构柱关键应变测点的温度信息。传感器工作原理是外界温度引起光栅周期以及有效折射率发生变化,使反射波长偏移,通过测量中心波长变化量,获取传感器所测温度。
为有效探究远距离布设的温度测点之间的相关性,提取FAST边缘圈梁支承格构柱对应测点的温度信息,每个被监测的格构柱提取一路测点信息,FAST工程圈梁格构柱共50个,有10个格构柱装有测点,被测格构柱编号与测点分布如图 1,传感器安装于如图 2圈梁支座处靠内侧的水平拉杆中的绿色杆件,测点之间最远距离为500 m。
|
| 图 1 测点分布示意图 Fig. 1 Distribution map of measuring points |
|
| 图 2 传感器安装位置 Fig. 2 Sensor mounting position |
监测系统数据采集频率为1 Hz,为降低数据量,滤除高频干扰,避免由于数据长度不统一造成的分析困难,对原始数据进行平均处理,平均时窗为10 min,取每10 min内温度数据平均值作为该时刻温度数据,每测点每日测得144个数据样本。我们提取2019年7月份监测数据,对应记作T1#~T46#,其中31#格构柱测点因采集通道检修关闭,无数据记录,共提取9个测点信息。因环境温度循环周期往往为昼夜,按天对数据进行分组,7月16日数据如图 3。
|
| 图 3 温度监测数据 Fig. 3 Temperature monitoring data |
由图 3可以看出,不同测点之间温差较大,最大温差超过5 ℃,波动规律也有一定区别,但其趋势大体一致。两数据样本分别记作X=[x1, x2, ..., xn],Y=[y1, y2, ..., yn],计算不同样本间线性相关性,相关系数公式为
| $ r_{x, y}=\frac{\sum\limits_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\sum\limits_{i=1}^n\left(x_i-\bar{x}\right)^2 \sum\limits_{i=1}^n\left(y_i-\bar{y}\right)^2}}, $ | (1) |
其中,n为样本长度;
| T1# | T6# | T11# | T16# | T21# | T26# | T36# | T41# | T46# | |
| T1# | 1.000 | 0.973 | 0.986 | 0.969 | 0.982 | 0.984 | 0.997 | 0.996 | 0.996 |
| T6# | 0.973 | 1.000 | 0.980 | 0.981 | 0.974 | 0.984 | 0.967 | 0.969 | 0.982 |
| T11# | 0.986 | 0.980 | 1.000 | 0.991 | 0.993 | 0.988 | 0.981 | 0.975 | 0.985 |
| T16# | 0.969 | 0.981 | 0.991 | 1.000 | 0.994 | 0.992 | 0.959 | 0.959 | 0.972 |
| T21# | 0.982 | 0.974 | 0.993 | 0.994 | 1.000 | 0.995 | 0.974 | 0.973 | 0.981 |
| T26# | 0.984 | 0.984 | 0.988 | 0.992 | 0.995 | 1.000 | 0.977 | 0.980 | 0.988 |
| T36# | 0.997 | 0.967 | 0.981 | 0.959 | 0.974 | 0.977 | 1.000 | 0.996 | 0.995 |
| T41# | 0.996 | 0.969 | 0.975 | 0.959 | 0.973 | 0.980 | 0.996 | 1.000 | 0.997 |
| T46# | 0.996 | 0.982 | 0.985 | 0.972 | 0.981 | 0.988 | 0.995 | 0.997 | 1.000 |
当变量之间高度线性相关时,常用线性回归方法建模。自变量个数为1时,记为x,因变量记作y,一般模型记为
| $y=\beta_0+\beta_1 x+\varepsilon, $ | (2) |
其中,β0和β1为模型系数; ε为随机误差。
健康监测温度估测应用中,受光照不均匀的影响,一元回归在某些时刻预测精度较差[8]。引入更多变量,综合不同测点的温度影响,可取得更优的预测结果。当变量个数为多个x1,x2,...,xp时,称为多元线性回归[9],模型记为
| $ y=\beta_0+\beta_1 x_1+\beta_2 x_2+\ldots+\beta_p x_p+\varepsilon, $ | (3) |
其中,
| $ y=X \boldsymbol{B}+\boldsymbol{E}, $ | (4) |
| $ \boldsymbol{Y}=\left(\begin{array}{c} y_1 \\ y_2 \\ \vdots \\ y_n \end{array}\right) \boldsymbol{B}=\left(\begin{array}{c} \beta_0 \\ \beta_1 \\ \vdots \\ \beta_p \end{array}\right) \boldsymbol{E}=\left(\begin{array}{c} \varepsilon_1 \\ \varepsilon_2 \\ \vdots \\ \varepsilon_n \end{array}\right), $ | (5) |
| $\boldsymbol{X}=\left(\begin{array}{cccc} 1 & x_{11} & \cdots & x_{p 1} \\ 1 & x_{12} & \cdots & x_{p 2} \\ \vdots & \vdots & \ddots & \vdots \\ 1 & x_{1 n} & \cdots & x_{p n} \end{array}\right), $ | (6) |
其中,Y为因变量向量; X为自变量矩阵; B为各自变量系数向量; E为随机误差向量,随机误差项符合正态分布εi~N(0, σ2), i=1, 2, ..., n。舍去误差项的影响,最小二乘法求解模型的自变量系数,系数向量估计为
| $\hat{\boldsymbol{B}}=\left(\boldsymbol{X}^{\mathrm{T}} \boldsymbol{X}\right)^{-1} \boldsymbol{X}^{\mathrm{T}} \boldsymbol{Y}. $ | (7) |
利用所得自变量估计系数
| $\hat{y}=\hat{\beta}_0+\hat{\beta}_1 x_1+\ldots+\hat{\beta}_p x_p, $ | (8) |
其中,x1~xp为自变量输入值;
对提取的9个测点数据,取其中一个测点作为因变量即被估测点,其余作为自变量输入,即可通过训练建立多元线性回归模型,当被估测点数据缺失时,可利用自变量输入对信号进行估测。
2.2 最优自变量选取将1#格构柱测点作为被估测点,其余8个测点温度信息作为候选变量,模型变量的不同分组子集有28~1种。利用16日数据训练模型,将变量按照相关性降序排列逐个增加,划分为8组。
结合Cp统计量和Ra2自由度调整复决定系数这两个选取准则来确定最优变量的子集,
| $ C_p=(n-m-1) \frac{R S S_p}{R S S_m}-n+2 p, $ | (9) |
其中,n=144为样本长度; m=8为全部待选变量个数; p为模型所选变量个数; RSSm为选择全部变量建模的残差平方和; RSSp为模型残差平方和。
| $R_a^2=1-\frac{n-1}{n-p-1}\left(1-R^2\right), $ | (10) |
其中,R2为复决定系数即模型拟合度,
| $ R^2=1-\frac{R S S}{T S S}, $ | (11) |
其中,TSS为因变量y=T1#离差平方和,
| $ \begin{gathered} R S S=\sum\limits_{i=1}^n\left(y_i-\hat{y}_i\right)^2, \end{gathered} $ | (12) |
| $ T S S=\sum\limits_{i=1}^n\left(y_i-\bar{y}\right)^2, $ | (13) |
其中,yi为实际值;
变量分组与对应模型Cp和Ra2数值如表 2,选取Cp最小且Ra2最大,即为最优变量子集,可见八元作为变量时模型拟合度最优。
| Groups | Variables | Cp | Ra2 |
| Univariate | T36# | 130.51 | 0.9937 |
| Two variables | T36#, T41# | 98.498 | 0.9944 |
| Three variables | T36#, T41#, T46# | 56.04 | 0.9954 |
| Four variables | T11#, T36#, T41#, T46# | 20.95 | 0.9963 |
| Five variables | T11#, T26#, T36#, T41#, T46# | 22.01 | 0.9963 |
| Six variables | T11#, T21#, T26#, T36#, T41#, T46# | 22.01 | 0.9963 |
| Seven variables | T6#, T11#, T21#, T26#, T36#, T41#, T46# | 13.29 | 0.9965 |
| Eight variables | T6#, T11#, T16#, T21#, T26#, T36#, T41#, T46# | 7 | 0.9967 |
由表 1可知,所有测点两两之间存在极强的相关性,对于多元线性回归模型,因多重共线性模型稳定性出现问题,即模型可能存在一组数k0, k1, ..., kp使
| $ k_0+k_1 x_{1 i}+\ldots+k_p x_{p i} \approx 0, \quad(i=1, 2, \ldots, n), $ | (14) |
此时设计矩阵秩rank(X) < p+1,意味着(7)式中
岭回归法针对多元线性回归模型中的多重共线性问题进行了优化[10],向量系数岭估计定义为
| $ \hat{\boldsymbol{B}}(\lambda)=\left(\boldsymbol{X}^{\mathrm{T}} \boldsymbol{X}+\lambda \boldsymbol{I}\right)^{-1} \boldsymbol{X}^{\mathrm{T}} \boldsymbol{Y}, $ | (15) |
其中,λ> 0称为岭参数。可见给XTX增加一个正常数矩阵L2范数惩罚项,保证XTX+λI满秩可逆,接近奇异程度比原矩阵减小。XTX+λI随着岭参数增大而增大,模型方差减小,但向量系数估计值
应用岭迹法将8个自变量回归系数对应岭迹如图 4,按原则选取使所有向量系数稳定的最小的一个岭参数值,确定λ = 6,建立岭回归模型。由图 4可见,变量T6#和T26#的系数趋近于0,说明岭回归法训练期间,对自变量有筛选作用。
|
| 图 4 岭迹图 Fig. 4 Ridge parameter map |
多元线性回归模型建立后,我们需要判断模型是否可靠。通过F检验确定模型建立的回归方程显著性,统计量公式为
| $F=\frac{E S S / p}{R S S /(n-p-1)}, $ | (16) |
其中,RSS为模型残差平方和; ESS为回归平方和; n=144为样本长度; p=8为所选变量个数。
| $ E S S=\sum\limits_{i=1}^n\left(\hat{y}_i-\bar{y}\right)^2, $ | (17) |
其中,
以T1#数据作为被估测点,其他测点数据作为输入变量。使用16日数据训练建立模型,并对17~18日数据进行估测检验,使用均方根误差(Root Mean Square Error, RMSE)评价模型的估测效果,值越小说明模型预测效果越好,
| $R M S E=\sqrt{\frac{1}{n} \sum\limits_{i=1}^n\left(y_i-\hat{y}_i\right)^2} $ | (18) |
对照前述分组,建立从一元到八元不同类型的线性回归与岭回归模型,并对模型进行估测效果评价,检验及模型估测结果见表 3。F检验统计量最低为4 972.29,依旧远大于查表所得Fa(1, 135)=3.911,所有模型通过显著性检验,拟合度均在0.99以上,满足要求。随着融合变量的增加,模型测试的均方根误差随之减小。
| Groups | 16th model fitting | 17th estimate | 18th estimate | Estimated mean value | |||||
| F test | R2 Fitting degree | RMSE/℃ | RMSE/℃ | RMSE/℃ | RMSE/℃ | ||||
| Univariate | 22 517.92 | 0.993 7 | 0.2 | 0.68 | 0.66 | 0.67 | |||
| Two variables | 12 784.23 | 0.994 5 | 0.19 | 0.71 | 0.56 | 0.635 | |||
| Three variables | 10 411.94 | 0.995 5 | 0.17 | 0.52 | 0.46 | 0.49 | |||
| Four variables | 9 593.81 | 0.996 4 | 0.15 | 0.52 | 0.44 | 0.48 | |||
| Five variables | 7 665.63 | 0.996 4 | 0.15 | 0.52 | 0.45 | 0.485 | |||
| Six variables | 6 878.33 | 0.996 7 | 0.15 | 0.53 | 0.43 | 0.48 | |||
| Seven variables | 5 876.86 | 0.996 7 | 0.15 | 0.53 | 0.43 | 0.48 | |||
| Eight variables | 5 418.98 | 0.996 9 | 0.14 | 0.52 | 0.43 | 0.475 | |||
| Ridge regression | 4 972.29 | 0.996 6 | 0.15 | 0.46 | 0.41 | 0.435 | |||
一元、八元线性回归、岭回归模型的预测效果如图 5,预测曲线与真实值几乎重叠,几种模型均可较好地跟踪估测信号,岭回归法模型精度更高。
|
| 图 5 真实值与模型预测值对比 Fig. 5 Comparison of true value and model predicted value |
本文提取FAST工程主动反射面健康监测系统中跨度500 m范围布设的9个测点温度监测数据,分析可知两两间存在极强的线性相关性,将1#测点作为被估测点,研究了融合其余测点数据对其估测的方法,并对比了不同变量集时模型的估测效果。
多元线性回归与一元回归模型相比,无论是拟合度还是实际估测应用,多元线性回归都具有更好的效果。当输入变量增加至三元时,测试中均方根误差 < 0.5 ℃。而岭回归与原始多元线性回归相比,模型拟合度略有降低,但可以有效避免变量间的多重共线性问题,对比17日和18日数据的测试,预测精度优于多元线性回归,算法具有更强的抗干扰能力,稳定性好,两日平均均方根误差仅为0.435 ℃。
结果表明,当某测点出现故障时,可使用岭回归法利用近期历史数据训练并建立多元线性回归模型,将正常测点温度信息作为输入,对故障测点输出值进行估测。方法具有较高精度,可用于补充健康监测系统缺失的节点温度信息,在故障测点维修期间保持健康监测系统的正常工作。但该方法使用近期数据进行拟合预测,只能作为测点故障后短期的替补方案。若测点故障过久,可用数据时日相差较大,由于日照天气差别等原因,设备温度场变化规律迁移,估测精度较低,长期数据缺失的估测方法仍需进一步研究。
| [1] | NAN R D. Five Hundred Meter Aperture Spherical Radio Telescope (FAST)[J]. Science in China: Physics Mechanics & Astronomy, 2006, 49(2): 129–148. |
| [2] |
王晓琳, 李东平, 朱明, 等. FAST主动反射面健康监测系统设计与应用研究[J]. 广西科技大学学报, 2018, 29(4): 84–91 WANG X L, LI D P, ZHU M, et al. Design and application of health monitoring system of main reflector system for FAST[J]. Journal of Guangxi university of Science and Technology, 2018, 29(4): 84–91. |
| [3] |
王玉婷, 王启明, 朱明, 等. 光纤光栅传感器在500 m口径球面射电望远镜工程索网施工阶段的应用[J]. 中国机械工程, 2016, 27(20): 2760–2764 WANG Y T, WANG Q M, ZHU M, et al. Application of fiber grating sensor in construction stage of cable net for FAST[J]. China Mechanical Engineering, 2016, 27(20): 2760–2764. |
| [4] |
赵保庆, 王启明, 李志恒, 等. FAST圈梁支承结构性能理论与实验研究[J]. 工程力学, 2018, 35(Suppl 1): 200–211 ZHAO B Q, WANG Q M, LI Z H, et al. Performance research of FAST ring beam by theoretical and experimental[J]. Engineering Mechanics, 2018, 35(Suppl 1): 200–211. |
| [5] |
王惠, 宁云炜, 闫浩. 26米天线座架温度分布规律及变形影响分析[J]. 天文研究与技术, 2018, 15(2): 208–215 WANG H, NING Y W, YAN H. Temperature distribution and deformation impact analysis of 26 m antenna frame[J]. Astronomical Research & Technology, 2018, 15(2): 208–215. |
| [6] |
孙晓, 王启明, 吴明长, 等. 光纤Bragg光栅应变计在500米口径球面射电望远镜工程索力监测中的应用[J]. 光学精密工程, 2015, 23(4): 919–925 SUN X, WANG Q M, ZHU M C, et al. Application of optical fiber Bragg grating strain gauge to cable force monitoring of FAST[J]. Optics and Precision Enginerring, 2015, 23(4): 919–925. |
| [7] |
王清梅, 朱明, 王启明, 等. FAST主动反射面健康监测系统数据处理方法研究及应用[J]. 天文研究与技术, 2017, 14(2): 164–171 WANG Q M, ZHU M, WANG Q M, et al. Research and application of data processing method of the health monitoring system for the main active reflector of FAST[J]. Astronomical Research & Technology, 2017, 14(2): 164–171. |
| [8] |
郭忠臣, 孙朋, 李致春, 等. 预报模型及建模序列长度对钟差短期预报精度影响研究[J]. 天文研究与技术, 2020, 17(3): 299–307 GUO Z C, SUN P, LI Z C, et al. Research on the influence of prediction model and modeling sequence length on short-term prediction accuracy of clock bias[J]. Astronomical Research & Technology, 2020, 17(3): 299–307. |
| [9] |
肖霞, 伍兴国. 线性回归中多重共线性的几何解释[J]. 统计与决策, 2021(21): 46–51 XIAO X, WU X G. Geometric interpolation of multicollinearity in linear regression[J]. Statistics & Decision, 2021(21): 46–51. |
| [10] | HOERL A E, KENNARD R W. Ridge regression: application to nonorthogonal problems[J]. Techometrics, 1970, 12(1): 69–82. |


