应用气象学报  2009, 20 (6): 699-705   PDF    
利用神经网络方法建立热带气旋强度预报模型
黄小刚1,2, 费建芳2, 陈佩燕3     
1. 中国科学院大气物理研究所大气科学与地球流体力学数值模拟国家重点实验室, 北京 100029;
2. 解放军理工大学气象学院, 南京 211101;
3. 中国气象局上海台风研究所, 上海 200030
摘要: 以神经网络方法为基础,建立西北太平洋热带气旋强度预测模型,模型首先进行历史相似热带气旋选择。从选择的样本出发,计算得到一组气候持续因子、天气学经验因子和动力学因子, 对这些因子采用逐步回归方法进行筛选,将筛选得到的因子同对应时效的热带气旋强度输入神经网络训练模块,从而得到优化的预测模型。从2004-2005年西北太平洋26个热带气旋过程对12,24,36,48,72h等不同预报时效分别进行的634,582,530,478,426次预测试验结果的统计来看,相对于线性回归模型预测水平,该模型显著降低了各时段的预测误差。从几个热带气旋个例的预测结果来看, 该模型对超强台风, 以及具有强度迅速加强、再次加强等特征的热带气旋过程均有很好的描述能力。
关键词: 热带气旋    神经网络    强度预报    
A Neural Network Approach to Predict Tropical Cyclone Intensity
Huang Xiaogang1,2, Fei Jianfang2, Chen Peiyan3     
1. State Key Laboratory of Atmospheric Sciences and Geophysical Fluid Dynamics, Institute of Atmospheric Physics, Chinese Academy of Sciences, Beijing 100029;
2. Institute of Meteorology, PLA University of Science & Technology, Nanjing 211101;
3. Shanghai Typhoon Institute, China Meteorological Administration, Shanghai 200030
Abstract: An artificial neural network (ANN) technique is used to predict tropical cyclone intensity change in the Western North Pacific basin and the efficacy is examined. The intensity change forecasts produced by the ANN model are compared to the results of a model developed using linear regression by National Hurricane Center (NHC) at 12-hour,24-hour,36-hour, 48-hour, 72-hour forecast periods. The date, location, track, intensity and the intensity change similarities is used to identify a historical analog tropical cyclone to the current tropical cyclone.Once the analog tropical cyclone are identified, the climatology and persistence variables, such as the previous 6-hour intensity change, location of the tropical cyclone center, current intensity at the time of the observation, are computed from the China Meteorological Administration (CMA) best-track dataset. The synoptic and dynamics variables, such as vertical sheer, sea surface temperature are computed from the National Centers for Environmental Prediction (NCEP) reanalysis data and the weekly sea surface temperature dataset. These variables and intensity of the tropical cyclone are combined as a training set to identify the variables that are best correlated with tropical cyclone intensity. The variables are used to train a neural network which uses BP algorithm as a learning rule to get the best forecast model. 26 tropical cyclone processes in Western North Pacific for 2004-2005 are used to compare the ANN model with linear regression. The number of forecast cases at 12-hour, 24-hour, 36-hour, 48-hour, 72-hour forecast periods is 634, 582, 530, 478, 426 respectively.The preliminary results suggest that, errors of the ANN model are significantly smaller comparing to linear regression for the 12-hour, 24-hour, 36-hour, 48-hour, 72-hour forecast periods. This improvement is the result of the analog tropical cyclones selection and variables filter for a given tropical cyclone. Several case studies show that the ANN model is able to reproduce the processes of super typhoon and tropical cyclones with fast-enhancing intensity and regrowing cases. The results also show that the most important variables for tropical cyclone predicting are the center pressure, the intensity change, the center location (longitude and latitude) and the vertical wind sheer. But the contributions of the other variables also cannot be ignored. So the tropical cyclone intensity change is complex and nonlinear.
Key words: tropical cyclone     artificial neural networks     intensity forecast    
引言

热带气旋强度预报对防灾减灾具有重要意义。多年来, 世界各预报中心一直致力于热带气旋强度业务预报的改进。当前热带气旋强度预报模式大体可分为3类, 即统计模式[1]、统计-动力模式[2]和数值模式[3-4]。目前热带气旋强度的业务预报主要依靠统计方法, 主要统计模式使用的都是双线性回归方法。一般而言, 在热带气旋强度统计预报的预报因子中, 热带气旋最佳路径 (如中心经纬度、中心最低气压、最大风速等)、海温、风场垂直切变等是对强度变化有重要影响的因子。而随着探测仪器、反演技术和数值模式的发展, 这些预报因子质量是随时间变化的, 热带气旋强度变化具有复杂的时变非线性特征, 因此用传统双线性回归方法进行预测存在系统性误差。到目前为止, 其预报技巧也只有路径预报的1/3~1/2[5]。当前工作多集中在对预报因子的改进上[6-7], 但由于热带气旋强度统计预报因子存在不精确、不完整、不确定等特点, 因此需要新一代的计算方法来从这些数据中挖掘出科学规律, 归纳推理, 从而实现热带气旋强度的预报, 而人工神经网络方法 (AN N) 正是满足上述条件的非线性计算方法。

人工神经网络是由大量人工神经元经广泛互连而组成的复杂网络系统, 是在现代神经科学成果的基础上提出的一种抽象的数学模型, 其实质是一门非线性科学, 它具有并行处理、容错性、自学习功能, 有别于传统方法, 已在模式识别、自动化控制等领域取得了很好效果。在天气预报业务中也开始进行人工神经网络预报方法的研究[8]。已采用多元回归方法和神经网络方法进行热带气旋强度72h预报的比较[9-10], 结果表明:神经网络方法在热带气旋强度预报方面很大潜力。

1 数据和方法 1.1 数据

用于构造热带气旋强度预报因子的原始数据包括热带气旋最佳路径、NCEP分辨率为2.5°×2.5°的逐日6h间隔再分析资料和分辨率为1°×1°的周平均SST资料。拟计算的预报因子 (Xi) 包括X1~X2:热带气旋中心经纬度; X3~X4 :热带气旋中心12h移向、移速; X5~X7:热带气旋中心12h纬度变化、经度变化和总变化; X8:热带气旋地面近中心最大风速; X9~X10:热带气旋地面近中心最大风速6h及12h变化; x11~X12:热带气旋中心最低气压、海温; X13:1000hPa热带气旋中心南北两侧7.5°纬距处的基本气流切变; X14:1000hPa热带气旋中心与北侧5°纬距处的位势高度差; X15:500hPa东京、大阪、福冈的24h变高之和; X16:1000hPa热带气旋中心及与其相距2.5°东、南、西、北方向5个点的最高温度和24h最高变温之和; X17:850hPa上述5个点平均温度和平均24h变温之和; X18:500hPa上述5个点平均相对湿度和平均24h变相对湿度之和; X19~X20:700hPa汕头相对湿度及24h相对湿度变化; X21~X22:850hPa东西向、南北向分量; X23~X24:200hPa东西向、南北向分量; X25:热带气旋中心上空垂直风切变; X26~X27:850hPa及200hPa平均动量场[11];X28:K指数; X29:TT指数 (total-totals index)[11]

① 资料取自中国台风网www.typhoon.gov.cn.CMA-STI 热带气旋最佳路径数据

1.2 方法

历史热带气旋因子库建立好以后, 以单独的文件方式存放以便调用。当警戒范围内有热带气旋生成时, 首先按图 1所示流程计算相应的预报因子, 并与历史热带气旋因子库一并进入强度预报流程。热带气旋强度预报包括寻找相似热带气旋、随机选择预报因子、神经网络模型预报等过程。

图 1. 热带气旋强度预报流程图 Fig 1. The flow chart of tropical cyclone intensity forecast

寻找相似热带气旋方法包括4个步骤:首先选择日期相似, 经过试验本文将热带气旋起报日前后各30d范围内的历史热带气旋, 看作符合日期相似。其次, 将符合日期相似的历史热带气旋样本进行路径相似判断, 将热带气旋起报点设为t0, 将前30h内的路径组成矩阵DF=[Zt, Mt], 采用有限混合模型[12]对该矩阵进行聚类分析, 聚类数设为4, 将与当前热带气旋同类的历史热带气旋看作符合路径相似。第三是进行强度相似判断, 将经过前两步选择的历史热带气旋样本的最大风速与起报点热带气旋中心最大风速进行比较, 将最大风速差绝对值小于7.5m/s的历史热带气旋看作满足强度相似。最后进行强度变化相似判断, 分别进行12h和24h强度变化的比较, 判断标准依然定为7.5m/s, 满足此条件的历史热带气旋最终选定为与起报时刻热带气旋相似的历史热带气旋样本。

由于预设的因子有29个, 并非每个因子对每次热带气旋强度预报均有正的贡献, 因此在历史相似热带气旋选定后, 采用逐步回归的方法进行预报因子筛选, 其基本思想是[13]:在前3步, 只引入可能因子, 要求是该因子与预报量构成的回归方程具有最大的回归平方和。从第4步开始, 每步先考虑剔除, 将偏回归平方和最小且不显著的因子剔除出回归方程; 若无剔除, 则考虑引进, 直到既无剔除又无引进为止。这样得到的方程局部最优, 其中每个因子都是重要且显著的。

选择好预报样本和预报因子后, 可进行神经网络的训练与预测。选择BP神经网络模型, 隐含层数为1, 隐含层节点数设为6, 输出层节点设为1, 即热带气旋中心最大风速。

2 试验设计与结果分析 2.1 试验设计

将1980-2003年西北太平洋发生的热带气旋2005年发生在西北太平洋的26个热带气旋个例作为预测检验样本进行热带气旋强度预报试验, 这些个例中包含了从强热带风暴到超强台风等4个热带气旋等级, 以及不同的强度变化特征, 因此具有较强的代表性。预报的时效分别为12, 24, 36, 48, 72h, 对应每个预报时效的历史热带气旋样本的总数分别为8473, 7627, 6799, 6002, 4532个。试验目的是检验本文设计的预报流程对热带气旋强度的预报效果, 同时与采用传统线性回归方法的预报效果进行比较。

2.2 结果分析

对热带气旋强度变化预报效果的评估, 可以通过预报模型对不同热带气旋强度变化特征的描述能力来考察。热带气旋强度的变化特征大致可以分为如下几类:超强台风、迅速加强或减弱的热带气旋、再度加强的热带气旋和其他普通类型。

对于超强台风来说, 预报重点是能否准确预测出热带气旋将要达到的强度, 表 1为检验样本中超强台风在不同时效预报中热带气旋强度能够达到的最大值。根据热带气旋等级划分标准, 将底层 (近地面或近海面)中心附近最大平均风速≥51 m/s的热带气旋划分为超强台风。表 1列出了每个超强台风过程中, 采用不同预报时效得到的强度预报最大值统计, 由表 1可见, 除0406号热带气旋72 h预报、0505号热带气旋48, 72h预报以及0513号热带气旋48 h预报外, 其余个例不同预报时效的强度预报结果均达到了超强台风的标准, 图 2中给出了4个具有典型强度变化特征的热带气旋过程, 间隔12h和24h(世界时) 的强度预报结果与热带气旋最佳路径信息的比较, 可以看出预报结果不仅在强度上满足预报要求, 而且在时间上与热带气旋最佳路径信息也较为吻合。同时本预测模型再现了0402号热带气旋强度变化前期迅速加强, 后期缓慢减弱, 以及0425号热带气旋再度加强的典型特征。

表 1 不同时效超强台风强度预报最大值 Table 1 The maximum intensity for super typhoon at different forecast periods

图 2. 0406, 0505, 0402, 0425号热带气旋 12 h 和 24 h 强度预报结果与观测比较 Fig 2. Intensity predictions for tropical cyclone 0406, 0505, 0402, 0425 for 12, 24 hours

表 2给出了所有个例在12, 24, 36, 48, 72 h的平均绝对误差, 总的平均绝对误差分别为2.9, 4.1, 5.8, 6.4, 6.6 m/s。而美国国家飓风中心(N HC)公布的2004年[14]和2005年[15] 12, 24, 36, 48, 72h的平均绝对预报误差分别为3.8, 5.2, 6.4, 7.2, 8.7 m/s和3.5, 5.6, 6.9, 8.1, 10.4 m/s, 分别提高了24. 58%和19.11%, 22.14%和27.14%, 9.53%和16.28%, 10.23%和20.01%, 24.42%和36.4%, 有效预报提前了24 h左右。

表 2 12, 24, 36, 48, 72h预报时效平均绝对预报误差 Table 2 Average absolute prediction error for 12, 24, 36, 48, 72 hours of the tropical cyclone sample

图 3给出了不同预报时效的最大风速误差分布图, 经检验5个时效的误差分布均服从正态分布, 其平均绝对偏差分别为2.8, 4.1, 5.7, 6.4, 6.4 m/s, 随着预报时效的增长, 平均绝对偏差变大。其中在12, 24, 36 h预报绝对误差小于3.75 m/s的比例分别为72.5%, 54.6%和43%, 在48, 72h预报绝对误差小于6.25 m/s的比例分别为58.1%和57.5 %。

图 3. 最大风速预报误差分布柱状图 Fig 3. Error distribution of intensity forecast for the tropical cyclone sample

图 4给出了所有预报因子在不同时次的强度预报中被调用次数。总体来说, 对每一个预报因子而言, 不同的预报时效其被调用的几率不同, 但每个因子都被调用。平均而言, 从被调用次数的比例来看, 对热带气旋强度变化影响较大的因子依次为因子1, 2, 19, 20, 13, 25, 12, 8, 11等, 由于热带气旋中心位置决定了下垫面的性质和大气环流的特征, 因此在不同时效的强度预报中, 因子1, 2都是最重要的因子之一;因子19, 20的统计结果表明:汕头站是热带气旋强度变化的重要指标站, 汕头地处我国东部(23.24°N, 116.21°E), 位于强盛的西南暖湿气流中, 汕头站的700 hPa相对湿度大小及其24h变化, 能够很好地指示未来热带气旋中层水汽流入的多寡, 这对热带气旋的强度变化有重要影响。因子13的入选可以从理论上进行说明, 研究表明对流层中、低层基本气流的气旋性切变是热带气旋发生、发展的基本条件之一[16]。而环境场的垂直风切变对热带气旋强度变化的影响虽然仍存在争议, 但越来越多的人认为, 垂直风切变越强越不利于热带气旋的加强[17-20]。因此, 因子25是热带气旋强度变化的重要因子。而因子12所代表的海温则与热带气旋强度变化有着更直接的关系, 热带气旋发生、发展所需能量大部分由海洋提供, 海温越高越有利于热带气旋加强, 但在本试验中, 海温因子影响显得并不重要, 这可能与海温数据经过了空间和时间上的插值, 损失了部分有益信息有关。热带气旋在一段时间内有一个连续的移动趋势, 因此当前热带气旋的强度 (中心最低气压、最大风速, 因子8, 11) 对未来强度的变化也有影响。而中心气压越低, 最大风速越大, 两者之间有着很大的相关性。

图 4. 预报因子被调用次数统计 Fig 4. The using times of different variables for the tropical cyclone sample

3 结论和讨论

本文以神经网络方法为基础, 发展了西北太平洋热带气旋强度预报模型, 分别进行了12, 24, 36, 48, 72h等不同时效的预报试验, 得到如下初步结果:

1) 对2004-2005年26个热带气旋过程的预报试验结果表明:该模型的预报效果优于线性回归方法预报结果和美国国家飓风中心预报结果, 且对超强台风、具有强度快速变化及强度再次加强等不同特点的热带气旋都有较好的预报能力。

2) 在该预报模型中, 包含选择相似热带气旋、筛选预报因子等过程, 这些过程是预报模型不可或缺的组成部分。试验也表明:进行随机筛选预报因子不但节约计算时间, 而且能有效提高热带气旋强度变化的预报效果。

本研究尚存在许多需要改进之处, 如初始相似热带气旋的挑选仅考虑了地理、时间、路径和强度特征, 条件尚需严格和细化, 从而得到与未来热带气旋强度变化更有相关性的相似样本。同时从图3也能发现, 随着预报时效的增长, 预报模型的预报稳定性在减小, 这些问题可以通过改进神经网络的学习算法加以克服, 如采用扩展卡尔曼滤波算法对神经网络参数进行辨识, 使神经网络具有更加稳定和优越的品质, 这是下一步即将进行的工作。

参考文献
[1] Neumann C J, An Alternate to the Hurran Tropical Cyclone Forecast System. NOAA Tech Memo NWS SR-62, 1972.
[2] Pike A C, Geopotential heights and thicknesses as predictors of Atlantic tropical cyclone motion and intensity. Mon Wea Rev, 1985, 113: 931–939. DOI:10.1175/1520-0493(1985)113<0931:GHATAP>2.0.CO;2
[3] Kurihara Y, Bender M A, Tuleya R E, et al. Improvements in the GFDL hurricane prediction system. Mon Wea Rev, 1995, 123: 2791–2801. DOI:10.1175/1520-0493(1995)123<2791:IITGHP>2.0.CO;2
[4] 王诗文. 国家气象中心台风数值模式的改进及其应用试验. 应用气象学报, 1999, 10, (3): 347–353.
[5] DeMaria M, MaineMainelli M, ShAY L K, et al. Further improvements to the Statistical Hurricane Intensity Prediction Scheme (SHIPS). Wea Forecasting, 2005, 20: 531–543. DOI:10.1175/WAF862.1
[6] DeMaria M, Statistical Tropical Cyclone Intensity Forecast Improvements Using GOES And Aircraft Reconnaissance Data. 27th Conference on Hurricanes and Tropical Meteorology, 2006.
[7] Rhome J R, On the Calculation of Vertical Shear : An Operational Perspective. 27th Conference on Hurricanes and Tropical Meteorology, 2006.
[8] 金龙. 神经网络气象预报建模理论方法与应用. 北京: 气象出版社, 2004.
[9] Baik J, Hwang H, Tropical cyclone intensity prediction using regression method and neural network. J Meteor Soc Japan, 1998, 76: 711–717.
[10] McGauley M G. Hurricane Intensity Forecasting with Neural Networks. http://rsmas.miami.edu/divs/mpo/AboutMPO/Seminars/2004/0405_McGauley_Abstract.pdf
[11] Anthony V C, A Neural Network Approach to Predict Hurricane Intensity in the North Atlantic Basin. University of Puer to Rico, 2004.
[12] 钮学新. 热带气旋动力学. 北京: 气象出版社, 1992.
[13] Smyth P, Ide K, Ghil M, Multiple regimes in northern hemisphere height fields via mixture model clustering. J Atmos Sci, 1999, 56: 3704–3723. DOI:10.1175/1520-0469(1999)056<3704:MRINHH>2.0.CO;2
[14] http://www.nhc.noaa.gov/verification/pdfs/Verification2004.pdf
[15] http://www.nhc.noaa.gov/verification/pdfs/Verification2005.pdf
[16] 黄嘉佑. 气象统计分析与预报方法. 北京: 气象出版社, 2000.
[17] Ramage C S, Hurricane development. J Meteor, 1959, 16: 227–237. DOI:10.1175/1520-0469(1959)016<0227:HD>2.0.CO;2
[18] Merrill R T, Environmental influences on hurricane intensification. J Atmos Sci, 1988, 45: 1678–1687. DOI:10.1175/1520-0469(1988)045<1678:EIOHI>2.0.CO;2
[19] Christopher S V, Leslie L M, The basic relationship between tropical cyclone intensity and the depth of environmental steering layer in the Australian region. Wea Forecasting, 1991, 6: 244–253. DOI:10.1175/1520-0434(1991)006<0244:TBRBTC>2.0.CO;2
[20] DeMaria M, The effect of vertical shear on tropical cycloneintensity change. J Atmos Sci, 1996, 53: 2076–2083. DOI:10.1175/1520-0469(1996)053<2076:TEOVSO>2.0.CO;2