人工智能技术能否提高地面气温预报的精度——记AI Challenger 2018全球天气预报挑战赛

http://dx.doi.org/10.11676/qxxb2019.070
中国气象学会主办。

文章信息

嵇磊, 王在文, 陈敏, 范水勇, 王迎春, 沈志远. 2019.

JI Lei, WANG Zaiwen, CHEN Min, FAN Shuiyong, WANG Yingchun, SHEN Zhiyuan. 2019.

How much can AI techniques improve surface air temperature forecast: A report from AI Challenger 2018 Global Weather Forecast Contest

气象学报, 77(5): 960-964.

Acta Meteorologica Sinica, 77(5): 960-964.

http://dx.doi.org/10.11676/qxxb2019.070

文章历史

2019-04-26 收稿
2019-08-16 改回

引用本文

嵇磊, 王在文, 陈敏, 范水勇, 王迎春, 沈志远. 2019. 人工智能技术能否提高地面气温预报的精度——记AI Challenger 2018全球天气预报挑战赛. 气象学报, 77(5): 960-964.

Ji Lei, Wang Zaiwen, Chen Min, Fan Shuiyong, Wang Yingchun, Shen Zhiyuan. 2019. How much can AI techniques improve surface air temperature forecast: A report from AI Challenger 2018 Global Weather Forecast Contest. Acta Meteorologica Sinica, 77(5): 960-964.

人工智能技术能否提高地面气温预报的精度——记AI Challenger 2018全球天气预报挑战赛

嵇磊¹ , 王在文¹ , 陈敏¹ , 范水勇¹ , 王迎春^1,2 , 沈志远³

1. 北京城市气象研究院, 北京, 100089;
2. 北京市气象局, 北京, 100089;
3. 创新工场人工智能工程院, 北京, 100080

2019-04-26 收稿, 2019-08-16 改回

资助课题: 国家重点研发计划专项(2018YFC1506801)、国家自然科学基金项目(41505117)、中央级公益性科研院所基本科研业务费专项(IUMKY201904)

作者简介: 嵇磊, 高级工程师, 主要从事大数据、水资源、云和降水物理观测与模式研究。E-mail:lji@ium.cn.

通讯作者: 王在文, 高级工程师, 主要从事大数据、数值模式释用预报研究。E-mail:zwwang@ium.cn.

摘要: 2018年8月，北京城市气象研究院与创新工场等公司联合举办了“天气预报”竞赛（WFC）——这是一项面向全球的人工智能（AI）挑战赛，旨在通过发挥AI技术的优势提高天气预报水平。全球有超过1000支队伍参加本次WFC竞赛，约250支队伍完成了实时天气预报赛程。最终，决赛排名前5的队伍获得了奖励。竞赛结果表明：多AI模型集合方法显著提高了2 m气温、2 m相对湿度和10 m风速的预报水平。与北京城市气象研究院在业务中应用的相似集合预报方法相比，基于时间序列分析、梯度提升树、深度概率预测等AI模型构建的集合预报方法，显著提升了2 m气温预报的准确率，前2名队伍在决赛期间的预报准确率分别提升24.2%和17.0%。同时，合理的数据处理技术和AI模型集合框架对预报效果的提升具有重要的作用。

关键词: 人工智能(AI) 天气预报地面气象要素 AI集合气象模型

How much can AI techniques improve surface air temperature forecast: A report from AI Challenger 2018 Global Weather Forecast Contest

JI Lei¹ , WANG Zaiwen¹ , CHEN Min¹ , FAN Shuiyong¹ , WANG Yingchun^1,2 , SHEN Zhiyuan³

1. Institute of Urban Meteorology(IUM), Beijing 100089, China;
2. Beijing Meteorological Service, Beijing 100089, China;
3. Sinovation Ventures AI Institute, Beijing 100080, China

1 人工智能技术在气象领域的应用现状

人工智能(AI)一词最早出现在1956年的达特茅斯科学会议上，它涵盖自然科学、社会科学和技术科学的交叉领域。2006年，机器学习领域泰斗Geoffrey Hinton教授首次提出深度学习的概念，极大地提高了神经网络学习的性能，进而掀起了人工智能研究的新一轮浪潮(Hinton，2006)。近年来，人工智能技术在很多领域得到了快速发展和广泛应用。鉴于此，基于大数据和机器学习技术，如何应用人工智能建立气象预报模型，提高气象预报准确率，正成为广大气象工作者及人工智能专家们共同关心的热点科学问题之一。

目前，众多气象组织正纷纷与人工智能研究机构和公司开展合作，探索人工智能在气象领域应用的解决方案。美国AccuWeather公司与Google公司开展合作，利用云计算和人工智能技术，初步实现了0—90 d逐分钟、逐时和逐日的精细预报(https://qz.com/535345/ibm-is-going-to-change-how-we-forecast-the-weather-with-watson/)。英国气象局与美国亚马逊公司合作研发数据存储、云计算技术，同时与微软公司合作发展人工智能技术(http://www.odbms.org/2017/07/machine-learning-in-weather-forecasting/)。Earth Risk公司基于ECMWF的数值预报，通过多智能模型集合框架研发出TempRisk Apollo方法，以提供更可靠的气温概率预报(EarthRisk Technologies, 2013)。中国国家气象中心与清华大学合作，采用分布式深度学习框架、时空记忆深度循环网络算法提升了雷达回波外推预报准确率(Wang, 2018)，相比交叉相关法平均提升了40%(毕宝贵, 2017)。与此同时，AI技术已初步用于冰雹和雷暴等强对流天气的预报(Zhou, et al, 2019)。北京市气象局利用机器学习方法开展了地面温度(戴翼等, 2019)、雷暴大风(杨璐等, 2018)和强对流天气(郭瀚阳等, 2019)预报。深圳市气象局与阿里平台合作开展了基于雷达回波观测的短时临近降水预报试验(Yao, et al, 2017)。

人工智能在天气预报业务中已有初步应用，涵盖了雷暴大风(Lagerquist, et al, 2018)、降水强度(Mattioli, et al, 2018)等短时临近预报，极地暴风雪(Burrows, et al, 2018)、低能见度(Kneringer, et al, 2018)等极端灾害性天气预警。同时，人工智能在天气、气候分析中也发挥着积极的作用(Collins, et al, 2018; Kunkel, et al, 2018)。

以上成果表明，基于多源观测和全球数值预报的AI方法，在提升不同时间和空间尺度气象要素预报准确率方面都展现出一定效果。近年来，随着高性能计算和网络技术的进步，中国高分辨率区域气象数值模式预报和高时、空气象监测网建设正在逐步完善。因此，如何充分发挥两者的优势，以达到精细化气象业务预报需求，是亟需思考的问题。鉴于此，作为面向全球人工智能人才的开源平台，由创新工场(http://www.chuangxin.com/)于2017年创建的AI Challenger全球挑战赛(https://challenger.ai/news/ai_challenger)，为解决当前天气预报所面临的问题提供了契机。

2 AI Challenger 2018全球挑战赛

2018年8月29日，第二届AI Challenger全球挑战赛在北京拉开序幕。该挑战赛共包含10个竞赛项目(天气预报、无人驾驶视觉感知、农作物病害检测等)，拟通过AI技术解决行业难点问题，“用AI挑战真实世界的问题”。

立足中国首都北京气象预报业务实际需求，北京城市气象研究院作为协办方，策划并组织了“天气预报”竞赛项目(https://challenger.ai/competition/wf2018)，旨在面向全球智力资源，跨学科探寻提高未来精细化气象业务预报的新思路、新方法。“天气预报”竞赛项目吸引了来自全球1000多支队伍报名；选手覆盖中国、美国、日本、俄罗斯等19个国家和地区；参赛机构包括中国科学院大学、清华大学、北京大学、美国斯坦福大学等众多高等学府以及多家知名科技公司。最终，约有250支队伍完成了两周一次的双周赛和持续一周的决赛赛程。

3 “天气预报”竞赛项目 3.1 赛题设置

“天气预报”竞赛是2018年AI Challenger全球挑战赛的实验项目之一。该项目要求选手基于北京城市气象研究院提供的气象站点的“观测”和“睿图^①” (范水勇等, 2013)数据集，建立科学有效的AI模型，用于预报气象站点未来36 h整点的2 m气温、2 m相对湿度和10 m风速。

① “睿图”由北京城市气象研究院的数值预报系统“RMAPS”音译而来。RMAPS全称为the Rapid-refresh Multi-scale Analysis and Prediction System。

“观测”和“睿图”数据集包含了北京10个地面自动气象站点的逐时气象要素时间序列值，时段为2015年3月1日—2018年11月3日。数据集中的气象站点经纬度和站号信息对参赛队伍做了隐藏。“观测”数据集包含各气象站点的2 m气温、2 m相对湿度、10 m风速和地面气压等9个气象要素；“睿图”数据集包含29个气象要素(地面和不同气压层的温、湿、风、压等)。两组数据集共同包含1188 d训练样本和89 d验证样本，用于参赛选手搭建和调试AI模型。在此基础上，实时更新的测试集数据则分别用于双周赛和持续一周的决赛。本次竞赛提供的数据量，仅为气象行业实际天气预报业务可用数据总量的1%。参赛队伍需要基于提供的有限数据，建立AI模型，用于预报北京10个气象站点36 h内逐时的2 m气温、2 m相对湿度、10 m风速。

由于实际天气预报具有极高的时效性要求，竞赛采取实时天气预报的方式，由北京城市气象研究院在竞赛日更新发布数据集，并要求参赛队伍在数据集公布后6 h内提交预报结果。对比其他竞赛项目，“天气预报”竞赛具有更高的挑战性。实时天气预报的竞赛方式，使得“观测”和“睿图”数据集需要实时更新，无法提前准备；预报结果需要在相对较短的时间内提交，以保证实用性；决赛需要连续7 d提交预报结果，以证明AI模型的健壮性。

3.2 竞赛结果

决赛前5名队伍(AI01—AI05)被选择进入最终的答辩环节。AI01—AI05的最终成绩与目前北京城市气象研究院释用效果最好的相似集合预报方法(AnEn，王在文等, 2019)进行对比，以评估各队AI建模的性能。

评判标准如下：以AnEn预报为基准，首先计算其与观测值的均方根误差(RMSE_AnEn)，再分别计算各支队伍(AI01—AI05)的预报结果与观测值的均方根误差(RMSE_Team)。最后，各支队伍的RMSE_Team成绩相对于RMSE_AnEn的误差减小比例RMSE_P为

(1)

该方程表明，RMSE_P越大，则AI方法相对于AnEn方法的预报效果越好。由于AnEn方法是目前北京城市气象研究院最好的预报方法，因此真正优秀的AI方法必须要取得比AnEn方法更准确的预报结果。

图 1给出决赛阶段上述5支参赛队逐日的36 h预报整体评估结果。5支队伍大多采用了多AI模型集合方法，但在具体模型选择以及数据处理技巧方面，有一定区别。主要采用的AI模型有：时间序列分析(Prophet)、梯度提升树(GBM)、深度概率预测(Seq2Seq)、双向长短记忆神经网络(Bi-LSTM)、循环神经网络(RNN)、人工神经网络(ANN)等。由于每天“睿图”集提供未来36 h预报，因此相邻两天的预报，在预报时段上会有12 h重叠，部分参赛队选取重叠时段平均值作为最后结果，并对时间特征做sin/cos编码。缺失值主要采用线性插值法、多站点均值填充法、长时段(超过37 h)缺测值剔除法等。

图 1 2018年10月28日—11月3日决赛期间，前5名参赛队(AI01—AI05)预报的2 m气温(a)、2 m相对湿度(b)和10 m风速(c)的对比 Fig. 1 Percentage change of RMSE (RMSE_P) for 2 m temperature (a), 2 m relative humidity (b) and 10 m wind speed (c) from the forecasts made by the five teams (AI01-AI05), during the week-long final contest period of 28 October to 3 November 2018

图选项

整体来看(表 1)，AI01(浙江大学yuanpengli代表队)和AI02(西南交通大学CCIT007代表队)的预报技巧比AnEn方法有明显提升，且逐日预报性能较为稳定，AI03的预报技巧略逊一筹，而AI04和AI05的预报效果总体低于AnEn方法。以上结果表明：合理构建AI模型集合框架，对2 m气温、2 m相对湿度和10 m风速的预报准确率提升具有至关重要的作用。这为今后应用AI技术提高天气预报业务水平提供了有价值的参考。以2 m气温预报为例，AI01—AI03优于AnEn方法的预报效果，其中AI01和AI02的优势更加明显，比AnEn方法分别提高24.2%和17.0%。

表 1 决赛阶段AI01—AI05队伍对2 m气温、2 m相对湿度和10 m风速预报的RMSE_P周平均成绩(%) Table 1 Weekly mean RMSE_P values for 2 m temperature, 2 m relative humidity and 10 m wind speed from forecasts by AI01-AI05 (%)

RMSE_P	AI01	AI02	AI03	AI04	AI05
2 m气温	24.2	17.0	7.0	-8.3	-29.9
2 m相对湿度	12.4	9.7	-6.1	-13.2	-24.6
10 m风速	6.2	-3.3	-4.0	-4.4	-6.3

表选项

4 展望

本次“天气预报”竞赛项目共吸引全球超过1000支队伍参加。竞赛选手来自全球多个国家和地区的众多高等学府和高科技公司。在仅提供极为有限的气象数据集的条件下，本次竞赛构建的部分AI集合气象模型由于采用了较合理的智能模型组合和数据处理技巧，对2 m气温、2 m相对湿度和10 m风速等气象要素展示出较好的预报能力。其中AI01和AI02参赛队伍对2 m气温的预报准确率较AnEn方法分别提高24.2%和17.0%。

本次竞赛也存在一些不足。例如：降水预报效果并没有进行评估。然而，竞赛结果仍然表明，AI技术在气象领域拥有重大的潜力等待被发掘。未来，北京城市气象研究院也将持续探索AI技术在气象领域的应用能力，并针对社会影响广泛的天气类型，切实提高其精细化预报水平。

AI技术可以渗透到基于大数据的众多学科，目前，除了应用广泛的医疗、交通、教育等领域，其未来在气象、水文、地质等自然科学领域也将会有巨大的机遇。

致谢: 感谢创新工场CEO李开复先生，CTO王咏刚先生，吴卓浩副总裁和东静女士，以及为本次“天气预报”竞赛项目圆满举办贡献力量的所有团队成员们。感谢全球所有热情投身于本次“天气预报”竞赛项目的广大竞赛团队的大力支持与智力奉献。

参考文献

毕宝贵. 2017.智能天气预报进展及思考//2017年全国气象台长会议技术报告.银川. Bi B G. 2017. Progresses and thoughts on weather forecasting using artificial intelligence technology. Proc//National Conference of Weather Forecast Center Directors, Yinchuan, China (in Chinese)

戴翼, 何娜, 付宗钰, 等. 2019. 北京智能网格温度客观预报方法(BJTM)及预报效果检验. 干旱气象, 37(2): 339–344. Dai Y, He N, Fu Z Y, et al. 2019. Beijing intelligent grid temperature objective prediction method (BJTM) and verification of forecast result. Chinese J Arid Meteor, 37(2): 339–344. (in Chinese)

范水勇, 王洪利, 陈敏, 等. 2013. 雷达反射率资料的三维变分同化研究. 气象学报, 71(3): 527–537. Fan S Y, Wang H L, Chen M, et al. 2013. Study of the data assimilation of radar reflectivity with the WRF 3D-Var. Acta Meteor Sinica, 71(3): 527–537. (in Chinese)

郭瀚阳, 陈明轩, 韩雷, 等. 2019. 基于深度学习的强对流高分辨率临近预报试验. 气象学报, 77(4): 715–727. Guo H Y, Chen M X, Han L, et al. 2019. High resolution nowcasting experiment of severe convection based on deep learning. Acta Meteor Sinica, 77(4): 715–727. (in Chinese)

王在文, 陈敏, MonacheL D, 等. 2019. 相似集合预报方法在北京区域地面气温和风速预报中的应用. 气象学报, 77(5): 869–884. Wang Z W, Chen M, Monache L D, et al. 2019. Application of analog ensemble method to surface temperature and wind speed prediction in Beijing area. Acta Meteor Sinica, 77(5): 869–884. (in Chinese)

杨璐, 韩丰, 陈明轩, 等. 2018. 基于支持向量机的雷暴大风识别方法. 应用气象学报, 29(6): 680–689. Yang L, Han F, Chen M X, et al. 2018. Thunderstorm gale identification method based on support vector machine. J Appl Meteor Sci, 29(6): 680–689. (in Chinese)

Burrows W R, Mooney C J. 2018. Automated products for forecasting arctic blizzard conditions. J36.4 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper336043.html

Collins W, Prabhat M, Racah E, et al. 2018. Deep learning for detecting extreme weather and climate patterns. TJ7.1 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper328029.html

EarthRisk Technologies. 2013. TempRisk Apollo White Paper. http://www.earthrisktech.com/resources/reports/white_papers/TempRiskApollo_WhitePaper_Oct2013.pdf.

Hinton G E, Osindero S, Teh Y. 2006. A fast learning algorithm for deep belief nets. Neural Computation, 18: 1527–1554. DOI:10.1162/neco.2006.18.7.1527

Kneringer P, Dietz S J, Mayr G J, et al. 2018. An ordered hurdle model for probabilistic low-visibility nowcasting to support decisions at airports. J36.6 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper325064.html. Accessed on 16 August 2019

Kunkel K E, Biard J C, Racah E. 2018. Automated detection of fronts using a deep learning algorithm. TJ7.4 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper333480.html

Lagerquist R, McGovern A, Richman M B, et al. 2018. Using machine learning to forecast severe thunderstorm winds on a CONUS-Wide grid. 3.1 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper335039.html

Mattioli C J, Veillette M S, Iskenderian H. 2018. Dual application of convolutional neural networks: Forecasts of radar precipitation intensity and offshore radar-like mosaics. 695 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper323735.html

Wang Y, Long M, Wang J, et al. 2018. PredRNN: Recurrent neural networks for predictive leaning using spatiotemporal LSTMs. Proc. 31st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, CA, USA, 4-9 December 2017. http://papers.nips.cc/paper/6689-predrnn-recurrent-neural-networks-for-predictive-learning-using-spatiotemporal-lstms

Yao Y C, Li Z J. 2017. Short-term precipitation forecasting based on radar reflectivity images. Proc. International Conference on Information and Knowledge Management, Singapore, 6-10 November 2017. https://github.com/yaoyichen/CIKM-Cup-2017/blob/master/CIKM_AnalytiCup_2017_Team_Marmot.pdf

Zhou K H, Zheng Y G, Li B, et al. 2019. Forecasting different types of convective weather:A deep learning approach. J Meteor Res, 33(5).