中国气象学会主办。
文章信息
- 嵇磊, 王在文, 陈敏, 范水勇, 王迎春, 沈志远. 2019.
- JI Lei, WANG Zaiwen, CHEN Min, FAN Shuiyong, WANG Yingchun, SHEN Zhiyuan. 2019.
- 人工智能技术能否提高地面气温预报的精度——记AI Challenger 2018全球天气预报挑战赛
- How much can AI techniques improve surface air temperature forecast: A report from AI Challenger 2018 Global Weather Forecast Contest
- 气象学报, 77(5): 960-964.
- Acta Meteorologica Sinica, 77(5): 960-964.
- http://dx.doi.org/10.11676/qxxb2019.070
文章历史
-
2019-04-26 收稿
2019-08-16 改回
2. 北京市气象局, 北京, 100089;
3. 创新工场人工智能工程院, 北京, 100080
2. Beijing Meteorological Service, Beijing 100089, China;
3. Sinovation Ventures AI Institute, Beijing 100080, China
人工智能(AI)一词最早出现在1956年的达特茅斯科学会议上,它涵盖自然科学、社会科学和技术科学的交叉领域。2006年,机器学习领域泰斗Geoffrey Hinton教授首次提出深度学习的概念,极大地提高了神经网络学习的性能,进而掀起了人工智能研究的新一轮浪潮(Hinton,2006)。近年来,人工智能技术在很多领域得到了快速发展和广泛应用。鉴于此,基于大数据和机器学习技术,如何应用人工智能建立气象预报模型,提高气象预报准确率,正成为广大气象工作者及人工智能专家们共同关心的热点科学问题之一。
目前,众多气象组织正纷纷与人工智能研究机构和公司开展合作,探索人工智能在气象领域应用的解决方案。美国AccuWeather公司与Google公司开展合作,利用云计算和人工智能技术,初步实现了0—90 d逐分钟、逐时和逐日的精细预报(https://qz.com/535345/ibm-is-going-to-change-how-we-forecast-the-weather-with-watson/)。英国气象局与美国亚马逊公司合作研发数据存储、云计算技术,同时与微软公司合作发展人工智能技术(http://www.odbms.org/2017/07/machine-learning-in-weather-forecasting/)。Earth Risk公司基于ECMWF的数值预报,通过多智能模型集合框架研发出TempRisk Apollo方法,以提供更可靠的气温概率预报(EarthRisk Technologies, 2013)。中国国家气象中心与清华大学合作,采用分布式深度学习框架、时空记忆深度循环网络算法提升了雷达回波外推预报准确率(Wang, 2018),相比交叉相关法平均提升了40%(毕宝贵, 2017)。与此同时,AI技术已初步用于冰雹和雷暴等强对流天气的预报(Zhou, et al, 2019)。北京市气象局利用机器学习方法开展了地面温度(戴翼等, 2019)、雷暴大风(杨璐等, 2018)和强对流天气(郭瀚阳等, 2019)预报。深圳市气象局与阿里平台合作开展了基于雷达回波观测的短时临近降水预报试验(Yao, et al, 2017)。
人工智能在天气预报业务中已有初步应用,涵盖了雷暴大风(Lagerquist, et al, 2018)、降水强度(Mattioli, et al, 2018)等短时临近预报,极地暴风雪(Burrows, et al, 2018)、低能见度(Kneringer, et al, 2018)等极端灾害性天气预警。同时,人工智能在天气、气候分析中也发挥着积极的作用(Collins, et al, 2018; Kunkel, et al, 2018)。
以上成果表明,基于多源观测和全球数值预报的AI方法,在提升不同时间和空间尺度气象要素预报准确率方面都展现出一定效果。近年来,随着高性能计算和网络技术的进步,中国高分辨率区域气象数值模式预报和高时、空气象监测网建设正在逐步完善。因此,如何充分发挥两者的优势,以达到精细化气象业务预报需求,是亟需思考的问题。鉴于此,作为面向全球人工智能人才的开源平台,由创新工场(http://www.chuangxin.com/)于2017年创建的AI Challenger全球挑战赛(https://challenger.ai/news/ai_challenger),为解决当前天气预报所面临的问题提供了契机。
2 AI Challenger 2018全球挑战赛2018年8月29日,第二届AI Challenger全球挑战赛在北京拉开序幕。该挑战赛共包含10个竞赛项目(天气预报、无人驾驶视觉感知、农作物病害检测等),拟通过AI技术解决行业难点问题,“用AI挑战真实世界的问题”。
立足中国首都北京气象预报业务实际需求,北京城市气象研究院作为协办方,策划并组织了“天气预报”竞赛项目(https://challenger.ai/competition/wf2018),旨在面向全球智力资源,跨学科探寻提高未来精细化气象业务预报的新思路、新方法。“天气预报”竞赛项目吸引了来自全球1000多支队伍报名;选手覆盖中国、美国、日本、俄罗斯等19个国家和地区;参赛机构包括中国科学院大学、清华大学、北京大学、美国斯坦福大学等众多高等学府以及多家知名科技公司。最终,约有250支队伍完成了两周一次的双周赛和持续一周的决赛赛程。
3 “天气预报”竞赛项目 3.1 赛题设置“天气预报”竞赛是2018年AI Challenger全球挑战赛的实验项目之一。该项目要求选手基于北京城市气象研究院提供的气象站点的“观测”和“睿图①” (范水勇等, 2013)数据集,建立科学有效的AI模型,用于预报气象站点未来36 h整点的2 m气温、2 m相对湿度和10 m风速。
① “睿图”由北京城市气象研究院的数值预报系统“RMAPS”音译而来。RMAPS全称为the Rapid-refresh Multi-scale Analysis and Prediction System。
“观测”和“睿图”数据集包含了北京10个地面自动气象站点的逐时气象要素时间序列值,时段为2015年3月1日—2018年11月3日。数据集中的气象站点经纬度和站号信息对参赛队伍做了隐藏。“观测”数据集包含各气象站点的2 m气温、2 m相对湿度、10 m风速和地面气压等9个气象要素;“睿图”数据集包含29个气象要素(地面和不同气压层的温、湿、风、压等)。两组数据集共同包含1188 d训练样本和89 d验证样本,用于参赛选手搭建和调试AI模型。在此基础上,实时更新的测试集数据则分别用于双周赛和持续一周的决赛。本次竞赛提供的数据量,仅为气象行业实际天气预报业务可用数据总量的1%。参赛队伍需要基于提供的有限数据,建立AI模型,用于预报北京10个气象站点36 h内逐时的2 m气温、2 m相对湿度、10 m风速。
由于实际天气预报具有极高的时效性要求,竞赛采取实时天气预报的方式,由北京城市气象研究院在竞赛日更新发布数据集,并要求参赛队伍在数据集公布后6 h内提交预报结果。对比其他竞赛项目,“天气预报”竞赛具有更高的挑战性。实时天气预报的竞赛方式,使得“观测”和“睿图”数据集需要实时更新,无法提前准备;预报结果需要在相对较短的时间内提交,以保证实用性;决赛需要连续7 d提交预报结果,以证明AI模型的健壮性。
3.2 竞赛结果决赛前5名队伍(AI01—AI05)被选择进入最终的答辩环节。AI01—AI05的最终成绩与目前北京城市气象研究院释用效果最好的相似集合预报方法(AnEn,王在文等, 2019)进行对比,以评估各队AI建模的性能。
评判标准如下:以AnEn预报为基准,首先计算其与观测值的均方根误差(RMSEAnEn),再分别计算各支队伍(AI01—AI05)的预报结果与观测值的均方根误差(RMSETeam)。最后,各支队伍的RMSETeam成绩相对于RMSEAnEn的误差减小比例RMSEP为
(1) |
该方程表明,RMSEP越大,则AI方法相对于AnEn方法的预报效果越好。由于AnEn方法是目前北京城市气象研究院最好的预报方法,因此真正优秀的AI方法必须要取得比AnEn方法更准确的预报结果。
图 1给出决赛阶段上述5支参赛队逐日的36 h预报整体评估结果。5支队伍大多采用了多AI模型集合方法,但在具体模型选择以及数据处理技巧方面,有一定区别。主要采用的AI模型有:时间序列分析(Prophet)、梯度提升树(GBM)、深度概率预测(Seq2Seq)、双向长短记忆神经网络(Bi-LSTM)、循环神经网络(RNN)、人工神经网络(ANN)等。由于每天“睿图”集提供未来36 h预报,因此相邻两天的预报,在预报时段上会有12 h重叠,部分参赛队选取重叠时段平均值作为最后结果,并对时间特征做sin/cos编码。缺失值主要采用线性插值法、多站点均值填充法、长时段(超过37 h)缺测值剔除法等。
整体来看(表 1),AI01(浙江大学yuanpengli代表队)和AI02(西南交通大学CCIT007代表队)的预报技巧比AnEn方法有明显提升,且逐日预报性能较为稳定,AI03的预报技巧略逊一筹,而AI04和AI05的预报效果总体低于AnEn方法。以上结果表明:合理构建AI模型集合框架,对2 m气温、2 m相对湿度和10 m风速的预报准确率提升具有至关重要的作用。这为今后应用AI技术提高天气预报业务水平提供了有价值的参考。以2 m气温预报为例,AI01—AI03优于AnEn方法的预报效果,其中AI01和AI02的优势更加明显,比AnEn方法分别提高24.2%和17.0%。
RMSEP | AI01 | AI02 | AI03 | AI04 | AI05 |
2 m气温 | 24.2 | 17.0 | 7.0 | -8.3 | -29.9 |
2 m相对湿度 | 12.4 | 9.7 | -6.1 | -13.2 | -24.6 |
10 m风速 | 6.2 | -3.3 | -4.0 | -4.4 | -6.3 |
本次“天气预报”竞赛项目共吸引全球超过1000支队伍参加。竞赛选手来自全球多个国家和地区的众多高等学府和高科技公司。在仅提供极为有限的气象数据集的条件下,本次竞赛构建的部分AI集合气象模型由于采用了较合理的智能模型组合和数据处理技巧,对2 m气温、2 m相对湿度和10 m风速等气象要素展示出较好的预报能力。其中AI01和AI02参赛队伍对2 m气温的预报准确率较AnEn方法分别提高24.2%和17.0%。
本次竞赛也存在一些不足。例如:降水预报效果并没有进行评估。然而,竞赛结果仍然表明,AI技术在气象领域拥有重大的潜力等待被发掘。未来,北京城市气象研究院也将持续探索AI技术在气象领域的应用能力,并针对社会影响广泛的天气类型,切实提高其精细化预报水平。
AI技术可以渗透到基于大数据的众多学科,目前,除了应用广泛的医疗、交通、教育等领域,其未来在气象、水文、地质等自然科学领域也将会有巨大的机遇。
致谢: 感谢创新工场CEO李开复先生,CTO王咏刚先生,吴卓浩副总裁和东静女士,以及为本次“天气预报”竞赛项目圆满举办贡献力量的所有团队成员们。感谢全球所有热情投身于本次“天气预报”竞赛项目的广大竞赛团队的大力支持与智力奉献。
毕宝贵. 2017.智能天气预报进展及思考//2017年全国气象台长会议技术报告.银川. Bi B G. 2017. Progresses and thoughts on weather forecasting using artificial intelligence technology. Proc//National Conference of Weather Forecast Center Directors, Yinchuan, China (in Chinese) |
戴翼, 何娜, 付宗钰, 等. 2019. 北京智能网格温度客观预报方法(BJTM)及预报效果检验. 干旱气象, 37(2): 339–344. Dai Y, He N, Fu Z Y, et al. 2019. Beijing intelligent grid temperature objective prediction method (BJTM) and verification of forecast result. Chinese J Arid Meteor, 37(2): 339–344. (in Chinese) |
范水勇, 王洪利, 陈敏, 等. 2013. 雷达反射率资料的三维变分同化研究. 气象学报, 71(3): 527–537. Fan S Y, Wang H L, Chen M, et al. 2013. Study of the data assimilation of radar reflectivity with the WRF 3D-Var. Acta Meteor Sinica, 71(3): 527–537. (in Chinese) |
郭瀚阳, 陈明轩, 韩雷, 等. 2019. 基于深度学习的强对流高分辨率临近预报试验. 气象学报, 77(4): 715–727. Guo H Y, Chen M X, Han L, et al. 2019. High resolution nowcasting experiment of severe convection based on deep learning. Acta Meteor Sinica, 77(4): 715–727. (in Chinese) |
王在文, 陈敏, MonacheL D, 等. 2019. 相似集合预报方法在北京区域地面气温和风速预报中的应用. 气象学报, 77(5): 869–884. Wang Z W, Chen M, Monache L D, et al. 2019. Application of analog ensemble method to surface temperature and wind speed prediction in Beijing area. Acta Meteor Sinica, 77(5): 869–884. (in Chinese) |
杨璐, 韩丰, 陈明轩, 等. 2018. 基于支持向量机的雷暴大风识别方法. 应用气象学报, 29(6): 680–689. Yang L, Han F, Chen M X, et al. 2018. Thunderstorm gale identification method based on support vector machine. J Appl Meteor Sci, 29(6): 680–689. (in Chinese) |
Burrows W R, Mooney C J. 2018. Automated products for forecasting arctic blizzard conditions. J36.4 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper336043.html |
Collins W, Prabhat M, Racah E, et al. 2018. Deep learning for detecting extreme weather and climate patterns. TJ7.1 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper328029.html |
EarthRisk Technologies. 2013. TempRisk Apollo White Paper. http://www.earthrisktech.com/resources/reports/white_papers/TempRiskApollo_WhitePaper_Oct2013.pdf. |
Hinton G E, Osindero S, Teh Y. 2006. A fast learning algorithm for deep belief nets. Neural Computation, 18: 1527–1554. DOI:10.1162/neco.2006.18.7.1527 |
Kneringer P, Dietz S J, Mayr G J, et al. 2018. An ordered hurdle model for probabilistic low-visibility nowcasting to support decisions at airports. J36.6 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper325064.html. Accessed on 16 August 2019 |
Kunkel K E, Biard J C, Racah E. 2018. Automated detection of fronts using a deep learning algorithm. TJ7.4 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper333480.html |
Lagerquist R, McGovern A, Richman M B, et al. 2018. Using machine learning to forecast severe thunderstorm winds on a CONUS-Wide grid. 3.1 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper335039.html |
Mattioli C J, Veillette M S, Iskenderian H. 2018. Dual application of convolutional neural networks: Forecasts of radar precipitation intensity and offshore radar-like mosaics. 695 in Proc. Annual Meeting of the Amer Meteor Soc, Austin, Texas, 6-11 January 2018. http://ams.confex.com/ams/98Annual/webprogram/Paper323735.html |
Wang Y, Long M, Wang J, et al. 2018. PredRNN: Recurrent neural networks for predictive leaning using spatiotemporal LSTMs. Proc. 31st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, CA, USA, 4-9 December 2017. http://papers.nips.cc/paper/6689-predrnn-recurrent-neural-networks-for-predictive-learning-using-spatiotemporal-lstms |
Yao Y C, Li Z J. 2017. Short-term precipitation forecasting based on radar reflectivity images. Proc. International Conference on Information and Knowledge Management, Singapore, 6-10 November 2017. https://github.com/yaoyichen/CIKM-Cup-2017/blob/master/CIKM_AnalytiCup_2017_Team_Marmot.pdf |
Zhou K H, Zheng Y G, Li B, et al. 2019. Forecasting different types of convective weather:A deep learning approach. J Meteor Res, 33(5). |