气象学报  2019, Vol. 77 Issue (5): 869-884   PDF    
http://dx.doi.org/10.11676/qxxb2019.044
中国气象学会主办。
0

文章信息

王在文, 陈敏, Luca Delle Monache, 卢冰, 张涵斌. 2019.
WANG Zaiwen, CHEN Min, Luca Delle Monache, LU Bin, ZHANG Hanbin. 2019.
相似集合预报方法在北京区域地面气温和风速预报中的应用
Application of analog ensemble method to surface temperature and wind speed prediction in Beijing area
气象学报, 77(5): 869-884.
Acta Meteorologica Sinica, 77(5): 869-884.
http://dx.doi.org/10.11676/qxxb2019.044

文章历史

2018-06-19 收稿
2018-12-27 改回
相似集合预报方法在北京区域地面气温和风速预报中的应用
王在文1 , 陈敏1 , Luca Delle Monache2 , 卢冰1 , 张涵斌1     
1. 北京城市气象研究院, 北京, 100089;
2. 美国国家大气研究中心, 科罗拉罗, 博尔德, 80307
摘要: 相似集合是近年来提出的一种基于相似理论、大数据挖掘和集合预报思路的统计释用方法。文中首先介绍了相似集合的基本原理,并应用该方法对北京快速更新循环数值预报系统(BJ-RUC)v3.0预报地面要素开展了订正释用试验。结果表明,相似集合订正后,在0—36 h预报时段内,10 m风速的均方根误差降低44%,2 m气温的均方根误差降低22%,均方根误差均显著减小。对比测站预报误差的水平分布,相似集合方法的应用对于提升非城区站点的10 m风速预报、复杂地形区域的2 m气温预报具有更为明显的效果。相同预报因子的相似集合和支持向量机方法对模式10 m风速和2 m气温预报均具有显著且相似的订正效果,但相似集合方法具有计算资源需求较少、不需要大量人工干预的优势。相似集合方法形成的集合较好地模拟了模式平均误差的增长情况,集合离散度与集合平均均方根误差表现出理想的统计一致性,即相似集合方法在形成确定性预报的同时,还能够提供预报要素的不确定性或概率信息。因此,相似集合方法在模式预报订正及释用方面具有广阔的应用前景。
关键词: 相似集合    支持向量机    要素释用    集合预报    
Application of analog ensemble method to surface temperature and wind speed prediction in Beijing area
WANG Zaiwen1 , CHEN Min1 , Luca Delle Monache2 , LU Bin1 , ZHANG Hanbin1     
1. Institute of Urban Meteorology, China Meteorological Administration, Beijing 100089, China;
2. National Center for Atmospheric Research, Boulder Colorado 80307, USA
Abstract: Analog Ensemble (AnEn) is a statistical interpretation method that is based on similarity theory,big data mining and ensemble forecasting. The basic principle of this method is introduced first. It is then applied to revise the ground elements predicted by BJ-RUCv3.0. The results show that the root-mean-square-errors (RMSEs) of 10 m wind speed and 2 m temperature are significantly decreased during the forecast lead times of 0-36 h after using AnEn. The RMSE of 10 m wind speed is decreased by 44%,and the RMSE of 2 m temperature is decreased by 22%. Comparing horizontal distribution of prediction errors at stations,it is found that the application of the AnEn method has more obvious effects for 10 m wind speed prediction at non-urban stations and 2 m temperature prediction at complex terrain area stations. AnEn and Support Vector Machines (SVM) with the same predictors have significant and similar effects on Numerical Weather Prediction (NWP) model predictions of 10 m wind speed and 2 m temperature. However,the AnEn method has the advantage of needing less computing resource and less manual intervention. The pattern of average error growth can be well simulated by the AnEn method,and the RMSE of AnEn mean and average ensemble spread show ideal statistical consistency. It not only yields deterministic predictions,but also provides uncertainty or probability information for the prediction factors. Therefore,the AnEn method will have a broad application prospect in NWP model interpretation prediction.
Key words: AnEn    SVM    Elements prediction    Ensemble    
1 引言

数值预报随大气探(遥)测能力、高性能计算能力的不断提升,近几十年来预报能力和水平获得了长足进步,已经成为现代天气预报最为重要的核心技术手段。但是,由于数值方法、初始条件的不确定性、模式对非线性物理过程描述以及大气本身可预测程度存在不确定性等原因,数值预报结果与实际观测相比仍然存在误差。近30年来,在尽可能减小模式预报误差,提升要素预报水平方面,大量研究及实际业务应用均采用统计方法对模式输出结果做订正。具体到方法学层面,主要形成了基于多元线性回归的模式输出统计方法(MOS) (丁士晟, 1985;陈豫英等, 2006;罗菊英等, 2014;吴启树等,2016)、完全预报(PP)法等;从2003年开始,基于统计学习理论的支持向量机(SVM)作为解决小样本、非线性、高维数的统计方法,开始在数值预报产品释用及气象研究业务中得到应用(陈永义等,2004;冯汉中等, 2004, 2005;熊秋芬等, 2007, 2008;王在文等,2012;何娜等,2013;丁煌等,2013)。上述方法在近几十年的科研和业务预报中逐渐发展和完善,也获得了较大的成功。相似预报(Van den Dool, 1987, 1989)也是其中一种得到广泛应用的方法,该方法“从众多的历史个例中找出一个与当前形势相似程度非常高的个例,则可以认为引起当前形势演变的全部机制都基本上隐含在这个历史个例中,因此,可以直接根据历史相似个例的演变作为当前预报的基础”(陶祖钰等,2016)。在实际应用中一般是利用模式的预报结果,构建与预报对象相关较强且相互独立的预报因子,根据当前与历史资料集中预报因子的相似度,利用历史观测来提供当前预报。例如Barnett等(1978)通过经验正交函数分解对多维状态空间进行降维, 提取出描述气候系统演变的“气候状态向量”进行相似选取,应用于地面气温异常区域预测并证明具有有效预报技能。相似方法已广泛应用于海温预报(任福民等,2001)、旬天气客观相似预报(钟元等,1991)、华北汛期降水预报(杨杰等,2011)和热带气旋短期预报(刘春霞,2002)等;相似方法也越来越多地用于短时临近预报方法的研发,例如地形降水的临近预报(Panziera, et al,2011),采用人工神经网络建立的相似天气形势分类(Michaelides, et al, 2007)等;统计-动力相结合的相似误差订正法也得到了发展和应用(任宏利等, 2005, 2006于海鹏等,2014)。近年来,一种基于相似理论、大数据挖掘和集合预报思路的统计释用方法——相似集合(AnEn)(Monache, et al, 2013)被提出并逐步得到应用。该方法假设长期、稳定的数值模式对于同一地点、相同起报时间和预报时效具有稳定的预报性能,通过寻找与当前预报最相似的若干历史预报,由其预报量的观测值组成相似集合,并运用集合预报相关的概念形成订正后的确定性预报及概率预报。相似集合方法在站点气象要素预报和风能、太阳能的预报应用中已经获得初步成功(Alessandrini et al, 2014, 2015; Nagarajan, et al, 2015)。

北京城市气象研究所于2002年开始研发建立北京快速更新循环数值预报系统(BJ-RUC),在资料同化以及模式物理偏差成因分析等方面开展了大量工作(仲跻芹等, 2010, 2017;陈敏等,2014;范水勇等,2013;卢冰等,2017),模式系统至今已经更新了3个版本,预报精度有明显的提升(刘梦娟等,2014闵晶晶,2014);基于BJ-RUC的数值模式预报结果,也开展了一系列的预报产品解释应用研究,如基于BJ-RUC系统的临近探空及其对强对流发生潜势预报的指示(陈敏等,2011),基于BJ-RUC产品的小区供暖供回水温度预报(李迅等,2015)及多模式气温的集成预报(吴振玲等,2014)。边界层内的气象要素预报,特别是近地面的气象要素(如10 m风、2 m气温等)预报,对基于模式预报的应用和服务至关重要。王在文等(2012)采用支持向量机方法发展了基于MM5预报系统的测站气象要素释用技术,并应用于2008年奥运场馆的2 m气温、10 m UV风和2 m比湿的预报,且预报精度均有明显提升。

基于前述研究,本研究发展了相似集合基于BJ-RUCv3.0系统的模式预报结果释用及预报误差订正、并提供确定性和概率预报的技术。以北京地区174个自动气象站2 m气温和10 m风速为预报对象,分析相似集合方法在模式地面要素预报误差订正方面的应用效果,并与支持向量机等统计释用方法的检验对比来探讨相似集合未来的应用潜力。

2 相似集合方法

首先将相似预报的思路应用于数值预报结果的解释应用及误差订正,本研究假设,对于相似的天气状况,在长期、稳定的数值模式预报中也应当形成相似的预报结果并具备相似的预报误差分布特征(Monache, et al, 2013)。基于该假定条件,选取与预报要素物理相关的若干预报因子构建模式预报的多维向量FtAt,其中Ft是模式对于未来t时刻的确定性预报,At则是模式在该空间位置上起报时间相同、预报时效相同的历史时刻t′的预报,并按(Monache, et al, 2013)

(1)

计算历史预报与当前预报的“相似度”。l为所选取预报因子个数,Fi, tAi, t分别为第i个因子在预报时刻t和历史时刻t′的模式预报值,σfi为第i个预报因子的时间序列误差标准差,wi为各因子的权重(所有因子权重累积值为1,通过设置不同权重组合,对比其预报效果来确定最优权重组合),为时间窗(文中,即取当前预报和其前后各1个预报时次参与计算),‖Ft-At‖可以认为是t′时刻的预报与t时刻预报在l维向量空间中的“距离”,式(1)计算的值越小则代表t′时刻与t时刻相似度越高。利用此式计算出历史样本数据集中与当前预报时刻t“距离”最小、最具相似性的n个历史预报对应的实际观测值构建n个成员的集合,由此可以应用集合预报的相关概念来获得对应要素的确定性和概率预报。其中要素的相似集合确定性预报计算为(Monache, et al, 2013)

(2)

式中,为第i个历史预报相应观测值的权重,‖Ft-Ati‖为按式(1)计算得到的第i个历史预报与当前预报的“距离”,n为集合成员数,Oi是第i个历史预报相应观测值。

参考Monache等(2013),相似集合预报的实现流程如图 1所示。假定所需预报为t=0时刻起始的24 h预报,根据所选预报因子的模式预报结果,分3步实现相似集合预报:(1)选定l个预报因子,对相同起报时间、相同预报时效的历史样本数据集用式(1)计算各样本与当前预报的相似度,并依据其值进行排序,选出其中前n个(文中n=20)具有最大相似度的历史预报。(2)找出这最相似的n个预报对应的观测值构建相似集合。(3)根据式(2)计算权重,对这n个观测值权重平均后即得到相似集合确定性预报。

图 1  相似集合方法预报流程 Fig. 1  The flowchart of AnEn method
3 相似集合方法在北京区域站点地面要素预报中的应用 3.1 资料和方法

以2016年12月18日—2017年3月27日共计100 d内BJ-RUCv3.0系统03时(世界时,下同)起始的0—36 h、北京地区174个自动气象站逐时预报为相似集合方法的释用对象。

从物理角度考察相关性和最优权重计算资源需求确定10 m风速和2 m气温的相似集合预报采用4个预报因子(即式(1)中l=4),在固定了l个预报因子后,考虑相似度并不是从单个因子的作用出发,而是考虑在l维预报因子构成的向量空间内的相似度状况,单个因子的影响会被弱化,预报因子越多(l越大),单个因子的影响越弱,单独考虑某个因子是否有益意义不大;文中选取的预报因子如表 1

表 1  10 m风速和2 m气温预报所选取的预报因子 Table 1  Physical variables selected from model output for 10 m wind speed and 2 m temperature prediction
预报量 10 m风速 2 m气温
预报因子 10 m风速 10 m风速
10 m风向 2 m气温
2 m气温 2 m比湿
地面气压 地面气压

对每个预报时次采用其过去2年内(即2015年3月1日—2017年3月27日)BJ-RUCv3.0系统在该站的模式历史预报根据式(1)计算相似度,应用其对应实况观测构建20个成员的相似集合(即n=20),并根据式(2)形成最终的确定性预报。实际应用于相似集合训练的模式数据为BJ-RUCv3.0系统2015年3月1日—2017年3月27日(共758 d)03时起始的0—36 h预报结果。对应的实况数据为2015年3月1日03时—2017年3月28日15时逐时北京自动气象站10 m风速(2 min平均)和2 m气温(1 min平均)观测。站点分布如图 2,其中阴影为模式中的地形高度(下同)。

图 2  所选取的北京区域174个自动气象站分布 Fig. 2  Distribution of 174 automatic weather stations (AWS) selected in Beijing area

保持其他参数不变,对比n取值为10、15、20、25、30时,预报样本集10 m风速和2 m气温相似集合预报均方根误差大小可知,n=20时2 m气温和10 m风速均方根误差累加最小,因此,文中统一取n=20;这里n取固定值而不是按相似度阈值(即“距离”大小)来确定相似历史预报,是因为固定阈值时,会存在某些时次满足条件的历史预报很多,而某些时次很少,没有统一的预报成员数,则不能实现相似集合预报中的“集合”。

3.2 相似集合方法释用结果分析 3.2.1 检验指标

均方根误差

预报偏差

式中,n为总样本数,fi为第i个样本的预报值,oi为第i个样本的观测值。均方根误差的大小直接决定预报精度,预报偏差表征预报相对观测的整体偏离度。

3.2.2 相似集合和模式预报按预报时效的检验对比

图 34分别给出了北京地区174个自动气象站10 m风速和2 m气温2016年12月18日—2017年3月27日0—36 h模式预报和相似集合订正后均方根误差和预报偏差的箱线。由此可见,模式预报的10 m风速预报偏差和均方根误差的四分位间距(上下四分位数间的距离)均为1—1.5 m/s,均方根误差(所有站点该时次预报均方根误差平均)为1—2 m/s;经相似集合方法订正后,所有时次的预报偏差四分位间距减至0.2 m/s左右,预报偏差中位数和平均值均在0 m/s附近,即基本达到无偏的状态;均方根误差中位数和平均值分布在1 m/s附近,且其四分位间距缩至0.5 m/s左右,因此,无论是从误差数值还是误差分布上来看相似集合订正较模式预报改进幅度明显。

图 3  北京174个自动气象站0—36 h的10 m风速相似集合预报和模式预报均方根误差和预报偏差箱线 (a. BJ-RUCv3.0预报均方根误差,b.相似集合预报均方根误差,c. BJ-RUCv3.0预报偏差,d.相似集合预报偏差;黑色曲线代表平均均方根误差或平均偏差) Fig. 3  Boxplots for RMSE and BIAS of 10 m wind speed predicted by AnEn and BJ-RUCv3.0 at 174 AWS in Beijing area at various lead times (a. RMSE of BJ-RUCv3.0, b. RMSE of AnEn, c. BIAS of BJ-RUCv3.0, d. BIAS of AnEn; Black lines show average values)
图 4  同图 3,但为2 m气温 Fig. 4  Same as Fig. 3 but for 2 m temperature

2 m气温预报偏差和均方根误差均存在明显的日变化特征。从BJ-RUCv3.0预报偏差的中位数及四分位间距分布可以看出,模式预报的2 m气温在t=1—8 h和t=24—30 h两个对应白天预报时段均表现为明显的负偏差,且t=24—30 h较t=1—8 h偏冷程度更甚;而在t=11—22 h所在的夜间时段内气温预报平均误差中位数虽然在0℃附近,但其四分位间距及大误差的多个异常值造成模式在夜间气温预报整体偏高。应用相似集合方法订正后,2 m气温的0—36 h预报整体几乎无偏,且均方根误差明显下降,可以认为采用相似集合订正后模式2 m气温夜间偏高、白天偏低的预报系统性偏差得到了显著的修正。

3.2.3 空间应用效果检验

考察10 m风速预报偏差和均方根误差的分布(图 5)可以发现,由于BJ-RUCv3.0系统中耦合了优化的城市冠层模式(张亦洲等, 2013),城区的10 m风速均方根误差整体均低于1.5 m/s,预报效果优于其他地面属性类型;应用相似集合方法后10 m风速预报偏差接近0 m/s,均方根误差明显降低,但相似集合在非城市地区应用效果更为显著,尤其在北京东北、西北山区,均方根误差减小最大可达77.12%。

图 5  北京地区174个测站2016年12月18日— 2017年3月27日0—36 h 10 m风速预报的均方根误差(单位:m/s;a.模式预报,b.相似集合预报),预报偏差(单位:m/s;d.模式预报,e.相似集合预报);相似集合预报相对BJ-RUCv3.0预报均方根误差减小百分率(c, 单位:%) Fig. 5  RMSE of 0-36 h 10 m wind speed prediction from 18 December 2016 to 27 March 2017 at 174 AWS in Beijing area (unit: m/s; a. BJ-RUCv3.0, b. AnEn), BIAS (unit: m/s; d. BJ-RUCv3.0, e. AnEn), and percentage RMSE decrease in predictions by AnEn method compared to that by BJ-RUCv3.0 at the selected stations (c, unit: %)

模式预报的2 m气温均方根误差(图 6)最大值为4.8℃,最小值为1.9℃,直观上看北京地区2 m气温预报在地形复杂地区具有更为明显的预报误差,平原地区气温预报误差相对较小。经过相似集合方法释用后,均方根误差最大和最小值分别为3.3和1.5℃,释用后预报性能提升为4.52%—47.1%。

图 6  同图 5,但为2 m气温 Fig. 6  Same as Fig. 5 but for 2 m temperture

边界层、陆面过程、辐射等多个物理参数化过程均与模式2 m气温预报性能表现密切相关。但就一般而言,与实测和模式地形高度差异相关的气温预报误差往往表现为模式预报系统性偏差的一部分,可以通过统计订正的办法部分修正。图 7给出各测站模式预报和相似集合订正后的2 m气温预报误差按测站模式地形高度由小到大排序后的分布。可以看出,山区测站的2 m气温预报相对于平原地区整体误差分布具有十分明显的四分位间距差异,这表明复杂地形区域的气温预报误差较平原地区具有更大的不确定性;而相似集合方法订正后各个测站的2 m气温预报偏差均接近无偏,且其四分位间距明显较模式预报更为收敛在0℃附近,平均均方根误差也基本稳定在2℃左右,加上其相对模式预报更小的四分位间距分布,表明相似集合方法释用后各个测站的气温预报误差水平均明显降低,但山区测站的释用效果更为显著。

图 7  2 m气温相似集合(b、d)和BJ-RUCv3.0(a、c)预报均方根误差(a、b)和预报偏差(c、d)箱线及BJ-RUCv3.0模式站点地形高度(e) Fig. 7  Boxplots for RMSE (a, b) and BIAS (c, d) of 2 m temperature predicted by AnEn (b, d) and BJ-RUCv3.0 (a, c), and the terrain height at stations in BJ-RUCv3.0 (e)
3.2.4 模型预报效果检验

利用所建相似集合预报模型对2017年3月28日—2018年3月27日北京174个站10 m风速和2 m气温进行预报试验,检验其预报效果。

10 m风速相似集合预报在夏半年(2017年5月15日—10月26日)效果更好,均方根误差较小,日变化亦小;2 m气温的相似集合预报全年均方根误差差别不明显,没有明显的季节变化(图 8);相对BJ-RUCv3.0模式预报,全年均方根误差平均10 m风速降低46%,2 m气温降低22%。

图 8  2017年3月28日—2018年3月27逐日检验均方根误差 (a. 10 m风速, b. 2 m气温) Fig. 8  Time series of RMSE from 28 March 2017 to 27 March 2018 (a. 10 m wind speed, b. 2 m temperature)
4 相似集合与支持向量机方法站点要素预报释用效果对比

支持向量机是一种以统计学习理论为基础的非线性学习方法,根据陈永义等(2004),最终回归函数的形式为

(3)

式中,Xi为样本因子向量,X为待预报因子向量,αiαi*b为建立支持向量机模型待确定的系数,γ为核参数。式(3)中K(X, Xi)=exp(X-Xi2)为选用的径向基核函数;通过调整系数(αi-αi*)和核参数(γ)的取值对支持向量机模型进行优化。

基于王在文等(2012)应用支持向量机方法开展基于MM5模式对北京奥运场馆要素预报的释用经验,采用2015年3月1日—2016年12月17日冬半年(11月—次年4月)BJ-RUCv3.0模式03时起始的0—36 h北京地区174个自动气象站逐时预报作为样本集训练建立支持向量机预报模型。其样本因子向量的选择与表 1一致。应用支持向量机预报模型对同一时段(2016年12月18日—2017年3月27日,共计100 d)进行测站地面要素释用预报,并对BJ-RUCv3.0、相似集合和支持向量机预报进行对比检验评估。

对比相似集合和支持向量机两种不同释用方法的订正效果(图 9)可以发现,二者对模式10 m风速和2 m气温预报均具有显著的订正效果,且订正后的均方根误差达到非常接近的水平,但相似集合预报的10 m风速仍然存在明显的负平均偏差(-0.126 m/s),而支持向量机的2 m气温预报具有明显的正偏差(0.17℃)。表 2定量给出了两种方法在订正效果的对比。

图 9  北京174个自动气象站BJ-RUCv3.0、相似集合和支持向量机预报0—36 h的检验对比 (a. 10 m风速均方根误差,b. 10 m风速预报偏差,c. 2 m气温均方根误差,d. 2 m气温预报偏差) Fig. 9  Verifications of BJ-RUCv3.0, AnEn and SVM predictions at 174 AWS in Beijing area at 0-36 h lead times (a. RMSE of 10 m wind speed prediction, b. BIAS of 10 m wind speed prediction, c. RMSE of 2 m temperature prediction, d. BIAS of 2 m temperature prediction)
表 2  174个站点、37个预报时次统计的10 m风速和2 m气温预报检验对比 Table 2  Comparison of deterministic verifications of 10 m wind speed and 2 m temperature predictions at 174 AWS and 37 lead times
10 m风速(m/s) 2 m气温(℃)
RMSE BIAS RMSE BIAS
BJ-RUCv3.0 2.062 0.756 2.836 -0.524
支持向量机 1.144 0.043 2.196 0.170
相似集合 1.146 -0.126 2.214 -0.084
注:黑斜体下划线预报效果最好。

2 m气温预报准确率定义为预报偏差在[-2℃, 2℃]的样本数占总样本数的百分比。相对BJ-RUCv3.0的预报,相似集合和支持向量机预报准确率均提高15%左右(图 10),比较而言,支持向量机的预报准确率略优于相似集合,但差距甚微。

图 10  北京174个自动气象站2 m气温BJ-RUCv3.0、相似集合和支持向量机预报准确率对比 Fig. 10  The accuracy of 2 m temperature predictions at 174 AWS in Beijing area using BJ-RUCv3.0 model, AnEn method and SVM method

尽管两种方法具有相似的订正效果,但是需要指出的是,同样作为解决非线性问题的学习方法,相似集合与支持向量机的实际建模-预报过程仍然具有不同的特点。相似集合方法并不试图建立固定的预报模型,模式每一次业务运行的结果均为相似集合下一次运行相似度的计算提供新的潜在样本,同时随着预报样本的不断积累,由模式预报因子构成的多维向量的动态相似度计算匹配度可能更高,因此其组成的观测集合更能反映预报对应的可能情况,实际订正效果将越来越好;与之相比,支持向量机方法需要基于一定长度的固定训练数据集来针对某预报变量建立固定的预报模型,建模总量为站点数×预报时次×预报量,而且每个模型都需要调整优化建模参数;考虑到其只基于有限样本建模,也需要经常对预报模型进行更新才能保证其预报性能。因此,分析两种方法的建模效率,可以认为相似集合方法在实际应用中更加易于实现,更具有灵活性。

相似集合的缺点是随着预报因子增加,计算最优权重(遍历法,文中最优权重以0.1为最小变数,即每个预报因子可取0.0,0.1,…,1.0共11种可能权重)的计算量倍数增加,选取4个预报因子时,需286次计算找到最优权重,选取14个预报因子时,需1144066次计算找到最优权重,这就限制了不能选取较多的预报因子来提供相似集合预报, 计算最优权重所需次数公式为

(4)

式中,n为选取的预报因子数,f(n)为计算最优权重次数。

5 集合性能评估

相似集合有别于其他统计释用方法的一个重要特点是该方法基于相似性由过往的历史观测组成集合,不仅可以通过集合平均的方法获得要素的确定性预报,同时还可以应用集合预报的概念产生预报要素的不确定性或概率信息。因此,通过对概率预报中常用的几个关键属性进行考察来评估分析相似集合形成的集合品质。

5.1 集合离散度和均方根误差

离散度计算公式为

式中,n为集合成员数,fi为各成员的预报结果,fave为集合平均预报结果。

集合离散度(即所有样本离散度平均)与集合平均均方根误差是否接近是检验集合预报系统可靠程度的一个重要指标。集合离散度表示集合对预报不确定性的描述能力,而集合平均均方根误差作为集合平均与观测值的差异,用来衡量集合预报误差的大小。

集合离散度和集合平均误差越接近,表示集合离散度越能够代表系统的误差演变特征,集合系统越可靠(Talagrand, et al, 1997)。图 11分别给出了0—36 h预报时效内174个自动气象站相似集合预报10 m风速和2 m气温集合离散度与集合平均均方根误差的对比。10 m风速的集合离散度略低于集合平均均方根误差,但二者展现出较好的一致性,表明相似集合较好地模拟了平均误差的增长情况。对于2 m气温而言,二者非常接近,但在0—7和20—22 h两个时段内集合离散度略高于平均均方根误差,在32—36 h时段内略低于平均均方根误差,但整体上相似集合的离散度和集合平均均方根误差之间表现出理想的统计一致性。

图 11  0—36 h预报的相似集合平均均方根误差和集合预报离散度 (a. 10 m风速,b. 2 m气温) Fig. 11  RMSE of AnEn mean and average ensemble spread at 0-36 h forecast lead times (a. 10 m wind speed, b. 2 m temperature)
5.2 Talagrand分布

Talagrand分布(Wilks, 2006Hamill, 2001)是评估集合预报系统可靠性的一个指标。根据集合预报原理,在统计学意义上,每个成员出现是等概率的,那么对于n个成员所构成的n+1个集合成员区间,实况落在这n+1个区间的概率是相等的。以实况值落在这n+1个区间的累积频率来描述集合预报的可靠性,一般称为Talagrand分布(皇甫雪官,2002)。对一个理想集合预报系统而言,其Talagrand分布应该是平直的(杜钧, 2002),而U型分布表示集合系统的发散度不足,J和L型分布则表明集合系统存在明显的系统性偏差。图 12给出的是10 m风速和2 m气温174个自动气象站的相似集合的总Talagrand分布,可以看出,尽管2 m气温有些过发散,但整体上对每个等级区间基本都达到了均匀分布,代表观测落在各成员区间的频率基本相当,即通过相似集合方法建立的10 m风速和2 m气温预报集合均达到了集合预报对可靠性的要求。

图 12  相似集合预报的Talagrand分布 (a. 10 m风速,b. 2 m气温) Fig. 12  Talagrand histogram of AnEn predictions (a. 10 m wind speed, b. 2 m temperature)
5.3 集合预报产品

根据前文的分析,可以看到相似集合性能可靠,因此,可以基于相似集合提供一系列概率集合预报产品。图 13给出了10 m风速和2 m气温可以同时展现模式预报、相似集合平均以及置信区间的预报结果。很明显,与模式输出确定性预报相比,相似集合平均与实际观测更加吻合,而且其2.5%—97.5%置信区间也表达了预报的概率范围,具有明确的指示意义。

图 13  单站地面要素相似集合和模式预报对比 (a. A1320站(模式地形高度907 m)预报的2016年12月21日03时—22日15时10 m风速, b.A1366站(模式地形高度950 m)预报的2017年2月8日03时—9日15时2 m气温;绿色实线为模式预报,红色实线为相似集合平均预报,黑色实线为实际观测,阴影代表 95%置信区间) Fig. 13  AnEn and BJ-RUCv3.0 forecasts of surface elements at single AWS (a. 10 m wind speed predictions from 03:00 UTC 21 December to 15:00 UTC 22 December 2016 at A1320 (terrain height is 907 m), b. 2 m temperature predictions from 03:00 UTC 8 February to 15:00 UTC 9 February 2017 at A1366 (terrain height is 950 m). The green lines are for BJ-RUCv3.0 predictions, red lines are for AnEn predictions and black lines are for observations. Shaded areas indicate the 95% bootstrap confidence interval)
6 结论和讨论

介绍了相似集合方法的基本原理,并以BJ-RUCv3.0模式系统预报的北京地区174个自动气象站2 m气温、10 m风速为对象开展了相似集合的应用试验和客观检验分析,并将其与支持向量机的订正效果进行了对比。此外,通过考察概率预报的几个关键检验量分析了相似集合方法形成的集合预报的性能,得出如下结论:

(1) 相似集合订正后,10 m风速和2 m气温在0—36 h的预报均方根误差明显下降,相对模式预报,10 m风速平均均方根误差降低44%;2 m气温平均均方根误差降低22%,释用效果显著;2 m气温预报明显的夜间偏高、白天偏低的系统性误差得到了有效修正。对比测站预报误差的水平分布,相似集合方法的应用对于提升非城区站点的10 m风速预报、复杂地形区域的2 m气温预报具有更为明显的作用。从全年预报试验来看,10 m风速相似集合预报夏半年效果更好;2 m气温的相似集合预报均方根误差变化不明显,平均10 m风速均方根误差降低46%,2 m气温降低22%。

(2) 对比相似集合与支持向量机两种不同非线性统计学习方法在相同时段内的预报性能可以看出,二者预报性能基本相当,但与支持向量机方法相比,相似集合方法并不建立固定的预报模型,对计算资源需求较少、不需要大量人工干预,且训练样本集会随着时间推移,实时积累,在实时预报中优势明显。

(3) 集合预报品质评估结果表明,相似集合方法形成的集合较好地模拟了模式平均误差的增长情况,集合离散度与集合平均均方根误差的变化表现出较为理想的统计一致性;而其平缓的Talagrand分布也说明相似集合具有良好的性能。相对集合预报,相似集合需要的计算资源几乎可以忽略不计,且从集合性能来看,优于现有的集合预报。

需要指出的是,相似集合方法的核心在于预报准确性的概率密度分布可以通过与当前模式输出确定性预报描述的大气状态最具相似性的n个历史预报的对应实况估计出来。这里相似方法不仅适用于确定性模式预报结果的后处理订正,而且也能从纯粹确定性预报中产生不确定性信息,这是与其他统计订正方法的最大区别。

文中所述的相似集合方法在北京地区地面要素预报中的应用刚刚起步,未来将从下列方面入手进一步开展相似集合方法的应用并提升应用效果:(1)针对各预报要素,寻找最优参数组合来优化预报效果;寻找确定权重组合来应对预报因子较多时的大量计算需求。(2)建立更长的历史样本数据集,让相似集合有机会从更长的历史样本中遍历当前预报对应的更多可能。(3)纳入更多的模式预报量作为参考因子,并且开展权重因子的敏感性分析,从类似“流依赖”等多个角度来捕捉相似度因子向量中最为关键的特征,从而提高相似集合的应用效果,尤其对于转折性天气过程的把握能力。(4)相似集合方法在格点化要素预报和降水预报客观订正方面的应用。

参考文献
陈敏, 范水勇, 郑祚芳, 等. 2011. 基于BJ-RUC系统的临近探空及其对强对流发生潜势预报的指示性能初探. 气象学报, 69(1): 181–194. Chen M, Fan S Y, Zheng Z F, et al. 2011. The performance of the proximity sounding based on the BJ-RUC system and its preliminary implementation in the convective potential forecast. Acta Meteor Sinica, 69(1): 181–194. (in Chinese)
陈敏, 陈明轩, 范水勇. 2014. 雷达径向风观测在华北区域数值预报系统中的实时三维变分同化应用试验. 气象学报, 72(4): 658–677. Chen M, Chen M X, Fan S Y. 2014. The real-time radar radial velocity 3DVar assimilation experiments for application to an operational forecast model in North China. Acta Meteor Sinica, 72(4): 658–677. (in Chinese)
陈永义, 俞小鼎, 高学浩, 等. 2004. 处理非线性分类和回归问题的一种新方法(Ⅰ):支持向量机方法简介. 应用气象学报, 15(3): 345–354. Chen Y Y, Yu X D, Gao X H, et al. 2004. A new method for non-linear classify and non-linear regression (Ⅰ):Introduction to support vector machine. J Appl Meteor Sci, 15(3): 345–354. DOI:10.3969/j.issn.1001-7313.2004.03.011 (in Chinese)
陈豫英, 陈晓光, 马金仁, 等. 2006. 风的精细化MOS预报方法研究. 气象科学, 26(2): 210–216. Chen Y Y, Chen X G, Ma J R, et al. 2006. A study on subtle mos forecasting method of wind. Scientia Meteor Sinica, 26(2): 210–216. (in Chinese)
丁煌, 陶树旺, 肖子牛, 等. 2013. 基于WRF和SVM方法的风电场功率预报技术研究. 高原气象, 32(2): 581–587. Ding H, Tao S W, Xiao Z N, et al. 2013. Study on wind power forecasting of wind farm based on WRF and SVM. Plateau Meteor, 32(2): 581–587. (in Chinese)
丁士晟. 1985. 中国MOS预报的进展. 气象学报, 43(3): 332–338. Ding S S. 1985. The advance of model output statistics method in china. Acta Meteor Sinica, 43(3): 332–338. (in Chinese)
杜钧. 2002. 集合预报的现状和前景. 应用气象学报, 13(1): 16–28. Du J. 2002. Present situation and prospects of ensemble numerical prediction. J Appl Meteor Sci, 13(1): 16–28. (in Chinese)
范水勇, 王洪利, 陈敏, 等. 2013. 雷达反射率资料的三维变分同化研究. 气象学报, 71(3): 527–537. Fan S Y, Wang H L, Chen M, et al. 2013. Study of the data assimilation of radar reflectivity with the WRF 3D-Var. Acta Meteor Sinica, 71(3): 527–537. (in Chinese)
冯汉中, 陈永义. 2004. 处理非线性分类和回归问题的一种新方法(Ⅱ):支持向量机方法在天气预报中的应用. 应用气象学报, 15(3): 355–365. Feng H Z, Chen Y Y. 2004. A new method for non-linear classify and non-linear regression Ⅱ:Application of support vector machine to weather forecast. J Appl Meteor Sci, 15(3): 355–365. (in Chinese)
冯汉中, 陈永义. 2005. 支持向量机回归方法在实时业务预报中的应用. 气象, 31(1): 41–44, 68. Feng H Z, Chen Y Y. 2005. Application of support vector machine regression method in weather forecast. Meteor Mon, 31(1): 41–44, 68. (in Chinese)
何娜, 付宗钰, 赵玮, 等. 2013. SVM方法在北京地区夏季晴雨预报中的初步应用. 暴雨灾害, 32(3): 284–288. He N, Fu Z Y, Zhao W, et al. 2013. Application of SVM method to summer clear-rain forecast in Beijing region. Torr Rain Dis, 32(3): 284–288. (in Chinese)
皇甫雪官. 2002. 国家气象中心集合数值预报检验评价. 应用气象学报, 13(1): 29–36. Huangfu X G. 2002. The verification for ensemble prediction system of national meteorological center. J Appl Meteor Sci, 13(1): 29–36. (in Chinese)
李迅, 冯涛, 丁德平, 等. 2015. BJ-RUC产品在小区供暖供回水温度预报的应用研究. 气象, 41(2): 234–239. Li X, Feng T, Ding D P, et al. 2015. Application research on community supply-return water temperature with BJ-RUC products. Meteor Mon, 41(2): 234–239. (in Chinese)
刘春霞. 2002. 广东热带气旋短期气候预测:相空间相似预报方法的应用. 热带气象学报, 18(1): 83–90. Liu C X. 2002. The short-term climate forecasting of tropical cyclone in Guangdong:In the phase space similarity method. J Trop Meteor, 18(1): 83–90. (in Chinese)
刘梦娟, 陈敏. 2014. BJ-RUC系统对北京夏季边界层的预报性能评估. 应用气象学报, 25(2): 212–221. Liu M J, Chen M. 2014. Evaluation of BJ-RUC system for the forecast quality of planetary boundary layer in Beijing area. J Appl Meteor Sci, 25(2): 212–221. (in Chinese)
卢冰, 孙继松, 仲跻芹, 等. 2017. 区域数值预报系统在北京地区的降水日变化预报偏差特征及成因分析. 气象学报, 75(2): 248–259. Lu B, Sun J S, Zhong J Q, et al. 2017. Analysis of characteristic bias in diurnal precipitation variation forecasts and possible reasons in a regional forecast system over Beijing area. Acta Meteor Sinica, 75(2): 248–259. (in Chinese)
罗菊英, 周建山, 闫永财. 2014. 基于数值预报及上级指导产品的本地气温MOS预报方法. 气象科技, 42(3): 443–450. Luo J Y, Zhou J S, Yan Y C. 2014. Local temperature MOS forecast method based on numerical forecast products and superior guidance. Meteor Sci Technol, 42(3): 443–450. (in Chinese)
任福民, 周琴芳. 2001. 赤道中东太平洋海温相似预报研究. 气象学报, 59(1): 49–58. Ren F M, Zhou Q F. 2001. A study on analogue forecast of SST in the equatorial central-eastern Pacific. Acta Meteor Sinica, 59(1): 49–58. (in Chinese)
任宏利, 丑纪范. 2005. 统计-动力相结合的相似误差订正法. 气象学报, 63(6): 988–993. Ren H L, Chou J F. 2005. Analogue correction method of errors by combining both statistical and dynamical methods together. Acta Meteor Sinica, 63(6): 988–993. (in Chinese)
任宏利, 丑纪范. 2006. 在动力相似预报中引入多个参考态的更新. 气象学报, 64(3): 315–324. Ren H L, Chou J F. 2006. Introducing the updating of multi-reference states into dynamical analogue prediction. Acta Meteor Sinica, 64(3): 315–324. (in Chinese)
陶祖钰, 赵翠光, 陈敏. 2016. 谈谈统计预报的必要性. 气象科技进展, 6(1): 6–13. Tao Z Y, Zhao C G, Chen M. 2016. The necessity of statistical forecasts. Adv Meteor Sci Technol, 6(1): 6–13. (in Chinese)
王在文, 郑祚芳, 陈敏, 等. 2012. 支持向量机非线性回归方法的气象要素预报. 应用气象学报, 23(5): 562–570. Wang Z W, Zheng Z F, Chen M, et al. 2012. Prediction of meteorological elements based on nonlinear support vector machine regression method. J Appl Meteor Sci, 23(5): 562–570. (in Chinese)
吴启树, 韩美, 郭弘, 等. 2016. MOS温度预报中最优训练期方案. 应用气象学报, 27(4): 426–434. Wu Q S, Han M, Guo H, et al. 2016. The optimal training period scheme of MOS temperature forecast. J Appl Meteor Sci, 27(4): 426–434. (in Chinese)
吴振玲, 潘璇, 董昊, 等. 2014. 天津市多模式气温集成预报方法. 应用气象学报, 25(3): 293–301. Wu Z L, Pan X, Dong H, et al. 2014. Forecast method of multi-model air temperature consensus in Tianjin. J Appl Meteor Sci, 25(3): 293–301. (in Chinese)
熊秋芬, 顾永刚, 王丽. 2007. 支持向量机分类方法在天空云量预报中的应用. 气象, 33(5): 20–26. Xiong Q F, Gu Y G, Wang L. 2007. Application of SVM method to cloud amount forecast. Meteor Mon, 33(5): 20–26. (in Chinese)
熊秋芬, 曾晓青. 2008. SVM方法在降水预报中的应用及改进. 气象, 34(12): 90–95. Xiong Q F, Zeng X Q. 2008. Application and improvement of SVM method in precipitation forecast. Meteor Mon, 34(12): 90–95. (in Chinese)
杨杰, 王启光, 支蓉, 等. 2011. 动态最优多因子组合的华北汛期降水模式误差估计及预报. 物理学报, 60(2): 029204. Yang J, Wang Q G, Zhi R, et al. 2011. Dynamic optimal multi-indexes configuration for estimating the prediction errors of dynamical climate model in North China. Acta Phys Sin, 60(2): 029204. (in Chinese)
于海鹏, 黄建平, 李维京, 等. 2014. 数值预报误差订正技术中相似-动力方法的发展. 气象学报, 72(5): 1012–1022. Yu H P, Huang J P, Li W J, et al. 2014. Development of the analogue-dynamical method for error correction of numerical forecasts. Acta Meteor Sinica, 72(5): 1012–1022. (in Chinese)
张亦洲, 苗世光, 戴永久, 等. 2013. 北京夏季晴天边界层特征及城市下垫面对海风影响的数值模拟. 地球物理学报, 56(8): 2558–2573. Zhang Y Z, Miao S G, Dai Y J, et al. 2013. Numerical simulation of characteristics of summer clear day boundary layer in Beijing and the impact of urban underlying surface on sea breeze. Chinese J Geophys, 56(8): 2558–2573. (in Chinese)
钟元, 祝荣霖. 1991. 中期(旬)天气客观相似预报方案. 气象学报, 49(4): 553–558. Zhong Y, Zhu R L. 1991. An objective analogue scheme for medium-range weather forecast. Acta Meteor Sinica, 49(4): 553–558. (in Chinese)
仲跻芹, 陈敏, 范水勇, 等. 2010. AMDAR资料在北京数值预报系统中的同化应用. 应用气象学报, 21(1): 19–28. Zhong J Q, Chen M, Fan S Y, et al. 2010. Assimilation application of AMDAR data to the operational NWP system of Beijing. J Appl Meteor Sci, 21(1): 19–28. (in Chinese)
仲跻芹, GuoY R, 张京江. 2017. 华北地区地基GPS天顶总延迟观测的质量控制和同化应用研究. 气象学报, 75(1): 147–164. Zhong J Q, Guo Y R, Zhang J J. 2017. A study of quality control and assimilation of ground-based GPS ZTD in North China. Acta Meteor Sinica, 75(1): 147–164. (in Chinese)
闵晶晶. 2014. BJ-RUC系统模式地面气象要素预报效果评估. 应用气象学报, 25(3): 265–273. Min J J. 2014. Evaluation on surface meteorological element forecast by Beijing rapid update cycle system. J Appl Meteor Sci, 25(3): 265–273. (in Chinese)
Alessandrini S, Davò F, Sperati S, et al. 2014. Comparison of the economic impact of different wind power forecast systems for producers. Adv Sci Res, 11(1): 49–53.
Alessandrini S, Monache L D, Sperati S, et al. 2015. An analog ensemble for short-term probabilistic solar power forecast. Appl Energy, 157: 95–110. DOI:10.1016/j.apenergy.2015.08.011
Barnett T P, Preisendorfer R W. 1978. Multifield analog prediction of short-term climate fluctuations using a climate state vector. J Atmos Sci, 35(10): 1771–1787. DOI:10.1175/1520-0469(1978)035<1771:MAPOST>2.0.CO;2
Hamill T M. 2001. Interpretation of rank histograms for verifying ensemble forecasts. Mon Wea Rev, 129(3): 550–560. DOI:10.1175/1520-0493(2001)129<0550:IORHFV>2.0.CO;2
Michaelides S C, Liassidou F, Schizas C N. 2007. Synoptic classification and establishment of analogues with artificial neural networks. Pure Appl Geophys, 164(6-7): 1347–1364. DOI:10.1007/s00024-007-0222-7
Monache L D, Eckel F A, Rife D L, et al. 2013. Probabilistic weather prediction with an analog ensemble. Mon Wea Rev, 141(10): 3498–3516. DOI:10.1175/MWR-D-12-00281.1
Nagarajan B, Monache L D, Hacker J P, et al. 2015. An evaluation of analog-based postprocessing methods across several variables and forecast models. Wea Forecasting, 30(6): 1623–1643. DOI:10.1175/WAF-D-14-00081.1
Panziera L, Germann U, Gabella M, et al. 2011. NORA-Nowcasting of orographic rainfall by means of analogues. Quart J Roy Meteor Soc, 137(661): 2106–2123. DOI:10.1002/qj.878
Talagrand O, Vautard R, Strauss B. 1997. Evaluation of probabilistic prediction systems//Proceedings of the ECMWF Workshop on Predictability, Reading. United Kingdom: ECMWF
Van den Dool H M. 1987. A bias in skill in forecasts based on analogues and antilogues. J Appl Meteor, 26(9): 1278–1281. DOI:10.1175/1520-0450(1987)026<1278:ABISIF>2.0.CO;2
Van den Dool H M. 1989. A new look at weather forecast through analogs. Mon Wea Rev, 117: 2230–2247. DOI:10.1175/1520-0493(1989)117<2230:ANLAWF>2.0.CO;2
Wilks D S. 2006. Statistical Methods in the Atmospheric Sciences. 2nd ed. Cambridge: Academic Press: 627pp.