基于卡尔曼滤波递减平均算法的集合预报综合偏差订正

http://dx.doi.org/10.11676/qxxb2015.062
中国气象学会主办。

文章信息

马旭林, 时洋, 和杰, 计燕霞, WANG Yong. 2015.

MA Xulin, SHI Yang, HE Jie, JI Yanxia, WANG Yong. 2015.

The combined descending averaging bias correction based on the Kalman filter for ensemble forecast

气象学报, 73(5): 952-964

Acta Meteorologica Sinica, 73(5): 952-964.

http://dx.doi.org/10.11676/qxxb2015.062

文章历史

收稿日期：2014-11-13

改回日期：2015-04-24

引用本文

马旭林, 时洋, 和杰, 计燕霞, WANG Yong. 2015. 基于卡尔曼滤波递减平均算法的集合预报综合偏差订正[J]. 气象学报, 73(5): 952-964 复制到剪切板

Ma Xulin, Shi Yang, He Jie, Ji Yanxia, Wang Yong. 2015. The combined descending averaging bias correction based on the Kalman filter for ensemble forecast[J]. Acta Meteorologica Sinica, 73(5): 952-964. 复制到剪切板

基于卡尔曼滤波递减平均算法的集合预报综合偏差订正

马旭林¹ , 时洋¹, 和杰¹, 计燕霞¹, WANG Yong²

1. 南京信息工程大学气象灾害教育部重点实验室(KLME), 南京, 210044;
2. 气象与地球动力学中央研究院预测模型所, 维也纳, 奥地利

收稿日期: 2014-11-13; 改回日期: 2015-04-24

资助课题: 国家自然科学基金项目(41275111)、重大研究计划培育项目(91437113)、公益性行业(气象)科研专项(GYHY201506005)、江苏高校优势学科建设工程资助项目(PAPD)。

作者简介: 马旭林,主要从事数值预报资料同化与集合预报理论与应用研究。E-mail:xulinma@nuist.edu.cn

摘要: 针对集合预报存在的偏差和集合离散度通常偏小的问题,在卡尔曼滤波递减平均的一阶矩和二阶矩偏差订正方案的基础上发展了综合偏差订正方案,并利用B08RDP WWRP(The WWRP Beijing 2008 Olympics Research and Development Project)项目中日本气象厅(JMA)区域集合预报的850 hPa温度资料,将敏感性试验得到的一阶矩和二阶矩订正的最优权重系数应用于综合偏差订正方案,并对其订正效果进行多方面检验分析。试验结果表明,一阶矩订正可以有效减小集合平均偏差,集合平均预报质量得到了明显改善;二阶矩订正对集合离散度具有较强的调整能力,订正后的集合预报可靠性、区分不同天气事件的能力总体上得到了提高;综合偏差订正方案有效融合了一阶矩和二阶矩订正的优势,其各自的最优权重系数适用于综合偏差订正方案,对集合平均偏差和离散度具有良好的订正效果,能够改善集合预报的整体质量。但一阶矩与二阶矩订正对综合偏差订正的贡献程度随评分指标而异,一阶矩订正对等级概率(RPS)评分和异常值百分比评分的贡献分别为83.75%和18.83%,可信度的改善约83.98%源于二阶矩订正,而相对作用特征(ROC)评分中二者的贡献基本相当。

关键词：数值天气预报集合预报综合偏差订正卡尔曼滤波

The combined descending averaging bias correction based on the Kalman filter for ensemble forecast

MA Xulin¹, SHI Yang¹, HE Jie¹, JI Yanxia¹, WANG Yong²

1. Key Laboratory of Meteorological Disaster of Ministry of Education (KLME), NUIST, Nanjing 210044, China;
2. Department of Forecasting Models, Central Institute for Meteorology and Geodynamics, Vienna, Austria

Abstract: To aim at the problem with both bias and small spread in ensemble forecast, a combined descending averaging bias correction method is designed based on the original Kalman filter. By using 850 hPa temperature from the regional ensemble dataset of JMA in the WWRP Beijing Olympics Research and Development Project, the optimal weights of the first and second moment are obtained by the weight sensitivity experiments and applied in the combined bias correction. Then, impacts of the combined bias correction are evaluated. The results show that the first moment bias correction largely reduces the bias in ensemble mean, so the forecast quality of ensemble mean is greatly improved. The second moment bias correction has good ability to adjust the spread to close the RMSE of the ensemble mean, improving the reliability and resolution of ensemble forecasts. To this end, a new descending averaging bias correction method is developed to combine the first moment with the second moment bias correction whose respective optimal weights can be applied to the combined bias correction, so as to improve the overall quality of ensemble forecast. However, the contributions of the first and second moment bias correction to the combined bias correction varies in terms of scores. For RPS and Outliers scores, the contributions of the first moment bias correction are 83.75% and 18.83%, respectively. The 83.98% improvement is from the second moment bias correction in terms of reliability, and the contributions of both moments are largely equal for ROC.

Key words: Numerical weather forecast Ensemble forecast Combined bias correction Kalman filter

1 引言

集合预报可以较好地估计大气运动的不确定性，得到未来可能天气形势的概率密度分布函数，为概率预报提供依据(Toth et al，1993; Wilks et al，2007)。自从欧洲中期天气预报中心(ECMWF)和美国环境预报中心(NCEP)1992年建立业务集合预报系统以来，集合预报已逐步成为提高天气预报准确率，特别是提高高影响天气预报预警能力的重要手段。一般来说，如果假定预报模式没有误差，那么从平均统计意义上而言，集合预报成员应该包含实际大气的所有可能的运动状态，每个集合成员的准确程度基本相当。同时，集合离散度能够反映真实大气的可预报性或预报的可信度(杜钧，2002)。然而，集合成员过少引起的取样误差、数值模式的初始误差和模式误差(包括系统性偏差)，尤其是集合初始扰动构造方案的不完善导致集合离散度偏小等，致使集合成员难以代表实际大气运动的不确定性特征。预报模式的不完善导致的系统性误差是影响集合预报质量最大的因素之一，该误差随预报时间延长，会引起集合预报一阶矩及二阶矩偏差(Toth et al. 2003)，其中，一阶矩偏差为集合平均预报误差，二阶矩偏差为集合离散度与预报误差方差的不协调，即集合离散度与大气运动不确定性的不一致。这两种误差是直接影响集合预报质量的主要因素。

通常，提高集合预报质量的一种方式是从集合预报系统的根本问题出发，改善数值预报模式性能和初始场质量及完善集合初始扰动构造方案等。近年来，预报模式和初始场质量等方面取得了显著的改善，集合初始扰动方案的研究也有了明显进展，如适用于暴雨集合预报的异物理模态法(陈静等，2005; 李俊等，2009)、针对台风预报的人造台风同化(BDA)扰动法(黄燕燕等，2006)和集合变换卡尔曼滤波(ETKF)初始扰动构造方案(马旭林等，2008; Ma et al，2009)，以及概率(频率)匹配法(李俊等，2014)的研究等。此外，关吉平等(2009)分析了增长模繁殖法在华南暴雨中期集合预报中的适用性问题，陈超辉等(2009)对多模式短期集合预报方法在江淮汛期的应用进行了初步研究。但是，由于大气非线性运动的复杂性以及模式误差等的影响，集合预报偏差依然存在。基于统计学对集合预报进行后处理的偏差订正方法是另一类改善集合预报质量的有效方式，该方式通过调整集合预报结果，校正集合预报概率密度分布函数以提高集合预报的可信度，进一步减小这种不可避免的集合预报误差偏差。对于确定性预报而言，早期的MOS(Model Output Statistics)方法(Glahn et al，1972)通过计算预报量和数值模式预报变量的统计关系，较好地订正了确定性预报近地面的预报变量。在确定性预报误差订正的基础上，根据非齐次高斯多元线性回归发展的EMOS(Ensemble Model Output Statistics)方法(Gneiting et al，2005)较好地改进了集合预报概率密度分布函数(PDF)的特征，使其更接近高斯分布。依据大气相似性原理并借助历史资料的相似信息，任宏利等(2005)发展了统计与动力相结合的相似误差订正(ACE)方法。同时，通过对集合成员分别加入相互独立的随机扰动以去除季节平均误差并调整集合离散度过小的“Dressing”方法(Roulston et al，2003)，利用多种集合成员线性或非线性组合的集合平均订正集合预报的GEP(Gene-expression programming)方法(Bakhshaii et al，2009)，以及Satterfield等(2004)将气候先验信息与集合预报信息相混合的异方差集合后处理方法，Monache等(2006)提出的臭氧集合预报系统性以及非系统性偏差的卡尔曼滤波增益权重法等，对由于集合成员数偏少、模式误差和集合初始扰动构造方案不完善等引起的集合预报误差偏差都取得了较好的订正效果。另外，针对多模式集合预报发展的BMA(Bayesian model averaging method)方法(Raftery et al，2005)也显示出良好的集合预报偏差校正能力。这些基于统计学理论针对集合预报结果进行的偏差订正方法基本上都属于后验订正方案，在实际应用中都呈现出一定效果。

近年来，基于自适应卡尔曼滤波方法的集合预报偏差订正方法在实践中显示出更加令人鼓舞的性能。Du等(2007)通过递减平均方法合理地调整了集合离散度，李莉等(2011)和佟华等(2014)先后对中国T213和T639全球集合预报的系统性偏差进行了一阶矩偏差订正的研究，指出不同季节预报的偏差订正最优订正权重系数并不相同。Cui等(2006，2012)对NCEP业务集合预报一阶矩偏差订正及在加入气候平均误差的试验中都取得了良好的结果，但单独对集合离散度订正的二阶矩偏差订正方案并未获得理想效果(Cui et al，2006)。王敏等(2012)对比了非均匀高斯回归(NGR，non-homogeneous Gaussian regression)方法与自适应卡尔曼滤波偏差订正方法对区域集合预报系统2 m温度的集合平均预报偏差和离散度的订正效果，指出非均匀高斯回归方法对集合离散度的订正效果更优，这与Cui等(2006)的结论一致。马清等(2008a，2008b)对2 m温度分别单独进行了一阶矩和二阶矩偏差订正，并在二阶矩偏差订正中引入了一阶矩订正信息。虽然预报评分得到一定改善，但是调整集合离散度时并未参考一阶矩订正后的集合平均均方根误差的影响。

前期的研究工作大多只单独考虑一阶矩和二阶矩偏差订正方案，较少涉及将两者结合，或者设计方案不尽完善，并没有得到理想的订正效果。因此，文中在一阶矩和二阶矩偏差订正研究的基础上，修订了二阶矩偏差订正因子的计算方法，通过一阶矩和二阶矩订正的最优权重系数试验，考虑综合偏差订正方案的最优权重系数，进一步完善适用于实际业务应用的综合偏差订正方案，并利用区域集合预报850 hPa温度场资料，对综合偏差订正的效果进行多角度验证分析，以期能够对实际业务集合预报的整体质量提高具有积极的效果。

2 偏差订正原理、资料及试验方案

卡尔曼滤波递减平均法通过估计订正时刻的递减平均偏差对集合预报结果进行直接订正。对于统计学中不精确的状态估计，卡尔曼滤波方法利用权重平均得到的状态估计相对于其他估计方法通常更加接近真实值(Cui et al，2012)。该算法简洁，具有所需计算资源少、历史样本量较小等特点，且订正方法不受预报模式、同化系统频繁升级的影响，适合气象业务的实际应用。

2.1 偏差订正原理

一阶矩偏差订正通过调整集合预报概率分布函数的数学期望对集合平均预报误差进行订正。

式中，F_sm1为一阶矩订正后的集合预报场，下标t₀表示当前订正时刻，F^ens_mean_t₀为当前订正时刻的集合平均，B为递减平均误差。

式中，B为气候平均预报误差，(f-o)为临近时刻预报与观测(这里用分析场)的偏差，w为权重系数。

首先使用集合平均与对应时刻分析资料的逐日集合平均预报误差求取气候态平均预报误差与临近时刻预报误差，再利用式(2)即可计算当前订正时刻的递减平均误差。式(2)既考虑了气候平均预报误差B的特征，保证了估计误差整体的稳定性，又加入了临近时刻误差信息(f-o)，融入了天气系统连续性特点。然后将二者以权重系数w相结合，共同估计递减平均误差。权重系数w的选择与集合预报系统、订正变量和表征气候平均预报误差的练习资料时长有关，需要进行权重系数敏感性试验，根据不同权重系数的偏差订正效果选取最优权重。

集合离散度可以有效反映集合预报的误差方差，通常其量值较小且能够反映真实预报的不确定性(Scheuerer et al，2014)。但实际集合离散度一般偏小，不能完全反映真实大气运动的不确定性特征(用预报不确定性来衡量)。二阶矩订正的目的在于调整集合离散度，即

式中，F_sm2^k为二阶矩偏差订正后的各集合成员，上标k代表各集合成员，R为递减平均的二阶矩订正因子。通过该因子对集合成员与集合平均的距离(F_t₀^k-F_t₀^ens_mean)进行调整，使集合离散度更加接近于集合平均的均方根误差。

二阶距订正因子R分别由气候平均因子R和临近时刻因子r_rec通过权重系数α加权构成。其中，权重系数α通过敏感性试验确定，对于同一层次、同一变量的各集合成员，权重系数α相同，且α∈[0，1]，气候平均因子R为一段时间逐日集合平均的均方根误差与集合离散度之比r的平均，临近时刻因子r_rec是当前订正时刻通过适应性滑动向前方法而确定，计算方法同r(式(5))，其中E^ens_mean表示集合平均的均方根误差，s为集合离散度。需要注意的是，式(4)与式(2)中的权重系数并不相同，虽然二者均控制着气候态与临近时刻的量值所占权重，但递减平均误差B与二阶矩订正因子R意义不同，需分别进行权重系数的敏感性试验以确定最优权重系数。

综合偏差订正是在最优权重的二阶矩订正的基础上，叠加最优权重的一阶矩订正效果，对集合平均预报偏差和离散度进行订正，综合改善集合预报质量。其数学表达式为

式中，F_com^k为综合偏差订正后的集合成员，R_c为使用一阶矩订正后集合平均均方根误差信息计算得到的二阶矩订正因子，可经权重系数α求取气候平均因子 R_c和临近时刻因子r_{c_rec}权重平均得到

式中，逐日r_c需使用一阶矩订正后的集合平均均方根误差(Eens_mean_c)与集合离散度(s)的比值计算，这样统计出的气候态R_c以及临近时刻r_crec包含了一阶矩偏差订正效果，使订正后的集合离散度更接近一阶矩偏差订正后的集合平均均方根误差，大小更加合理。这与马清等(2008b)的方案不同。需要指出的是，综合订正方案中一阶矩与二阶矩订正相互独立进行，式(6)中F_sm1与单独的一阶矩完全相同，故二者的权重系数w也等同；综合订正与二阶矩订正中α控制的均为R与r_rec所占权重，其物理意义相同。另外，试验表明综合订正方案中的权重系数与单独的一阶矩和二阶矩订正的权重系数一致，故综合偏差订正方案的权重系数与二者的最优权重系数保持一致。

2.2 集合预报资料

使用B08RDP(The WWRP Beijing 2008 Olympics Research and Development Project)项目(Duan et al，2012)的日本气象厅(以下简称JMA)区域集合预报850 hPa温度场资料，验证递减平均法的一阶矩、二阶矩以及综合偏差订正方案的效果。该集合预报资料共有11个预报成员，预报区域为30°—45°N，105°—125°E，模式分辨率为0.15°×0.15°，预报时长为36 h，时间间隔为6 h，起报时间为每日12时(世界时，下同)。资料时段为2008年6月24日—8月24日，共62 d。偏差订正中的分析资料采用欧洲中期天气预报中心6 h间隔的高分辨率分析资料，其再分析资料作为检验资料，两种资料的分辨率、资料区域等均与JMA区域集合预报资料相同。在实际业务应用中，这里的分析资料可以更换为相应时刻的其他分析场。

2.3 偏差订正试验方案

一阶矩偏差订正主要利用递减平均法估计递减平均预报误差用以去除当前时刻集合平均的预报偏差。由于集合预报资料长度的限制，同时为了保持与综合偏差订正对应订正时刻相一致，为一阶矩订正确定最优权重系数时，试验选取前20 d的集合预报作为练习资料求取气候态平均预报误差与临近时刻预报误差，对7月16日—8月24日的集合预报进行连续一阶矩订正。首先使用临近时刻与20 d平均预报误差通过式(2)计算递减平均预报误差，然后用式(1)对t₀之后的集合预报进行一阶矩订正。图 1a为一阶矩偏差订正方案模型。由于实际业务中不存在当前及其之后时刻的分析资料，故需采取向前滑动方式寻找临近时刻与相应的之前20 d平均所对应的时刻。例如，对于预报时效为6—18 h的集合预报，一阶矩订正起始时刻t₀前1 d的相应时刻即可作为临近时刻，前2至前22 d为计算气候态平均的资料时刻；而对于预报时效为24—36 h的资料，则需选取当前时刻前2 d的24—36 h预报为订正当前时刻所需的临近时刻预报资料，并使用当前时刻前3至前23 d的24—36 h预报与相应时刻分析资料以估计20 d平均预报误差。这种利用向前滑动来确定临近时刻的方法，充分考虑了天气系统的连续性特点，有助于合理估计当前时刻的预报误差。

图 1 偏差订正方案
(a．一阶矩订正，b．二阶矩订正，c．综合订正)Fig. 1 Schematic diagram for the bias correction
(a. the first moment, b. the second moment, c. the combined correction )

图选项

二阶矩订正用来调整集合离散度的合理性。为了单独验证二阶矩订正的效果，特设计独立的二阶矩订正方案。为了使其与综合偏差订正结果具有等价的可比性，单独二阶矩订正时段与综合偏差订正保持相同，故文中仅对 t₂₂(即8月7日)之后的集合预报进行单独二阶矩订正，其试验方案如图 1b。首先根据二阶矩订正起始时刻t₂₂使用与一阶矩订正相同的向前滑动方法确定临近时刻及20 d平均对应的时刻，其次计算临近时刻因子r_rec与20 d平均的气候平均因子R，然后用式(4)得到递减平均的二阶矩订正因子，最后对t₂₂时刻起始的8月7—24日集合预报资料进行二阶矩偏差订正。

综合偏差订正是一阶矩偏差订正和二阶矩订正的融合(图 1c)，首先将t_-22—t_-3的资料作为一阶矩订正的练习资料，利用递减平均法循环对t₀时刻起始的22 d(7月16日—8月6日)集合预报进行一阶矩订正，消除集合平均预报偏差，提高集合平均预报的可信度；在此基础上，使用与单独二阶矩订正相同的20 d的练习资料与对应临近时刻因子r_rec，共同估计递减平均二阶矩订正因子，循环调整t₂₂开始的(8月7—24日)集合预报的离散度，使之更符合实际大气运动的不确定性特征。这里一阶矩订正的22 d，其中，前20 d作为二阶矩偏差订正的练习资料，最后2 d为使用滑动向前方法确定的临近时刻。综合偏差订正方法使用一阶矩订正后的集合均方根误差进一步调整集合离散度，综合了一阶矩和二阶矩偏差订正的效果，最终实现集合预报平均偏差和离散度两方面的综合调整，以提高集合预报整体质量的目的。

3 权重系数敏感性试验与分析

由于不同的数值预报模式、初始扰动方案等造成集合预报误差存在差异，而且不同物理量的误差也具有自身特点。因此，在集合预报的偏差订正中，需要根据具体的集合预报分别开展敏感性试验，确定偏差订正合适的权重系数。式(2)与(4)的权重系数w与α分别为估计递减平均误差与递减平均二阶矩订正因子的权重，需要通过一阶矩和二阶距偏差订正的敏感性试验分别确定，为综合偏差订正的权重系数提供确定依据。

3.1 一阶矩订正的最优权重系数试验

集合预报的一阶矩偏差订正主要是去除集合预报平均偏差，通常用集合均方根误差(RMSE)进行衡量。试验首先在[0，1]区间内初步选取权重系数，通过比较订正前后不同权重系数的均方根误差评分初步确定最优权重系数范围，然后在最优权重系数范围内再进行更精细权重系数的检验，最终确定最优权重。图 2是7月16日—8月24日JMA集合预报850 hPa温度一阶矩订正敏感性试验的最优权重区间[0.1，0.5]的20 d平均均方根误差评分。可以看出，整个预报时段内(36 h)，订正后集合预报的均方根误差均较订正前有明显降低，特别是权重系数为0.1、0.15、0.20与0.25时订正后的集合平均偏差的改善最为明显，后三者的订正效果更为接近。订正效果差异较小的后三个权重系数改善的定量比较(表 1)显示，6—24 h预报时间的0.20与0.25权重评分非常相近，其中，30与36 h两个权重系数的效果比较则是0.20更显优势。即气候态预报误差权重占80%、临近时刻预报误差对应权重为20%时，一阶矩偏差订正的效果最优，表明当前时刻的预报误差大部分可以由气候态预报误差进行解释。综合而言，权重系数0.20的一阶矩偏差订正的效果最为明显，是JMA集合预报850 hPa温度的一阶矩偏差订正的最优权重系数，可作为综合偏差订正中一阶矩订正的权重系数。权重系数大于0.50的一阶矩订正质量明显偏低(图略)，不再详细讨论。

图 2 850 hPa温度预报的一阶矩偏差订正不同权重系数的集合平均均方根误差Fig. 2 RMSEs of the ensemble mean of the 850 hPa temperature forecasts after the first moment bias correction with the various weights

图选项

表 1 850 hPa温度预报不同权重系数一阶矩偏差订正后集合平均均方根误差(℃)Table 1 The RMSEs of the ensemble mean of the 850 hPa emperature forecasts after the first moment bias correction with the various weights (℃)

权重	预报时效(h)
6	12	18	24	30	36
0.15	0.999	0.993	1.198	1.239	1.210	1.257
0.20	0.996	0.992	1.194	1.235	1.213	1.261
0.25	0.996	0.994	1.193	1.234	1.219	1.267

表选项

3.2 二阶矩订正的最优权重敏感性试验

集合离散度可反映集合成员描述实际大气运动状态不确定性的性能，其量值与集合平均预报均方根误差相当，二者的比值(理想情况下为1)通常可作为衡量集合离散度是否合理的依据。根据二阶矩订正原理可知，二阶矩订正因子R的取值取决于式(4)中的权重系数α，而权重系数α的选取依赖集合均方根误差与集合离散度的比值r。因此，通过敏感性试验并根据其比值r可以确定合适的权重系数α，从而得到二阶矩订正因子。图 3a为二阶矩订正中各权重系数α敏感性试验的r。显然，在整个预报时效内，权重系数为0.90的r相对于其他权重系数而言始终最接近于1(蓝色实线)，表明此时集合离散度更加合理，可以认为二阶矩订正的最优权重系数α=0.90。从二阶矩订正前后的离散度和均方根误差(RMSE)的比较也可以看出(图 3b)，订正前的集合离散度(黑色实线)量值非常小，明显偏离未订正的均方根误差(黑色虚线)而整体位于其下方，数值仅约为均方根误差的一半；订正后各权重系数的离散度均较未订正的明显增大，且随预报时间的延长基本上都具有合理的变化，其中36 h的预报时效内权重系数α＝0.90的离散度与均方根误差最为接近，明显优于订正前的效果。调整后各权重系数对应的集合离散度均有不同程度的增大，充分显示了二阶矩订正中权重系数α对订正质量具有较强的敏感性；但是，集合离散度并非越大越好，应当与集合预报均方根误差相比处于合理的范围。需要说明的是，单纯的二阶矩订正仅调整集合离散度而不改变集合预报偏差，故订正前后均方根误差保持不变，均为图 3b中均方根误差曲线(黑色虚线)所示。

图 3 850 hPa温度预报二阶矩订正不同权重系数的(a)敏感性试验r比值,(b)均方根误差(虚线)与离散度, (c)RPS评分, (d)离散度-技巧相关关系Fig. 3 Verification scores of ensembles for the 850 hPa temperature forecasts after the second moment bias correction with the various weights (a) r, (b) RMSE and spread, (c) RPS and (d) spread-skill relationship

图选项

图 3c为二阶矩订正中不同权重系数的850 hPa温度预报的等级概率(RPS)总体评分。RPS评分与BS评分类似，是衡量多种事件预报准确性的评分指标。可以看出，权重系数为0.90的RPS评分(蓝色实线)显著优于其他权重系数，而且也明显高于订正前(黑色实线)的质量。BS评分也进一步显示二阶矩订正的前述所有权重系数的评分均好于订正前，且α＝0.90的权重系数评分最优(图略)。另外，从各权重系数对应的集合离散度和集合平均均方根误差的相关关系(spread-skill)(图 3d)也可以看出，订正前6、18、24 h的850 hPa温度预报的相关系数(黑色实线)明显比其他时次偏低，在整个预报时效内差异较大；订正后权重系数为0.9和0.7的集合离散度与均方根误差相关系数则相对平稳，且相对于订正前有较大提高，尤其权重系数为0.9时，其相关关系的改善总体上更为显著(蓝色实线)。上述检验分析结果可以说明，单独二阶矩订正对2008年8月7日—24日的JMA集合预报的850 hPa温度集合预报质量具有明显的订正效果，且α＝0.90为二阶矩订正最优权重系数。

集合预报可信度(reliability)和可辨识度(reso-lution)是衡量集合预报质量的两个重要属性。可信度曲线为可信度和可辨识度的一个综合反映(Wilks，2006)，是通过统计求取每个预报概率分类中观测事件发生的相对频率的曲线。在可信度曲线图中，可信度是指可信度曲线与对角线的均方距离，而可辨识度主要衡量可信度曲线与气候样本可信度曲线(水平直线)的均方距离。理想的可信度曲线与对角线重合，即观测相对频率与预报概率相等。由于气候样本的可信度曲线与x轴平行，且其可辨识度为0。因此，如果集合预报的可信度曲线与气候样本的可信度曲线越接近，即预报可信度曲线越平直(斜率越小)，则预报的可辨识度愈低(Wilks，2006)。图 4是二阶矩订正中不同权重系数的18 h降温和升温2℃预报的可信度曲线。由图 4a可以看出，订正前降温时较高预报概率(0.63—1.0)对应的观测频率偏低，中低概率(0.0—0.63)对应的观测频率则偏高，而升温预报与观测的关系与此基本类似(图 4b)。即订正前降温和升温预报的可信度曲线(黑色实线)明显偏离对角线，可信度偏低；同时，可信度曲线在预报概率为0.3—0.8的部分趋于平直，即斜率偏小，表明两种变温情况下在该预报概率区间的集合预报可辨识度较低。订正后各权重系数对应的降温和升温预报的可信度曲线(彩色实线)都明显更加接近理想状态时的对角线，表明集合预报的可信度得以增大；二者可信度曲线的整体斜率也有所增大，尤其是上述中等预报概率区间部分的斜率明显增大，预报可辨识度得以增大。因此，二阶矩订正后相对于订正前850 hPa变温的集合预报质量总体上得到改善。比较前述5个权重系数订正后的可信度曲线可见，二阶矩订正的权重系数α＝0.90时的改善效果最为明显，进一步表明该权重系数对JMA区域集合预报850 hPa温度预报的订正效果为最优。值得注意的是，图 4a、b中订正前后可信度曲线基本呈反相特征，与马清等(2008b)试验结果相类似。这主要与二阶矩订正在合理范围内增大了离散度(图 3b)和选取的 ±2℃的温度检验指标有关。在可信度评分中，由于二阶矩订正后离散度增大，对于固定的温度检验指标，在预报概率不变的情况下，可能存在预报频次减小/增大的情况，造成观测相对频率增大/减小，从而形成二阶矩订正后可信度曲线可能(并不是必然)反相的结果。

图 4 850 hPa 18 h温度变化预报的二阶矩订正可信度评分
(a．降温2℃，b．升温2℃)Fig. 4 Reliability diagram for the 850 hPa temperature forecasts after the second moment bias correction
(a.-2℃, b. +2℃)

图选项

4 综合偏差订正效果分析

综合订正方案完全融合了一阶矩、二阶矩偏差订正的优势信息，使用前述最优权重系数对近20 d的集合预报分别进行订正前(raw)、一阶矩订正(sm1)、二阶矩订正(sm2)以及综合订正(com)试验，并对订正效果进行比较分析。

4.1 集合离散度与RPS评分

图 5为JMA区域集合预报的850 hPa温度订正前与一阶矩订正、二阶矩订正和综合订正的集合离散度与均方根误差以及RPS评分的比较。由图 5a可以看出，订正前的集合平均预报均方根误差(raw_rmse)明显大于综合偏差订正(com_rmse)的结果。同时，订正前的离散度(raw_spread)较二阶矩订正(sm2_spread)和综合偏差订正(com_spread)都明显偏小，且远小于订正前集合预报均方根误差。由于二阶矩订正不影响集合平均值，包含二阶矩订正的综合偏差订正与一阶矩偏差订正后的集合平均均方根误差相同。综合订正由于融入了一阶矩订正信息，又包含了二阶矩订正的效果，所以综合订正的均方根误差明显减小，且集合离散度较订正前有显著增大。由于综合订正方案中二阶矩订正是在预报偏差订正(即一阶矩偏差订正)的基础上对离散度进行调整，故综合订正后的离散度小于单独的二阶矩订正的离散度，使其与综合订正后的均方根误差更加接近，显示出综合偏差订正方案兼顾订正集合平均预报误差与调整集合离散度的优势。比较集合平均均方根误差与集合离散度的比值r(图 5b)可以看出，订正前的r最大，说明集合平均均方根误差与集合离散度的配置最为不合理；一阶矩订正后r有所改善(减小)，但依然与理想值1相差较大；相对而言，二阶矩订正与综合订正的r更为合理，均调整至1附近。这主要由于r衡量的仅仅是集合平均均方根误差与集合离散度的相对大小，一阶矩订正减小了集合平均预报偏差，但对集合离散度的影响较小，故一阶矩订正后的r与1的差距仍较大；二阶矩订正是直接依据集合平均均方根误差对集合离散度进行调整，故二者关系更加趋于合理。而综合订正是在减小集合平均预报偏差的基础上，根据订正后的集合平均均方根误差再对集合离散度进行优化，从而其r也较为理想。值得注意的是，虽然综合偏差订正后的离散度与订正前相比有较大幅度的改善，但相较单独二阶矩订正结果反而稍有变差，即集合离散度相较集合平均预报误差略偏大(r＜1)，这显示综合偏差订正可能会导致集合离散度略偏大。这可能与试验选取的练习资料长度等有关系，具体原因需要进一步分析。根据订正前(raw)、一阶矩订正(sm1)、二阶矩订正(sm2)和综合偏差订正(com)结果的RPS评分(图 5c)来看，单独一阶矩订正的RPS评分明显得到改善，而二阶矩订正相较于订正前仅略有提高，包含一阶矩和二阶矩订正的综合偏差订正的RPS评分也明显提升。经各预报时刻改善程度统计计算，一阶矩订正对RPS的改善占综合订正对RPS改善程度的83.75%，可以说综合订正的RPS评分效果主要源于一阶矩订正的贡献。这主要是由于RPS为集合预报各类事件预报准确性的综合评判，受集合平均预报误差影响较大，而对集合离散度并不敏感。总起来看，对于集合预报的RPS评分，综合偏差订正较单独的二阶矩订正具有更加明显的优势。

图 5 850 hPa温度预报订正前(raw)、一阶矩订正(sm1)、二阶矩订正(sm2)与综合偏差
订正(com)的(a) 离散度(实线)与均方根误差(虚线), (b) r, (c) RPS评分Fig. 5 Verification of the 850 hPa temperature forecasts with no bias correction (raw), the 1st moment bias correction (sm1), the 2nd moment bias correction (sm2) and the combined bias correction (com). (a) spread (solid line) and RMSE (dotted line), (b) r and (c) RPS scores

图选项

4.2 变温预报的ROC评分与集合可信度

ROC评分可衡量集合预报区分未来不同天气事件的能力，将每个检验阈值的命中率(横坐标)和误报率(纵坐标)对应的各点连成曲线即是ROC曲线(Wilks，2006)。理想ROC曲线的面积(也称为ROC面积)为1，此时ROC曲线通过ROC图形中正方形的左上角；而ROC面积为0.5时表明该集合预报没有预报技巧。对比订正前(raw)、一阶矩订正(sm1)、二阶矩订正(sm2)以及综合订正(com)的18 h变温预报(图 6a、b)的ROC评分，订正前降温预报(图 6a)的ROC面积为0.91，一阶矩订正后的ROC面积为0.92，二阶矩订正后的ROC面积也是0.92。综合订正的ROC曲线较订正前和一阶矩、二阶矩订正更加接近左上角顶点，其ROC面积较订正前增加0.02，超过0.93，约增加2.2%。尽管一阶矩和二阶矩订正后的ROC面积相同，对综合订正效果的贡献相当，均占50%，但二者的ROC曲线结构并不一致：前者主要集中于错误报警率(横坐标)小于0.3的范围，而后者在0—1的范围内则更为合理。类似地，升温预报(图 6b)的一阶矩订正和二阶矩订正后ROC面积均较订正前增大，综合订正后则增大了0.02，ROC曲线曲率最大位置也更靠近图形左上角。这反映了无论降温预报还是升温预报，综合偏差订正不仅较订正前能够提高集合预报区分不同天气事件的能力，而且也优于一阶矩和二阶矩订正方案的效果。此外，二阶矩订正(sm2)和综合偏差订正(com)后18 h变温预报的可信度曲线较订正前(raw)也更加接近理想的对角线，尤其降温预报中综合订正后的小概率事件的预报部分，其可信度曲线几乎与对角线重合；同时预报的中概率范围(0.3—0.8)内的可辨识度也较订正前有明显提高(图 6c、d)，而一阶矩订正的可信度曲线相对于订正前变化并不明显。统计计算订正前、一阶矩订正、二阶矩订正与综合偏差订正可信度曲线与对角线的距离发现，综合偏差订正对可信度曲线与对角线距离减小的83.98%来源于二阶矩订正。这进一步说明，尽管一阶矩订正对集合预报的ROC效果的改善与二阶矩订正效果相当，但综合偏差订正对集合预报可信度的改善主要源于二阶矩偏差订正。其他预报时刻变温预报的评估效果与此总体上基本类似，这里不再赘述。总之，综合偏差订正可以改善集合预报的ROC和可信度质量，优于单独的一阶矩和二阶矩订正方案。

图 6 850 hPa温度变温预报的订正前(raw)、一阶矩订正(sm1)、二阶矩订正(sm2)与综合偏差订正 (com)的 (a)降温2℃、(b)升温2℃的ROC与(c)降温2℃、(d)升温2℃的可信度Fig. 6 Verification of the 850 hPa temperature forecasts with no bias correction (raw), the 1st moment bias correction (sm1), the 2nd moment bias correction (sm2) and the combined bias correction (com)
(a. ROC for-2℃, b. ROC for +2℃, c. reliability diagram for -2℃， d. reliability diagram for +2℃)

图选项

4.3 综合偏差订正的整体效果

异常值百分比是指所有未被集合成员包含的观测分析值的统计百分比，当异常值百分比较大时，离散度偏小，反之亦然。区域集合预报850 hPa温度预报的异常值百分比(图 7a)显示，订正前(raw)集合预报的异常值百分比明显偏高，其数值为0.38—0.6；一阶矩订正后(sm1)异常值百分比略有减小，但相对于订正前并不明显，而二阶矩订正(sm2)和综合偏差订正(com)后的异常值百分比显著降低，整体上降低至0.167—0.2，更加接近最优异常值(0.167)。相对于二阶矩订正，综合订正的效果除6和12 h的异常值百分比略高外，其他预报时次均较低。经各预报时刻改善程度统计计算，一阶矩订正对异常值百分比的改善仅占综合订正对异常值百分比改善程度的18.83%。可以认为，综合订正的效果总体上好于二阶矩订正，更明显的优于一阶矩订正的结果。从离散度-技巧相关关系(图 7b)可以看出，订正前(raw)的18与24 h相关系数明显偏小，处于0.2附近。二阶矩订正(sm2)后离散度与均方根误差的相关系数整体上得到明显改善，且所有预报时次的相关系数基本保持稳定。一阶矩订正后18、24和36 h三个预报时刻与二阶矩订正效果相当，但6 h与订正前基本没有变化，特别是第30小时预报时刻则异常偏高，整体上随预报时间增大，且异常变化明显，与订正前的趋势基本类似。综合订正(com)后各预报时次的相关系数均明显优于一阶矩(除异常偏大的第30小时预报时刻)和二阶矩订正效果，相比二阶矩订正效果约提高了20%，且显著优于订正前。这体现了综合订正方案对集合预报的异常值百分比和离散度-技巧相关关系均具有良好的改善作用，并优于单独的一阶矩和二阶矩订正方案。

图 7 850 hPa温度预报订正前(raw)、一阶矩订正(sm1)、二阶矩订正(sm2)和综合偏差订正(com)的(a)异常值百分比与(b)离散度-技巧相关关系Fig. 7 Verification of the 850 hPa temperature forecasts with no bias correction (raw), the 1st (sm1), the 2nd moment bias correction (sm2) and the combined bias correction (com)(a) Percentage of outliers, and (b) spread-skill relationship

图选项

图 8为JMA区域集合预报850 hPa温度预报订正前(raw)与综合订正(com)的逐日均方根误差与集合离散度的变化。可见综合订正前均方根误差较大，而集合离散度偏小。综合偏差订正后，除8月7、8和20日的集合均方根误差降低较小外，其余时间均较订正前总体上有了明显减小，而集合离散度则有较大程度的增大，与订正后的均方根误差更加接近，且变化趋势基本一致。可见，综合订正较好地减小了集合平均的误差偏差，同时又能够适当地调整集合离散度，使之与集合均方根误差更加接近，改善了集合预报反映实际大气运动不确定性特征的能力。这充分显示了综合订正方案在合理的选取最优权重系数的条件下，能够较好地融合一阶矩和二阶矩订正效果，实现对集合平均偏差和集合离散度的同时订正，最终提高集合预报的整体质量。

图 8 2008年8月7—24日850 hPa温度预报的订正前(raw)、综合订正(com)的逐日均方根误差与集合离散度Fig. 8 Daily RMSE and spread of the 850 hPa temperature forecasts with no bias correction (raw) and the combined bias correction (com) for August 7-24, 2008

图选项

5 结论与讨论

由于集合初始扰动方案、边界扰动方法、模式误差以及分析误差等原因，造成了集合预报结果与观测存在一定的偏差以及集合离散度通常不足的问题。为了减小集合预报的偏差和合理调整离散度，在基于卡尔曼滤波递减平均法的一阶矩和二阶矩偏差订正方案的基础上，开展了综合偏差订正方案的试验研究，利用B08RDP项目的JMA区域集合预报的850 hPa温度资料，通过敏感性试验确定一阶矩和二阶矩订正的最优权重系数，并对综合偏差订正方案的订正效果进行了多方面检验分析。结果显示，集合平均偏差经过一阶矩订正有较大程度上的减小，集合平均预报质量得到明显改善；二阶矩订正的集合离散度也得到合理调整，订正后集合预报的可信度和区分不同天气事件能力的可辨识度都得到了提高；综合偏差订正方案结合一阶矩和二阶矩订正的优势，其各自的最优权重系数适用于综合偏差订正方案，有效减小了集合平均偏差和提高了集合预报对实际大气运动不确定性特征的反映能力，实现集合预报整体质量的改善。对综合偏差订正改善效果的定量评估显示，一阶矩与二阶矩订正对综合偏差订正的贡献程度随选取的评分指标而存在差异：RPS评分和异常值百分比评分中分别有83.75%和18.83%的贡献来自于一阶矩订正，可信度曲线改善的83.98%源于二阶矩订正的贡献，而ROC评分中二者对综合偏差订正的贡献基本相当。然而，相对于单独的二阶矩订正而言，综合偏差订正对集合离散度的订正也有可能出现订正过度的情形。

在方案设计中，一阶矩、二阶矩和综合偏差订正方案的气候态参数求取的时间长度等受到实际集合预报资料长度的限制，具体应用时可以适当调整。同时，一阶矩和二阶矩的最优权重系数与具体的集合预报资料有关，并非固定值。此外，文中虽然是利用区域集合预报对综合订正方案的效果进行分析和讨论，但所用方法也同样适用于全球集合预报的偏差订正。最后，因资料来源、区域、时长以及订正变量的不同，一阶矩、二阶矩订正对综合偏差订正的贡献程度可能存在差异。

参考文献

陈超辉, 王铁, 谭言科等. 2009. 2003年江淮汛期多模式短期集合预报方法研究. 热带气象学报, 25(4): 449-457. Chen C H, Wang T, Tan Y K, et al. Research of multi-model short-range ensemble forecasting techniques in forecasting rainy season over Changjiang-Huaihe basin in 2003. J Trop Meteor, 25(4): 449-457 (in Chinese)

陈静, 薛纪善, 颜宏. 2005. 一种新型的中尺度暴雨集合预报初值扰动方法研究. 大气科学, 29(5): 717-726. Chen J, Xue J S, Yan H. 2005. A new initial perturbation method of ensemble mesoscale heavy rain prediction. Chinese J Atmos Sci, 29(5): 717-726 (in Chinese)

杜钧. 2002. 集合预报的现状和前景. 应用气象学报, 13(1): 16-28. Du J. 2002. Present situation and prospects of ensemble numerical prediction. J Appl Meteor Sci, 13(1): 16-28 (in Chinese)

关吉平, 张立凤. 2009. 增长模繁殖法在华南暴雨中期集合预报中的应用. 热带气象学报, 25(2): 246-250. Guan J P, Zhang L F. 2009. Application of the method of BGM in medium-range ensemble forecast for a south China rainstorm. J Trop Meteor, 25(2): 246-250 (in Chinese)

黄燕燕, 万齐林, 袁金南等. 2006. 基于BDA扰动法的台风路径集合预报试验研究. 热带气象学报, 22(1): 49-54. Huang Y Y, Wan Q L, Yuan J N, et al. 2006. Experiments of ensemble forecast of typhoon track using BDA perturbing method. J Trop Meteor, 22(1): 49-54 (in Chinese)

李俊, 杜钧, 王明欢等. 2009. 中尺度暴雨集合预报系统研发中的初值扰动试验. 高原气象, 28(6): 1365-1375. Li J, Du J, Wang M H, et al. 2009. Experiments of perturbing initial conditions in the development of mesoscale ensemble prediction system for heavy rainstorm forecasting. Plateau Meteor, 28(6): 1365-1375 (in Chinese)

李俊, 杜钧, 陈超君. 2014. 降水偏差订正的频率(或面积)匹配方法介绍和分析. 气象, 40(5): 580-588. Li J, Du J, Chen C J. 2014. Introduction and analysis to frequency or area matching method applied to precipitation forecast bias correction. Meteor Mon, 40(5): 580-588 (in Chinese)

李莉, 李应林, 田华等. 2011. T213全球集合预报系统性误差订正研究. 气象, 37(1): 31-38. Li L, Li Y L, Tian H, et al. 2011. Study of bias-correction in T213 global ensemble forecast. Meteor Mon, 37(1): 31-38 (in Chinese)

马清, 龚建东, 李莉等. 2008a. 超级集合预报的误差订正与集成研究. 气象, 34(3): 42-48. Ma Q, Gong J D, Li L, et al. 2008a. Study of bias-correction and consensus in regional multi-model super-ensemble forecast. Meteor Mon, 34(3): 42-48 (in Chinese)

马清, 龚建东, 李莉等. 2008b. 中尺度集合预报的二阶矩离散度订正研究. 气象, 34(11): 15-21. Ma Q, Gong J D, Li L, et al. 2008b. Study on the 2nd moment spread-correction of mesoscale ensemble forecast system. Meteor Mon, 34(11): 15-21 (in Chinese)

马旭林, 薛纪善, 陆维松. 2008. GRAPES全球集合预报的集合卡尔曼变换初始扰动方案初步研究. 气象学报, 66(4): 526-536. Ma X L, Xue J S, Lu W S. 2008. Preliminary study on ensemble transform Kalman filter-based initial perturbation scheme in GRAPES global ensemble prediction. Acta Meteor Sinica, 66(4): 526-536 (in Chinese)

任宏利, 丑纪范. 2005. 统计-动力相结合的相似误差订正法. 气象学报, 63(6): 988-993. Ren H L, Chou J F. 2006. Analogue correction method of errors by combining both statistical and dynamical methods together. Acta Meteor Sinica, 63(6): 988-993 (in Chinese)

佟华, 郭品文, 朱跃建等. 2014. 基于大尺度模式产品的误差订正与统计降尺度气象要素预报技术. 气象, 40(1): 66-75. Tong H, Guo P W, Zhu Y J, et al. 2014. Bias correction and statistical downscaling meteorological parameters forecast technique based on large-scale numerical model products. Meteor Mon, 40(1): 66-75 (in Chinese)

王敏, 李晓莉, 范广洲等. 2012. 区域集合预报系统2m温度预报的校准技术. 应用气象学报, 23(4): 395-401. Wang M, Li X L, Fan G Z, et al. 2012. Calibrating 2 m temperature forecast for the regional ensemble prediction system at NMC. J Appl Meteor Sci, 23(4): 395-401 (in Chinese)

Bakhshaii A, Stull R. 2009. Deterministic ensemble forecasts using gene-expression programming. Wea Forecasting, 24(5): 1431-1451

Cui B, Toth Z, Zhu Y, et al. 2006. The trade-off in bias correction between using the latest analysis/modeling system with a short, versus an older system with a long archive//The First THORPEX International Science Symposium. Montreal, Canada, World Meteorological Organization, 281-284

Cui B, Toth Z, Zhu Y J, et al. 2012. Bias correction for global ensemble forecast. Wea Forecasting, 27(2): 396-410

Du J, Dimego G, Toth Z. 2007. Bias correction for the SREF at NCEP and beyond. A Discussion at the EMC Predictability Meeting. Feb 26, 2007

Duan Y H, Gong J D, Du J, et al. 2012. An overview of the Beijing 2008 Olympics research and development project (B08RDP). Bull Amer Meteor Soc, 93(3): 381-403

Glahn H R, Lowry D A. 1972. The use of model output statistics (MOS) in objective weather forecasting. J Appl Meteor, 11(8): 1203-1211

Gneiting T, Raftery A E, Westveld III A H, et al. 2005. Calibrated probabilistic forecasting using ensemble model output statistics and minimum CRPS estimation. Mon Wea Rev, 133(5): 1098-1118

Ma X L, Xue J S, Lu W S. 2009. Study on ETKF-based initial perturbation scheme for GRAPES global ensemble prediction. Acta Meteor Sinica, 23(5): 562-574

Monache D L, Nipen T, Deng X X, et al. 2006. Ozone ensemble forecasts: 2. A Kalman filter predictor bias correction. J Geophys R: Atmospheres, 111(D5): D05308, doi: 10.1029/2005JD006311

Raftery A E, Gneiting T, Balabdaoui F, et al. 2005. Using Bayesian model averaging to calibrate forecast ensembles. Mon Wea Rev, 133(5): 1155-1174

Roulston M S, Smith L A. 2003. Combining dynamical and statistical ensembles. Tellus, 55(1): 16-30

Satterfield E A, Bishop C H. 2014. Heteroscedastic ensemble postprocessing. Mon Wea Rev, 142(9): 3484-3502

Scheuerer M, Büermann L. 2014. Spatially adaptive post-processing of ensemble forecasts for temperature. J Roy Statistical Soc: Series C (Appl Statistics), 63(3): 405-422

Toth Z, Kalnay E. 1993. Ensemble forecasting at NMC: The generation of perturbations. Bull Amer Meteor Soc, 74(12): 2317-2330

Toth Z, Talagrand O, Candille G, et al. 2003. Probability and ensemble forecasts//Jolliffe I T, Stephenson D B. Forecast Verification: A Practitioner's Guide in Atmospheric Science. Chichester, UK: John Wiley Sons, pp380

Wilks D S. 2006. Statistical Methods in the Atmospheric Sciences (Second Edition). San Diego: Academic Press of Elsevier, 255-336

Wilks D S, Hamill T M. 2007. Comparison of ensemble-MOS methods using GFS reforecasts. Mon Wea Rev, 135(6): 2379-2390