基于数值预报产品释用技术的客观气象要素预报在实际工作中扮演着越来越重要的角色, 很多研究成果在实际预报业务中起到重要作用[1-7]。降水客观预报一直是数值预报产品释用中的难点问题。近年来, 我国气象工作者就如何提高客观降水预报效果进行了大量研究, 这些工作大体分为两个方面, 一是从预报因子上下功夫, 寻找更合理、更有用的预报因子[8-10], 或者建立预报模型前对降水量进行一定预处理以达到提高预报效果的目的[11]; 另一方面是将降水预报量转化为降水等级预报, 这些研究工作在一定程度上起到了提高预报效果的作用[12-13]。
目前, 比较常用的降水等级预报方法是对降水量进行一定处理后, 通过逐步回归方法分别建立不同等级的降水预报方程 (以下称回归降水等级预报), 国家气象中心和部分省区气象台采用这种方法制作客观降水预报。另一个比较常用的降水等级预报方法是基于事件概率回归估计的降水等级预报 (以下称概率回归降水等级预报)。事件概率回归估计方法是将预报量看成随机事件, 将事件出现与否转化为0, 1化的二值变量, 再通过逐步回归方法建立与预报因子之间的概率回归方程, 同时确定事件发生的概率判别值[14]。美国气象发展试验室 (MDL) 一直使用这种方法制作降水客观预报[15], 取得较好效果。
以上两种降水等级预报方法根本区别在于是否将不同降水等级转换为0, 1化的二值变量, 数学方法本身是一致的, 这样处理会对降水预报结果有怎样的影响目前没有明确结论, 本文将在同样资料的基础上来分析两种方法的预报效果差异, 旨在于对两种方法有明确的对比分析结果, 为以后降水等级预报提供参考。
1 资料、技术方案和预报模型建立 1.1 资料本文使用的资料为国家气象中心中期数值预报模式T213模式12:00(世界时, 下同) 起报的预报结果以及我国600多个观测站00:00的24 h降水量, 资料长度为2003年1月—2008年8月8。
T213模式预报为1.125°×1.125°的经纬网格点资料, 预报时效72 h内间隔为12 h, 72~240 h间隔为24 h。
T213模式输出结果以及大量的诊断量插值到站点, 作为该站点的初选预报因子, 通过逐步回归方法筛选出最优的因子组合建立降水预报方程。以下不同预报方案均在相同的初选预报因子基础上建立预报方程。
1.2 预报方案设计为了对比分析回归降水等级预报方法和概率回归降水等级预报方法的差异, 确定判别值的不同方案对预报结果的影响, 设计3个预报方案。
方案1, 即回归降水等级预报方案 (简称S1)。小雨预报方程直接以降水量作为预报对象, 建立预报方程同时确定样本拟合中使得小雨TS评分达最大的方程拟合值作为判别值, 实际预报中预报量大于该判别值则预报有小雨, 否则预报无雨; 对于中雨预报方程, 建立预报方程前将样本中小于中雨的降水量重新赋为0, 中雨以上则保持原值, 建立预报模型同时确定使得样本拟合中雨预报TS评分达最大的方程拟合值为判别值, 实际预报中, 预报量大于该判别值则报有中雨, 否则判断为没有中雨; 其他量级的预报方程依此类推, 最终的预报结果取出现的最大量级。
方案2, 即概率回归降水等级预报方案1(简称S2)。在建立小雨预报方程前, 将样本中大于0.01 mm (小雨) 的样本赋为1, 小于等于0.01 mm的样本赋为0;对于中雨预报则将样本中小于10.0 mm的样本赋为0, 大于等于10.0 mm的样本赋为1.0;以上量级依此类推, 其他处理同S1。
方案3, 即概率回归降水等级预报方案2(简称S3)。在确定判别值时参考预报偏差:对于小雨预报方程取使得拟合小雨预报偏差小于等于1.1且小雨TS评分达到最大的方程拟合值为判别值; 中雨预报方程则取拟合中雨预报偏差小于等于1.2, 且中雨TS评分达最大的方程拟合值为判别值; 量级每增加一级, 预报偏差增加0.1, 其他处理同S2。
1.3 预报模型的建立四季分别建立预报方程, 季节划分采用传统的划分方法, 即每年3—5月为春季, 6—8月为夏季, 9—11月为秋季, 12月—次年2月为冬季。春季和夏季建立预报方程所用的样本资料分别为2003, 2004, 2005, 2006, 2007年的春季和夏季资料, 2008年春季和夏季分别作为试报样本; 建立秋季方程所用的资料为2003, 2004, 2005, 2006年的秋季资料, 2007年秋季作为试报样本; 建立冬季预报方程的资料为2003—2004, 2004—2005, 2005—2006, 2006— 2007年4个冬季资料, 2007—2008年冬季资料作为试报样本。
2 试验结果 2.1 回归降水等级预报与概率回归降水等级预报对比 2.1.1 TS评分图 1给出了2007—2008年四季全国平均降水TS评分。由于预报量是00:00的24 h降水累积等级, 模式的起报时间为12:00, 预报时效是36 h, 60 h, … …, 这里给出了36 h到108 h的检验分析结果。
|
|
| 图 1. 2007—2008年度全国平均降水预报TS评分 Fig 1. TS score of precipitation forecast averaged over China during 2007—2008 | |
从图 1可以看到: 4个季节小雨TS评分中, 除冬季和夏季108 h预报S2和S1的值相等外, 其余时效S2相比较S1都有提高, 其中秋季提高最明显, 36 h预报TS评分从0.35提高到0.45, 提高率为28.6%。中雨预报TS评分除春季108 h预报S1大于S2、秋季84 h和冬季以及春季的60 h预报两个方案的评分相等外, 其余都是S2大于S1, 从后面的预报偏差分析可以看到即使是上面提到的几个预报时效, S2预报偏差相比较S1都更接近1, 说明结合预报偏差看, 这些时效S2相比较S1预报效果也有所提高。因此, 从总体上看S2的中雨预报也比S1有所提高。其他量级预报, 总体上仍是S2好于S1, 但两者相差不大。
降水预报在夏季尤为重要, 夏季两个方案的TS评分均为4个季节中最高的, 其中36 h小雨预报S2的TS评分是0.58, S1的TS评分是0.51, S2比S1提高了14%, 60 h预报TS评分提高了8%, 84 h提高了6%, 108 h两个方案TS评分相等, 夏季小雨预报S2好于S1。中雨及以上量级的情况是:除60 h以及108 h的暴雨预报S1的TS评分略高于S2, 84 h以及108 h的大雨预报TS评分两个方案相等外, 其余TS评分均为S2高于S1。因此整体上看, 夏季降水预报S2好于S1。
2.1.2 预报偏差预报偏差是衡量降水预报的另一个重要指标, 某一量级的预报偏差为该量级预报站点数与实况出现站点数的比值, 因此预报偏差越接近1越好。图 2给出了与图 1相对应的全国平均的降水预报偏差。
|
|
| 图 2. 2007—2008年度全国平均降水预报偏差 Fig 2. Precipitation forecast bias averaged over China during 2007—2008 | |
从图 2可以看出, S1的小雨预报偏差较大, 其中冬季最大, 预报偏差都在2.5以上, 108 h达到3.28, 夏季的预报偏差相对较小, 但预报偏差的值也都在1.5以上, 预报偏差有随预报时效增大的趋势。相比较而言, S2小雨的预报偏差好于S1, 4个季节36~108 h预报偏差都小于1.5并接近1.0, 同时也存在随时效增大的趋势。因此从预报偏差看, S1的雨区预报比实况偏大, 而S2在这点上有非常明显的改进。
中雨及以上量级的预报偏差情况如下:中雨和大雨除冬季外, 其余季节36~108 h两个预报方案的预报偏差都在1.0以上, 其中除了秋季84 h和夏季36 h大雨预报S2的预报偏差比S1大之外, 其余时效S2的预报偏差相比较S1都有不同程度的降低, 说明相比较S1, S2中雨和大雨预报区域偏大的情况有所改进。
由于冬季大雨样本较少, 所以很多站点没有建立大雨预报方程 (样本数少于10则不建立该量级预报方程), 因此预报偏差较小, 而中雨预报的预报偏差情况与其他季节相似。冬季没有暴雨预报评分结果, 这与冬季降水偏少、量级偏小的情况一致, 而其他季节暴雨预报存在与冬季大雨预报相似的情况, 很多站点没有建立暴雨预报方程, 从预报偏差看, 两个方案暴雨预报没有明显差异。
2.1.3 TS评分和预报偏差差异的显著性检验前面分析了两个方案的TS评分和预报偏差情况, 结果表明: S2总体上预报效果好于S1, 尤其是小雨预报相比较S1而言TS评分有提高, 且预报偏差更接近1, 但是差异是否显著还需要进一步通过统计检验的结果来说明问题。
2007年秋季至2008年夏季小雨预报TS评分和预报偏差平均值差异显著性检验结果表明: TS评分平均值差异除了108 h通过0.1显著性检验外, 其他时效都通过了0.01显著性检验, 说明S2小雨预报TS评分的平均值与S1具有显著差异, S2的小雨预报TS评分明显高于S1, 预报偏差平均值差异则是所有时效都通过了0.01显著性检验, 说明S2小雨预报偏差明显小于S1, 显著性检验进一步说明了S2小雨的预报效果明显好于S1。
2.1.4 空报率和漏报率与预报偏差一致, 4个季节中所有预报时效S2的小雨空报率 (图略) 相比较S1都有明显下降, 中雨和大雨的空报率除冬季外也有不同程度的降低, 冬季大雨的空报率从整体上看两个方案相差不是很大。其他3个季节暴雨空报率与冬季大雨相似, 相差不大。
S2小雨漏报率 (图略) 相对S1有所增加, 为0.23~0.46, 其中秋、冬季相对偏大, 而夏季漏报最小, 为0.23~0.29, 说明S2比较S1虽然小雨的漏报有所增加, 但漏报并不严重。其他量级降水的漏报率两者并没有明显差异。
结合TS评分、预报偏差、漏报率和空报率看, S2相比较S1在小雨到大雨的预报不同程度地好于S1, 尤其是小雨预报有明显提高, 但是暴雨以上量级预报则没有明显优势。
2.1.5 预报因子分析本文中不同预报方案都是在同样的预报因子基础上建立预报方程, 由于逐步回归方法从备选的完全一样的预报因子中选出对预报对象最优的因子组合建立预报方程, 因此不同预报方案最终入选方程的预报因子可能会存在差异。
表 1和表 2分别给出了S2和S1 36 h大雨和小雨预报方程中出现频次最多的前10个因子以及占总因子频次的百分比。由表 1可以看到S2中, 小雨预报因子中前10位的主要是湿度因子, 其次是反映动力条件的垂直速度和涡度因子。大雨预报因子中虽然湿度因子仍然重要, 但反映动力条件的垂直速度、涡度等预报因子则大大增加, 说明对于大量级降水预报除了湿度条件外, 满足一定的动力条件也十分重要, 这与实际预报经验相符, 并且湿度相关的因子也不再是湿度本身, 而是其平方或者立方项, 说明大雨与湿度的关系主要表现为非线性的关系, 前10位的预报因子中大雨与小雨有4个因子不同。
|
|
表 1 S2预报因子统计 Table 1 Predictors statistic of Scheme 2 |
|
|
表 2 S1预报因子统计 Table 2 Predictor statistic of Scheme 1 |
S1的预报因子情况 (表 2) 则不一样, 相比较S2, S1小雨预报因子中动力因子增加, 而且位于前10位的小雨预报因子与大雨预报因子完全一样, 说明在S1中没有很好地反映出大雨与小雨发生的热力和动力条件的差异。
2.1.6 样本方差贡献逐步回归方法选取对预报量方差贡献大、相对独立的预报因子进入预报方程, 因此有必要通过预报量的方差情况进一步分析S1与S2的差异, 尤其是在小雨预报上的差异。
下面引入样本方差贡献的概念, 预报量方差S的计算公式如下:
|
(1) |
如果将
|
(2) |
以表征单个样本的重要性, 式 (1) 和式 (2) 中, n为样本总数, i为样本序号。
利用式 (2), 以北京站为例分别计算了S1和S2中建立小雨预报方程样本的样本方差贡献, S1用于建立小雨预报方程的资料为原始的降水量, 而S2用于建立小雨预报方程的资料为处理为0, 1化后的资料。在计算了单个样本的方差贡献后, 统计了原始资料中降水量不低于10 mm, 25 m m和50 m m样本占样本总数的百分比以及总的样本方差贡献, 其目的是为了分析这些大降水量样本在不同情况下对总样本方差的贡献。
表 3给出了S1和S2不同降水量级样本占总样本数百分比以及对应的样本方差贡献。从表 3看出, 对于S1, 降水量大于等于50 mm的样本只占总样本数的0.7%, 但样本方差贡献却达到了38.1%; 而大于等于25 m m的样本占总样本数的2.8%, 样本方差贡献却高达73.4%; 同样, 大于等于1 0 mm的样本占总样本数的8%, 样本方差贡献达到了89.1%。因此在S1中小雨预报方程扩大了少数降水量较大样本的作用, 因子对预报量的方差贡献实际上主要是对这些少数大降水量样本的方差贡献, 而忽略了众多降水量较小的样本是造成S1小雨预报空报较大、TS评分偏低的重要原因, 也是所选预报因子与大雨预报方程无明显差异的主要原因。S2经过0, 1化处理后这个情况得到了很大改善, 原降水量大于等于10 mm的样本方差贡献不到14%, 大于等于25 mm的样本方差贡献只有4.8%, 而50 mm以上样本的样本方差贡献只有1.2%, 与其0.7%的样本总数占有率来看是相当的, 这是S2小雨预报效果比S1有显著提高的重要原因。
|
|
表 3 北京夏季小雨预报方程样本数百分比及方差贡献 Table 3 Sample percentage and corresponding variance contribution of Beijing summer light rain forecast equation |
2.2 S2与模式预报评分比较
前面两个预报方案的对比分析表明:概率回归降水等级预报效果优于回归降水等级预报, 为了说明该处理方案与模式直接预报降水效果的差异, 本文对T213模式的相应降水预报结果进行了插值, 得到相应的全国600多个站的降水预报, 并对2008年6—8月的预报结果进行了检验, 给出了模式直接降水预报 (以下称DMO) 检验结果与S2即概率回归降水等级预报检验结果的对比分析。
36 h预报, 小雨、中雨、大雨和暴雨的TS评分S2都高于DMO预报 (图 3a)。DMO预报偏差较大, 说明预报范围比实况偏大, S2相比较DMO预报的预报偏差有所降低 (图 3b), 除暴雨外, 预报偏差大于且更接近1。漏报率 (图略) 显示36 h预报小雨和中雨S2漏报率大于DMO预报, 表明相对于DMO预报S2的小雨和中雨漏报有所增加, 但是大雨的漏报率小于DMO预报, 而暴雨两者漏报率相等。虽然小雨和中雨的漏报有所增加, 但TS评分提高且预报偏差更接近1, 说明对于36 h预报, S2相比较DMO预报效果有提高。
|
|
| 图 3. 2008年6—8月全国平均降水预报 (a) TS评分, (b) 预报偏差 Fig 3. TS score (a) and forecast bias (b) averaged over China during June to August of 2008 | |
60 h预报除了暴雨的TS评分两者相等外其余与36 h预报相似。84 h预报S2与DMO预报小雨TS评分相等, 中雨、大雨和暴雨预报则DMO高于S2, 但84 h的DMO预报中雨、大雨和暴雨的预报偏差较大, 其中中雨的预报偏差达到了2.3, 同时可以看到DMO的84 h预报偏差也明显大于其自身其他的预报时效。因此, TS评分不大的提高是大大牺牲了预报偏差得到的, 120 h除小雨预报DMO的TS评分略高于S2外, 其余量级是S2高于DMO或者两者相等, 而预报偏差的情况同样是S2更接近1。漏报率除84 h外, 其他时效与36 h一样, 84 h预报小雨到暴雨4个量级S2的漏报率都大于DMO预报, 但前面的分析说明DMO 84 h预报的预报偏差明显偏大, 而S2的预报偏差则明显好于DMO预报。因此, 总的来说, S2的预报要好于DMO预报, 但随时效增加, 其优势有所减弱。
2.3 不同判别值确定方案的对比分析S3采取了与S2不同的判别值确定方案, 在S3中考虑了预报偏差。2008年夏季S3的TS评分 (图略) 除了36 h的小雨和中雨、60 h和108 h的暴雨S2 TS评分相等外, 其余时效和量级小于S2, 但是相差不是很大。从预报偏差看, S3比较S1小雨和中雨预报又有改进 (更接近1), 大雨和暴雨总体上则S3的预报偏差过小, 表明大雨和暴雨预报区域相比较实况过小。
整体上看, S2和S3预报效果基本相当, 但TS评分相比较S2略有下降, 预报偏差则要优于S2。因此, 可以看到判别值的确定会对预报结果有一定影响, 采取适合的判别值确定方案十分重要。不同季节、不同区域应当根据实际情况采取不同方案。
2.4 个例分析以上的统计分析结果表明:概率回归降水等级预报效果优于回归降水等级预报, 且预报效果也好于模式直接降水预报, 为了进一步直观说明, 图 4给出了2008年7月23日降水实况与相应的S2, S1和DMO的36 h降水预报。
|
|
| 图 4. 2008年7月23日00:00 24 h降水量 (a) 和2008年7月21日DMO (b)、S2(c)、S1(d) 36 h降水预报 Fig 4. 24-hour rainfall on 23 July 2008 (a) and corresponding 36-hour forecast on 21 July 2008 of DMO (b), Scheme 2 (c) and Scheme 1 (d) | |
降水实况 (图 4a) 沿江淮流域、长江中游到云南东部、贵州和广西西部是一条明显的降雨带, 有两个明显的降水中心, 一个位于江淮流域, 一个位于贵州到重庆的南部地区, 中心值都大于100 m m, 云南的西部地区有一个相对独立的降雨区域, 其中心值大于25 mm, 另外黑龙江和吉林有一个独立的降水区域, 中心值大于50 mm。
DMO相应于实况的36 h降水预报结果 (图 4b), 雨带分布与实况基本一致, 但江淮流域的降水中心位置相比较实况偏西偏北, 而且中心值偏大, 贵州到重庆南部地区没有出现明显的降水中心, 云南西部没有出现相对独立的降水中心。总体上看, 小雨和中雨的区域比实况偏大, 东北地区的降水中心区域比实况偏东偏北。相比较DMO预报结果, S1 (图 4d) 和S2(图 4c) 则能给出更多的降水分布细节, S2在贵州和重庆南部出现一个与实况相对应的降水中心区域, 但中心位置略偏南, 云南西部出现相对独立的降水区域, 相比较实况位置偏南, 中心位于云南西部和南部地区, 江淮流域的降水中心区域比实况偏西, 中心值偏小, 东北地区的降水区域偏东偏北。总的来说, S2的36 h降水预报与实况比较一致, S1与S2一样能够抓住一些降水分布的细节:贵州到湖南南部地区的降水中心, 云南西部的降水区域。但S1雨区范围明显比实况偏大, 整个东部地区大部分区域出现了小雨, 贵州附近的降水中心偏南。因此, 在3个方案的预报中, S2的预报效果最好。
3 结论和讨论本文利用相同资料建立预报方程, 利用2007—2008年的试报结果对比分析了概率回归降水等级预报和回归降水等级预报的差异, 并与模式直接输出的降水预报进行对比, 得到如下结论:
1) 综合分析TS评分、预报偏差、漏报率和空报率的结果表明:概率回归降水等级预报效果好于回归降水等级预报, 尤其是小雨预报TS评分明显高于回归降水等级预报, 同时预报偏差也有很大改善 (更接近1), 中雨和大雨预报效果有不同程度的改进, 但暴雨以上量级两者预报效果相当。
2) 回归预报方案在建立小雨预报方程的样本中, 少数较大降水量的样本方差占总方差的百分比过大, 导致预报方程中反映预报量与预报因子的关系以这些少数大降水量样本为主, 而在一定程度上忽视了大量小降水量样本的作用, 是造成小雨预报空报过大的原因, 而概率回归降水等级预报方案避免了这样的问题。
3) 预报方程中确定判别值的方案会对预报结果有明显影响, 因此采取合适的方案很重要, 但具体采用何种方案应根据不同情况而定, 不同季节、不同区域可采取不同方案。
4) 与模式直接输出降水预报的对比分析表明:概率回归降水等级预报效果同样好于模式直接降水预报, 模式降水空报较大的情况得到改善。
本文的目的是分析概率回归降水等级预报方案与其他预报方案的差异, 并未从预报因子的角度来探讨改进降水预报效果的途径, 下一步将开展这方面的相关工作。
| [1] | 刘还珠, 赵声蓉, 陆志善, 等. 国家气象中心气象要素的客观预报———MOS系统. 应用气象学报, 2004, 15, (2): 181–191. |
| [2] | 胡江林, 涂松柏, 冯光柳. 基于人工神经网络的暴雨预报方法探讨. 热带气象学报, 2003, 19, (4): 423–428. |
| [3] | 刘爱鸣, 潘宁, 邹燕, 等. 福建前汛期区域暴雨客观预报模型研究. 应用气象学报, 2003, 14, (4): 420–429. |
| [4] | 赵声蓉. 多模式温度集成预报. 应用气象学报, 2005, 17, (1): 52–58. |
| [5] | 魏凤英. 全国夏季降水区域动态权重集成预报试验. 应用气象学报, 1999, 10, (4): 402–409. |
| [6] | 周家斌, 张海福, 杨桂英, 等. 制作汛期降水集成预报的分区权重法. 应用气象学报, 1999, 10, (4): 428–435. |
| [7] | 张万诚, 解明恩. 奇异值分解方法对降水的预测试验. 高原气象, 2002, 21, (1): 103–107. |
| [8] | 刘还珠, 郝为, 林孔元, 等.基于智能计算的多模型气象综合预报∥刘还珠, 汤桂生.暴雨落区预报实用方法.北京:气象出版社, 2000:30-37. |
| [9] | 宋海鸥, 王永红, 顾善齐, 等. 应用K指数和TOT指数制作江苏中期降水预报的试验. 气象科学, 2002, 22, (2): 242–246. |
| [10] | 陈力强, 韩秀君, 张立群. 基于MM5模式的站点降水预报释用方法研究. 气象科技, 2003, 31, (5): 268–272. |
| [11] | 赵声蓉, 裴海瑛. 客观定量预报中降水的预处理. 应用气象学报, 2007, 18, (1): 21–28. |
| [12] | 龚佃利, 王以琳, 谢考宪. 山东飞机增雨降水区分级预报方法研究. 应用气象学报, 2001, 12, (增刊): 139–145. |
| [13] | 曹晓岗. 利用T106数值预报产品作江西暴雨动态落区预报. 江西气象科技, 1998, 21, (1): 2–5. |
| [14] | 黄嘉佑. 气象统计分析与预报方法. 北京: 气象出版社, 1990. |
| [15] | Mark S A, An overview of the National Weather Service' s centralized statistical quantitative precipitation forecast. J Hydrol, 2000, 239, (9): 306–337. |
2009, 20 (5): 521-529

