目前常用的降水预报检验方法主要通过计算TS评分、空报率、漏报率、命中率、预报偏差等若干统计量来实现[1-4]。该方法与日常业务联系更紧密,且更易理解,因此往往也将其沿用到数值模式降水预报检验和评估方面[5, 6]。随着数值预报模式在时间和空间分辨率上的提高,传统的检验方法已不足以评估模式产品的精细化预报能力。王在文等[7]研究认为,模式的高分辨率(如3 km分辨率)和观测能支撑的检验分辨率之间存在的较大差异,会导致Ts检验结果的可信度下降。肖玉华等[8]对数值预报模式进行全国预报分区域客观检验分析,发现Ts评分能反映模式对各级降水的预报能力,但却掩盖了模式降水预报能力的空间信息。
由于传统预报检验方法在模式精细化预报能力评估方面存在不足,从预报精细化发展的趋势看, 解决降水预报检验标准问题的有效措施是尽快推进定量化降水预报, 使分级预报过渡到降水量值预报[9]。近年来,面向对象的预报检验方法正逐渐兴起,其中有代表性的有MODE(Method for Object-Based Diagnostic Evaluation) [10]、CRA(Contiguous Rain Area) [11]、SAL(Structure, Amplitude and Location)[12]等检验方法。所谓面向对象,就是识别有限区域内的天气系统并将其作为预报检验对象,利用各种空间诊断检验技术,关注预报场与观测场的相似程度、位置面积、轴角方位等的不同,或在构造变形矢量的基础上分析模式的预报能力[13]。王国荣等[14]认为,相对于传统的点对点的检验方法,MODE综合考虑了空间位置、形状、面积等多种因素,并通过符合主观判断的模糊逻辑算法计算相似度,克服了数值预报传统检验方法对于空间位置的过度依赖以及TS评分中的“双重惩罚”等不足,有较高的实际应用价值。符娇兰等[15]使用CRA方法对欧洲中心数值预报产品2012年汛期西南地区的强降水过程预报进行了检验。公颖[16]研究发现,SAL检验方法计算科学简单、结果量化直观,对雨带的预报从强度、位置、结构三方面进行评估,具有量化指示各预报准确度的特点。但同时各面向对象的预报检验方法也存在计算复杂(CRA)、对预报对象在时间分布细节方面检验不足、只针对同一个降水实况的条件下具有可比性(SAL)等缺点。
本文采用综合使用MODE和SAL两种方法的思路,即在MODE相似度检验方法的基础上,引入降水预报时间序列的分析,形成观测、预报场的相似度矩阵,然后通过SAL结构分析的思路进行量化评分,以期找到一种对数值模式降水精细化预报能力快速实用的检验方法。
1 资料来源及处理 1.1 资料来源选取2016年4月5-6日武汉市出现的一场暴雨天气过程作为分析对象。观测数据取自武汉国家基本观测站报表数据中117个区域自动观测站和5个国家观测站逐小时雨量数据观测数据已经过质量审核;预报数据为中国气象局通过CMACAST下发的欧洲中心(EC_thin)、日本(Japan_thin)和T639(T639_thin)细网格48 h内逐3 h降水预报资料。各产品统一使用强降水出现前一天20时的预报结论。
武汉市精细化预报业务系统已在武汉市气象台业务化运行,综合使用了武汉暴雨所WRF及欧洲中心、T639和日本细网格数值预报产品,经解释应用后生成113.6°- 115.2°E,29.8°-31.4°N范围内降水等气象要素72 h内逐3 h的1 km×1 km的精细化预报结论。本文使用的预报数据采用武汉市精细化预报业务系统(以下简称精细化系统)中12~24 h内逐3 h降水预报结论。
1.2 资料处理研究表明[17],在相对较小区域范围内,下垫面地形环境变化不大、观测站点较为密集且分布相对均匀的情况下,各插值方法得出的降水分布结果相差不大,比较而言,反距离权重系数(IDW)较为稳健,在运算速度方面更有优势,因此本文中均采用IDW方法进行插值计算。
观测数据中缺测站点的雨量数据由邻近2~4个站点的插值补齐;预报数据选取113.6°-115.2°E,29.8°-31.4°N范围内,插值生成0.01经度×0.01纬度的网格数据,根据网格数据读取122个观测站点雨量逐3 h的预报值。实际应用中发现,插值后往往存在雨区范围扩大的问题,经武汉市精细化预报业务系统检验,使用3 h雨量≥0.2 mm、24 h雨量≥0.5 mm作为降水阈值,低于相应阈值的记录作预报无降水(0 mm)处理。
2 检验方法 2.1 Ts评分根据中国气象局制订的“重要天气预报质量评定办法”,Ts评分方法为:
| $ {T_{\rm{s}}} = {N_{\rm{a}}}/({N_{\rm{a}}} + {N_{\rm{b}}} + {N_{\rm{c}}}) $ | (1) |
Ts为预报准确率, 由表 1确定, Na、Nb、Nc分别为报对、漏报、空报的站(次)数。
|
|
表 1 降水量分级表 Table 1 The precipitation classification |
Ts评分在0~1之间, 反映了对降水有效预报的准确程度, 在同一季节对同一地区的预报具有可比性。
2.2 MODE和SAL检验MODE算法首先在预报、观测格点场分别作平滑处理后,使用阈值法进行过滤,将格点场中的主要对象分离出来,并进行识别和标记,得到预报场和观测场中的对象。然后是计算相似度,以如下方程的形式进行累加:
| $ {I_j} = \frac{{\sum\nolimits_{i = 1}^M {{c_i}{w_i}{F_{ij}}} }}{{\sum\nolimits_{i = 1}^M {{c_i}{w_i}} }} $ | (2) |
式中F代表相似方程,计算得到的是两个对象之间的相似系数(值在0~1之间),w是该相似系数在总相似度中所占的权重,c为该相似系数的置信度,M为相似系数的总个数。常用的相似系数有面积比、重叠率、几何中心距离、边界最短距离等,每一种相似系数的权重和置信度可以由使用者按照自己的需求进行设计。
SAL同样需要使用阈值法划分、识别预报对象,然后通过计算Structure(S)、Amplitude(A)和Location(L)三个误差,其中参数S表示预报场对降水区域结构的预报是否准确,参数A描述了预报场的平均降水预报准确度,参数L描述了预报场的平均落区准确度。三个参数的完美值均为0,S的计算公式为(下标fc代表预报数据,ob代表观测数据):
| $ S = \frac{{V({R_{{\rm{fc}}}})- V({R_{{\rm{ob}}}})}}{{0.5[V({R_{{\rm{fc}}}}) + V({R_{{\rm{ob}}}})]}} $ | (3) |
式中
由以上分析可知,MODE和SAL主要针对区域内某一时段内的降水总量的强度和空间分布进行检验评估,如需对数值预报产品的一次连续降水在时间和空间上的精细化预报准确度进行综合评估,则要通过划分时间段的方式,分别计算每一个时间剖面的雨量场准确度,然后进行综合评估完成,这样不仅会大大增加计算量,而且很难给出能适应各种情况的完美的综合评估方案。
2.3 综合检验(1) 直接使用自动站降水作为检验对象,略去对象识别和选择的环节:由一次降水过程得到武汉市各自动站从降水开始到结束的122个雨量实况时间序列;将数值模式降水预报插值到自动站,读取各站点对应的雨量值,根据设定的阈值生成相应的122个雨量预报时间序列。
(2) 按照MODE相似度计算的思路,以(2)式计算得到各预报时间序列与实况时间序列的相似度,形成相似度矩阵。
本文采用欧几里德距离(Euclidean Distance)来计算空间平面图像相似度[18],以皮氏积矩相关系数(Pear son product-moment correlation coefficient, PPCC)来计算时间序列相似度,计算公式分别为:
欧几里德距离:
| $ Sim(x, y) = \frac{1}{{1 + \sqrt {\left( {\sum {{{\left( {{x_i}-{y_i}} \right)}^2}} } \right)} }} $ | (4) |
Sim(x, y)的范围为[0, 1],值越大,说明距离越近,则相似度越大。
相关系数:
| $ r = \frac{{\sum\nolimits_{i = 1}^n {\left( {{x_i}-\bar x} \right)\left( {{y_i}-\bar y} \right)} }}{{\sqrt {n\sum\nolimits_{i = 1}^n {x_i^2}-{{\left( {\sum\nolimits_{i = 1}^n {{x_i}} } \right)}^2}} \cdot \sqrt {n\sum\nolimits_{i = 1}^n {y_i^2} - {{\left( {\sum\nolimits_{i = 1}^n {{y_i}} } \right)}^2}} }} $ | (5) |
相关系数r取值范围为[-1, 1],r>0表示正相关,r < 0表示负相关,|r|表示了变量之间相关程度的高低。r=1称为完全正相关,r=-1称为完全负相关。通常认为|r|为0.6~0.8表示强相关,0.4~0.6为中等程度相关,0.2~0.4为弱相关,0.0~0.2为极弱相关或无相关。
(3) 以SAL方法中结构分析的方法(③式),得到预报场对降水区域结构的评估,计算相似度矩阵的特征值作为模式场预报准确率的总体描述。矩阵特征值以各站点降水量作为权重系数[19],计算公式为:
| $ Q = \sum\nolimits_{i = 1}^n {\left( {\frac{{{x_i}}}{{\sum\nolimits_{i = 1}^n {{x_i}} }} \cdot {r_i}} \right)} $ | (6) |
式中ri为各站点时间序列的相关系数,xi为站点总降水量,Q为矩阵特征值。
3 检验与分析 3.1 检验对象使用传统Ts检验、MODE检验及综合检验三种方法,分别对武汉市2016年4月5日、6月1日、6月19日(分别简称为4-5、6-1和6-19过程, 下同)出现的三场强降水天气过程(图 1)武汉精细化预报结果进行了检验。
|
图 1 2016年4月5日(a)、6月1日(b)、6月19日(c)武汉市强降水过程雨量分布图(单位:mm) (色斑为雨量实况,等值线为对应时段的雨量预报,黄色△为Ts评分站点) Fig. 1 The rainfall distribution in Wuhan (unit: mm) at (a) 5 Apr, (b)1 Jun, and (c)19 Jun 2016. spots(contour) are for the live(forecast) precipitation, yellow △ for TS score sites. |
4-5过程强降水时段为2016年4月5日16:00至4月6日20:00(北京时,下同),降水空间分布为南部暴雨-大暴雨,北部大雨;6-1过程强降水时段为2016年6月1日05:00-11:00,主要为中部大暴雨,其它区域中雨;6-19过程则为全市暴雨-大暴雨,降水时段6月19日07:00-16:00。这三次强降水过程分别为春季、初夏(6月初入夏)和梅雨期暴雨(6月18日入梅),在时间和空间分布上较为全面地涵盖了多种类型,其检验分析结果应颇具代表性。
3.2 结果与分析参照24 h评分标准,对三次强降水过程中武汉市五个评分站(武汉57494、蔡甸57489、黄陂57491、新洲57492、江夏57493)的过程雨量进行Ts评分。MODE方法是以122个观测站点过程雨量绘制空间分布图,并作为特征点比较对应相应时段的模式预报结果,计算预报和实况场分布图的相似度,分析预报准确率。同时,在MODE计算中将相似度替换为Ts评分进行计算以作为比较。各检验方法结果情况见表 2,需要说明的是,由于评价标准不同,各方法之间的得分一般不具有可比性。
|
|
表 2 2016年武汉市三次强降水过程检验得分情况(%) Table 2 The test scores(unit:%) of three times heavy rain events in Wuhan |
如表 2所示,在Ts评分中6-1过程与6-19过程一样,暴雨预报得分为0,远低于4-5过程。这是因为各评分站未出现暴雨,而模式在靠近强降水中心的武汉、江夏两站预报了50 mm以上的降水,实况是两站降水为46.5 mm和25.5 mm,检验判定为空报;6-19过程中暴雨Ts评分偏低是因为模式五个评分站降水量预报为41.6~48.7 mm,实况是有两站雨量52、64 mm,三站雨量超过100 mm。很明显,Ts评分中按雨量分级评定的方法忽略了预报更为接近实况的细节,未能客观反映出模式预报的准确度。
MODE检验中,直接使用122个站点进行Ts评分来代替图像相似度的计算,对于强降水预报准确度的评价也有很大的改善。三次过程中得分变化均非常明显,得分最高的依然是4-5暴雨过程,这是因为这两次过程强降水均有覆盖范围广的特点,模式针对有限区域内的预报暴雨命中率相对而言会更高一些;对于6-1过程来说,集中在小范围内的强降水使模式空报率升高,导致得分偏低。使用图像相似度进行比较,6-1过程相似度特征值反而大于6-19过程,这说明模式对三次过程中降水在空间分布上的定量预报实际是6-19过程最差。这个结论完全不同于以上两个Ts评分的结果,但通过对图 1的分析可以看出,显然采用MODE相似度计算结果更为准确客观。
综合检验方法对三次强降水过程检验结果表明,在降水起止时间、3 h雨强以及降水集中时段等方面,6-1过程预报最为准确,对比图 1和图 2可以看到,各过程时间序列相关系数较大的区域均基本覆盖了实况中的强降水中心;6-1过程预报对全市范围内降水的发展也做了很好的预报,仅仅在中部偏西的区域和新洲北部两个小范围内出现了偏差;4-5过程和6-19过程中,模式预报出现偏差的区域范围明显大于6-1过程,从最终得分也可以看到,6-1过程预报相关系数矩阵的最大值,尤其是特征值显著高于另两次过程。在此结论的基础上,武汉市气象台对于6-1暴雨过程的气象服务取得了非常好的效果。
|
图 2 综合检验方法对4-5(a)、6-1(b)、6-19(c)三次过程中各站点时间序列相关系数分布图 Fig. 2 The distribution of correlation coefficient between comprehensive inspection parameters and live precipitation in Wuhan for the evets of (a)5 Apr, (b)1 Jun, and (c)19 Jun 2016. |
(1) 使用Ts检验、MODE检验及综合检验三种方法,对武汉市2016年4~6月三场强降水天气过程中武汉市精细化预报业务系统的预报结果进行了检验,结果表明:武汉市精细化预报业务系统对于本市强降水有较好的预报能力,而且在降雨的时空分布上有较高的辨识度;在对2016年武汉市出现的三次强降水过程的预报中,4-5暴雨过程Ts评分最高,综合检验方法表明6-1过程的预报对强降水起止时间、雨强和空间分布的预报更为准确;同时,综合检验方法以一场暴雨发生、发展到消亡完整的过程作为研究对象,对实际工作中开展精细化气象服务的指导意义更为明显。
(2) 综合检验使用面向暴雨过程对象的方法,结合MODE和SAL的检验思路,以一次区域范围内的强降水作为研究对象,主要考虑了降水起止时间、3 h雨强和强降水出现时段等因素,以区域内各站点降水预报时间序列和实况时间序列的相关系数构建空间分布矩阵,通过对矩阵的结构和数值进行分析以检验模式预报的准确度。与Ts评分和MODE检验等方法相比,综合检验方法可以很好地用于评估各数值模式在降水起止时间、降水强度的时空分布等方面的准确度,作为预报员日常气象服务的参考以及数据预报产品解释应用系统中动态权重系数或模式/模型自学习的依据。
(3) 综合检验方法同样适用于气温、气压、湿度等要素场的预报检验;对风、流场等矢量场的检验可以考虑使用余弦相似度判别以构造相似度矩阵。
(4) 由于简化了预报对象识别选取及相似度计算的过程,当模式预报降水落区出现偏差时,综合检验方法评价的模式预报准确度将大为降低。在这种情况下,应该在识别并选取预报对象后,采用CRA方法中移动雨区使预报场和观测场达到最大相似,以此时的雨区位移量作为一个评判依据,再使用综合检验方法进行检验,结合使用多个判据进行评估,可以更为客观地判断模式预报的准确度。
| [1] |
陈超君, 李俊, 王明欢. 2013年华中区域中尺度业务数值预报的客观检验[J]. 暴雨灾害, 2014, 33(2): 187-192. DOI:10.3969/j.issn.1004-9045.2014.02.012 |
| [2] |
陈博宇, 代刊, 郭云谦. 2013年汛期ECMWF集合统计量产品的降水预报检验与分析[J]. 暴雨灾害, 2015, 34(1): 64-73. DOI:10.3969/j.issn.1004-9045.2015.01.009 |
| [3] |
张兵, 钟敏. GRAPES模式对湖北省汛期强降水预报的分类检验分析[J]. 暴雨灾害, 2009, 28(2): 137-142. DOI:10.3969/j.issn.1004-9045.2009.02.007 |
| [4] |
李俊, 王明欢, 公颖, 等. AREM短期集合预报系统及其降水预报检验[J]. 暴雨灾害, 2010, 29(1): 30-37. DOI:10.3969/j.issn.1004-9045.2010.01.005 |
| [5] |
公颖, 李俊, 鞠晓慧. 2009年我国汛期降水形势总结与三个常用模式预报效果检验[J]. 热带气象学报, 2011, 27(6): 823-833. DOI:10.3969/j.issn.1004-4965.2011.06.005 |
| [6] |
肖玉华, 何光碧, 陈静, 等. AREM对2008年西南地区低温雨雪天气预报能力的检验[J]. 暴雨灾害, 2009, 28(2): 152-156. DOI:10.3969/j.issn.1004-9045.2009.02.010 |
| [7] |
王在文, 梁旭东, 范水勇, 等. 数值模式降水评分对分辨率的敏感性初探[J]. 暴雨灾害, 2016, 35(1): 10-16. DOI:10.3969/j.issn.1004-9045.2016.01.002 |
| [8] |
肖玉华, 赵静, 蒋丽娟. 数值模式预报性能的地域性特点初步分析[J]. 暴雨灾害, 2010, 29(4): 322-327. DOI:10.3969/j.issn.1004-9045.2010.04.004 |
| [9] |
李良武, 拓砚军, 陈文涛. 降水预报检验标准浅议[J]. 气象科技进展, 2015(06). |
| [10] |
Davis, Brown, Bullock. Object-Based Verification of Precipitation Forecasts[J]. Monthly Weather Review, 2006, 134(7): 1772-1784. DOI:10.1175/MWR3145.1 |
| [11] |
EE Ebert, McBride J L. Verification of precipitation in weather system: determination of systematic errors[J]. Journal of Hydrology, 2000, 239(1-4): 179-202. DOI:10.1016/S0022-1694(00)00343-7 |
| [12] |
Wernli, Heini, Paulat Marcus, Hagen, Martin, et al. SAL-A Novel Quality Measure for the Verification of Quantitative Precipitation Fore casts[J]. Monthly Weather Review, 2008, 136: 4470-4480. DOI:10.1175/2008MWR2415.1 |
| [13] |
潘留杰, 张宏芳, 王建鹏. 数值天气预报检验方法研究进展[J]. 地球科学进展, 2014, 29(3): 327-335. |
| [14] |
王国荣, 陈敏, 由凤春, 等. 基于对象诊断的空间检验方法(MODE)[J]. 气象科技, 2014, 42(4): 652-656. DOI:10.3969/j.issn.1671-6345.2014.04.022 |
| [15] |
符娇兰, 宗志平, 代刊, 等. 一种定量降水预报误差检验技术及其应用[J]. 气象, 2014, 40(7): 796-805. |
| [16] |
公颖. SAL定量降水预报检验方法的解释与应用[J]. 暴雨灾害, 2010, 29(2): 153-159. DOI:10.3969/j.issn.1004-9045.2010.02.009 |
| [17] |
刘劲松, 陈辉, 杨彬云, 等. 河北省年均降水量插值方法比较[J]. 生态学报, 2009, 29(7): 3949-3500. |
| [18] |
李苏梅, 韩国强. 感兴趣区域的确定及相似度计算方法[J]. 湖南工业大学学报, 2008, 22(4): 48-52. DOI:10.3969/j.issn.1673-9833.2008.04.013 |
| [19] |
罗军, 朱文奇. 考虑物品相似权重的用户相似度计算方法[J]. 计算机工程与应用, 2015, 51(8): 123-127. DOI:10.3778/j.issn.1002-8331.1306-0048 |
2017, Vol. 36 