2. 国家气象中心, 北京 100081;
3. 北京市气象局, 北京 100089
2. National Meteorological Center, Beijing 100081;
3. Beijing Meteorological Bureau, Beijing 100089
雷暴大风是北京地区夏季发生的主要灾害性天气之一。雷暴大风发生发展突发性强且破坏力大,常对交通运输、人民生活带来严重影响,目前预报该类天气还有一定难度,如何深入有效研究雷暴大风的精细化气象灾害天气预警和提升短时预报能力是十分重要而紧迫的任务。
气象工作者对于雷暴大风天气研究已取得一些成果,为改善雷暴大风的预报预警起到一定的指示作用[1-11]。俞小鼎等[12]指出雷暴大风临近预报主要基于雷达回波特征,中层径向辐合和弓形回波有很好的指示意义。廖晓农等[13]总结了北京地区雷暴大风的气候特征,并提出短时临近预报方法。王福侠等[14]发现河北地区雷暴大风的主要雷达回波特征有弓形回波、阵风锋和径向速度大值区,出现其中一个或多个特征均可发布雷暴大风预警。廖玉芳等[15]对湖南常德多普勒天气雷达产品的强对流天气预报、预警方法进行研究,建立了基于雷达回波形状、强对流天气场特征、垂直积分液态水含量、强对流天气风场特征等因子的预报、预警数学模型。
周金莲等[16]应用短时临近预报预警业务系统生成的TITAN产品,提出了6个候选识别参数,对武汉多普勒天气雷达用模糊逻辑等权重法识别对流性大风。李国翠等[17]依据众多学者现有理论研究结果,初步发展了基于雷达组网数据的雷暴大风识别算法。周康辉等[18]在地面气象观测站大风观测记录的基础上,结合卫星、雷达等多源数据,利用模糊逻辑算法,建立了一套全国范围的雷暴大风自动识别的算法。这些研究结果表明:利用雷达回波识别对流性大风算法可行,并值得进一步研究。
支持向量机作为一种智能学习方法,既可处理非线性数据,又能有效解决训练样本较少时的过拟合问题[19],且其分类结果不依赖于阈值,分类速度快、准确率高。因此,本研究基于支持向量机的分类原理,根据不同形态雷达回波不同生命期内雷达回波、平均径向速度场、谱宽等产品特征信息等对雷暴大风提前预警具有指示作用的统计信息[20],利用北京市观象台雷达基数据和加密自动气象站数据确立了9个用于识别雷暴大风的预报因子,并以此作为训练样本建立了雷暴大风天气的有效识别模型。通过对雷暴大风的独立样本检验,证明这种识别算法切实可行,对于提高雷暴大风预警预报的准确率有一定帮助。
1 支持向量机基本原理支持向量机(简称SVM)是基于1909年Mercer核展开定理[21],通过非线性映射φ,将样本空间映射到一个高维乃至于无穷维的特征空间,使在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。与线性回归法对某一时刻降水相态客观化预报相比,SVM适合解决本质上非线性的分类、回归和密度函数估计等问题[22],可用于具有显著非线性特征的气象预报中,所得出的SVM推理模型具有良好的预报能力,在短期天气预报、数值预报释用、实时短期预报业务等方面有良好的预报前景[23-24]。
2 建立雷暴大风天气的提前识别和临近预警模型具体流程(图 1)主要包括3步:①确立雷暴大风SVM建模的预报因子。利用统计法定量分析2010—2014年北京地区18次雷暴大风过程回波顶高、最大反射率因子、最大反射率因子所在高度、垂直积分液态水含量、垂直积分液态水含量随时间变率、垂直积分液态水含量密度、雷暴大风发生前最大反射率因子下降高度、风暴移动速度、速度谱宽。②预报因子归一化处理。计算各项预报因子在大风和非大风样本中的概率分布,并得到对应的各项预报因子雷暴大风的隶属度,利用得到的隶属度函数对样本进行归一化处理。③确定核函数和模型参数,建立雷暴大风天气的有效识别模型。
|
|
| 图1 基于支持向量机的雷暴大风识别模型建立流程 Fig.1 Flow chart of the thunderstorm gale identification model based on SVM | |
2.1 确立雷暴大风支持向量机建模的预报因子
选取为北京地区2010—2014年的18次雷暴大风天气过程,采用北京市观象台雷达基数据(径向分辨率为1 km,时间分辨率为6 min)以及北京地区时间分辨率为5 min的加密自动气象站风场数据及大风重要天气报数据。
提取风暴单体识别产品的预报因子在18次雷暴大风个例中的值,与自动气象站极大风时间和地点进行匹配,匹配时时间限定在前后5 min以内,距离限定在5 km范围以内。最终挑选了451个非大风样本和425个大风样本,其中大风样本包括瞬时极大风速超过13.9 m·s-1的测站样本,非大风样本包括瞬时极大风速小于8 m·s-1的测站样本。通过定性、定量分析不同形态雷达回波不同生命期内的演变规律,以及雷达回波强度、回波顶高、垂直积分液态水含量、阵风锋、平均径向速度场、谱宽等产品特征信息及其提前量,归纳总结了对雷暴大风提前预警具有指示作用的信息[15],并确定以下9个用于识别雷暴大风的预报因子。
① 回波顶高。该因子反映了云内垂直上升气流的强度,可衡量风暴发展强弱程度,回波顶高越高, 云内上升气流越强,风暴发展越强。雷暴大风一般对应的回波顶高较高,本研究样本统计结果表明:发现当回波顶高超过6 km时,雷暴大风出现的概率开始增大,而当回波顶高超过8 km时,雷暴大风出现的概率更大。
② 最大反射率因子。该因子指一个体积扫描中风暴不同高度投影反射率因子的最大值,其值越大,代表的粒子越大,产生的下沉气流也越强。廖玉芳等[15]认为回波中心强度小于55 dBZ时,出现大风的概率较小;回波强度为55~60 dBZ时,概率较大;回波强度为60~65 dBZ时,概率很大。本研究样本统计结果表明:当风暴最大反射率因子超过55 dBZ时,出现雷暴大风的概率开始增大。
③ 最大反射率因子所在高度。该因子指最大反射率因子向上扩展的高度。反射率因子高值区向上扩展到越高的高度,产生雷暴大风的可能性越大;本研究样本统计结果表明:最大反射率因子所在高度大于4.5 km时,雷暴大风出现的概率开始增大,所在高度大于5.5 km时,雷暴大风出现的概率更大,也有一些样本对应的最大反射率因子所在高度为2 km以下,一般此时对流风暴中的下沉气流已经到达地面。
④ 垂直积分液态水含量。该因子反映降水云体中,在某一确定的底面积的垂直柱体内液态水含量分布。垂直积分液态水含量值越大,则说明空中液态水含量越多,东高红等[1]认为垂直积分液态水含量达到30 kg·m-2为地面灾害性大风出现的阈值,而垂直积分液态水含量不小于40 kg·m-2可以作为地面灾害大风的一个预报指标。本研究样本统计结果表明:垂直积分液态水含量超过25 kg·m-2时,雷暴大风出现的概率开始增大;而当垂直积分液态水含量超过40 kg·m-2时,雷暴大风出现的概率更大。
⑤ 垂直积分液态水含量随时间变率。该因子指相邻两个体积扫描之间的垂直积分液态水含量变化,刁秀广等[3]指出,强单体垂直积分液态水含量至少减少10 kg·m-2,是大风提前0~9 min预报的指标。本研究样本统计结果表明:当垂直积分液态水含量变化量超过6 kg·m-2时,雷暴大风出现的概率开始增大,垂直积分液态水含量变化量越大,雷暴大风出现的概率越大。
⑥ 垂直积分液态水含量密度。该因子定义为垂直积分液态水含量与风暴单体高度之比。本研究样本统计结果表明:垂直液态水含量密度大于4 g·m-3时,雷暴大风出现的概率较大,垂直液态水含量密度越大,雷暴大风出现的概率越大。
⑦ 最大反射率因子下降高度。该因子指同一风暴单体强中心当前体积扫描的反射率因子高度与前一体积反射率因子高度的差值。周金莲等[16]认为风暴单体强中心高度下降越快,则下沉气流越强,产生大风的可能性也越大。东高红等[1]认为风暴到达地面前最大反射率因子的快速降低,预示着地面灾害性大风的开始。本研究样本统计结果表明:最大反射率下降高度超过2.5 km时,雷暴大风出现的概率开始增大。
⑧ 风暴移动速度。雷暴在初生、发展阶段移动较慢,成熟和减弱阶段因地面出流的影响,风暴传播加快,其值越大,雷暴大风发生概率越高[16]。本研究样本统计结果表明:风暴移动速度超过45 km·h-1时,雷暴大风出现的概率开始增大。
⑨ 速度谱宽。该因子可提供由于风切变、湍流和速度样本质量引起的平均径向速度变化的观测,对于风场变化有一定指示意义。本研究样本统计结果表明:雷暴大风发生时,速度谱宽一般为7~14 m·s-1,当谱宽值大于8 m·s-1时,雷暴大风出现概率基本维持在50%左右。
2.2 建立隶属度函数根据已有的工作和上述预报因子的特征,对9个预报因子进行大风和非大风样本概率分布统计,得到雷暴大风的概率分布函数FYi和非雷暴大风的概率分布函数FNi, 利用式(1)计算各预报因子对应的隶属度函数MFi,使其归一化到[0, 1]范围。
|
(1) |
由于样本量有限,概率密度函数为离散点分布,为了得到更好的概率分布特征,利用S型曲线y=1/(e-a(x+b)+c)进行拟合,其中,x为预报因子,y为预报因子的拟合函数,a,b,c为待估参数。各预报因子隶属度函数如图 2所示。
|
|
| 图2 9个预报因子的隶属函数 Fig.2 The function member of forecast factors | |
2.3 确定核函数和模型参数
模型建立包括核函数选取和参数确定,本研究选取广泛使用且效果较好的径向基(RBF)函数作为核函数。需要确定的参数有惩罚因子C和径向基宽度g。C控制函数的复杂度,C越大,对松弛变量的惩罚越大,两个支持向量直线之间的间隔越小,模型越精确苛刻,对噪声数据点容忍小,越容易过拟合;C越小,两个支持向量直线之间的距离越大,对噪声的容忍能力就越大,最终效果越好;g通过定义高维空间的结构控制最终解的复杂程度。
为进行参数调优,将训练样本集输入支持向量机,采用基于网格搜索的交叉验证方法,将待搜索内容在一定空间范围内划分成网格,通过遍历网格内所有点得到最优参数C为2048,g为0.111111,通过训练,得到雷暴大风识别模型。
2.4 检验和评价雷暴大风预报模型 2.4.1 带状回波检验2017年7月7日傍晚至夜间受东移南下的飑线影响,北京市大部分地区出现雷阵雨并伴有雷暴大风、冰雹等灾害性天气。瞬时风力达6~9级,其中延庆、昌平、怀柔、门头沟、平谷等区局地出现10级以上短时大风,平谷玻璃台站和怀柔桥梓站瞬时风力达11级(分别为32.2 m·s-1和31.8 m·s-1)。
2.4.1.1 识别检验利用支持向量机建立的雷暴大风预报模型,对7月7日11:00—16:00(世界时,下同)北京雷达6 min时间间隔的数据进行风暴跟踪和识别,在51次体扫中,累计识别出111个雷暴单体,定量提取每个风暴单体识别产品的定量分析指标,并与自动气象站大风出现时间和地点进行匹配。应用建立好的雷暴大风预报模型,将检验数据的特征矩阵和标签进行预测得到预测标签,再将预测标签和真实标签进行对比。
图 3为识别出的出现大风的风暴单体与实况大风测站的位置图。由图 3可以看到,风暴单体出现的位置与实况大风测站出现位置基本对应。
|
|
| 图3 2017年7月7日实况大风位置与识别出的大风风暴单体分布 Fig.3 The position of gale and identified thunderstorm cells with gale on 7 Jul 2017 | |
选用命中率(POD)、误判率(FAR)、临界成功指数(CSI)等参数对结果进行定量检验。7月7日11:00—16:00累计识别出可能出现大风的风暴单体111个,其中,正确识别大风的站次为81,出现大风但未被识别出的站次为7,未出现大风但误识别为大风的站次为23,所以命中率、误判率及临界成功指数分别为92.0%,22.1%,73.0%。
2.4.1.2 检验结果为进一步分析本次过程中实况大风位置与识别出的风暴单体的对应情况,对反射率因子、地面实况大风及识别出风暴单体进行对比分析。图 4为7月7日15:11及15:23反射率因子、实况大风位置与风暴单体位置分布。由图 4a可以看到,识别出的6个风暴单体中,有2处识别为雷暴大风,其中有1处(图 4a中A处)并没有相应的自动气象站出现大风,考虑与此风暴单体附近自动气象站站点稀疏有一定关系;另外有4个风暴单体,识别为非大风,对应3处,自动气象站并未出现大风,另有1处(图 4a中B处)对应自动气象站出现了大风,对应9个预报因子,该风暴单体对应的垂直积分液态水含量为10 kg·m-2,垂直积分液态水含量随时间变率为0,回波顶高和最大反射率因子所在高度均为2.4 km,这些值均不利于大风的识别,但从反射率因子看,这块回波为主回波区,对应反射率因子较大,回波顶高和最大反射率因子所在高度较低,考虑此时风暴单体发展已经很成熟,对流风暴中的下沉气流已到达地面。由图 4b可以看到,识别出的8个风暴单体中,有4处识别为大风,其中有1处(图 4b中A处)并没有相应的自动气象站出现大风,具体对应9个预报因子,该风暴单体对应的垂直积分液态水含量随时间变率为6 kg·m-2·(6 min)-1,垂直积分液态水含量为22 kg·m-2,回波顶高为9.9 km,从预报因子看属于容易出现雷暴大风的风暴单体,但从整体的雷达反射率因子看,这块回波离主体回波较远,比较孤立,这种情况需要预报员的定性判别;另外4处识别为非大风,对应3处自动气象站并未出现大风,另有1处(图 4b中B处)对应自动气象站出现了大风,具体对应9个预报因子看,利于大风的出现,但模型判断为非大风,考虑也许与该位置附近站点稀疏或时间分辨率较低有关。
|
|
| 图4 2017年7月7日15:11(a)及15:23(b)反射率因子(填色)、实况大风位置与风暴单体 Fig.4 Base reflectivity(the shaded), the position of gale and identified thunderstorm cells at 1511 UTC(a) and 1523 UTC(b) on 7 Jul 2017 | |
2.4.2 块状回波检验
2012年5月19日傍晚到夜间受强对流风暴单体影响,平谷、怀柔等地出现雷阵雨,并伴有8级以上短时雷暴大风、冰雹等灾害性天气,怀柔怀北瞬时风力达9级(22 m·s-1)。
2.4.2.1 识别检验图 5为2012年5月19日识别出的出现大风的风暴单体与实况大风测站分布。由图 5可以看到,风暴单体出现的位置与实况大风测站出现位置基本对应。
|
|
| 图5 2012年5月19日实况大风位置与识别出大风的风暴单体分布 Fig.5 The position of gale and identified thunderstorm cells with gale on 19 May 2012 | |
利用支持向量机建立的雷暴大风预报模型,对5月19日09:00—14:00北京雷达6 min时间间隔的数据进行风暴跟踪和识别,在51次体扫中,累计识别出201个雷暴单体,其中,正确识别大风的站次为119,出现大风但未被识别出的站次为1,未出现大风但误识别为大风的站次为81,该命中率、误判率及临界成功指数分别为99.2%,40.5%,59.2%。
2.4.2.2 检验结果该个例的命中率高,但误判率也较高,即实况没有监测到雷暴大风,但根据雷暴大风预报模型得到的风暴单体判定为出现雷暴大风的样本较多。对反射率因子、地面实况大风及风暴单体进行对比(图 6),并挑选了一些误判的样本,具体给出了7个误判样本所对应的9个预报指标及自动气象站极大风速的对比(表 1)。
|
|
| 图6 2012年5月19日12:47(a)及12:53(b)反射率因子(填色)、实况大风位置与风暴单体 Fig.6 Base reflectivity(the shaded), the position of gale and identified thunderstorm cells at 1247 UTC(a) and 1253 UTC(b) on 19 May 2012 | |
|
|
表 1 7个误判样本所对应的9个预报因子及自动气象站极大风速对比 Table 1 Comparision of forecast factors of misjudged samples with the maximum instantaneous wind speed at automatic weather stations |
图 6为2012年5月19日12:47及12:53反射率因子、实况大风位置与风暴单体位置分布。由图 6a可以看到,识别出的10个风暴单体中,有5处识别为雷暴大风,但相对应自动气象站只有1处出现了大风。由图 6b可以看到,识别出的8个风暴单体中,有4处识别为雷暴大风,但相对应自动气象站只有1处出现了大风。从表 1各预报因子看,这7个样本属于易出现雷暴大风的风暴单体,但从整体的雷达反射率因子看,这7个误判样本对应的回波均为主体回波分裂出的小回波,离主体回波较远,比较孤立,所以这种情况在实际工作中还需要预报员的定性判别。
3 小结本文基于北京市观象台雷达基数据和加密自动气象站数据,利用支持向量机建立了雷暴大风天气的提前识别和临近预警模型,并选取了北京2017年7月7日飑线和2012年5月19日块状回波两次灾害大风典型个例进行识别效果检验,得到以下主要结论:
1) 个例分析显示,识别出的出现大风的风暴单体与实况大风测站出现位置和范围基本对应。
2) 两个个例命中率、误判率和临界成功指数分别为92.0%,22.1%,73.0%和99.1%,40.5%,59.2%,表明该识别算法切实可行,对于提高雷暴大风预警预报的准确率有一定帮助。
需要注意的是,一些风暴单体若仅从预报因子分析,利用建立的雷暴大风临近预警模型确实会判定为易出现雷暴大风的风暴单体,这种情况就需要预报员结合整体的雷达反射率因子、天气实况等定性分析进行人工干预,以此降低大风的误判率。另外,在今后的工作中,将尝试利用雷达长时间序列的全部观测数据开展大样本普查研究,建立基于天气雷达的雷暴大风事件自动识别系统。
| [1] |
东高红, 吴涛. 垂直积分液态水含量在地面大风预报中的应用. 气象科技, 2007, 35(6): 877-881. DOI:10.3969/j.issn.1671-6345.2007.06.024 |
| [2] |
梁爱民, 张庆红, 申红喜. 北京地区雷暴大风预报研究. 气象, 2006, 32(11): 73-80. |
| [3] |
刁秀广, 张新华, 朱君鉴. CINRAD/SA雷达风暴趋势产品在冰雹和大风预警中的应用. 气象科技, 2009, 37(2): 230-233. DOI:10.3969/j.issn.1671-6345.2009.02.022 |
| [4] |
王彦, 吕江津, 王庆元, 等. 一次雷暴大风的中尺度结构特征分析. 气象, 2006, 32(2): 75-80. |
| [5] |
王福侠, 俞小鼎, 裴宇杰, 等. 河北省雷暴大风的雷达回波特征及预报关键点. 应用气象学报, 2016, 27(3): 342-351. |
| [6] |
应冬梅, 许爱华, 黄祖辉. 江西冰雹、大风与短时强降水的多普勒雷达产品的对比分析. 气象, 2007, 33(3): 48-53. |
| [7] |
姚建群, 戴建华, 姚祖庆. 一次强飑线的成因及维持和加强机制分析. 应用气象学报, 2005, 16(6): 746-754. DOI:10.3969/j.issn.1001-7313.2005.06.005 |
| [8] |
慕熙昱, 党人庆, 陈秋萍, 等. 一次飑线过程的雷达回波分析与数值模拟. 应用气象学报, 2007, 18(1): 42-49. DOI:10.3969/j.issn.1001-7313.2007.01.006 |
| [9] |
谢健标, 林良勋, 颜文胜, 等. 广东2005年"3.22"强飑线天气过程分析. 应用气象学报, 2007, 18(3): 321-329. DOI:10.3969/j.issn.1001-7313.2007.03.008 |
| [10] |
朱敏华, 俞小鼎, 夏峰, 等. 强烈雹暴三体散射的多普勒天气雷达分析. 应用气象学报, 2006, 17(2): 215-223. DOI:10.3969/j.issn.1001-7313.2006.02.012 |
| [11] |
俞小鼎, 张爱民, 郑媛媛, 等. 一次系列下击暴流事件的多普勒天气雷达分析. 应用气象学报, 2006, 17(4): 385-393. DOI:10.3969/j.issn.1001-7313.2006.04.001 |
| [12] |
俞小鼎, 周小刚, 王秀明. 雷暴与强对流临近天气预报技术进展. 气象学报, 2012, 70(3): 311-337. DOI:10.3969/j.issn.1004-4965.2012.03.003 |
| [13] |
廖晓农, 于波, 卢丽华. 北京雷暴大风气候特征及短时临近预报方法. 气象, 2009, 35(9): 18-28. |
| [14] |
王福侠, 俞小鼎, 裴宇杰, 等. 河北省雷暴大风的雷达回波特征及预报关键点. 应用气象学报, 2016, 27(3): 342-351. |
| [15] |
廖玉芳, 潘志祥, 郭庆. 基于单多普勒天气雷达产品的强对流天气预报预警方法. 气象科学, 2006, 26(5): 564-571. DOI:10.3969/j.issn.1009-0827.2006.05.015 |
| [16] |
周金莲, 魏鸣, 吴涛, 等.对流性大风天气的多普勒雷达资料识别方法研究//第28届中国气象学会年会论文集.北京: 中国气象学会, 2001.
|
| [17] |
李国翠, 刘黎平, 张秉祥, 等. 基于雷达三维组网数据的对流性地面大风自动识别. 气象学报, 2013, 71(6): 1160-1167. |
| [18] |
周康辉, 郑永光, 王婷波, 等. 基于模糊逻辑的雷暴大风和非雷暴大风区分方法. 气象, 2017, 43(7): 781-791. |
| [19] |
赫英明, 王汉杰. 支持向量机在积雪检测中的应用. 南京气象学院学报, 2009, 32(1): 134-139. DOI:10.3969/j.issn.1674-7097.2009.01.018 |
| [20] |
杨璐, 陈明轩, 孟金平, 等. 北京地区雷暴大风不同生命期内的雷达统计特征及预警提前量分析. 气象, 2018, 44(6): 802-813. |
| [21] |
Courant R, Hilbert D. Method of Mathematical Physics. New York: Springer Verlag, 1953.
|
| [22] |
陈永义, 俞小鼎, 高学浩, 等. 处理非线性分类和回归问题的一种新方法(Ⅰ)——支持向量机方法简介. 应用气象学报, 2004, 15(3): 345-353. DOI:10.3969/j.issn.1001-7313.2004.03.011 |
| [23] |
冯汉中, 陈永义. 处理非线性分类和回归问题的一种新方法(Ⅱ)——支持向量机方法在天气预报中的应用. 应用气象学报, 2004, 15(3): 355-365. DOI:10.3969/j.issn.1001-7313.2004.03.012 |
| [24] |
冯汉中, 陈永义. 支持向量机回归方法在实时业务预报中的应用. 气象, 2005, 31(2): 41-44. |
2018, 29 (6): 680-689



