期刊检索:
  暴雨灾害   2018, Vol. 37 Issue (2): 115-123.  DOI: 10.3969/j.issn.1004-9045.2018.02.003

论文

DOI

10.3969/j.issn.1004-9045.2018.02.003

资助项目

国家自然科学基金项目(41475044);国家重点研发计划(2017YFC1502004);高原与盆地暴雨旱涝灾害四川省重点实验室青年专项(省重实验室2017-青年-05);国家科技支撑计划课题(2015BAK10B03)

第一作者

王彬雁,主要从事短时临近天气预报及其相关方法研究。E-mail: w_byan@163.com

通信作者

赵琳娜,主要从事数值天气预报和应用气象研究。E-mail: zhaoln@cma.gov.cn

文章历史

收稿日期:2018-01-25
定稿日期:2018-03-15
四川雨季小时降水的概率分布特征及其降水分区
王彬雁 1, 赵琳娜 2, 许晖 3, 刘莹 1    
1. 四川省气象台 高原与盆地暴雨旱涝灾害四川省重点实验室,成都 610072;
2. 中国气象科学研究院,北京 100081;
3. 广东省中山市气象局,中山 528400
摘要:利用2010—2016年5—9月四川省157个国家自动气象站小时降水资料,采用皮尔逊Ⅲ型概率分布模型对四川全省小时降水进行拟合,给出全省超过不同阈值的降水累积概率空间分布;在此基础上,计算最大小时降水量的概率分布及其重现期极值。结果表明:四川盆地西部沿山一带出现降水频次较少,但易发生较大量级的小时降水,攀西地区东部虽是降水高发区,但出现大量级小时降水的可能性小;50 a一遇小时降水高值中心分布在乐山市北部、遂宁市西北部与绵阳交界处以及达州市北部,其极值可达60 mm以上;100 a一遇小时降水极值分布趋势同50 a一遇的基本一致,其极值达70 mm;小时降水的皮尔逊Ⅲ型概率分布模型偏差系数与降水站点的海拔高度呈对数递减关系,决定系数达0.654 5,表明地形高度对四川小时降水分布有一定影响;此外用k均值聚类法可很好地对四川小时降水进行分区。
关键词概率分布    小时降水    皮尔逊Ⅲ型    重现期    四川盆地    
Probability distribution and partition of hourly rainfall during the rainy season over Sichuan Province
WANG Binyan1, ZHAO Linna2, XU Hui3, LIU Ying1    
1. Sichuan Meteorological Observatory, Heavy rain and Drought-Flood Disaster in Plateau and Basin key laboratory of Sichuan Province, Chengdu 610072;
2. Chinese Academy of Meteorological Sciences, Beijing 100081;
3. Zhongshan Meteorological office of Guangdong Province, Zhongshan 528400
Abstract: Using the hourly rain gauge data from 157 national automatic weather stations (AWS) over Sichuan province between May and September from 2010 to 2016, by applying the Pearson-Ⅲ distribution function, we have conducted a fitting of the hourly rainfall in Sichuan to find out the spatial probability distribution that exceeds different thresholds. Based on the results, we calculated the probability distribution pattern and their extreme values under different return period scenarios of hourly rainfall. The results indicate that rainfall with low frequency but with high grade of hourly rainfall occurs the most often along mountains in the western Sichuan Basin. The rainfall that occurs frequently but with the high grade of hourly rainfall seldom happens in the east part of Panxi region. High value areas of hourly rainfall within a recurrence period of 50 years are located in the northern part of Leshan, in the junction between northwestern Suining and Mianyang, and in the northern part of Dazhou, whose the maximum value can be over 60 mm. The extreme hourly rainfall within a recurrence period of 100 years is up to 70 mm, with a distribution similar to that with a recurrence period of 50 years. The deviation coefficient (Cv) of the Pearson-Ⅲ distribution function to hourly rainfall has a logarithmic decreasing correlation with the altitude of AWSs, the statistic coefficient (R2) between them being up to 0.6545, indicating that terrain has an effect to the hourly rainfall patterns significantly. In addition, the k-means clustering method can be used to group hourly rainfall over Sichuan province.
Key words: probability distribution    hourly rainfall    Pearson-Ⅲ distribution function    return period    Sichuan Basin    
引言

近年来,我国西南地区暴雨、洪涝、泥石流等自然灾害频发,给当地国民经济发展、人民生命财安全和城市交通运输等产生了重大影响。四川因其地形复杂,成为该地区气象灾害发生相对较多的省份。有研究表明[1-2],我国除东北、西北大部地区外,其余地区降水均呈现明显的区域特征。也有人曾详细分析过四川省的降水特征[3-5],认为川西高原至四川盆地的过渡区域易产生强度大、时间相对集中的强降水,且四川盆地不同地区降水变化特征表现不同,但这些研究多集中在对日尺度以上降水的分析。随着降水资料的不断丰富,国内外学者对强降水天气越来越关注,尤其是短时间内产生的较大强度降水天气[6-8]。小时强降水分布特征已成为各级政府相关职能部门在部署防灾减灾工作中迫切需要了解的信息,因此探讨各地各区域小时降水分布特征是当前我国气象科技工作者的重要研究热点之一。陈炯等[9]利用全国小时降水资料,对短时强降水分布及其与中尺度对流系统(MCS)日变化之间的关系进行了深入研究,揭示了短时强降水产生的原因。姚莉等[10]采用频数分析法,分析了超过不同阈值的小时雨量时空分布,表明夏季南部沿海为较大雨强频数出现最多的地区。刘伟东等[11]分析北京多年逐小时降水资料得到北京小时降水日变化存在明显峰谷区。上述研究工作多集中在小时降水空间分布及成因方面,且单纯使用频率分析法会使不同量级的频数分布产生一定的不连续性,导致较大雨强出现的次数多于较小雨强出现的次数,并对无观测地区极值分布缺少一定的描述能力。

近年来,虽然四川地面降雨观测站点不断增多,但高原上地面站点仍较稀疏,观测数据也存在一定误差,且获取较长时段的降水历史资料难度较大,如果想基于加密地面降雨观测站资料获取四川西部地区降水极值分布仍有一定困难。鉴于以上问题,考虑到概率分布函数模型不仅能确定不同地区降水极值,还可通过拟合得到无观测资料地区的降水分布,因此越来越多的学者利用分布函数模型模拟降水强度的变化规律[12-14]。气象要素中,由于日降水量或更短时间降水量空间变化程度较月以上时间尺度降水量要大得多,且具有一定的偏态性和不均匀性,对其极值难以进行定量估算,但可借助一些统计方法寻求极值分布的最佳模型,推算出不同重现期下小时降水极值,揭示其时间变化的内在规律,从而为防灾减灾、市政工程建设所需的设计暴雨提供一定的参考依据[15-16]。马京津等[17]利用北京观象台逐分钟降水资料分析了不同历时下的重现期,为暴雨强度公式编制提供了一定的理论背景。司波等[18]对1991—2007年四川盆地12个代表站短时强降水极值用两种不同的概率分布模型进行估算,结果表明,广义帕雷托分布(GPD)模型的拟合精度要优于广义极值分布(GEV)模型。田付友等[19]利用Γ分布研究暖季小时降水概率分布指出,华南沿海以及海南西北部最易出现短时强降水。本文采用皮尔逊Ⅲ型概率模型对观测站点小时降水进行模拟,在揭示四川小时降水时空分布的基础上,着重研究不同阈值小时极端降水量的概率分布特征及其重现期的空间分布,从概率角度揭示不同地区不同阈值小时降水出现的可能性,以期为该地区预防和减轻暴雨引发的山洪地质灾害、城市内涝等提供有力支撑,并为城市建设暴雨强度公式编制提供技术基础。

1 资料来源与研究方法 1.1 资料来源

本文所用资料为2010—2016年四川省范围内经过质量控制的157个国家自动气象站(图 1)小时降水资料,即每个整点时次测得的降水量为之前1 h累积降水量。考虑到四川强降水集中在5—9月,与我国雨季降水出现时间相一致,以及自动站主要观测的是非固态降水,且四川西部海拔较高,为使不同站点之间资料具有可比性,本文将研究时段确定为5—9月。从图 1中可见,本研究区域内气象站点分布从东部盆地向西部高原逐渐稀疏。

图 1 四川省157个国家自动气象站(黑色圆点所示)地理分布 Fig. 1 Distribution of the 157 national automatic weather stations (showed by black dots) over Sichuan province.
1.2 研究方法 1.2.1 皮尔逊Ⅲ型概率分布及其参数估计

为寻求各种气候要素概率特征的最佳函数形式,用实际资料获得各种分布参数的最佳估计是获得气候统计规律的主要手段。对于随机变量的取值规律,最严格的描述是使用概率分布密度函数, 不同时间尺度的降水具有不同的统计特征,如年降水量、海平面气压、气温等气象要素一般用正态分布密度函数模拟,而日或更短时间尺度的降水量则是明显的偏态分布, 采用Γ分布密度函数模拟较合适[20-21]。因此,对于不同气象要素的概率分布模型,一般依据各自要求特点进行选取[14]。但对降水而言,最通用的是皮尔逊Ⅲ型分布(一种三参数的Γ分布),其对任意量级的降水均具有很好的描述能力[22-24]。水文气象工作者将皮尔逊Ⅲ型引入到降水频率计算中,成为被广泛应用的概率分布模型[12]。该分布的概率密度函数为

$ f\left( x \right)=\frac{{{\beta }^{\alpha }}}{\mathit{\Gamma} \left( \alpha \right)}{{\left( x-{{a}_{0}} \right)}^{\alpha -1}}{{e}^{-\beta \left( x-{{a}_{0}} \right)}} $ (1)

式(1)中: $ \alpha =\frac{4}{{{C}_{\text{s}}}^{2}} $为该分布的形状参数,而$ \mathit{\Gamma} \left( \alpha \right)=\int_{0}^{\infty }{{{x}^{\alpha -1}}{{e}^{-x}}\text{d}x} $为参数α的伽马函数;$ \beta =\frac{2}{\overline{x}{{C}_{\text{v}}}{{C}_{\text{s}}}} $为该分布的尺度参数;$ {{a}_{0}}=\overline{x}\left( 1-\frac{2{{C}_{\text{v}}}}{{{C}_{\text{s}}}} \right) $为系列起点到坐标原点的距离[18]

利用皮尔逊Ⅲ型对降水资料进行拟合时,首先要对参数αβa0作相应的估计。根据样本资料,利用矩形法[23-24],计算得到平均值(x)、均方差(s)、偏差系数(Cv)和偏态系数(Cs),即

$ \overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n}{{{x}_{i}}} $ (2)
$ s=\sqrt{\frac{1}{n}\sum\limits_{i=1}^{n}{{{\left( {{x}_{i}}-\overline{x} \right)}^{2}}}} $ (3)
$ {{C}_{\text{v}}}=s/\overline{x} $ (4)
$ {{C}_{\text{s}}}=\frac{1}{n}\sum\limits_{i=1}^{n}{{{\left( {{x}_{i}}-\overline{x} \right)}^{3}}/{{\left( \frac{1}{n}\sum\limits_{i=1}^{n}{{{x}_{i}}-{{\overline{x}}^{2}}} \right)}^{3/2}}} $ (5)

Cv反映了样本之间个体的差异情况,若与平均值差异越大,则Cv取值越大,离散程度也越大,反之亦然。Cs控制曲线的形态,反映样本在均值两侧的对称性,若Cs>0,则曲线正偏,反之负偏[22-23]。当Cs≥2时,其密度曲线为单调减少凹曲[13]

为简化计算,令式(1)中β(x - a0)等于t,得到变化后的皮尔逊Ⅲ型积分为[8]

$ p\left( x\ge {{x}_{p}} \right)=\frac{1}{\mathit{\Gamma} \left( \alpha \right)}\int\limits_{p}^{\infty }{{{t}^{-\alpha -1}}{{e}^{-t}}\text{d}t} $ (6)

从式(6)中看出,简化后的概率函数仅依赖于参数α。因此,当参数确定之后,以p为横坐标,相应的样本值为纵坐标,即可得到频率曲线,从而通过拟合曲线进行概率推算。

1.2.2 k均值动态聚类法

聚类的思想是为了将相近的样本归为一类、不相近的样本尽量划分到不同的类中。类内样本距离尽量小,类间样本距离尽可能大。本文选取k均值动态聚类法进行处理,其原理为:(1)在n个样本中确定k个聚类中心(即本文所确定的类别数);(2)余下的nk个样本分别计算与聚类中心的距离,根据距离最近原则进行归类判别;(3)计算出每个类别的均值,不断迭代此过程;(4)如果此后分类的类别数没有变化,则停止迭代[25]

2 结果与分析 2.1 降水概率分布函数的参数特征

以各个站点超过0.1 mm的降水小时数占研究时段总时数(样本)的比例作为研究指标,衡量四川全省降水发生的多少。图 2给出研究时段四川省有降水发生时数占样本时数的百分比分布,从中可知,四川盆地东北部以南地区以及乐山市西北部为降水百分比最大区域,可达44%以上;攀西地区东部为另一降水高发区,其降水百分比为40%;川西高原同其他区域相比,降水百分比量值明显减少,表明该地区有降水出现的时数偏少。

图 2 2010—2016年四川省有降水(≥0.1 mm)时数占样本时数的百分比 Fig. 2 Sample percentage of hourly rainfall greater than or equal to 0.1 mm over Sichuan province during 2010-2016.

以温江站(56187)为例,按照上述皮尔逊Ⅲ型的计算公式(1)—(6),将上述有降水发生的时数作为建模样本,分别计算小时降水在不同阈值区间出现的降水时数占建模样本时数的占比(即样本频率),将小时降水的量值作为纵坐标、频率作为横坐标,对样本资料进行概率拟合。利用公式(4)和(5)计算得到,当Cv=4.3、Cs=10.8时,该站样本的分布与拟合曲线吻合程度较高,因此可认为该理论曲线为样本的概率密度分布曲线(图 3)。从图 3中可见,温江站出现20 mm·h-1以上的降水概率不超过0.5,其中40 mm·h-1的频率为0.05,降水概率大值主要集中在量级较小的降水区间。

图 3 温江站小时降水量(单位: mm)皮尔逊Ⅲ型分布拟合频率与样本频率(单位: %)曲线 Fig. 3 The frequency curve fitted by Pearson-Ⅲ distribution function and sample frequency (unit: %) for hourly rainfall (unit: mm) at Wenjiang station.

同理,对四川省内其余站点进行概率拟合,最终得到全省157个站点皮尔逊Ⅲ型的CvCs两参数的空间分布(图 4)。总体而言,偏差系数Cv取值均小于3 (图 4a),变化区间在1.2~2.6之间。1.75的等Cv线将四川省分为明显的两个部分:四川盆地和攀西地区Cv一般在1.75~2.55之间;川西高原大部地区Cv取值在1.25~1.65之间。盆地西部沿山一带及盆地南部Cv取值最大,表明上述地区降水量差异较大。

图 4 四川省157个气象站点皮尔逊Ⅲ型概率分布拟合的偏差系数(a)与偏态系数(b)分布 Fig. 4 Spatial distribution of (a) deviation factor and (b) skew coefficient fitted by Pearson-Ⅲ distribution function for the 157 AWS over Sichuan province.

偏态系数Cs取值变化范围较大(图 4b),最大值为16.5,最小值为2.5,但均大于2,表明样本曲线分布呈现出正偏的特点,Cs值越大,下端越接近水平。Cs大值区域出现在川西高原西部,四川盆地大部地区Cs为7~10。结合偏差系数Cv可知,四川盆地较高原地区而言,较高等级小时降水出现的可能性大,尤其是盆地西部沿山一带以及盆地南部地区。

2.2 超过不同阈值的降水空间分布特征

由式(1)可知,当一个序列的平均值x、偏差系数Cv、偏态系数Cs确定后,就可得到该序列皮尔逊Ⅲ型概率分布模型,在此基础上即可求得超过任意阈值的降水累积概率。为了更好地获取四川不同量级小时降水的空间分布特征,分别计算降水量超过5 mm·h-1、10 mm·h-1、20 mm·h-1、30 mm·h-1四个阈值的降水概率。分析降水超过5 mm·h-1的累积概率分布(图 5a)可知,四川盆地和攀西地区降水累积概率显著大于川西高原,且越到盆地东北部,降水出现超过5 mm·h-1的累积概率越大,最大累积概率为0.13,出现在广元和巴中两市北部交界山区,为0.13,即在100次超过0.1 mm的降水中,有13次小时降水量超过5.0 mm。相比而言,盆地东北部以东和攀西地区南部为降水累积概率次大值区,为0.09~0.12。累积概率为0.09的等值线越向西,小时雨量超过5.0 mm的概率越小,川西高原仅为0.01~0.03,这与高海拔地区大气可降水量小有关[26]

图 5 四川省小时雨量超过不同阈值(a. 5.0 mm;b. 10.0 mm;c. 20.0 mm;d. 30.0 mm)的累积概率分布 Fig. 5 Spatial distribution of cumulative probability with hourly rainfall thresholds more than (a) 5.0 mm, (b) 10.0 mm, (c) 20.0 mm and (d) 30.0 mm in Sichuan province.

另外,由图 5b可知,小时降水超过10.0 mm的累积概率分布与超过5.0 mm的空间分布基本一致,其累积概率大值区(超过0.05)仍位于广元和巴中两市交界的北部,即100次降水中约有5次小时降水量超过10.0 mm,但不足小时降水超过5.0 mm的一半。

再由图 5cd可知,超过20 mm·h-1和30 mm·h-1的降水累积概率空间分布,其大值区主要位于四川盆地西部沿山一带,累积概率分别为0.012和0.05,这与偏差系数Cv(图 4a)的分布相吻合。结合降水时数占比分布(图 2)发现,四川盆地西部沿山一带有降水发生的时数较小,但易发生量级较大的小时降水,攀西地区东部虽是降水高发区,但出现大量级小时降水的可能性较小,这是短时强降水预报中需关注的现象。

为了衡量利用皮尔逊Ⅲ型分布函数模型求出的累积概率分布是否具有一定优势,图 6给出用小时降水超过10 mm·h-1与20 mm·h-1的时数占总时数占比的空间分布。对比图 6a图 5b图 6b图 5c可知,利用皮尔逊Ⅲ型分布函数模型模拟出的累积概率空间分布与相对应阈值的百分比空间分布基本吻合。但不同的是,利用皮尔逊Ⅲ型分布函数模型求出的累积概率分布具有较为连续和细致的刻画,对于小时降水超过10.00 mm·h-1的情况,利用皮尔逊Ⅲ型分布函数模型求出的降水累积概率分布(图 5b)对川西高原、四川盆地有很好的区别,并对盆地内山前迎风坡降水和平原降水也有一定的区分,其刻画较为细致。而相对小时降水超过10 mm·h-1占总时数比例的空间分布图(图 6a),对高原上降水分布细节刻画不够,而对盆地降水分布区分出大地形所导致的降水差异;但对川西高原和盆地而言,则对盆地内降水分布差异缺乏更细致的描述。对小时降水超过20 mm·h-1的情况,对比图 5c图 6b,用小时降水时数占比(图 6b)得到整个研究区域内降水的比例分布区分出了高原和盆地,对盆地降水分布的细节没有皮尔逊Ⅲ型分布函数得到降水概率分布(图 5c)细致,对盆地内山前迎风坡降水和平原降水区分缺乏更细致的描述。

图 6 四川省小时雨量超过不同阈值(a. 10.0 mm;b. 20.0 mm)的时数占总降水时数之比 Fig. 6 Hours percentage of hourly rainfall thresholds more than (a) 10.0 mm and (b) 20.0 mm in Sichuan province.
2.3 极端降水的空间分布特征

本文第2.2节中仅分析了四川地区降水超过不同阈值的概率分布,但考虑到极端降水事件往往会带来较大的灾害损失,因此越来越多的学者才更加关注降水的极端分布[27-28]。为了进一步讨论四川小时降水的极值问题,对该地区1 h降水极值概率分析如下。

对于极端降水样本的筛选,可采用年最大值法和年多个样法这两种方法。但年最大值法需要至少20 a以上的资料长度,因此本文采用年多个样法进行降水极值样本筛选,即将每年降水量按大小顺序排列,选取前10个最大值作为统计资料[29-31]图 7给出四川1 h最大降水超过10 mm、20 mm、30 mm的概率分布。从中可见,随着降水阈值增加,降水极值概率减小,且极端降水极值出现范围明显缩小。1 h最大降水超过10 mm的极值高值区主要集中在四川盆地、攀西地区南部,次高值区在四川盆地西部沿山一带(图 7a)。1 h最大降水超过20 mm高值中心零星分布在四川盆地西部沿山一带,盆地其余地方以及攀西地区南部为次高值区(图 7b)。1 h最大降水超过30 mm的概率分布同1 h最大降水超过20 mm的大致相近,其高值中心明显位于雅安市东部、乐山市西北部(图 7c)。结合图 5可知,四川盆地西部沿山一带不仅易发生小时强降水,且易产生极端降水。

图 7 四川小时降水最大值超过不同阈值(a. 10.0 mm;b. 20.0 mm;c. 30.0 mm)的概率分布 Fig. 7 Probability distribution of the maximum hourly rainfall thresholds more than (a) 10.0 mm, (b) 20.0 mm and (c) 30.0 mm in Sichuan province.

重现期是为了衡量某种事件在长时间试验里出现的时间间隔平均数[32]。通过皮尔逊Ⅲ型概率分布函数的计算公式(6),可得到四川50 a一遇和100 a一遇的降水值(图 8)。由图 8a可知,四川50 a一遇的1 h降水高值中心分布在乐山市北部、遂宁市西北部与绵阳交界处以及达州市北部,1 h降水量可达60 mm以上;次高值区位于四川盆地西部沿山一带,50 a一遇的1 h降水极值为50~60 mm。

图 8 给定重现期(a. 50 a一遇;b. 100 a一遇)的四川1 h降水量极值(单位: mm)的空间分布 Fig. 8 Spatial distribution of the 1-hour rainfall extremes (unit: mm) at return periods of once every (a) 50 years and (b) 100 years in Sichuan province.

另从图 8b中看到,四川100 a一遇的1 h降水极值分布趋势同50 a一遇的基本一致,大值区仍集中在四川盆地西部沿山一带、遂宁市西北部、盆地东北部,1 h降水极值可达70 mm以上;盆地其余地方和攀西地区也较高,100 a一遇1 h降水极值为50~60 mm。

3 降水分区

上述研究表明,四川小时降水存在显著的地域差异,为弥补高原上地面站点稀疏造成观测资料不够和资料误差的缺陷,更好地描述四川区域小时降水的空间分区特征,获取四川西部无资料或少资料地区降水的极值分布,考虑基于该地区皮尔逊Ⅲ型概率分布结合其他因子对四川地区降水分区,获得各区域降水分布特征,了解无资料或少资料站点的极端降水情况。下文对第2.3节筛选出的四川省站点降水样本(157×70)进行因子计算,分别求得每站的皮尔逊Ⅲ型两参数(αβ)以及第90、第95与第99百分位数5个因子,再利用k均值聚类法进行降水分区。由于因子维数较多,不能直观展示聚类后的情况,因此利用主成分分析法进行降维,当前几个因子贡献率达到95%时,则可作为主要的聚类因子。计算上述5个因子的累积贡献率,分别为0.801 2、0.949 0、0.981 4、0.992 8、1.000 0,由此发现前2个因子(αβ)累积贡献率接近95%,表明前2个因子皮尔逊Ⅲ型αβ参数可作为主要的聚类因子。

对于k值的确定,则利用k个类的平均质心距离的平均值作为指标,k值取值范围一般为2~6,当某一类出现的数目小于5时,即认为k值不符合聚类效果[33]。因此,本文分别计算了k取2—6的聚类结果(图 9),发现当k=5时(图 9e),其中一类的站点数少于5个,难以划为一类,不符合聚类效果(同理k=6时,仍存在相同结果),因此确定k=4为最佳取值,其划分结果为川西高原为1区,攀西地区和四川盆地北部多为3区,盆地西部沿山一带为4区,盆地其余地方为2区(图 10)。对比k均值聚类法分区结果与自动站所处下垫面地形发现,k均值聚类法不仅区分出高原与盆地地区,并对盆地西部沿山一带、盆地北部山区山前降水与平原降水的差异也有一定区分,说明分区结果反映了地形对降水的影响。

图 9 基于主成分分析法的k均值聚类分析过程(不同颜色代表聚类后的不同类): (a)为聚类前的结果;(b)—(f)依次为k取2—6的聚类结果 Fig. 9 The k-means clustering process based on principal component analysis, and different colors represent different categories after clustering. (a) The outcome before clustering, and ones after clustering when k is (b) 2, (c) 3, (d) 4, (e) 5 and (f) 6 in sequence.

图 10 采用k均值聚类后的四川省小时降水分区(数字1—4分别代表川西高原区、盆地中东部区、攀西地区和四川盆地北部区、盆地西部沿山一带区) Fig. 10 Hourly precipitation zones in Sichuan province based on k-means clustering method. Numerals from 1 to 4 indicate western Sichuan Plateau zone, central and eastern Sichuan Basin zone, Panxi and northern Sichuan Basin zone, and the zone along the piedmont of western Sichuan Basin, respectively.

由四川省各区降水参数(表 1)并结合图 10可知,1区皮尔逊Ⅲ型两参数值最小,表明该区域降水量分布偏态性最弱,这主要是因为该地区位于川西高原,降水较其他区域相对稳定(图 2)。4区皮尔逊Ⅲ型概率分布函数的参数值最大,说明该区域降水量的偏态性和非均匀性最强。此外,1 h雨强第99百分位数在在1区最小4区最大,说明4区易发生极端降水。上述分析表明, k均值聚类法分区后,四川不同区域小时降水分区的皮尔逊Ⅲ型概率分布参数特征变化较为明显。

表 1 四川省分区降水参数 Table 1 Precipitation parameters in different zones over Sichuan province.

另外,对比图 10图 8可知,50 a一遇的降水极值重现期,1区(川西高原区)1 h降水值不超过30.00 mm,2区(盆地中东部区)1 h降水值在40.00~50.00 mm之间,3区(攀西地区和四川盆地北部区)1 h降水值在50.00~60.00 mm之间,4区(盆地西部沿山一带区)1 h降水值在60.00~70.00 mm之间。这表明4个分区50 a一遇降水极值重现期的降水值也具有较明显的分区特征。1—4各分区与100 a一遇的降水极值重现期的降水值对比也有类似结论。因此,k均值聚类法分区也表现出50 a与100 a一遇降水极值重现期的分区特征。

从上述k均值聚类法分区结果可知地形对降水有影响,因此对比四川省有降水时数占样本时数的百分比(图 2)、小时雨量超过不同阈值的累积概率分布(图 5)、小时降水最大值超过不同阈值的概率分布(图 7)以及各分区降水参数(表 1)发现,四川省小时降水分布呈现出明显的不均性,这很可能与四川特殊的地形有关。那么,海拔高度对不同等级降水的概率分布是否有影响?考虑到皮尔逊Ⅲ型概率分布由CvCs确定,且CvCs基本为同相变化,因此将资料所在站点的海拔高度与Cv的关系进行分析,其结果见图 11

图 11 四川省皮尔逊Ⅲ型概率模型的偏差系数(Cv)与海拔高度的关系 Fig. 11 The relation between parameter deviation (Cv) of the Pearson-Ⅲ distribution function and altitude in Sichuan.

图 11中可见,Cv与海拔高度服从对数单调递减关系,即随着海拔高度增高Cv越小,Cv与海拔高度的较为相关,决定系数(R2)达0.654 5,说明二者高度相关(当R2为0.5~1.0时表示高度相关)。由信度α=0.05的t检验可知,返回值H=0,表明在5%的零假设下不被拒绝,即通过检验,表明Cv与海拔高度满足同一分布。此外,Cv表示与平均值的差异,其越小则该地区出现较大量级小时降水的可能性越小,这与田付友等[19]利用Γ函数对我国小时降水分析得到的“海拔越高,较小量级小时降水出现可能性越大”的结论相一致,从而表明地形对四川地区小时降水概率分布有一定影响。结合图 4a可知,Cv=1.75的等值线明显区分出高原与盆地地区,且Cv大值区主要位于盆地西部沿山一带,该区域降水由山前迎风坡抬升降水所造成。由此可知,不同海拔高度对不同等级降水的概率分布有一定影响。

4 结论与讨论

本文利用2010—2016年5—9月四川省157个国家自动气象站小时降水资料,采用皮尔逊Ⅲ型概率模型对观测站点的小时降水进行模拟,得到不同阈值小时降水的概率分布;在此基础上,结合年多个样本法,着重研究小时极端降水量的概率分布及其重现期的空间分布,并利用k均值聚类法对小时降水进行了分区。得到如下结论:

(1) 对四川不同阈值小时降水的模拟结果可知,皮尔逊Ⅲ型概率模型较好地描述了四川小时降水分布,且得到小时降水概率密度分布曲线与实际降水的样本频率曲线相一致。

(2) 由超过不同阈值的降水累积概率分布可知,四川盆地西部沿山一带出现小时降水的时数较少,但发生量级较大的小时降水概率高,攀西地区东部虽是降水高发区,但出现大量级小时降水的可能性较小,这应在短时强降水预报中给予关注。

(3) 1 h降水极值重现期估算表明,50 a一遇的高值中心分布在乐山市北部、遂宁市西北部与绵阳交界处以及达州市北部,小时降水极值可达60 mm以上;100 a一遇的降水极值分布趋势同50 a一遇的基本一致,但小时降水极值可达70 mm。

(4) 小时降水极值皮尔逊Ⅲ型概率分布模型的偏差系数(Cv)与降水站点的海拔高度呈对数递减关系,其决定系数达到0.654 5,表明地形对四川小时降水的分布有一定影响。此外,k均值聚类法可很好地对四川小时降水进行分区。

需要指出的是,本文仅选择了近几年四川省内的观测数据,由于样本长度对极端降水背景研究有一定影响,下一步将收集更加完善的小时降水资料,利用皮尔逊Ⅲ型对四川盆地不同短历时以及模型参数日变化特征进行分析,进而研究皮尔逊Ⅲ型概率模型在四川短时强降水概率预报业务的应用。

参考文献
[1]
任国玉, 吴虹, 陈正洪. 我国降水变化趋势的空间特征[J]. 应用气象学报, 2000, 11(3): 322-330.
[2]
马振锋, 彭骏, 高文良, 等. 近40年西南地区的气候变化事实[J]. 高原气象, 2001, 2(1): 633-642.
[3]
陈文秀, 郝克俊. 20世纪四川盆地降水变化特征分析[J]. 四川气象, 2001, 21(1): 37-39.
[4]
周长艳, 李跃清, 彭俊. 高原东侧川渝盆地降水与水资源特征及变化[J]. 大气科学, 2006, 30(6): 1 217-1 226.
[5]
朱艳峰, 宇如聪. 川西地区夏季降水的年际变化特征及与大尺度环流的联系[J]. 大气科学, 2003, 27(6): 1 045-1 056.
[6]
Bell J L, Sloan L C, Snyder M A. Regional changes in extreme climatic events: A future climate scenario[J]. Journal of Climate, 2004, 17(1): 81-87. DOI:10.1175/1520-0442(2004)017<0081:RCIECE>2.0.CO;2
[7]
王萃萃, 翟盘茂. 中国大城市极端强降水事件变化的初步分析[J]. 气候与环境研究, 2009, 14(5): 553-560.
[8]
Fischer T, Su B, Luo Y, et al. Probability distribution of precipitation extremes for weather index-based insurance in the Zhujiang River Basin, South China[J]. Journal of Hydrometeorology, 2012, 13(3): 1 023-1 037. DOI:10.1175/JHM-D-11-041.1
[9]
陈炯, 郑永光, 张小玲, 等. 我国暖季短时强降水分布和日变化特征及其与MCS日变化关系分析[J]. 气象学报, 2013, 71(3): 367-382. DOI:10.11676/qxxb2013.035
[10]
姚莉, 李小泉, 张立梅. 我国1小时雨强的时空分布特征[J]. 气象, 2009, 35(2): 80-87. DOI:10.7519/j.issn.1000-0526.2009.02.012
[11]
刘伟东, 尤焕苓, 任国玉, 等. 北京地区精细化的降水变化特征[J]. 气候与环境研究, 2014, 19(1): 61-68. DOI:10.3878/j.issn.1006-9585.2013.12142
[12]
杜锐. 西安市暴雨强度公式的推求研究[D]. 西安: 西安建筑科技大学, 2011 http://kns.cnki.net/KCMS/detail/detail.aspx?filename=gsps201017022&dbname=CJFD&dbcode=CJFQ
[13]
宁静. 上海市短历时暴雨强度公式与设计雨型研究: [D]. 上海: 同济大学, 2006 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y851393
[14]
顾骏强, 陈海燕, 徐集云. 瑞安市暴雨强度概率分布公式参数估计研究[J]. 应用气象学报, 2000, 11(3): 355-363.
[15]
朱颖元, 米伟亚. 城市短历时暴雨的指数分布及参数估计[J]. 福州大学学报(自然科学版), 2005, 33(3): 285-288.
[16]
侯瑞科. 利用耿贝尔极值分布计算年最高水位[J]. 海洋通报, 1993, 12(3): 126-129.
[17]
马京津, 李书严, 王冀. 北京市强降雨分区及重现期研究[J]. 气象, 2012, 38(5): 569-576. DOI:10.7519/j.issn.1000-0526.2012.05.007
[18]
司波, 余锦华, 丁裕国. 四川盆地短历时强降水极值分布的研究[J]. 气象科学, 2012, 32(4): 403-410.
[19]
田付友, 郑永光, 毛冬艳, 等. 基于Γ函数的暖季小时降水概率分布[J]. 气象, 2014, 40(7): 787-795. DOI:10.7519/j.issn.1000-0526.2014.07.002
[20]
刘学华, 吴洪宝. 中国夏季雨日降水量的概率分布[J]. 南京气象学院报, 2006, 29(2): 173-180.
[21]
谢云, 林小鹃, 殷水清, 等. 中国次雨量特征及其区域分异[J]. 地理学报, 2009, 64(3): 323-330. DOI:10.11821/xb200903007
[22]
肖卉, 姜爱军, 沈瑱. 江苏省最大日降水量时空分布特征及其统计拟合[J]. 气象科学, 2006, 26(2): 177-182.
[23]
米伟亚. excel在水文皮尔逊Ⅲ型分布多样本参数估计中的应用研究[J]. 农业与技术, 2005, 25(5): 93-112.
[24]
毛慧琴, 杜尧东, 宋丽莉. 广州短历时降水极值概率分布模型研究[J]. 气象, 2004, 30(10): 3-6.
[25]
刘伟东, 尤焕苓, 任国玉, 等. 北京地区自动站降水特征的聚类分析[J]. 气象, 2014, 40(7): 844-851. DOI:10.7519/j.issn.1000-0526.2014.07.008
[26]
Zhai P, Eskridge R E. Atmospheric water vapor over China[J]. J Climate, 1997, 10(10): 2 643-2 652. DOI:10.1175/1520-0442(1997)010<2643:AWVOC>2.0.CO;2
[27]
张永领, 丁裕国. 黄淮地区降水极值统计特征的研究[J]. 南京气象学院学报, 2003, 26(1): 70-75.
[28]
蔡敏, 丁裕国, 江志红. 我国东部极端降水时空分布及其概率特征[J]. 高原气象, 2007, 26(2): 309-318.
[29]
周玉文, 翁窈瑶, 张晓昕, 等. 应用年最大值法推求城市暴雨强度公式的研究[J]. 给水排水, 2011, 37(10): 40-44. DOI:10.3969/j.issn.1002-8471.2011.10.008
[30]
王彬雁, 赵琳娜, 巩远发, 等. 北京降雨过程分型特征及短历时降雨重现期研究[J]. 暴雨灾害, 2015, 34(4): 302-308.
[31]
苏布达, MarcoGemmer, 姜彤, 等. 1960—2005年长江流域降水极值概率分布特征[J]. 气候变化研究进展, 2007, 3(4): 208-213.
[32]
姚莉, 赵声蓉, 赵翠光, 等. 我国中东部逐时雨强时空分布及重现期的估算[J]. 地理学报, 2010, 65(3): 293-300. DOI:10.11821/xb201003004
[33]
王斌. 大数据-互联网大规模数据挖掘与分布式处理[M]. 北京: 人民邮电出版社, 2015.