2. 中国气象局公共气象服务中心,北京 100081;
3. 中国科学院大气物理研究所,北京 100029;
4. 中国科学院研究生院,北京 100049
2. Public Weather Service Center, China Meteorological Administration, Beijing 100081;
3. Institute of Atmospheric Physics, Chinese Academy of Sciences, Beijing 100029;
4. Graduate University of Chinese Academy of Sciences, Beijing 100049
淮河流域地处我国东部,介于黄河与长江之间,位于30°55′~36°36′N,111°55′~121°25′E,流域面积达2.7×105 km2,跨河南、安徽、江苏、山东四省。由于淮河流域处于南亚季风和北半球大陆性气候的过渡区,降水的空间分布不均匀,时间分布变化大。淮河流域上游地势高,落差大;中游流域地势低平,落差小。这样的地形特征是形成“无降水旱、有降水涝、强降水洪”典型区域旱涝特征的原因之一[1]。自20世纪50年代以来,淮河流域先后经历了1954,1991,2003年和2007年的洪涝灾害。干旱、洪涝灾害的频繁发生给人民的生命财产带来了严重损失。鉴于淮河流域在防汛抗旱中的重要作用,掌握该流域在汛期中降水概率的时空分布分析特征,尤其是若干天内最大日降水量的概率分布,对定量降水预报、农业、水资源开发利用等提供参考依据,具有重要意义。
对降水量统计分布特征的研究,常用到的统计分布模型有指数分布、Γ分布、Kappa和Weibull分布[2]等。Todorovic等[3]研究表明:指数分布并不能很好拟合日降水量的概率分布;而Katz[4]提出了降水作为一天相关链的随机过程模型,它比独立随机过程更符合实际情况,而且适合于递推20 d内最大日降水量的概率分布;Gregory等[5]研究表明:Γ分布能很好拟合历史降水分布,并且在参数估计、函数计算简便上优于Weibull分布,能更好区分降水变化的特点。
国内对降水概率的时空分布特征研究工作也有一些成果。张耀存[6]从理论上得到任意给定时期内N日总降水量及最大日降水量的理论分布函数;张婷等[7]采用广义极值分布等统计诊断方法研究了华南地区近46年前、后汛期极端降水的概率分布特征;苏布达等[8]分析了长江流域降水极值序列的概率分布模式,证明Wakeby分布函数能较好地模拟降水极值的概率分布;吴洪宝等[9]利用Γ分布研究了广西6,7月若干天内最大日降水量的概率分布,表明Γ分布能较好地从理论上描述降水量的概率特征。
对于淮河流域降水量分布特征的研究多数集中在降水量的空间分布以及时间演变分析方面[10-13]。本文主要采用统计分析方法对淮河流域夏季降水概率分布进行分析。首先从大量逐日降水资料中寻找描述单个雨日降水概率分布的最佳函数形式,揭示淮河流域多年汛期降水的概率分布特点;然后在概率分布的基础上递推计算出一个时段内最大日降水量的概率分布。
1 资料和方法 1.1 资料本文利用淮河流域加密站点1980—2007年5月31日—8月31日的逐日降水量资料,选取前日20:00(北京时,下同) 至当日20:00的24 h累积降水量作为当日降水量,当日降水量≥0.1 mm时定义为雨日。剔除1980—2007年由于撤站和新建的原因导致降水资料序列不完整的站点,最后保留淮河流域158个站点的逐日降水量资料进行研究,计算范围及站点分布如图 1所示。
![]() |
|
图 1. 研究流域区以及和流域内有关站点分布 Fig 1. The illustration of the test catchments and the locations of relevant stations |
1.2 分析方法
建立降水的统计概率分布与极端降水事件之间的联系 (规律) 是本研究的一个基本目标,目的是通过用这样的联系 (规律) 做出预报预测。众所周知,降水量不像气温、海平面气压等气象要素那样服从正态分布。降水量是水文气象预报遇到的随机变量中最关键的变量之一,虽然它是明显的偏态分布,但又不知道其总体分布的具体类型,而采用统计建模是了解降水量随机过程可行的办法。很多研究工作表明[5-6, 9]:采用Γ分布建立日降水量的随机过程是可行的。因此,本文也采用Γ分布密度函数对日降水量的概率分布进行估计。利用Γ分布估计某个站点的形状参数αi和尺度参数βi,就可以建立某站首雨日或连续雨日降水量的概率分布。在此基础上,可以递推得到N日内最大日降水量的概率分布。具体就是采用Katz提出的Markov链方法[4],假设日降水量的概率分布与前1天是否有雨相关,干、湿日演变符合一阶Markov链模型,简称一天相关。降水量的相关过程由一个双变量随机过程来描述,即{(Jn-1, Xn),n=1, 2, 3, ……}。其中,当J=1时,表示第n天是雨日 (即日降水量不低于0.1 mm);当J=0时,表示第n天是非雨日。Xn是第n日的降水量。双变量 (Jn-1, Xn) 表示第n日的降水量的概率分布与第n-1日是否为雨日有关。Jn和Xn的起始日序号分别为0和1。假设Jn-1=0和Jn-1=1两种条件下,雨日 (Jn=1) 的降水量Xn都服从Γ分布,两种条件下的概率密度函数为
![]() |
(1) |
![]() |
(2) |
式 (1) 和式 (2) 中,αi>0, βi>0, x>0, α为形状参数,β为尺度参数,x为日降水量。其中i=0,1分别对应于首雨日 (Jn-1=0,Jn=1) 和连续雨日 (Jn-1=1, Jn=1)。
由fi(x) 可得条件分布函数:
![]() |
(3) |
式 (3) 中,i = 0, 1;P表示概率。N日内最大降水量记为过程{Mn:n=1, 2,……,N},则Mn=
![]() |
(4) |
即在规定初始日状态J0=0或J0=1的条件下,可求得不同的极值分布[14]。由全概率公式,得
![]() |
(5) |
而Gn(x;0) 和Gn(x;1) 可以从n=1, 2, ……,按全概率公式原理递推得到:
![]() |
(6) |
其中,P[J0=0], P[J0=1]为初始概率;P00,P01,P10,P11是转移概率,Pij=P[Jn=j|Jn-1=i], j=0,1, i=0, 1,且有P00+P01=1,P10+P11=1。以初始条件G0(x;0)=G0(x;1)=1为基础,就可以根据上述关系计算出Gn(x)。求得Mn的概率分布函数Gn(x) 后,可用差分法计算其概率密度函数gn(x):
![]() |
(7) |
式 (7) 中,取△x=5 mm。由Gn(x) 还可以计算Mn落在不同区间的概率。
本文首先对淮河流域158个站点分首雨日 (Jn-1=0,Jn=1) 和连续雨日 (Jn-1=1, Jn=1) 确定雨日样本,用极大似然估计法得出两种雨日情况下Γ分布的参数αi, βi,然后运用上述相关公式计算出对应的fi(x), Fn(x), Gn(x), gn(x) 和Mn落入一定区间的概率。
1.3 检验方法当Γ分布参数估计出来后,需要确定其反映真实降水分布的准确性。要将经验分布与估计的Γ分布相比较,可以采用柯尔莫哥洛夫检验法 (Kolmogorov-Smirnov简写为K-S) 进行检验。因为在该假设中用到的数值与由参数估计出来的数值是一致的。K-S检验将理论分布的累积分布函数 (由形状参数和尺度参数描述) 与观测降水的样本频率分布相比较,返回这两种累积分布的最大差值,它们的最大差值常用K-S统计量表示。本文采用文献[15]所述的K-S检验法进行拟合适度检验,具体步骤从略。
2 利用Γ分布分析日降水量 2.1 淮河流域雨日降水量的概率密度分布在淮河上游、淮河中上游、淮河中下游、洪泽湖以下和沂沭河流域5个子流域上,分别选取息县、阜阳、商丘、淮安、连云港5个代表站,针对每个站建立雨日降水概率分布,表 1给出了由淮河流域代表站雨日计算出的形状参数αi和尺度参数βi,图 2是这5个站的首雨日和连续雨日概率密度函数。
![]() |
表 1 淮河流域代表站雨日形状参数αi和尺度参数βi的样本估计 Table 1 Sample estimates of shape parameter αi and scale parameter βi of representative stations in the Huaihe Basins |
![]() |
|
图 2. 淮河流域子流域代表站首雨日和连续雨日的Γ分布概率密度函数与样本频率 (a) 息县, (b) 阜阳, (c) 商丘, (d) 淮安, (e) 连云港 Fig 2. Gamma distribution density function and sample frequencies function of the daily precipitation following a dry or a wet preceding day at representative stations of Xixian (a), Fuyang (b), Shangqiu (c), Huaian (d) and Lianyungang (e), respectively |
为了便于比较建立的概率密度函数是否与实际情况相吻合,本文同时给出对应条件下的雨日降水量的样本频率。即分别对首雨日 (Jn-1=0,Jn=1) 和连续雨日 (Jn-1=1,Jn =1) 的样本,计算雨日降水量落在 (0, 5],(5, 10],…,(145, 150]区间内次数占各自样本总数的比例,再除以区间宽度5.0,成为单位区间内的频率,即频率密度,所得结果可以在数量上与概率密度函数作比较。相应地,计算出f1(x),f2(x) 在x=2.5, 7.5, …,147.5处的值,并与样本频率区间一一对应[9]。
如图 2所示,Γ分布概率密度曲线和样本频率柱形图的趋势都呈反“J”字型,两图形的吻合度较高,其吻合度随着雨日降水量的增加而增加。说明用Γ分布函数能很好地描述两种条件下的雨日降水量概率分布,同时在一定程度上克服了样本的随机振荡对估计日降水量概率分布的影响。0~20 mm区间上, f0(x),f1(x) 和样本频率都反映出日降水量出现在该区域的概率较大,样本频率和Γ分布概率密度偏差较大的区域大多集中在小于60 mm的区间内。特别是日降水量在小于30 mm的中、小雨区间内,两类曲线的偏差最大,相同日降水量对应的概率密度值比样本频率值大。说明Γ分布函数不仅能够描述出小雨和中雨出现概率大,而且还能描述出大降水出现概率低的这一规律,但对大降水的估计偏低。
参数估计会受到样本数和样本随机振动的影响[9],样本频率曲线和Γ分布概率密度曲线之间存在偏差,但可以认为这些小振动是样本的随机振动引起的,当样本数充分大时可以得到平滑。显然,从对图 2的分析中可以看出,用已有的28年观测样本,估计的Γ分布概率密度函数已能较好地对降水量进行拟合。
此外,若采用柯尔莫哥洛夫法对以上5个代表站点的概率分布模型进行拟合适度检验。各代表站点的K-S值均小于临界值,即认为总体分布函数F(y) 与经验分布函数F0(y) 无显著差异,通过显著性水平α=0.05的统计检验,该结论也与前文将概率密度函数与样本频率对比相吻合的结果是一致的,表明用Γ分布模式拟合日降水量的概率分布是可行的。
2.2 20 d内最大日降水量的概率分布由2.1节中估计得到的Γ分布概率密度函数f0(x),f1(x) 积分得到条件分布函数F0(x) 和F1(x),再由递推公式算出N日内最大日降水量的概率分布Gn(x),n可以取1,2,3,……,20。
图 3是5个代表站1 d, 10 d, 20 d内最大日降水量的概率密度gn(x) 曲线。当N=1时,当日的降水量即为1 d内最大降水量,包含无雨的情况在内。g1(x) 呈反“J”字型的单调递减趋势,在x=0时取得极值。各代表站10 d, 20 d内最大日降水量概率密度函数的峰值大体相同,略有差异。息县10 d内最大日降水量为7.5 mm的概率最大,20 d内最大日降水量为30 mm的概率最大;阜阳和商丘均是10 d内最大日降水量为7.5 mm的概率最大,20 d内最大日降水量为22.5 mm的概率最大;淮安10 d内最大日降水量为7.5 mm的概率最大,20 d内最大日降水量为27.5 mm的概率最大,连云港10 d内最大日降水量为7.5 mm的概率最大,20 d内最大日降水量为32.5 mm的概率最大。20 d内的最大日降水量概率密度曲线比10 d内的更偏向降水量大的一方,并且分布更平坦,各区间的概率值差异更小。说明随着天数的增加,20 d内最大日降水量Mn的随机性也在增加,预报的难度也就增加了。5个代表站在28年实际样本资料中,日降水量超过100 mm的次数均超过10,其中, 息县为16次,阜阳为17次,商丘为11次,淮安为18次,连云港为19次。日降水量超过200 mm的站点分别为淮安2005年7月21日224.9 mm,阜阳1984年6月13日200.9 mm,1991年6月14日211.6 mm,2007年7月8日226.1 mm。说明日降水量越大,出现的概率越小,预报的难度也相应增加,也说明了模型建立的合理性。此外,代表站点所经历的多次强降水年次中,大部分都经历了洪涝灾害,例如1991年5—7月,2003年6—7月,2007年6—7月,进一步说明淮河流域降水涝、强降水洪的旱涝特征很明显。
![]() |
|
图 3. 代表站1 d, 10 d, 20 d内最大日降水量的概率密度曲线 (a) 息县, (b) 阜阳, (c) 商丘, (d) 淮安, (e) 连云港 Fig 3. Probability density functions of the maximum daily precipitation within 1, 10, 20 days derived from Gamma distributions of representative stations of Xixian (a), Fuyang (b), Shangqiu (c), Huaian (d) and Lianyungang (e), respectively |
由于强降水或暴雨的概率分布特征的参考价值更高,为了掌握整个淮河流域20 d内最大日降水量的概率分布特征,图 4给出了10 d, 20 d内最大日降水量不低于10 mm, 25 mm, 50 mm的概率空间分布。
![]() |
|
图 4. 淮河流域10 d,20 d内最大日降水量不低于10 mm,25 mm,50 mm概率分布 Fig 4. Probability distribution of the maximum daily precipitation no less than 10 mm, 25 mm, 50 mm within 10 and 20 days of the Huaihe Basins |
各等级降水量概率的空间分布特征基本一致,5个子流域中,淮河上游、淮河中下游、沂沭河流域大于其余区域。10 d内最大日降水量不低于10 mm的概率高值区在洪泽湖以东、淮河中上游南部,不低于25 mm的概率高值区在沂沭河流域南部、淮河中上游南部、淮河中下游和洪泽湖以东的交界处,不低于50 mm的概率高值区在沂沭河流域东部、淮河上游地区。20 d内最大日降水量不低于10 mm的概率高值区在沂沭河流域南部、淮河上游南部,不低于25 mm的概率高值区在淮河上游、洪泽湖以东,不低于50 mm的概率高值区在淮河中下游和洪泽湖以东的交界处。另外,同地区20 d内各等级降水量概率明显大于10 d内同等级的降水量概率,说明淮河流域汛期20 d内出现中雨、暴雨的可能性更大。
大雨和暴雨的随机性是由大气环流活动的随机性造成的。例如,根据对1991年和2003年江淮流域大水的大尺度环流特征对比分析中可知[16-18],2003年副热带高压脊线位置较1991年偏北是造成1991年主要雨区位于江淮之间 (即淮河中上游、中下游流域),而2003年雨带中心位于沿淮一带 (即沂沭河流域、洪泽湖以下) 的主要原因。西太平洋副热带高压相对稳定且较常年同期偏南,以及东西进退活跃和强度偏强等因素都会造成淮河流域大降水分布的随机性。
3 结论和讨论掌握淮河流域在汛期降水中时空分布的概率分布特征,尤其是未来若干天内最大日降水量的概率分布,对于防汛抗旱预报服务有重大意义。本文利用Γ分布,基于淮河流域158个气象站1980—2007年的日降水量观测建立的日降水概率分布模型,在通过K-S检验的基础上得到20 d内最大日降水量的概率分布,得到以下初步结论:
1) Γ分布函数能较好地拟合两种条件下淮河流域夏季雨日 (首雨日和连续雨日) 的概率分布,在一定程度上克服了用样本频率代替概率时所产生的随机振荡对估计最大日降水量概率分布的影响,是描述日降水量概率特征较为理想的函数形式。
2) 用Γ分布函数递推得到的20 d内最大日降水量概率分布比较规则合理。1 d的降水量概率密度曲线呈反“J”字型,单调递减;而10 d,20 d内的最大日降水量概率分布则随日数增加,概率密度峰值偏向降水量大的一侧。
3) 淮河上游、淮河中下游、沂沭河流域在10 d,20 d内最大日降水量不低于10 mm,25 mm,50 mm的可能性更大。其中,10 d,20 d内出现暴雨的概率高值区在沂沭河流域东部、淮河上游地区以及淮河中下游和洪泽湖以东的交界处。
需要指出的是,本研究只是基于淮河流域湿季的日降水量资料得到的结果,对于造成这种随机性背后的大尺度环流只是做了简单讨论,而这种随机性和淮河流域大尺度环流之间的相关性,以及对于干季或者更长时间序列资料所得到的结果还需进一步探讨。
[1] | 赵琳娜, 杨晓丹, 齐丹, 等. 2007年汛期淮河流域致洪暴雨的雨情和水情特征分析. 气候与环境研究, 2007, 12, (6): 729–736. |
[2] | Woolhiser D A. Modeling Daily Precipitation-process and Problems//Walden A T, Guttorp P. Statistics in the Environmental & Earth Sciences. London:Halsted Press, 1992:71-89. |
[3] | Todorovic W. A stochastic model of n-day precipitation. J Appl Meteor, 1975, 14: 17–24. DOI:10.1175/1520-0450(1975)014<0017:ASMODP>2.0.CO;2 |
[4] | Katz R. Precipitation as a chain-dependent process. J Appl Meteor, 1977, 16: 671–676. DOI:10.1175/1520-0450(1977)016<0671:PAACDP>2.0.CO;2 |
[5] | Gregory J Husak, Joel Michaelsen, Chris Funk. Use of the gamma distribution to represent monthly rainfall in Africa for drought monitoring applications. International Journal of Climatology, 2007, 27: 935–944. DOI:10.1002/(ISSN)1097-0088 |
[6] | 张耀存. N日降水量的随机分布模式. 南京气象学院学报, 1990, 13, (1): 23–31. |
[7] | 张婷, 魏凤英. 华南地区汛期极端降水的概率分布特征. 气象学报, 2009, 67, (3): 442–451. DOI:10.11676/qxxb2009.044 |
[8] | 苏布达, MarcoGemmer, 姜彤, 等. 1960—2005年长江流域降水极值概率分布特征. 气候变化研究进展, 2007, 3, (4): 208–213. |
[9] | 吴洪宝, 王盘兴, 林开平. 广西6、7月份若干日内最大日降水量的概率分布. 热带气象学报, 2004, 20, (5): 586–592. |
[10] | 孙丞虎, 李维京, 张祖强, 等. 淮河流域土壤湿度异常的时空分布特征及其与气候异常关系的初步研究. 应用气象学报, 2005, 16, (2): 129–138. |
[11] | 廖移山, 李武阶, 闵爱荣, 等. "6.29"淮河暴雨过程β中尺度系统结构特征的数值模拟分析. 应用气象学报, 2006, 17, (4): 421–430. |
[12] | 高歌, 陈德亮, 徐影. 未来气候变化对淮河流域径流的可能影响. 应用气象学报, 2008, 19, (6): 741–748. |
[13] | 徐群, 张艳霞. 近52年淮河流域的梅雨. 应用气象学报, 2007, 18, (2): 147–157. |
[14] | 么枕生, 丁裕国. 气候统计. 北京: 气象出版社, 1990: 710–712. |
[15] | 孙济良, 秦大庸, 孙翰光. 水文气象统计通用模型. 北京: 中国水利水电出版社, 2001: 20–21. |
[16] | 丁一汇. 1991年江淮流域持续性特大暴雨研究. 北京: 气象出版社, 1993: 47–65. |
[17] | 矫梅燕, 姚学祥, 周兵, 等. 2003年淮河大水天气分析与研究. 北京: 气象出版社, 2004: 29–42. |
[18] | 毕宝贵, 矫梅燕, 廖要明. 2003年淮河流域大洪水的雨情、水情特征分析. 应用气象学报, 2004, 15, (6): 681–687. |