期刊检索:
  暴雨灾害   2022, Vol. 41 Issue (1): 94-100.  DOI: 10.3969/j.issn.1004-9045.2022.01.011

短论

DOI

10.3969/j.issn.1004-9045.2022.01.011

资助项目

国家重点研发计划(2017YFC1502306);中国长江电力股份有限公司项目(2417020001);湖北省气象局项目(2019Y04;2020Q4;2020Q05);中国气象局预报员专项(CMAYBY2020-082);中国气象局创新发展专项(CXFZ2021Z033)

第一作者

吴瑶,主要从事短期气候预测工作。E-mail:wzd361301@163.com.

通信作者

杜良敏,主要从事短期气候预测工作。E-mail:duliangmin@qq.com.

文章历史

收稿日期:2020-07-13
定稿日期:2021-05-20
Box-Cox正态转换在长江子流域极端降水气候事件判定中的应用
吴瑶1 , 杜良敏1 , 刘长征2 , 张俊3     
1. 武汉区域气候中心,武汉 430074;
2. 国家气候中心,北京 100081;
3. 中国长江电力股份有限公司,宜昌 443000
摘要:利用1961—2017年长江流域700个气象站点逐月降水资料计算长江流域9个子流域面雨量,采用基于Box-Cox正态分布转换后的百分位法对长江流域不同时间长度的极端降水气候事件阈值进行界定。结果表明,在数据序列长度发生变化的情况下,面雨量序列经Box-Cox正态转换后,计算得到的极端降水气候事件阈值的变化相较于常规百分位法明显减小,具有更为稳健的特性,从而使得相应极端降水气候事件个例的挑选更为稳定。根据该方法得到的阈值,对2018年汛期(6—8月)长江各子流域极端降水气候事件进行判定,岷沱江流域发生了极端多雨气候事件,而长江干流重庆-宜昌段、汉江及中游干流区间发生了极端少雨气候事件。
关键词Box-Cox正态转换    极端降水气候事件    面雨量    阈值    
Application of Box-Cox transformation in the determination of extreme precipitation climate events in the Yangtze sub-basins
WU Yao1 , DU Liangmin1 , LIU Changzheng2 , ZHANG Jun3     
1. Wuhan Regional Climate Center, Wuhan 430074;
2. National Climate Center, Beijing 100081;
3. China Yangtze Power Co., Ltd, Yichang 443000
Abstract: According to the geographical boundaries, we divided the Yangtze river basin into nine sub-basins, and calculated areal rainfall in each sub-basin based on monthly precipitation data at 700 meteorological stations in the basin from 1961 to 2017. We find threshold values of extreme precipitation climate events in each sub-basin by percentile method after applying Box-Cox transformation. The results show that compared with year number ranking method, the threshold value of extreme precipitation climate events in the Yangtze sub-basins defined by these normalized areal rainfall series have obvious advantage. It presents a more stable characteristic when the length of the areal rainfall series changes. The threshold value changes are reduced, and the threshold changes for vast majority of the sub-basins are within 10 mm. Thus the extreme years are stable. Using the threshold values by this method, we examined whether extreme precipitation climate events have occurred during flood season in 2018. As a result, extreme rainy climate event happens in the Mintuo river basin and extreme less rain climate events happen both in the stem stream from Chongqing to Yichang and in the basin that from Hanjiang river to the middle reaches of the Yangtze river.
Key words: Box-Cox transformation    extreme precipitation climate events    areal rainfall    threshold value    
引言

旱涝是长江流域的主要气象灾害,近年来的观测事实和相关科学研究都表明长江流域极端降水事件发生的频率正在不断增加,范围不断扩大。1998年长江全流域性大洪水、2016年长江中游“暴力梅”、2017年长江中下游区域性大洪水、2020年超长梅雨,均引发了严重的洪涝及地质灾害。与此同时,极端少雨事件也频繁发生,2018年盛夏江汉大部降水偏少2~5成,出现伏旱;2019年长江中下游地区出现近40a来最严重的伏秋连旱。频繁发生的极端事件给社会经济发展带来越来越严重的影响,也因此受到越来越多的关注。目前针对极端事件的研究有很多,但诊断对象通常是单日或几日强降水过程,或是以月、季内日降水量极值、暴雨日数等作为极端降水指数(Karl and Knight, 1998Zhai et al., 1999Goswami et al., 2006陈峪等,2010任国玉等,2010)。针对长江流域的研究,也主要以日降水作为研究对象(杨宏青等,2005张天宇等,2007张文等,2007杨玮和程智,2015高洁,2019)。

气候上,单次或几次强降水过程并不足以概括更长时间尺度的特征,月、季尺度总降水量亦是很重要的研究内容,直接关系到是否会出现极端事件。另一方面,天气尺度的极端降水事件研究对象往往是极端多雨,但气候尺度上则更为关注月、季极端少雨及其影响。本研究着眼于长江流域月、季尺度的极端降水,探讨更长时间尺度的“极端降水气候事件”的判定方法。

“极端降水气候事件”是气候领域的概念,区别于通常所说的“日极端降水过程”,对于月、季平均的气候要素,采用极值的思想进行分析,能在更长时间尺度上描述气候的异常状况。气候概率统计学上,对气候要素极值的概率统计主要有两种方法,一种是基于统计样本的百分位法,该方法目前多用来对日极端降水进行挑选,如翟盘茂和潘晓华(2003)张家国等(2018)以1961—1990年逐年日降水量的第99个百分位值的30 a均值定义极端降水事件的阈值,苏布达等(2006)考虑了长江上游降水的特殊性,利用95%分位降水量代替常规的暴雨标准50 mm定义了极端强降水事件,陈波等(2010)对华中地区四个不同百分位的强降水事件进行了区分,苏志重等(2016)唐永兰等(2018)郑小华(2019)采用95百分位法在年极端降水总量、频次、最大日降水量及强度等4种指数上对极端降水进行描述;另一种是用某种概率分布模型对气候要素值进行拟合,常用的分布型如皮尔逊一Ⅲ型曲线、耿贝尔分布、正态分布等,根据气候值的概率对极端事件进行分析(罗梦森等,2013伍丽丽等,2013曹洁等,2014陈子燊等,2015崔玫意等,2017),或是对气候要素的重现期进行估算等(陈建昌等,1995林两位和王莉萍,2005梁忠民等,2016何干皓等,2017杜晓阳等,2018牟婷婷,2018)。有研究表明,经正态分布转换后的数据具有明显统计优势(罗梦森等,2013)。而Box-Cox变换和正态分布有机结合构建的新的Box-Cox正态分布,在研究降水极值分布(崔玫意等,2017)和气温极值方面(曹洁等,2014),拟合效果要优于常用的广义极值(GEV)等分布。本研究将这一方法引入气候极端事件领域,采用正态分布模型对降水进行拟合,再结合百分位法,判断“极端降水气候事件”,对常规百分位法进行一定改进。

1 资料与方法 1.1 资料及处理

资料为1961—2017年长江全流域700个气象站点逐月降水资料,来源于国家气象信息中心。

采用泰森多边形法(Thiessen, 1911),将站点降水资料转化成流域面雨量资料。为了尽可能减少缺测站及迁站的影响,根据站点变化动态调整泰森多边形边界。

1.2 流域分区

依据自然地理条件及气候业务需求,将长江流域划分为9个子流域,分别是金沙江流域石鼓以上、金沙江流域石鼓以下、岷沱江流域、嘉陵江流域、乌江流域、宜宾-重庆区间、重庆-宜昌区间、汉江流域及长江中游干流区间、两湖流域(洞庭湖流域和鄱阳湖流域),空间分区见图 1

图 1 长江各子流域空间分区图 Fig. 1 Nine sub-basins of the Yangtze river.
1.3 分布转换方法(Box-Cox变换)

各种气象要素的概率分布都存在不同程度的偏态特征(曹杰和陶云,2002曹洁等,2014郭凌曜和李英,2015),研究表明(杜良敏等,2018),长江流域月降水量经常呈Gamma分布,正态通过率低,而季节降水通过正态检验的站点比率相对月降水略高,但也仍是正态分布、Gamma分布各占一半。统计分析时需要对序列进行正态分布转换,常用的方法有Box-Cox变换、Yeo-Johnson变换等。

本文采用Box-Cox变换,将具有一定偏态分布的降水及面雨量序列转换为近似符合正态分布的新序列,以便利用已有的数理统计方法研究数据的统计规律和特征。Box-Cox变换是统计建模中的常用方法,该变换可以使线性回归模型在不丢失信息的同时,具有良好统计性质,由Box和Cox提出。

该变换的表达式为

$ Y_{i}(\lambda)=\left\{\begin{array}{l} \frac{y_{i}^{\lambda}-1}{\lambda}, \lambda \neq 0 \\ \ln y_{i}, \lambda=0 \end{array}\right. $ (1)

其中,λ是一个待定的变换参数,最佳λ值由python程序中scipy.stat.boxcox函数自动生成,为极大似然相似估计值。

逆变换表达式为

$ Y_{i}=\left\{\begin{array}{l} \left(\frac{1+\lambda y_{i}(\lambda)}{\lambda}\right)^{\frac{1}{\lambda}}, \lambda \neq 0 \\ \exp \left(y_{i}(\lambda)\right), \lambda=0 \end{array}\right. $ (2)

利用Box-Cox变换可将原始计算所得的面雨量序列转化为近似符合正态分布的新序列。

2 Box-Cox变换在长江流域极端降水气候事件判定中的应用 2.1 极端降水气候事件的判定

判定极端降水气候事件采用基于Box-Cox正态分布转换后的百分位法(以下简称“Box-Cox百分位法”)。

将一个原始面雨量序列经过Box-Cox变换后得到一个近似正态分布的新面雨量序列,计算出各年面雨量在正态分布中所占百分比,取10%和90%百分位反算出对应的原始面雨量值作为阈值。定义10%对应的面雨量值为极端少雨气候事件阈值、90%对应的面雨量值为极端多雨气候事件阈值。变换后的面雨量小于少雨阈值的年份定义为发生极端少雨事件、面雨量大于多雨阈值的年份定义为发生极端多雨事件。

2.2 Box-Cox百分位法与常规百分位法对极端阈值拟合的比较

常规百分位法是直接在降水序列排序基础上,取相应百分位处的值作为阈值,但这种方法的前提实际上是假定了数据遵循正态分布,在这种正态假设不成立的情况下,所挑选的阈值随着时间序列的延长或者缩短,会产生很大变化。而采用Box-Cox百分位法挑选出来的阈值,由于原始数据经过了正态化处理,则有效解决了常规百分位法的上述问题。

以夏季为例,采用Box-Cox百分位法提取的阈值与常规百分位法的阈值列于表 1,可以看出,当参与排序的面雨量序列长度发生变化时,常规百分位法阈值在一部分流域发生明显变化,主要有岷沱江流域、重庆-宜昌区间、两湖流域等,阈值浮动超过30 mm(以“*”标出);而Box-Cox百分位法阈值变化显著减小,绝大多数流域变动在10 mm之内。

表 1 不同时段下Box-Cox百分位法面雨量阈值与常规百分位法面雨量阈值对比(单位:mm) Table 1 Comparison of areal rainfall threshold values defined by Box-Cox transformation and year number ranking method in different times (unit: mm).

另一方面,Box-Cox百分位法在短时序数据处理上更具优势。对比两种方法相同时间长度的阈值,相比于30 a,50 a长度下阈值变化明显减小。表明,当序列足够长时,是否经过Box-Cox转换,对阈值的影响不大;但当数据长度较短时,Box-Cox转换则显现出明显的稳健特性。

图 2a为原始面雨量序列通过正态检验情况,深色流域表示未通过正态分布检验,浅色流域为通过正态分布检验。经Box-Cox变换后,原始面雨量序列被转换成了更为近似正态分布的新面雨量序列,下文将其称为“Box-Cox面雨量序列”,由图 2b可见,全部子流域Box-Cox面雨量序列在月、季、年各时间尺度上均通过Lilliefors正态分布检验。

图 2 长江各流域月、季、年原始面雨量序列通过正态检验情况(a)、Box-Cox面雨量序列通过正态检验情况(b) Fig. 2 The normal test results of (a) observed areal rainfall series and (b) normalized areal rainfall series in different time scales in the Yangtze sub-basins.
2.3 Box-Cox变换在长江流域极端降水气候事件判定中的应用初探

分别选择不满足正态分布的嘉陵江流域秋季(9— 11月)面雨量序列,和满足正态分布的岷沱江流域秋季(9—11月)面雨量序列进行应用对比。

嘉陵江流域秋季的原始面雨量序列不满足正态分布,面雨量在190~200 mm出现频次最多(图 3a),相对于平均值235 mm具有明显偏移;出现这种偏态分布的原因在于面雨量的年代际分布不均,20世纪80年代中后期至2010年之间,面雨量均值维持在200 mm左右,与全序列均值相差较大(图 3c);图 4为嘉陵江流域秋季极端降水气候事件的年代际频次分布,从中可见,在80年代中后期至2010年期间发生了4次极端少雨气候事件,分别在1991、1997、1998、2002年,4 a秋季面雨量均仅有140~160 mm。而与之对比,岷沱江流域1961年以来秋季面雨量呈缓慢减少趋势(图 5c),很少出现明显的年代际雨量分布不均,因此该流域原始面雨量序列本身就满足正态分布(图 5a)。

图 3 嘉陵江流域1961—2017年秋季(9—11月)原始面雨量序列频次分布(a,单位:次)、Box-Cox面雨量序列频次分布和正态分布曲线(b,柱状图为Box-Cox面雨量序列频次,单位:次;实线为正态分布曲线)、原始面雨量及Box-Cox面雨量序列(c,实线为原始面雨量序列,单位:mm;虚线为Box-Cox面雨量序列) Fig. 3 (a)The frequency of observed areal rainfall(bar, unit: time), (b) the frequency of normalized areal rainfall and normal distribution curve (bar indicates frequency, unit: time, and line indicates normal distribution curve), and (c) observed areal rainfall and normalized areal rainfall (full line indicates areal rainfall, unit: mm, and dotted line indicates normalized areal rainfall) of Jialing river basin in autumn from 1961 to 2017.

图 4 嘉陵江流域秋季极端降水气候事件年代际频次分布图(单位:次) Fig. 4 The decadal frequency of extreme precipitation climate events in Jialing river basin in autumn (unit: time).

图 5 岷沱江流域1961—2017年秋季(9—11月)原始面雨量序列频次分布(a,单位:次)、Box-Cox面雨量序列频次分布和正态分布曲线(b,柱状图为Box-Cox面雨量序列频次,单位:次;实线为正态分布曲线)、原始面雨量及Box-Cox面雨量序列(c,实线为原始面雨量序列,单位:mm;虚线为Box-Cox面雨量序列) Fig. 5 (a)The frequency of observed areal rainfall (bar, unit: time), (b) the frequency of normalized areal rainfall and normal distribution curve (bar indicates frequency, unit: time, line indicates normal distribution curve), and (c) observed areal rainfall and normalized areal rainfall (full line indicates areal rainfall, unit: mm, and dotted line indicates normalized areal rainfall) of Mintuo river basin in autumn from 1961 to 2017.

对嘉陵江流域秋季面雨量采用Box-Cox正态分布转换后的序列频次分布如图 3b,拟合序列均值为2.5,与拟合频次分布最大值一致,满足正态分布。对比图 3c可以看出,Box-Cox面雨量序列与原始面雨量序列的逐年变化趋势一致,拟合序列仅在y轴方向进行了拉伸(或压缩)。而对于岷沱江流域,为了保证不同子流域间极端阈值挑选规则的一致性,对这类满足正态分布的序列,我们依然对其进行Box-Cox正态转换,转换后的序列将比其原始序列更接近标准正态分布型(图 5b)。岷沱江秋季原始面雨量序列极端多雨、少雨阈值分别为237.4 mm和152.7 mm,转换后则为240 mm和154.9 mm,仅有微小变化,不影响极端年份的选取。

2.4 2018年汛期(6—8月)长江各子流域极端降水气候事件判定应用

2018年汛期,长江上游降水实况分布为西多东少,上游西北部的岷沱江流域和嘉陵江流域北部降水偏多1~5成,上游其他子流域偏少1~5成。

采用Box-Cox百分位法计算1961—2017年汛期长江各子流域极端降水气候事件阈值(表 2)。利用阈值对2018年汛期面雨量实况进行判定,则岷沱江流域面雨量超过极端多雨气候事件阈值,判定为发生极端多雨气候事件,面雨量偏多排历史第4位;而长江干流重庆-宜昌段、汉江及中游干流区间面雨量超过极端少雨气候事件阈值,判定为发生极端少雨气候事件,面雨量偏少均排在历史第7位。而按照常规百分位法,1961—2018年共58 a,仅能筛选出极端多雨、少雨气候事件各6 a (约占10%),那么干流重庆-宜昌段、汉江及中游干流两个子流域则未达到极端少雨气候事件标准。

表 2 1961—2017年汛期(6—8月)长江各子流域极端降水气候事件阈值及2018年实况面雨量 Table 2 The threshold values of extreme precipitation climate events in the Yangtze sub-basins in flood season from 1961 to 2017 and the observed area rainfall in 2018.

同样按常规百分位法,若将新增年份并入序列,计算1961—2018年汛期岷沱江流域极端降水气候事件阈值,极端年份发生改变,极端多雨阈值由原来的532.7 mm (1988年)调整为545.0 mm (1981年),原来排第6位的1988年不再是夏季极端多雨年。但采用Box-Cox百分位法得到的极端阈值仅发生微小变化,由542.5 mm上升为548.2 mm,无论是阈值还是极端年份的改变均不如常规百分位法剧烈,具有更为稳健的特性。

3 结论与讨论

本文在长江流域分区面雨量研究中引入Box-Cox正态分布转换方法,对长江流域面雨量进行正态分布拟合,并展开了流域极端降水气候事件阈值的研究,得到以下结论。

(1) 经Box-Cox变换,部分因降水年代际分布不均导致面雨量呈偏态分布特征的子流域,其拟合序列能转换为正态分布序列,而其他原始序列符合正态分布特征的流域,经转换后则更为接近标准正态分布型。

(2) 相较于常规百分位法,Box-Cox百分位法能一定程度上降低因为延长序列带来的阈值波动。经转换后得到的阈值,受序列长度变化的影响明显减小,具有更为稳健的特性。

(3) 当序列足够长时,经过Box-Cox转换与否,对阈值的影响不大;但在短时序数据处理上,Box-Cox百分位法比常规百分位法稳定,更具优势。

(4) 根据1961—2017年极端降水气候事件的阈值,判定2018年汛期(6—8月),岷沱江流域发生了极端多雨气候事件,长江干流重庆-宜昌段、汉江及中游干流区间发生了极端少雨气候事件。

长江流域地形复杂,地理跨度大,降水变化原因复杂,不同子流域间地形差异对极端事件阈值的影响方面还有待深入研究。而阈值判定也只是极端降水气候事件研究的开始,依据此阈值挑选出来的极端降水气候事件,具有何种特征、形成机理等方面有待进一步的研究和诊断。

参考文献
曹杰, 陶云. 2002. 中国的降水量符合正态分布吗?[J]. 自然灾害学报, 11(3): 115-120.
曹洁, 叶文, 刘焕彬, 等. 2014. 山东省极端气温偏态性分布和变化特征[J]. 气象科学, 34(2): 193-199.
陈波, 史瑞琴, 陈正洪. 2010. 近45年华中地区不同级别强降水事件变化趋势[J]. 应用气象学报, 21(1): 47-54.
陈建昌, 郭化文, 魏生生, 等. 1995. 用Jenkinson法推算山东年最大日雨量重现期值的初探[J]. 应用气象学报, 6(4): 486-491.
陈峪, 陈鲜艳, 任国玉. 2010. 中国主要河流流域极端降水变化特征[J]. 气候变化研究进展, 6(4): 265-269. DOI:10.3969/j.issn.1673-1719.2010.04.006
陈子燊, 黄强, 李鸿皓. 2015. 珠江三角洲城市短时强降水概率分布模型的对比分析[J]. 中山大学学报(自然科学版), 54(2): 127-132, 140.
崔玫意, 张玉虎, 陈秋华. 2017. Box-Cox正态分布及其在降雨极值分析中的应用[J]. 数理统计与管理, 36(1): 8-17.
杜良敏, 刘绿柳, 高雅琦, 等. 2018. 长江流域月季降水量的概率分布特征分析[J]. 气象科技进展, 8(4): 89-94.
杜晓阳, 杜尧东, 唐力生. 2018. 广州市单日降水量极值特征、分布拟合与推算[J]. 气象与环境科学, 41(4): 77-81.
高洁. 2019. 基于GAMLSS的雅砻江流域极端降水时空特性研究[J]. 水力发电, 45(1): 13-17, 56.
郭凌曜, 李英. 2015. 湖南省短历时降水极值分布拟合与应用[J]. 气象与环境学报, 31(3): 69-74.
何干皓, 李国龙, 刘铁钢, 等. 2017. 岷江流域降水极值概率分布研究[J]. 工程科学与技术, 49(1): 78-85.
梁忠民, 卜慧, 刘和昌, 等. 2016. 干旱事件重现期计算问题研究[J]. 南水北调与水利科技, 14(6): 1-5.
林两位, 王莉萍. 2005. 用Pearson-Ⅲ概率分布推算重现期年最大日雨量[J]. 气象科技, 33(4): 314-317.
罗梦森, 熊世为, 梁羽飞. 2013. 区域极端降水事件阈值计算方法比较分析[J]. 气象科学, 33(5): 549-554.
牟婷婷, 林爱文, 方建. 2018. 基于广义帕累托分布的长江中下游极端降水重现期研究[J]. 国土与自然资源研究, 13(2): 42-45.
任国玉, 封国林, 严中伟. 2010. 中国极端气候变化观测研究回顾与展望[J]. 气候与环境研究, 15(4): 337-353.
苏布达, 姜彤, 任国玉, 等. 2006. 长江流域1960—2004年极端强降水时空变化趋势[J]. 气候变化研究进展, 2(1): 9-14.
苏志重, 石顺吉, 张伟, 等. 2016. 1960—2010年福建省极端降水事件变化趋势分析[J]. 暴雨灾害, 35(2): 166-172.
唐永兰, 于晓晶, 徐桂荣, 等. 2018. 近54 a湖北极端降水的变化特征及其与城市化的关系研究[J]. 暴雨灾害, 37(1): 73-82.
伍丽丽, 刘丙军, 陈晓宏, 等. 2013. 珠江流域极端降水阈值不确定性分析[J]. 水文, 33(4): 59-64.
杨宏青, 陈正洪, 石燕, 等. 2005. 长江流域近40年强降水的变化趋势[J]. 气象, 31(3): 66-68.
杨玮, 程智. 2015. 近53年江淮流域梅汛期极端降水变化特征[J]. 气象, 41(9): 1126-1133.
翟盘茂, 潘晓华. 2003. 中国北方近50年温度和降水极端事件变化[J]. 地理学报, 58(z1): 1-10. DOI:10.3321/j.issn:0375-5444.2003.z1.001
张家国, 王珏, 吴涛, 等. 2018. 长江中游地区极端降水主要天气系统类型分析[J]. 暴雨灾害, 37(1): 14-23.
张天宇, 程炳岩, 刘晓冉. 2007. 近45年长江中下游地区汛期极端强降水事件分析[J]. 气象, 33(10): 80-87.
张文, 寿绍文, 杨金虎. 2007. 长江中下游地区汛期极端降水量的异常特征分析[J]. 气象, 33(3): 61-67.
郑小华, 娄盼星, 刘环, 等. 2019. 陕西极端降水时空变化特征研究[J]. 沙漠与绿洲气象, 13(4): 9-16.
Goswami B N, Venugopal V, Sengupta D, et al. 2006. Increasing trend of extreme rain events over India in a warming environment[J]. Science, 314(5804): 1442-1445. DOI:10.1126/science.1132027
Karl T R, Knight R W. 1998. Secular trends of precipitation amount, frequency, and intensity in the USA[J]. Bulletin of the American Meteorological Society, 79(2): 231-241.
Thiessen A H. 1911. Precipitation Averages for Large Areas[J]. Monthly Weather Review, 39(7): 1082-1089.
Zhai P M, Sun A, Ren F, et al. 1999. Changes of climate extremes in China[J]. Climatic Change, 42(1): 203-218. DOI:10.1023/A:1005428602279