环境科学学报  2017, Vol. 37 Issue (6): 2387-2393
基于正态分布假设检验的湖泊营养盐浓度分级评价方法研究    [PDF全文]
张雨宇, 梁中耀, 陆文涛, 刘永 , 郭怀成    
北京大学环境科学与工程学院, 水沙科学教育部重点实验室, 北京 100871
摘要: 目前湖泊营养盐浓度级别评价常采用的平均值法忽视了变量的不确定性.本文据此提出一种基于正态分布总体均值假设检验的级别评价方法,并结合我国地表水环境质量标准(GB3838-2002)对营养盐浓度的分类,提出了简便快捷的图示法.结果发现,该方法能体现营养盐浓度变量的不确定性,融合先验级别假设,将决策风险定量化,可提供较为广阔的决策空间.同时,采用该方法对滇池外海观音山监测断面氨氮浓度的水质级别进行评价,发现先验级别假设、样本容量和决策偏好对评价结果有显著影响;与平均值法的比较发现,假设检验法具有更小的错误概率(例如,样本容量>13时,风险 < 0.21),评价结果具有更高的可信度,验证了假设检验法的适用性.
关键词: 营养盐     级别评价     假设检验     图示法     决策风险    
A hypothesis test method with normal distribution assumption for grade assessment of lake nutrient concentrations
ZHANG Yuyu, LIANG Zhongyao, LU Wentao, LIU Yong , GUO Huaicheng    
The Key Laboratory of Water and Sediment Sciences, Ministry of Education, College of Environmental Science and Engineering, Peking University, Beijing 100871
Received 22 December 2016; received in revised from 17 January 2017; accepted 17 January 2017
Supported by the National Major Science and Technology Project for Water Pollution Control and Management (No.2012ZX07503-002) and the National Natural Science Foundation of China(No.41222002)
Biography: ZHANG Yuyu(1992—), male, E-mail:zhangyuyu@pku.edu.cn
*Corresponding author: LIU Yong, E-mail:yongliu@pku.edu.cn
Abstract: The uncertainty of nutrient concentration variable is always ignored while assessing the water quality grade. A grade assessment method based on the hypothesis test for the mean of normal distribution was thereby proposed in this study. We introduced the principles of the hypothesis test. Since the nutrient concentration was divided into six grades in China according to the environmental quality standards for surface water (GB3838-2002), a simple graphic method based on the hypothesis test to assess the concentration grade was developed. It can reflect the decision-making risk quantitatively, and improves broader decision space for decision-maker, with emerging prior hypothesis on the grade of nutrient concentration. Using the hypothesis test method, we assessed the water quality grade of ammonia nitrogen of Guanyinshan monitoring station in Lake Dianchi. The results demonstrated significant impacts of prior hypothesis, sample size and the decision preference of decision-maker on grade assessment results. Comparing with the mean value method, we found that the result of hypothesis method had higher credibility with lower falsely inferring a breach of standard risk and low falsely inferring compliance risk. In general, the hypothesis test method proposed in this article was applicable for nutrient concentration grade assessment.
Key words: nutrient     grade assessment     hypothesis test     graphic method     decision-making risk    
1 引言(Introduction)

湖泊富营养化问题及其对生态系统和人体健康造成的危害已引起人们的广泛关注(Lucie, 2007; Smith et al., 2009; Dodds et al., 2009; Qin et al., 2010), 控制营养盐浓度是防治湖泊富营养化的主要途径(Paerl et al., 2008; Schelske, 2009; Conley et al., 2009; Paerl et al., 2014).营养盐浓度级别评价通过客观反映湖泊富营养化状态, 为其防治规划和措施实施提供科学依据(Smith et al., 2001; 龚艳冰等, 2011富天乙等, 2014).湖泊营养盐浓度级别评价与浓度标准的制定密切相关, 以保护生态系统健康为目的的营养盐浓度标准主要通过野外试验方法确定, 该方法以营养盐浓度梯度对生物指标的显著影响点作为浓度限值(Richardson et al., 2007; Smith et al., 2013);由于水质监测数据具有波动性, 平均值被用来代替特定时段营养盐浓度的平均水平, 并与标准值作对比分析(Stephan et al., 1985).营养盐浓度的标准值实质上规定了一段时间内浓度平均值的限值(Barnett et al., 1997; Qian, 2015).通过压力-响应模型法(Huo et al., 2014)、参考状态法(许秋瑾等, 2011)制定的标准也是指营养盐浓度的平均值.因此, 湖泊营养盐浓度级别评价的对象为一定时段内的浓度平均值.

科学合理的方法是营养盐浓度级别评价的基础.水质变量具有时空变异性, 而监测数据不能覆盖所有时间和点位, 因此, 仅以监测数据的平均值作为评价依据不能表征水质变量的不确定性和决策风险, 评价结果不可靠(de Fouquet, 2012; Merrington et al., 2014).在统计学中, 水质指标被视为随机变量, 从而可有效表征其不确定性(Shabman et al., 2003梁中耀等, 2017), 此时浓度平均值应该理解为水质变量的总体均值, 即水质级别评价是对一定时段内水质变量总体均值的评价.假设检验法通过样本监测数据估计总体均值特征, 已被广泛用于水质达标评价的研究中, Smith等(2001)McBride等(2001)同时采用非参数二项分布检验及贝叶斯方法进行了水质达标评价;其后, 研究人员探索了参数假设检验及贝叶斯方法在水质达标评价中的适用性(Gibbons, 2003; Smith et al., 2003; Smith et al., 2015).然而, 这些方法对总体的90%分位数进行假设检验, 对于表征平均值的营养盐浓度标准并不适用.以保障总体均值达标为目的, ISO(2008)推荐使用样本平均值的95%置信区间进行评价, Phillips等(2012)研究了样本容量对饮用水污染物平均值95%置信区间的影响.但上述研究并未讨论由于水质变量不确定性带来的决策风险, 不足以支撑水质达标评价决策.本文采用统计学中的假设检验方法, 对营养盐浓度总体均值进行假设检验, 服务于我国地表水环境质量标准对营养盐浓度级别的划分.对不同级别营养盐标准分别进行达标评价, 将由营养盐浓度不确定性导致的决策风险定量化, 融入先验级别假设和决策者的决策偏好, 提出简便快捷的营养盐浓度级别评价图示法.最后以滇池流域氨氮(NH3-N)浓度的级别评价为例, 探究先验级别假设、样本容量和决策偏好对级别评价结果的影响, 并与平均值法对比, 验证假设检验法对营养盐浓度级别评价的适用性.

2 研究方法(Methodological framework) 2.1 基于正态分布总体的营养盐浓度达标评价方法

湖泊营养盐浓度级别评价的对象必须与标准规定的浓度平均值涵义一致.Qian等(2003)Richardson等(2007)利用野外试验数据探究TP浓度标准值时, 采用其几何平均值;很多基于压力-响应模型法推算营养盐浓度标准或浓度限值的研究, 均对营养盐浓度进行了对数变换(Malve et al., 2006; Lamon et al., 2008; Zhang et al., 2014霍守亮等, 2014), 此时浓度平均值本质上也为几何平均值.水质变量的自然对数变换可将其由右偏分布转换为正态分布(Ott, 1995), 因而将获得的营养盐浓度监测数据首先进行对数变换, 然后视变换后的数据为正态分布, 符合营养盐浓度标准的涵义和统计学准则.中心极限定理指出, 当样本容量足够大时, 样本平均值服从正态分布;而钱松(2011)的研究表明, 任何关于样本容量“足够大”的具体建议都是不可靠的.因此, 即使在样容量较大时, 进行对数变换也是必要的.

下面介绍采用假设检验法进行营养盐浓度达标评价的一般思路.记随机变量X为自然对数变换(下同)后的营养盐浓度变量, 则X~N(μ, σ2);现有样本容量为n的监测数据{x1, x2, ..., xn}, 则其算术平均值x~N(μ, σ2/n).定义, 则z~N(0, 1), 当用样本标准差s估计总体标准差σ时, 存在:

(1)

记对数变换后的营养盐浓度标准为θ.在理想条件下, 比较μθ可判断营养盐浓度是否达标;实践中μ是未知的, 需要使用统计学假设检验法对μ进行推断.给定假设检验的显著性水平为α.假设营养盐浓度达标, 即原假设为H0:μθ, 备择假设为H1:μ>θ.由式(1) 可得式(2), 式(2) 可转化为式(3).

(2)
(3)

其中, , 由原假设和式(3) 可得:

(4)

可见当原假设水质达标为真时, x-ω>θ为小概率事件, 若发生了则拒绝原假设, 判定为水质超标.拒绝域为x-ω>θ, 此时ω可理解为将先验达标水体判定为超标时, 对较大监测数据的“容忍度”.

假设营养盐浓度超标, 原假设为H0:μ>θ, 备择假设为H1:μθ.由式(1) 可得:

(5)

由于t分布是以零为中心的对称分布, 因此,存在式(6) 所示关系, 由式(5) 和(6) 可得式(7).

(6)
(7)

由原假设和式(7) 可得:

(8)

可见当原假设水质超标为真时x+ωθ为小概率事件, 若发生了则拒绝原假设, 判定为水质达标.拒绝域为x+ωθ, 此时ω可理解为将先验达标水体判定为超标时的“安全因子”.

2.2 基于正态分布总体的营养盐浓度级别评价方法

我国地表水环境质量标准将水质级别分为6类(含劣Ⅴ类), 根据营养盐浓度达标评价的思路和方法, 在进行级别评价前, 需要根据先验知识设定先验级别, 作为假设检验的原假设(区别于水质达标评价中的原假设, 称为“先验级别假设”);级别评价需要对先验级别假设中营养盐浓度所处的水质级别的上下限分别进行假设检验.假设某营养盐Ⅰ~Ⅴ类水质的对数浓度限值分别为θi(i=1、2、3、4、5), 令θ0=-∞, θ6=+∞;令先验级别假设为:营养盐浓度级别为j(j=1、2、3、4、5、6), j=6表示劣Ⅴ类.当x-ω>θj时营养盐浓度级别变差, 若x-ω>θix-ωθi+1则级别判定为i;当x+ωθj-1时级别变好, 若x+ωθix+ω>θi-1则级别判定为i;当θj-1-ω < xθj+ω时, 级别不变.上述方法较为繁琐, 对其进行归纳总结得到简便快捷的营养盐浓度级别评价图示法(图 1):当区间M=(x-ω, x+ω]位于同一营养盐浓度级别时, 无论先验级别假设为何种营养盐浓度级别, 评价结果均为M所在水质级别(图 1a).当M跨越多个级别时, 评价结果仅有可能在跨越的级别中, 当先验级别假设在跨越的级别中时, 评价结果为先验级别假设级别;当先验级别假设为劣于跨越的级别中最差级别时, 评价结果为跨越级别中的最差级别;当先验级别假设优于跨越级别中最优级别时, 评价结果为跨越级别中的最优级别(图 1b).图 1b反映了先验级别假设和不确定性对评价结果的影响, 对于同样的监测数据, 不同的先验级别假设使得评价结果可能存在差异;不确定性使得M可能跨越多个水质级别, 导致评价结果与x所在级别可能不一致.统计学假设检验法进行营养盐浓度级别评价时具有“临近吸引”的规律, 评价结果必然位于M跨越的级别之中, 且总是选择离先验级别假设最近的级别.

图 1 营养盐浓度级别评价图示法 Fig. 1 Graphic method for nutrients concentration grade assessment
2.3 决策风险与决策过程

由于湖泊营养盐浓度的时空分异性, 采用监测数据推断总体均值时, 会有弃真错误和取伪错误, 其中, 弃真错误是指原假设为真而错误放弃, 取伪错误是指原假设为假而错误相信;弃真错误的概率记为α, 取伪错误的概率记为β.在进行营养盐浓度级别评价时, 弃真错误是指原假设为真, 即级别为j时却错误地判定为其它级别;取伪错误是指原假设为假, 即级别不为j时却错误地判定为j.在进行级别评价时对营养盐浓度所处的上下限均进行了假设检验, 因此, 总的弃真错误概率(αT)包括两部分:将原本为j的水质错判为高于j所犯的错误(αU)和将原本为j的水质错判为低于j所犯的错误(αL), 即αT=αU+αL;对于取伪错误亦然, 即βT=βU+βL.这两类错误给出了决策过程中的风险, 对于统计决策至关重要(Brosi et al., 2009).由于t分布为连续分布, 当控制一定的显著性水平而选择β最小的拒绝域时, α等于显著性水平(王志良等, 2013).

βαsn、效应值δ(零假设平均值与特定备择假设平均值之间的差距)有关(钱松, 2011), 当原假设为水质达标时, 计算可得, 即为自由度为n-1的t分布的累积分布函数中, 所在的分位数(T(x)为tn-1(x)的累积分布函数, T-1(x)为其反函数, 即为x在累积分布函数的分位数);当原假设为水质超标时, βL=1-T-1, 由t分布的对称性可知, 当δU=δLαU=αL时, βU=βL.

统计学假设检验通常控制一定的显著性水平进行决策(McBride et al., 1993王治臻等, 2007), 而对于营养盐浓度级别评价决策, (α, β)的组合能提供更多信息(Saltz, 2011).(α, β)将决策风险定量化, 不同的决策准则(即对ω的选择)对应不同的(α, β)组合, 决策者可根据决策偏好进行选择.以H0:μθ为例, 弃真错误导致高估营养盐浓度, 做出对湖泊过保护的决策, 造成资源和资金的浪费; 取伪错误导致对现状的过分乐观.若决策倾向于流域经济发展, 则可以适当减小α, 使对营养盐浓度级别评价更加保守; 若决策倾向于保护流域生态环境, 则可以适当增加α, 使评价更为严格.(α, β)组合还可根据不同的约束条件(例如αβαβ等)选择, 从而提供更多的(α, β)组合供决策者选择, 为决策者提供较大的决策空间.需要说明的是, (α, β)是对决策准则两类错误可能性的衡量, 而非某次特定的评价过程; 在具体某次评价中, 若根据决策准则判定为不达标, 则只可能弃真错误且其概率≤α, 若判定为达标, 则只可能取伪错误且其概率≤β.

综上, 在湖泊营养盐浓度级别评价以达标评价对2种不同原假设的假设检验为基础, 级别评价具有“临近吸引”的规律.营养盐浓度的时空差异使得采用样本平均值估计总体均值时需要同时考虑xω, ω的大小取决于决策者的决策偏好, 即对(α, β)的选择, 级别评价结果由先验级别假设和(x-ω, x+ω]区间所在的级别共同决定.

3 案例研究(Case study) 3.1 研究对象

本文选择滇池外海国控断面观音山站作为研究对象, 数据来源于国家环保部网站.根据数据可得性, 分析NH3-N的水质级别, 收集2005—2014年的水质监测周数据;以年为单位对营养盐浓度进行级别评价, 每年有52组监测数据, 总计有2个缺失数据, 采用中位数平滑法对其进行插值(Qian et al., 2000), 对插补后的数据进行自然对数变换.采用Kolmogorov-Smirnov方法对变换后的数据进行正态性检验(Ilijević et al., 2015), 发现均符合正态分布假设(p < 0.05).除对每年52组数据进行分析外, 本文还对变换后的数据按相邻2周、4周、13周合并, 求算术平均值, 分别近似代表双周、月、季度的采样频率, 以探究样本容量对级别评价结果的影响.为简化表述和运算, 本研究选择αU=αL=α, 并令δU=δL, 则βU=βL=β.选择α=0.05、0.1、0.15对评价结果进行对比, 探究不同的决策偏好对结果的影响.本文所有统计运算均基于R软件(http://www.r-project.org), 其中, 正态性检验采用ks.test函数, 求取伪错误概率采用power.t.test函数.

3.2 评价结果

对于4种不同的样本容量, 由于x均可转化为特定年份52个原始监测数据几何平均值的自然对数, 因此, 特定年份的x相同(表 1).图 2为采用图示法进行水质级别评价的结果.图中的实心圆点代表NH3-N的样本平均值, 相应的竖实线代表[x-ωα, x+ωα]所在区间;由上至下分别代表α=0.05、0.1、0.15时的结果, 各竖实线对应的区间分别为总体均值90%、80%、70%的对称置信区间;对于某一特定年份, 由左至右4条竖实线分别代表样本容量为52、26、13、4时的结果.在评价时, 取前一年的水质级别评价结果作为本年的先验级别假设;对2005年直接采用所在的水质级别作为评价结果, 可以保证不同评价方法的最初先验级别假设一致.NH3-N浓度Ⅰ类水质标准的自然对数值为-1.89, 由表 1可知, 2005年的水质级别为Ⅰ类.由图 2可知, 弃真错误概率α和样本容量nω影响显著:ωα的增加而减小, 体现了随着α增加, 对超标的“容忍度”或达标的“安全因子”变小;ωn的增加而减小, 这是因为随着n增加, 样本平均值对总体均值的估计更为准确, 不确定性更小.

表 1 自然对数变换后NH3-N浓度的年平均值 Table 1 Annual mean value of ammonia nitrogen concentration after natural logarithm transform

图 2 不同弃真错误概率和样本容量对应的[x-ωα, x+ωα]区间 Fig. 2 [x-ωα, x+ωα] for different probabilities of falsely inferring a breach of standard risk and sample sizes

滇池观音山断面NH3-N的水质级别评价结果见表 2.总体而言, 观音山监测断面2005—2014年NH3-N的水质级别呈现下降趋势, 由Ⅰ类变为Ⅱ类.相对平均值法, 假设检验法水质级别评价“临近吸引”的规律使得评价结果的波动性更小.αn对评价结果影响显著.NH3-N浓度总体上存在递增趋势, 在递增过程中水质级别由Ⅰ类变为Ⅱ类, 不同的αn对水质级别变化点的判断不同, 随着αn的增加, 对变化点的判断提前(表 2).例如, 当α=0.05时, n为52、26、13、4对水质级别变化点的判断分别为2008年、2008年、2010年、2013年, 而当α=0.15时, 均判断为2008年.对2012年水质级别的评价体现了先验级别假设的影响, 样本平均值小于Ⅰ类水质标准, 平均值法判定为Ⅰ类;假设检验法在先验级别假设为Ⅱ类水质时, 认为样本平均值没有足够小到将级别判定为Ⅰ类, 因此,判定水质级别不变(Ⅱ类水), 而在先验级别假设为Ⅰ类水质时, 判定为Ⅰ类水质.

表 2 类别评价结果 Table 2 Grade assessment results

αn对应的β不同(表 3, 取s为多年平均值, δ为Ⅱ类水质上下限值的1/2, 为0.60).如前所述, 平均值法对应的α=0.5;而采用假设检验法进行类别评价时, 当n=4时β过大, 不能满足决策要求, 而当n为其它3个值时, 两类错误概率之和均小于0.21, 具有较低的决策风险, 决策具有较高的可信度(表 3).此外, 假设检验法为决策者提供了较大的决策空间, 决策者可以根据决策偏好选择不同的αβ组合.例如,当样本容量为26时欲使得α+β最小, 可选择α=0.05、β=0.034的组合;当样本容量为13时欲使得αβ, 则需要选择α=0.1;欲使得样本容量为52时αβ, 则需要减小α计算β, 直到找到符合要求的组合.在案例研究中, 达标评价原假设为达标和不达标的α取相同值, 实践中可以根据需要选择不同的α值, 例如,为体现对生态环境的重视, 在原假设为达标时可选择较大的α, 在原假设为超标时可选择较小的α, 此时区间[x-ωbig, x+ωsmall]变为下长上短的非对称区间.

表 3 不同弃真错误概率对应的取伪错误概率 Table 3 Risk of falsely inferring compliance for different risk of falsely inferring a breach of standard
4 讨论(Discussion) 4.1 先验级别假设的获得

案例研究中, 先验级别假设对评价结果具有显著影响.先验级别假设是主观确定的, 但需要科学的依据.得到先验级别假设的过程, 需要收集充足的信息, 进行科学判断.本文使用的先验级别假设是前一年的水质级别, 实际级别评价中可以考虑多年的水质级别、水体负荷输入、专家意见等一切有助于增加对先验级别假设判断的信息.假设检验过程中的弃真错误概率α体现了先验级别假设对评价结果的影响, 在其它条件一定时α越大, 先验级别假设对营养盐浓度级别评价结果的影响越小.考虑2种极端情况:当α→0时, t1-α→+∞, ω→+∞, 则区间[x-ω, x+ω]→(-∞, +∞), 根据2.1节的论述, 此时营养盐浓度级别的评价结果为先验级别, 监测数据的平均值x对评价结果没有影响;当α=0.5时, t0.5=0, ω=0, 此时假设检验法变为平均值法, 先验级别假设对评价结果没有影响.因此, 在缺乏足够信息但仍有部分信息支撑先验级别假设时, 选择较大α是合理的.

4.2 级别评价的目的

案例研究中, 采用假设检验法得到的水质级别既有劣于也有优于平均值法的, 说明统计学方法进行营养盐浓度级别评价的目的并非建立更为严格的级别评价方法, 而是在充分考虑和表征监测数据不确定性的条件下, 建立科学的评价准则, 回答“当水质监测数据符合何种条件时判定为何种水质级别”.欲建立更为严格的级别评价准则, 至少可以通过以下3种途径实现:① 原假设为达标, 选择较大的α, 原假设为超标, 选择较小的α;② 将假设检验的分位数提高, 控制总体的更高分位数达标;③ 建立更为严格的营养盐浓度标准.本研究不推荐使用平均值的95%分位数来严格控制水质超标, 这样的标准会导致很大的弃真错误, 在实践中如果变量的波动性较大或监测数据较少, 达标将非常困难.

4.3 假设检验法的适用性

本文采用的方法针对营养盐浓度级别评价提出, 根据其原理, 也适用于可以转化为正态分布且转化后标准仍有意义的其它水质指标.当变量之间存在较为严重的自相关时, 样本平均值的分布会发生改变(Khalil et al., 2009), 此时可采用自举法求解平均值分布的分位数(钱松, 2011).Gronewold等(2009)论述了小样本对方差估计不准确的问题, 可以采用贝叶斯层次模型聚集数据(Qian et al., 2009), 或者采用Robust ANOVA克服小样本方差变异性问题(Demetriades, 2010).此外, 随意取样会造成平均值估计的偏差(Fouquet, 2012), 采样时间应均匀分布于监测周期内, 以充分体现营养盐的季节变化特征(Long et al., 2014).

5 结论(Conclusions)

1) 采用平均值法进行类别评价忽视了营养盐浓度的不确定性, 会导致较大的弃真错误概率, 使得决策缺乏可信度.假设检验法能够充分体现营养盐浓度变量的不确定性, 通过弃真错误概率和取伪错误概率定量表征决策风险, 并根据决策偏好选择合适的弃真错误概率和取伪错误概率组合.

2) 本文提出了基于正态分布总体均值假设检验的湖泊营养盐浓度级别评价方法, 并归纳总结出简便快捷的图示法.利用该方法对滇池外海NH3-N浓度级别进行评价, 结果表明:NH3-N水质级别在2005—2014年期间有变差的趋势, 总体上由Ⅰ类水质变为Ⅱ类水质;样本容量、先验级别假设和决策偏好都会对级别评价结果产生显著影响;该方法可以融合先验级别假设, 控制2种错误概率在较低水平, 使得评价结果具有较高的可信度, 同时提供了较为广阔的决策空间.

参考文献
[${referVo.labelOrder}] Barnett V, O'Hagan A. 1997. Setting Environmental Standards:The Statistical Approach to Handling Uncertainty and Variation[M]. London: Chapman and Hall.
[${referVo.labelOrder}] Brosi B J, Biber E G. 2009. Statistical inference, type Ⅱ error, and decision making under the US endangered species act[J]. Frontiers in Ecology and the Environment, 7(9): 487–494. DOI:10.1890/080003
[${referVo.labelOrder}] Conley D J, Paerl H W, Howarth R W, et al. 2009. Controlling eutrophication:nitrogen and phosphorus[J]. Science, 323(5917): 1014–1015. DOI:10.1126/science.1167755
[${referVo.labelOrder}] de Fouquet C. 2012. Environmental statistics revisited:Is the mean reliable?[J]. Environmental Science & Technology, 46(4): 1964–1970.
[${referVo.labelOrder}] Demetriades A. 2010. Use of measurement uncertainty in a probabilistic scheme to assess compliance of bottled water with drinking water standards[J]. Journal of Geochemical Exploration, 107: 410–422. DOI:10.1016/j.gexplo.2010.11.001
[${referVo.labelOrder}] Dodds W K, Bouska W W, Eitzmann J L, et al. 2009. Eutrophication of U[J]. S.freshwaters:analysis of potential economic damages[J].Environmental Science & Technology, 43(1): 12–19.
[${referVo.labelOrder}] 富天乙, 邹志红, 王晓静. 2014. 基于多元统计和水质标识指数的辽阳太子河水质评价研究[J]. 环境科学学报, 2014, 34(2): 473–480.
[${referVo.labelOrder}] Gibbons R D. 2003. A statistical approach for performing water quality impairment assessments[J]. Journal of the American Water Resources Association, 39(4): 841–849. DOI:10.1111/jawr.2003.39.issue-4
[${referVo.labelOrder}] 龚艳冰, 张继国, 梁雪. 2011. 基于全排列多边形综合图示法的水质评价[J]. 中国人口·资源与环境, 2011, 21(9): 26–31.
[${referVo.labelOrder}] Gronewold A D, Borsuk M E. 2009. A software tool for translating deterministic model results into probabilistic assessments of water quality standard compliance[J]. Environmental Modelling & Software, 24: 1257–1262.
[${referVo.labelOrder}] 霍守亮, 席北斗. 2014. 湖泊营养物基准制定的压力-响应模型及其案例研究[M]. 北京: 科学出版社: 126–173.
[${referVo.labelOrder}] Huo S L, Ma C Z, Xi B D, et al. 2014. Lake ecoregions and nutrient criteria development in China[J]. Ecological Indicators, 46: 1–10. DOI:10.1016/j.ecolind.2014.06.014
[${referVo.labelOrder}] Ilijević K, Obradović M, Jevremović V, et al. 2015. Statistical analysis of the influence of major tributaries to the eco-chemical status of the Danube River[J]. Environmental Monitoring and Assessment, 187: 553. DOI:10.1007/s10661-015-4740-y
[${referVo.labelOrder}] Michael D.2008.ISO 5667-20:Water quality Sampling Part 20:Guidance on the use of sampling data for decision making-Compliance with thresholds and classification systems[S].United Kingdom:ISO
[${referVo.labelOrder}] Khalil B, Ouarda T B. 2009. Statistical approaches used to assess and redesign surface water-quality-monitoring networks[J]. Journal of Environmental Monitoring, 11: 1915–1929. DOI:10.1039/b909521g
[${referVo.labelOrder}] Lamon Ⅲ E C, Qian S S. 2008. Regional scale stressor-response models in aquatic ecosystems[J]. Journal of the American Water Resources Association, 44(3): 771–781. DOI:10.1111/j.1752-1688.2008.00205.x
[${referVo.labelOrder}] 梁中耀, 张雨宇, 钱松, 等. 2017. 基于二项分布检验法的水质达标评价方法研究[J]. 环境科学学报, 2017, 37(1): 339–346.
[${referVo.labelOrder}] Long T Y, Christopher W, George A, et al. 2014. Evaluation of stormwater and snowmelt inputs, land use and seasonality on nutrient dynamics in the watersheds of Hamilton Harbour, Ontario, Canada[J]. Journal of Great Lakes Research, 40(4): 964–979. DOI:10.1016/j.jglr.2014.09.017
[${referVo.labelOrder}] Lucie G. 2007. Doing battle with the green monster of Taihu Lake[J]. Science, 317(5842): 1166. DOI:10.1126/science.317.5842.1166
[${referVo.labelOrder}] Malve O, Qian S S. 2006. Estimating nutrients and chslorophyll a relationships in Finnish Lakes[J]. Environmental Science & Technology, 40(24): 7847–7853.
[${referVo.labelOrder}] McBride G B, Ellis J C. 2001. Confidence of compliance:a bayesian approach for percentile standards[J]. Water Research, 35(5): 1117–1124. DOI:10.1016/S0043-1354(00)00536-4
[${referVo.labelOrder}] McBride G B, Jim C L, Adkins N C. 1993. What do significance tests really tell us about the environment?[J]. Environmental Management, 17(4): 423–432. DOI:10.1007/BF02394658
[${referVo.labelOrder}] Merrington G, An Y J, Grist E P M, et al. 2014. Water quality guidelines for chemicals:learning lessons to deliver meaningful environmental metrics[J]. Environmental Science & Pollution Research, 21: 6–16.
[${referVo.labelOrder}] Ott W R. 1995. Environmental Statistics and Data Analysis[M]. Boca Raton: Lewis Publishers.
[${referVo.labelOrder}] Paerl H W, Gardner W S, Mccarthy M J. 2014. Algal blooms:noteworthy nitrogen[J]. Science, 346(6206): 175.
[${referVo.labelOrder}] Paerl H W, Huisman J. 2008. Blooms like it hot[J]. Science, 320(5872): 57–58. DOI:10.1126/science.1155398
[${referVo.labelOrder}] Phillips C R, Chmelynski H J, Sensintaffar E L, et al. 2012. Reliability of drinking water quality data used for compliance determinations[J]. Journal American Water Works Association, 104(11) .
[${referVo.labelOrder}] 钱松. 2011. 环境与生态统计-R语言的应用[M]. 北京: 高等教育出版社: 55-65–96-99.
[${referVo.labelOrder}] Qian S S, Borsuk M E, StowC A. 2000. Seasonal and long-term nutrient trend decomposition along a spatial gradient in the Neuse River watershed[J]. Environmental Science & Technology, 34(21): 4474–4482.
[${referVo.labelOrder}] Qian S S, Craig J K, Baustian M M, et al. 2009. A Bayesian hierarchical modeling approach for analyzing observational data from marine ecological studies[J]. Marine Pollution Bulletin, 58: 1916–1921. DOI:10.1016/j.marpolbul.2009.09.029
[${referVo.labelOrder}] Qian S S, Lavine M. 2003. Setting standards for water quality in the everglades[J]. Chance, 16(3): 10–16. DOI:10.1080/09332480.2003.10554855
[${referVo.labelOrder}] Qian S S. 2015. The frequency component of water quality criterion compliance assessment should be data driven[J]. Environmental Management, 56: 24–33. DOI:10.1007/s00267-015-0493-1
[${referVo.labelOrder}] Qin B Q, Zhu G W, Gao G, et al. 2010. A drinking water crisis in Lake Taihu, China:Linkage to climatic variability and lake management[J]. Environmental Management, 45: 105–112. DOI:10.1007/s00267-009-9393-6
[${referVo.labelOrder}] Richardson C J, King R S, Qian S S, et al. 2007. Estimating ecological thresholds for phosphorus in the everglades[J]. Environmental Science & Technology, 41: 8084–8091.
[${referVo.labelOrder}] Saltz D. 2011. Statistical inference and decision making in conservation biology[J]. Israel Journal of Ecology & Evolution, 57(4): 309–317.
[${referVo.labelOrder}] Schelske C L. 2009. Eutrophication:focus on phosphorus[J]. Science, 324(5928): 722–722. DOI:10.1126/science.324_722
[${referVo.labelOrder}] Shabman L, Smith E. 2003. Implications of applying statistically based procedures for water quality assessment[J]. Journal of Water Resources Planning & Management, 129(4): 330–336.
[${referVo.labelOrder}] Smith A J, Thomas R L, Nolan J K, et al. 2013. Regional nutrient thresholds in wadeable streams of New York State protective of aquatic life[J]. Ecological Indicators, 29: 455–467. DOI:10.1016/j.ecolind.2013.01.021
[${referVo.labelOrder}] Smith E P, Canale R P. 2015. An analysis of sampling programs to evaluate compliance with numerical standards:total phosphorus in Platte Lake, MI[J]. Lake and Reservoir Management, 31: 190–201. DOI:10.1080/10402381.2015.1061073
[${referVo.labelOrder}] Smith E P, Ye K Y, Hughes C, et al. 2001. Statistical assessment of violations of water quality standards under section 303(d) of the clean water act[J]. Environmental Science & Technology, 35(3): 606–612.
[${referVo.labelOrder}] Smith E P, Zahran A, Mahmoud M, et al. 2003. Evaluation of water quality using acceptance sampling by variables[J]. Environmetrics, 14(4): 373–386. DOI:10.1002/(ISSN)1099-095X
[${referVo.labelOrder}] Smith V H, Schindler D W. 2009. Eutrophication science:where do we go from here?[J]. Trends in Ecology and Evolution, 24(4): 201–207. DOI:10.1016/j.tree.2008.11.009
[${referVo.labelOrder}] Stephan C E, Mount D I, Hansen D J, et al.1985.Guidelines for deriving numerical water quality criteria for the protection of aquatic organisms and their uses[R].No.822R85100. Cincinnati:US Environmental Protection Agency, Office of Research and Development
[${referVo.labelOrder}] van Belle Gerald. 2002. Statistical Rules of Thumb(2nd edition)[M]. Hoboken: Wiley.
[${referVo.labelOrder}] 王志良, 李淑贞, 李立阳, 等. 2013. 水质统计理论及方法[M]. 北京: 中国水利水电出版社.
[${referVo.labelOrder}] 王治臻, 傅海江, 柏景方, 等. 2007. 环境应用数学[M]. 哈尔滨: 哈尔滨工业大学出版社: 144–152.
[${referVo.labelOrder}] 许秋瑾, 朱延忠, 郑丙辉, 等. 2011. 我国东部与云贵湖区富营养化控制标准对比研究[J]. 中国环境科学, 2011, 31(12): 2046–2051.
[${referVo.labelOrder}] Zhang Y L, Huo S L, Ma C Z, et al. 2014. Using stressor-response models to derive numeric nutrient criteria for lakes in the eastern plain ecoregion, China[J]. CLEAN-Soil, Air, Water, 42(11): 1509–1517. DOI:10.1002/clen.201300708