气象学报  2018, Vol. 76 Issue (5): 779-789   PDF    
http://dx.doi.org/10.11676/qxxb2018.036
中国气象学会主办。
0

文章信息

黄丛吾, 陈报章, 马超群, 王体健. 2018.
HUANG Congwu, CHEN Baozhang, MA Chaoqun, WANG Tijian. 2018.
基于极端随机树方法的WRF-CMAQ-MOS模型研究
WRF-CMAQ-MOS studies based on extremely randomized trees
气象学报, 76(5): 779-789.
Acta Meteorologica Sinica, 76(5): 779-789.
http://dx.doi.org/10.11676/qxxb2018.036

文章历史

2017-10-25 收稿
2018-04-10 改回
基于极端随机树方法的WRF-CMAQ-MOS模型研究
黄丛吾1, 陈报章2, 马超群1, 王体健1     
1. 南京大学大气科学学院, 南京, 210023;
2. 中国矿业大学环境与测绘学院, 徐州, 221116
摘要: 随着城市化、工业化的快速发展,空气污染已经成为了公众最关注的问题之一。为了提高空气质量预报的准确度,以多尺度空气质量模型(Community Multi-Scale Air Quality,CMAQ)为工具,结合中尺度WRF(Weather Research and Forecast Model)气象预报数据、气象观测数据、污染物浓度观测数据,基于极端随机树方法建立了WRF-CMAQ-MOS(Weather Research and Forecast Model-Community Multi-Scale Air Quality-Model Output Statistics)统计修正模型。结果表明,结合WRF气象预报的CMAQ-MOS方法明显修正了由于模型非客观性产生的模式预报偏差,提高了预报效果。使用线性回归方法不能获得较好的优化效果,选取极端随机树方法和梯度提升回归树方法对模型进行改进和比较,发现极端随机树方法对结合WRF气象要素的CMAQ-MOS模型有较大的提升。针对徐州地区空气质量预报,进一步使用基于极端随机树方法的WRF-CMAQ-MOS模型对2016年1、2、3月的空气质量指数(AQI)及PM2.5、PM10、NO2、SO2、O3、CO六种污染物优化试验进行验证,发现优化效果最为明显的两种污染物分别是NO2及O3,2016年1、2、3月整体相关系数NO2由0.35升至0.63,O3由0.39升至0.79,均方根误差NO2由0.0346减至0.0243 mg/m3,O3由0.0447减至0.0367 mg/m3。文中发展的WRF-CMAQ-MOS统计修正模型可以有效提升预报精度,在空气质量预报中具有很好的应用前景。
关键词: 多尺度空气质量模型(CMAQ)     WRF     极端随机树     CMAQ-MOS模型    
WRF-CMAQ-MOS studies based on extremely randomized trees
HUANG Congwu1, CHEN Baozhang2, MA Chaoqun1, WANG Tijian1     
1. School of Atmospheric Sciences, Nanjing University, Nanjing 210023, China;
2. School of Environment Science and Spatial Informations, China University of Mining and Technology, Xuzhou 221116, China
Abstract: With the rapid development of urbanization and industrialization, air pollution has become one of the problems which are most concerned with. In this paper, the CMAQ (Community Multi-Scale Air Quality) model is combined with the WRF (Weather Research and Forecast Model) forecast of meteorological data, observed meteorological data and pollutants concentration data to build the WRF-CMAQ-MOS statistical correction model based on the method of Extremely Randomized Trees. The output of CMAQ model like AQI and pollutants concentrations of PM2.5, PM10, NO2, SO2, O3 and CO etc. are optimized. In the experiment that combines WRF meteorological elements with the CMAQ-MOS model, it is found that the linear regression method cannot well reflect the effect of optimization. Thereby the Extremely Randomized Trees method and Gradient Boosted Regression Trees were selected to improve the model performance. The investigations show that the Extremely Randomized Trees method has greatly improved the performance of CMAQ-MOS model combined with WRF meteorological elements. Finally, the model and method are evaluated using the data of January, February and March 2016. The results show that the most obvious optimization effect can be found in two pollutants, i.e., NO2 and O3. The correlation coefficient of NO2 in January, February and March 2016 is increased from 0.3542 to 0.6274, the correlation coefficient of O3 is increased from 0.3883 to 0.7886, the root-mean-square error of NO2 is decreased from 0.0346 to 0.0243 mg/m3, and the root-mean-square error of O3 is decreased from 0.0447 to 0.0367 mg/m3. The WRF-CMAQ-MOS statistical correction model developed in this study can effectively improve the prediction accuracy of various pollutants, and thus has a great application prospect in operational air quality prediction.
Key words: CMAQ     WRF     Extremely randomized trees     CMAQ-MOS model    
1 引言

多尺度空气质量模型(CMAQ)作为MODES-3的核心组成部分,可用于局地、城市、区域和大陆等多尺度的空气质量预报研究。为了提高模式预报精度,使模型能够真实反映研究区域的大气污染过程,中外已经有许多学者开展了相关研究,如许建明等(2005)进行的CMAQ-MOS区域空气质量统计修正模型预报途径研究,通过观测气象要素值以及观测污染物浓度值对模型模拟结果进行统计订正,成功将概率预报方式与数值预报方式结合起来;Peng等(2014)基于CMAQ模型成功建立了东亚地区的碳同化反演系统;Chang等(2016)使用了同化后的MACC(Monitoring Atmospheric Composition and Climate)数据作为初始和边界条件,成功地对CMAQ模型进行优化;Gou等(2011)使用四维变分方法优化了CMAQ模型的化学传输过程;Zubrow等(2008)使用了集合调整卡尔曼滤波方法对CMAQ模型预报中CO的化学传输过程进行优化;针对CMAQ模型所使用的排放源清单,程兴宏等(2013, 2016)提出了使用自适应偏最小二乘回归法以及张弛逼近源同化反演对排放源清单进行订正的方法。

为了提高多尺度空气质量模型(CMAQ)的模拟准确度,本研究引入了结合WRF气象要素的CMAQ-MOS模型。在模拟试验过程中,发现传统的多元线性回归方法限制了MOS模型的优化效果,采用非线性的极端随机树方法和梯度提升回归树方法对模式输出统计模型进行优化,将两种方法应用到徐州空气质量预报业务中,并进行性能比较。

2 模式和方法 2.1 WRF-CMAQ-MOS模型

传统的多元线性回归方法限制了结合WRF气象要素的CMAQ-MOS模型的发挥,多元线性回归方法可较好地预测线性过程,但对于非线性过程,例如大气污染物预报过程,其效果显然会受到较大的限制。为了解决以上问题,提升结合WRF气象要素的CMAQ-MOS模型优化效果,文中选取较为新颖且易于实现的极端随机树(Extremely Randomized Trees)方法(Galelli, et al, 2013Scalzo, et al, 2012)和梯度提升回归树(Gradient Boosted Regression Trees)方法(Carslaw, et al, 2009),对结合WRF气象要素的CMAQ-MOS模型进行改进。传统的使用多元线性回归方法、基于WRF预报气象要素的MOS模型计算式为

(1)
(2)

式中,Xt|t-t0代表t|t-t0时刻至t时刻某种污染物的浓度观测值矩阵, 代表t-t0时刻至t时刻常数矩阵,代表t-t0时刻至t时刻N列WRF大气要素预报值、L列空气质量模型污染物浓度模拟值,Ãmt|t-t0N+Lt-t0时刻至t时刻相对应系数项矩阵。根据式(1),求得Ãmt|t-t0N+L后代入式(2)。在式(2)中,St+t1|tt时刻至t+t1时刻某种污染物的浓度预报值矩阵,本系统中,取t0为1×24 h,取t1为1×24 h,代表t时刻至t+t1时刻WRF大气要素预报值、空气质量模型污染物浓度模拟值。

由式(1)、(2)可知,使用MOS模型综合考虑了污染物浓度观测数据、大气要素观测数据、WRF预报气象数据和空气质量模型预报数据进行污染物浓度预报订正,考虑了动力作用、化学作用和污染物排放的影响。

图 1为结合WRF预报气象要素的CMAQ-MOS模型运行流程,分为模拟阶段和预报阶段。在模拟阶段,模型读取t-1时段观测气象数据,t时段CMAQ模型预报污染物浓度数据,t时段WRF预报气象数据,t时段观测污染物浓度数据,建立基于多元线性回归的矩阵方程,其中,观测气象要素数据为4×25的矩阵,4列分别为观测温度、湿度、气压、风速,25行为从t-1天00时至t天00时的时间序列;WRF气象要素数据为4×25的矩阵,4列分别为WRF预报温度、湿度、气压、风速,25行为从t天00时至t+1天00时的时间序列;CMAQ模型预报污染物浓度数据为7×25的矩阵,7列分别为空气质量指数(AQI)、PM2.5、PM10、CO、NO2、O3、SO2的模型模拟值,25行为从t天00时至t+1天00时的时间序列;观测污染物浓度数据为7×25的矩阵,7列分别为空气质量指数、PM2.5、PM10、CO、NO2、O3、SO2的观测值,25行为从t天00时至t+1天00时的时间序列。通过以上数据组成多元线性回归模型,将所得模型代入预报阶段中,得到t+1时段MOS模型污染物预报浓度值,为7×25的矩阵,7列分别为空气质量指数、PM2.5、PM10、CO、NO2、O3、SO2的污染物浓度预报值,25行为从t天00时至t+1天00时的时间序列。

图 1 结合WRF预报气象要素的MOS模型运行流程 Figure 1 Flow chart of the CMAQ-MOS model based on WRF forecast of meteorological data
2.1.1 极端随机树方法

Geurts等(2006)提出了极端随机树方法,根据经典的自上而下的方法,极端随机树构建了一系列“自由生长”的回归树集合。与随机森林方法相似,极端随机树方法也是由多棵决策树构成,但与随机森林方法不同在于极端随机树方法是完全随机的得到分叉值,从而进行对回归树的分叉,不同于随机森林的在一个随机子集内得到最佳分叉属性。此外,极端随机树方法中的每一棵回归树用的都是全部训练样本。该方法的实现流程为:

(1) 根据观测污染物浓度数据建立随机拆分(S, a)

计算S的最大值和最小值,分别记为aminSamaxS;选择均匀切点为[aminSamaxS]中的ac;返回拆分[a < ac]。

(2) 结合WRF预报气象数据、模型预报数据建立一棵极端随机树t

在以下3种情况时,返回叶子结点:(ⅰ)|S| < nmin,即叶子节点的最小样例;(ⅱ)S中包含了所有的候选属性;(ⅲ)S中包含了输出变量。运行流程如下:在所有的属性中选择互不相同的随机K属性{a1, …, aK}; 利用随机拆分(S, ai),构建K拆分{S1, …, SK};选择拆分S*,其中,Score(S*, S)=maxi=1, …, KScore(Si, S),Score为评分函数,文中,ScoreR(Si, S)=, var{y|S}为yS中的方差;根据S*,在分叉SlSr中进行切片S;分叉SlSr中分别形成下一步的回归树tltr;创建分叉点S*tltr作为左右子树并返回树t

(3) 建立极端随机树集合

根据(2)构建极端回归树集合T={t1, …, tM}。

2.1.2 梯度提升回归树方法

梯度提升回归树是根据梯度提升算法构建的回归树模型,梯度提升是一种组合算法,它的基分类器是决策树,既可以用来回归,也可以用作分类。与随机森林相比,梯度提升算法在分类性能上能够与其媲美,甚至有可能表现得更好。梯度提升回归树具有以下三点优势:自然而然地处理混合类型的数据、预测能力强及在输出空间通过强大的损失函数对于异常值的鲁棒性强。

Friedman(2001)提出梯度提升算法,其核心就在于每棵树是从先前所有树的残差中来学习。利用的是当前模型中损失函数的负梯度值作为提升树算法中的残差的近似值,进而拟合一棵回归树。其运行流程为:

(1) 初始化,结合WRF预报气象数据、模型预报数据和观测污染物浓度数据通过函数

(3)

估计一个使损失函数极小化的常数值,式中,yi为WRF预报气象数据和模型预报数据,c为观测污染物浓度数据,此时它是只有一个节点的树。

(2) 迭代法建立M棵提升树

在第1层循环中m=1,2,…,M;在第2层循环中i=1,2,…,N,计算损失函数的负梯度在当前模型的值,并将其作为残差的估计值。

(4)

对于rm, i拟合一棵回归树,得到第m棵树的叶节点区域Rm, jj=1,2,…,J;在第2层循环中j=1,2,…,J,计算

(5)

利用线性搜索估计叶节点区域的值,使损失函数极小化;之后,更新

(6)

式中,指示函数IxRm, j时,I=1,否则I=0。

(3) 最后得到的fm(x)就是最终的梯度提升回归树模型

(7)
2.2 研究区域设置

以六大污染物(NO2、PM2.5、PM10、SO2、O3、CO)及空气质量指数(AQI)为研究对象,利用空气质量模型CMAQ及Python、Fortran语言,shell脚本语言,进行CMAQ-MOS统计修正模型研究,用于徐州空气质量预报。

模型使用3层嵌套网格(图 2),水平分辨率分别为27、9和3 km,第1层区域覆盖整个东亚、大部分东南亚和部分南亚地区,第2层区域覆盖大部分华东地区及部分华中地区,第3层区域覆盖徐州市全域,网格数分别为88×76,112×94和97×97;垂直方向采用η坐标系,共29层,模式层顶气压为50 hPa,模式层顶距地面20 km,边界层(约2 km)内分为10层。对于污染源排放数据,区域内层主要采用SMOKE模型输出,外层嵌套采用清华大学MEIC清单数据。

图 2 研究区域 Figure 2 Model domain for simulation
2.3 误差分析方法

采用的误差分析方法主要有4种,分别是均方根误差(RMSE)、相关系数(R)、平均相对误差(MFE)、平均相对偏差(MFB)(Boylan, et al, 2006)。当平均相对误差在±30%内,且平均相对偏差小于50%时,可认为预报是准确的。

(8)
(9)
(10)
(11)
3 WRF-CMAQ-MOS统计修正模型的应用 3.1 极端随机树方法和梯度提升回归树方法比较

选取2016年9月13-24日徐州市黄河新村站点逐时污染物浓度观测数据、WRF气象预报数据、CMAQ模型污染物浓度预报数据,使用极端随机树方法和梯度提升回归树方法并结合WRF气象要素进行CMAQ-MOS模型试验。分别以WRFMOS1代表使用多元线性回归方法、结合WRF气象要素预报的CMAQ-MOS模型优化结果,EXTRA代表使用极端随机树方法、结合WRF气象要素预报的CMAQ-MOS模型优化结果,GBRT代表使用梯度提升回归树方法、结合WRF气象要素预报的CMAQ-MOS模型优化结果,试验结果如下:

表 1可以看出,EXTRA方案优化效果最佳。结合观测污染物浓度值(OBV)、WRFMOS1方案结果、EXTRA方案结果、GBRT方案结果,绘制出2016年9月13-24日徐州市空气质量指数、CO、NO2、O3、PM10、PM2.5、SO2浓度观测、WRFMOS1方案、EXTRA方案、GBRT方案时间变化和泰勒图(图 34)。

表 1 徐州市黄河新村站点3种CMAQ-MOS方法比较结果 Table 1 Comparison of results obtained by three methods in HHXC, Xuzhou
RRMSE(mg/m3)MFB(%)MFE(%)
AQI-WRFMOS10.49150.030947.17-18.02
AQI-EXTRA0.54530.019922.295.12
AQI-GBRT0.38810.018722.476.28
CO-WRFMOS10.22500.717528.415.99
CO-EXTRA0.28270.422827.3712.40
CO-GBRT0.16220.445530.4513.04
NO2-WRFMOS10.27980.035751.834.05
NO2-EXTRA0.40200.022030.6614.16
NO2-GBRT0.29710.024132.7315.92
O3-WRFMOS10.27280.0575173.61-95.34
O3-EXTRA0.57960.035540.8617.92
O3-GBRT0.50970.037343.8221.45
PM10-WRFMOS10.44720.030723.12-0.32
PM10-EXTRA0.53240.022328.047.98
PM10-GBRT0.40790.022430.697.19
PM2.5-WRFMOS10.56800.024946.81-24.80
PM2.5-EXTRA0.59040.018028.762.88
PM2.5-GBRT0.49580.017629.641.50
SO2-WRFMOS10.21780.027821.579.24
SO2-EXTRA0.36650.017923.1110.43
SO2-GBRT0.22700.018824.9412.87
图 3 2016年9月13-24日徐州市黄河新村站点AQI(a)、CO(b)、NO2(c)、O3(d)、PM10(e)、PM2.5(f)、SO2(g)浓度观测、WRFMOS1方案、EXTRA方案、GBRT方案时间变化 Figure 3 Hourly variations of concentrations of AQI (a), CO (b), NO2 (c), O3 (d), PM10 (e), PM2.5 (f) and SO2 (g) from observations and outputs of WRFMOS1, EXTRA and GBRT during 13-24 September, 2016 in HHXC, Xuzhou
图 4 2016年9月13-24日徐州市黄河新村站点六大污染物及AQI浓度观测、CMAQ模拟值、WRFMOS1方案、EXTRA方案、GBRT方案泰勒图 Figure 4 Taylor diagram of concentrations of six pollutants and AQI from observations and outputs of CMAQ, WRFMOS1, EXTRA and GBRT during 13-24 September, 2016 in HHXC, Xuzhou

针对CMAQ模型,使用多元线性回归方法,结合WRF预报气象要素的CMAQ-MOS模型,其优化效果仍未达到预期。在选取极端随机树方法和梯度提升回归树方法,分别对结合WRF气象要素的CMAQ-MOS模型进行改进之后,经由试验结果发现,使用极端随机树方法比梯度提升回归树方法的改进效果更显著,其原因主要是因为其每一棵树都是用了全部的样本,并进行了完全随机的拆分。

3.2 极端随机树方法的应用

为了验证使用极端随机树方法并结合WRF气象要素的CMAQ-MOS模型优化效果并进行应用,进行了针对徐州地区2016年1-3月的逐时预报应用试验,选取黄河新村站点(1177A)观测数据进行评估,并针对7个站点的优化效果进行统计分析。模型运行效率较高,进行单站点一个月逐时预报试验耗时约15 min,业务化运行中每日对7个站点进行未来3 d逐时预报,耗时约3 min。

针对空气质量指数及六大污染物,使用极端随机树方法结合WRF气象要素预报的CMAQ-MOS模型进行试验,7个站点试验结果见表 2。可见,经过优化后的六大污染物及空气质量指数的准确度均得到了极大的提高。根据试验结果,针对黄河新村站点的空气质量指数与六种污染物分别绘制2016年1-3月徐州市空气质量指数、CO、NO2、O3、PM10、PM2.5、SO2污染物浓度预报和订正误差时间变化、散点分布和泰勒图。从图 5-7可明显看出,针对空气质量指数、CO、NO2、O3、PM10、PM2.5、SO2,使用极端随机树方法结合WRF气象要素预报的CMAQ-MOS模型具有良好的优化效果。

表 2 2016年1-3月徐州市7站点六大污染物及空气质量指数浓度预报和订正误差统计结果(a.相关系数,b.均方根误差(mg/m3)) Table 2 Relative coefficients and biases between hourly forecast, and corrected and observed data of six pollutants and AQI during January-March 2016 in Xuzhou (a. correlation coefficient, b. root mean square error (mg/m3))
a.相关系数AQICONO2O3PM10PM2.5SO2
黄河新村CMAQ0.400.440.350.390.340.470.12
MOS0.470.530.630.730.490.550.53
淮塔CMAQ0.470.470.430.390.470.500.15
MOS0.480.520.610.570.500.510.22
铜山兽医院CMAQ0.190.350.220.510.160.290.06
MOS0.490.520.680.540.520.500.20
新城区CMAQ0.260.420.410.490.220.41-0.04
MOS0.390.600.550.710.420.570.20
桃园路CMAQ0.410.440.330.400.380.460.16
MOS0.490.490.650.620.520.520.38
农科院CMAQ0.220.360.310.470.190.35-0.01
MOS0.450.550.630.680.480.540.32
铜山区环保局CMAQ0.170.330.260.380.170.250.13
MOS0.430.450.660.590.490.480.40
b.均方根误差AQICONO2O3PM10PM2.5SO2
黄河新村CMAQ0.0721.0760.0450.0560.1200.0510.051
MOS0.0630.8000.0240.0370.0800.0480.030
淮塔CMAQ0.0771.1230.0490.0690.1170.0590.065
MOS0.0680.8890.0210.0190.0870.0560.031
铜山兽医院CMAQ0.0771.2640.0490.0530.1240.0540.050
MOS0.0760.9210.0270.0420.1010.0590.040
新城区CMAQ0.0680.8980.0410.0470.1280.0410.035
MOS0.0470.5730.0230.0320.0770.0340.024
桃园路CMAQ0.0761.1720.0480.0610.1180.0560.057
MOS0.0700.8890.0240.0320.0930.0560.035
农科院CMAQ0.0711.0710.0440.0490.1240.0470.042
MOS0.0620.7480.0250.0370.0880.0470.032
铜山区环保局CMAQ0.0741.1990.0480.0530.1220.0520.053
MOS0.0630.8870.0250.0340.0900.0490.036
图 5 2016年1-3月徐州市黄河新村站点空气质量指数(a)、CO(b)、NO2(c)、O3(d)、PM10(e)、PM2.5(f)、SO2(g)污染物浓度预报和订正误差时间变化 Figure 5 Temporal variations of hourly forecast, and corrected and observed concentrations of AQI (a), CO (b), NO2 (c), O3 (d), PM10 (e), PM2.5 (f) and SO2 (g) during January-March 2016 in HHXC, Xuzhou
图 6 2016年1-3月徐州市黄河新村站点AQI(a)、CO(b)、NO2(c)、O3(d)、PM10(e)、PM2.5(f)、SO2(g)浓度预报、订正和观测值的散点分布 Figure 6 Scatter plots of hourly forecast, and corrected and observed concentrations of AQI (a), CO (b), NO2 (c), O3 (d), PM10 (e), PM2.5 (f) and SO2 (g) during January-March 2016 in HHXC, Xuzhou
图 7 2016年1-3月徐州市黄河新村站点六种污染物与AQI浓度预报、订正(OPT)和观测值的泰勒图 Figure 7 Taylor diagram of hourly forecast, and corrected (OPT) and observed concentrations of six pollutants and AQI during January-March 2016 in HHXC, Xuzhou
4 总结

为了提高CMAQ空气质量模型的预报精度,基于多元线性回归方法,引入了结合WRF气象要素的CMAQ-MOS模型,通过试验发现其优化效果一般,主要原因是多元线性回归方法限制了结合WRF气象要素的CMAQ-MOS模型的发挥。为了提升模型优化效果,选取极端随机树方法和梯度提升回归树方法,对结合WRF气象要素的CMAQ-MOS模型进行改进,通过试验发现,相对梯度提升回归树方法,极端随机树方法的改进效果更为显著。

采用极端随机树方法,并结合WRF预报气象要素的CMAQ-MOS模型在徐州地区进行2016年1-3月的模拟应用试验。结果表明,针对空气质量指数及六大污染物逐时预报,与未经优化的CMAQ模型相比,采用极端随机树方法并结合WRF预报气象要素的CMAQ-MOS模型在相关系数、均方根误差、平均相对误差、平均相对偏差方面都有较为明显的优化效果,NO2及O3两种污染物优化效果最为明显,其原因可能是O3、NO2与MOS模型引入的温度气象要素的相关性较高,这是因为温度的变化往往与太阳辐射的变化相关,而太阳辐射的变化会导致O3光化学反应速率的变化。与此同时,NO2和O3的化学耦合较强,O3浓度的变化会导致NO2浓度也发生变化,因此MOS模型针对NO2及O3两种污染物优化效果最为明显。

综上所述,采用极端随机树方法并结合WRF预报气象要素的CMAQ-MOS模型预报准确度得到较大的提升,未来可以投入实际业务应用。

此外,采用极端随机树方法并结合WRF预报气象要素的CMAQ-MOS模型仍存在有一定的局限性,有待进一步改进,主要包括以下两个方面:(1)本方法优化的仅为点位数据,并不能完成对整个预报场的优化;(2)本方法针对空气质量模型预报较差时优化效果较好,但针对空气质量模型预报较好时优化效果并不明显。

参考文献
程兴宏, 李德平, 徐祥德等. 2013.北京地区CMAQ源同化模式预报PM10产品订正方法研究//2013中国环境科学学会学术年会浦华环保优秀论文集.昆明: 中国环境科学学会. Cheng X H, Li D P, Xu X D, et al. 2013. Study on PM10 product correction method for CMAQ source assimilation model prediction in Bei-jing region//Proceedings of 2013 Chinese Academy of Environmental Sciences. Kunming: Chinese Society of Environmental Sciences (in Chinese)
程兴宏, 刁志刚, 胡江凯, 等. 2016. 基于CMAQ模式和自适应偏最小二乘回归法的中国地区PM2.5浓度动力-统计预报方法研究. 环境科学学报, 36(8): 2771–2782. Cheng X H, Diao Z G, Hu J K, et al. 2016. Dynamical-statistical forecasting of PM2.5 concentration based on CMAQ model and adapting partial least square regression method in China. Acta Sci Circumst, 36(8): 2771–2782. (in Chinese)
许建明, 徐祥德, 刘煜, 等. 2005. CMAQ-MOS区域空气质量统计修正模型预报途径研究. 中国科学D辑:地球科学, 48(S2): 155–172. Xu J M, Xu X D, Liu Y, et al. 2005. Study of statistically correcting model CMAQ-MOS for forecasting regional air quality. Sci China Ser D Earth Sci, 48(S2): 155–172. (in Chinese)
Boylan J W, Russell A G. 2006. PM and light extinction model performance metrics, goals, and criteria for three-dimensional air quality models. Atmos Environ, 40(26): 4946–4959. DOI:10.1016/j.atmosenv.2005.09.087
Carslaw D C, Taylor P J. 2009. Analysis of air pollution data at a mixed source location using boosted regression trees. Atmos Environ, 43(22-23): 3563–3570. DOI:10.1016/j.atmosenv.2009.04.001
Chang L S, Cho A, Park H, et al. 2016. Human-model hybrid Korean air quality forecasting system. J Air Waste Manag Assoc, 66(9): 896–911. DOI:10.1080/10962247.2016.1206995
Friedman J H. 2001. Greedy function approximation:A gradient boosting machine. Ann Stat, 29(5): 1189–1232.
Galelli S, Castelletti A. 2013. Assessing the predictive capability of randomized tree-based ensembles in streamflow modelling. Hydrol Earth Syst Sci, 17(7): 2669–2684. DOI:10.5194/hess-17-2669-2013
Geurts P, Ernst D, Wehenkel L. 2006. Extremely randomized trees. Mach Learn, 63(1): 3–42. DOI:10.1007/s10994-006-6226-1
Gou T Y, Sandu A. 2011. Continuous versus discrete advection adjoints in chemical data assimilation with CMAQ. Atmos Environ, 45(28): 4868–4881. DOI:10.1016/j.atmosenv.2011.06.015
Peng Z, Zhang M, Kou X, et al. 2014. A regional carbon data assimilation system and its preliminary evaluation in East Asia. Atmos Chem Phys Discuss, 14(14): 20345–20381. DOI:10.5194/acpd-14-20345-2014
Scalzo F, Hamilton R, Asgari S, et al. 2012. Intracranial hypertension prediction using extremely randomized decision trees. Med Eng Phys, 34(8): 1058–1065. DOI:10.1016/j.medengphy.2011.11.010
Zubrow A, Chen L, Kotamarthi V R. 2008. EAKF-CMAQ:Introduction and evaluation of a data assimilation for CMAQ based on the ensemble adjustment Kalman filter. J Geophys Res Atmos, 113(D9): D09302.