环境科学学报  2016, Vol. 36 Issue (8): 2771-2782
基于CMAQ模式和自适应偏最小二乘回归法的中国地区PM2.5浓度动力-统计预报方法研究    [PDF全文]
程兴宏1,2 , 刁志刚3, 胡江凯4, 徐祥德1, 张建春4, 李德平5    
1. 中国气象科学研究院灾害天气国家重点实验室, 北京 100081;
2. 中国气象局大气化学重点开放实验室, 北京 100081;
3. 南京信息工程大学大气物理学院, 南京 210044;
4. 国家气象中心, 北京 100081;
5. 北京市气象局, 北京 100089
摘要: 采用CMAQ模式和自适应偏最小二乘回归法相结合的动力-统计预报方法,对2014年1-12月全国252个环境监测站的PM2.5浓度逐时预报值进行了滚动订正,分析了订正前后PM2.5浓度的时空变化特征,重点研究该方法在中国不同地区不同季节的适用性.结果表明:CMAQ模式预报的PM2.5浓度年平均和秋冬季季节平均偏差表现为非均匀空间分布特征,即辽宁、山东部分地区、川渝地区及华中、华东、华南大部分地区预报偏高,京津冀和西部大部分地区预报偏低;订正后PM2.5浓度与实测值的空间分布较一致,上述偏高和偏低地区的PM2.5浓度预报误差显著减小;秋冬季PM2.5浓度预报和订正偏差均大于年平均值.全国区域平均PM2.5浓度实测值存在明显的季节变化特征,1-3月和11-12月较大,其他月份较小;PM2.5浓度预报误差较大,多数时刻预报偏低,尤其是1-3月和11-12月偏低较明显;订正后PM2.5浓度与实测值较接近,而且时间变化趋势较一致,秋冬季PM2.5浓度预报和订正偏差亦明显大于春夏季.秋冬季4个重点污染区域中,京津冀地区PM2.5实测浓度的区域平均值较大,川渝地区次之,长三角和珠三角地区较小;珠三角地区PM2.5浓度预报和订正效果较好,川渝和长三角地区次之,京津冀地区相对较差;经滚动订正后,全年和秋冬季时段PM2.5浓度订正值与实测值的相关系数均显著增加,误差显著减小,尤其是秋冬季订正效果较好.川渝地区的订正改进幅度最大,长三角和京津冀地区次之,珠三角地区较小.本文方法均适用于非污染日和污染日全国范围的PM2.5预报浓度订正,两种天气过程PM2.5浓度的订正效果均较好;该方法对于改进京津冀地区污染日的PM2.5浓度预报更有效,其他3个地区非污染日的订正改进效果优于污染日.本文研究结果可为改进空气质量预报、重霾污染天气预警和防治提供新技术途径和科学依据.
关键词: PM2.5浓度     动力-统计预报方法     CMAQ模式     自适应偏最小二乘回归法    
Dynamical-statistical forecasting of PM2.5 concentration based on CMAQ model and adapting partial least square regression method in China
CHENG Xinghong1,2 , DIAO Zhigang3, HU Jiangkai4, XU Xiangde1, ZHANG Jianchun4, LI Deping5    
1. State Key Lab of Severe Weather, Chinese Academy of Meteorological Sciences, Beijing 100081;
2. Key Laboratory for Atmospheric Chemistry, Chinese Academy of Meteorological Sciences, Beijing 100081;
3. School of Atmospheric Physics, Nanjiang University of Information Science and Technology, Nanjing 210044;
4. National Meteorological Center of China Meteorological Administration, Beijing 100081;
5. Beijing Weather Observatory, Beijing 100089
Supported by: Supported by the Special Fund for Public Welfare Industry of National Environmental Protection (No.201409027, 201509001) and the National Hi-tech Research and Development Pragram of China (No.2011AA05A302)
*Corresponding author: CHENG Xinghong, E-mail:cxingh@cma.gov.cn
Abstract: In this study, hourly PM2.5 concentrations at 252 environmental monitoring stations in China during January-December 2014 forecasted by the real-time running Fifth-Generation Penn State/NCAR Mesoscale Model (MM5)-Community Multiscale Air Quality (CMAQ) model system are corrected using the dynamical-statistical method based on CMAQ model and adapting partial least square regression technique. Temporal and spatial variations of PM2.5 concentrations before and after correction are analyzed with a focus on the applicability of the dynamical-statistical method in different areas and seasons in China. It is shown that the spatial distributions of both annual and seasonal (for autumn and winter) averages of PM2.5 concentrations forecasted by the MM5-CMAQ model system are inhomogeneous. Forecast PM2.5 concentrations are larger than observations in parts of Liaoning and Shandong provinces, Sichuan and Chongqing provinces and most areas of Central China, East China and South China. Forecast values are smaller in Beijing-Tianjin-Hebei region and in most areas of West China. After correction, the spatial distributions of forecast PM2.5 concentrations are in good consistence with observations, and forecast errors in the above areas decrease significantly. Forecast and corrected deviations of seasonally averaged PM2.5 concentrations in autumn and winter in most areas of China are larger than the annual averaged values. There is an obviously seasonal variation of observed PM2.5 concentrations, with higher values in Jan., Feb., Mar., Nov. and Dec. Forecast errors are larger, with prediction values less than observations in most of the time. Corrected PM2.5 concentrations and its temporal variation are close to observations. Forecast and corrected deviations in autumn and winter are larger than those in spring and summer. During autumn and winter, among the four seriously polluted regions in China, Beijing-Tianjin-Hebei region shows the highest observed PM2.5 concentrations, followed by Sichuan and Chongqing provinces, Yangtze River Delta and Pearl River Delta Regions. Pearl River Delta shows the best forecast and correction effects, followed by Sichuan and Chongqing provinces, Yangtze River Delta Region, and Beijing-Tianjin-Hebei region. Correlation coefficients between corrected PM2.5 concentrations and observations increase remarkably, and forecast errors decrease obviously, especially for autumn and winter. Error decrease ratios after correction are the largest in Sichuan and Chongqing provinces, followed by Yangtze River Delta Region, Beijing-Tianjin-Hebei region and Pearl River Delta Region. The method presented in this paper can be applicable to the correction of PM2.5 forecast in both polluted and clean days in China. The correction is more effective during polluted processes in the Beijing-Tianjin-Hebei region and correction effects are better during clean processes than on polluted days in other three regions. Results of this study will provide new technique and scientific basis for improving air quality forecasting, early warning and prevention of heavy haze weather.
Key words: PM2.5 concentrations     the dynamical-statistical forecasting method     CMAQ model     the adapting partial least square regression method    
1 引言(Introduction)

2013年年初至今,我国中东部大中型城市相继受到霾污染天气的影响,2014年京津冀、长三角、珠三角等重点区域和直辖市、省会城市及计划单列市中有89%的城市存在不同程度的空气污染超标现象,而且重霾污染过程的首要污染物多为PM2.5.污染物在大气中的浓度水平和时空分布主要是由污染物的排放、化学转化及气象因素决定的,既包括物理过程,又涉及化学过程,影响因素众多,而且各因素之间有相互作用.数值模式具有现场实测和实验室研究不可替代的功能和特点,它可以综合考虑各种物理、化学过程和影响因素,定量描述污染物在大气中的迁移、转化规律,因此,空气质量数值预报模式成为研究大气污染问题的一种重要手段(唐孝炎等,2006).目前,空气质量模式主要以美国环保局(EPA)开发的第三代空气质量预报和评估系统CMAQ(Community Multiscale Air Quality Model)/MODEL-3为代表(Dennis et al.,1996),具有多尺度、通用性、灵活性、开放性等优点,成为国内外应用最为广泛的空气质量模拟系统之一(Arnold et al.,2003张美根,2005刘煜等,2005许建明等,2005王自发等,2008Xu et al.,2008Cheng et al.,2010王丽涛等,2012).CMAQ模式对多类污染物时空分布及其变化趋势具有较强的预报能力,能够较好地模拟区域大气污染物浓度的时空分布规律(许建明等,2005Xu et al.,2008Cheng et al.,2010).

由于目前排放源清单的不确定性较大,而且空气质量数值预报模式的物理、化学机制尚需不断完善,CMAQ模式对PM2.5浓度的预报误差较大(许建明等,2005;et al.,2008;Cheng et al.,2010),需在模式预报的基础上对预报结果进行客观订正,即采用动力-统计预报方法改进PM2.5浓度的预报效果.近年来国内诸多学者(许建明等,2005王庆梅等,2008张伟等,2010谢敏等,2012陈彬彬等,2012程兴宏等,2013尤佳红等,2014)采用多元线性逐步回归、BP神经网、偏最小二乘回归、系统辨识实时迭代等多种统计方法对CMAQ模式输出结果进行订正,该方法可显著降低由于污染源不确定性产生的模式系统误差,明显提高CMAQ模式空气质量预报水平(许建明等,2005).部分学者(谢敏等,2012)将预报日前1 d的监测值作为初始值,加上CMAQ模式输出的预报日与预报日前1 d的浓度差,作为修正的预报值,对CMAQ模式预报的SO2、NO2、PM10、O3浓度进行修正.上述研究认为引入实测和预报污染物浓度数据对预报结果进行修正是可行的.另外,气象条件对大气污染物的传输、扩散、转化具有重要作用,李军等(2009)亦分析了北京地区不同季节PM2.5实测浓度与气压、风速、气温、相对湿度等的相关性,结果显示,PM2.5浓度与上述气象要素均有显著的正相关或负相关.因此,空气质量预报产品的订正需考虑气象条件的影响,部分学者(许建明等,2005陈彬彬等,2012程兴宏等,2013)初步研究了考虑污染物浓度和多种气象要素实测值的动力-统计订正方法,取得了一定的订正效果,但订正时未考虑前期气象条件的动态影响.

前人研究主要针对空气质量模式预报的某一区域,如珠三角(谢敏等,2012)、福州(陈彬彬等,2012)、北京(许建明等,2005程兴宏等,2013)、上海(尤佳红等,2014王茜等,2015)等地区的SO2、NO2、PM10、PM2.5浓度进行订正试验,而对目前较为关注的全国范围PM2.5预报浓度的动力-统计订正研究较少,而且多数研究未考虑前期污染和气象条件的动态影响.基于此,本文采用具有强非线性表达能力的自适应偏最小二乘回归法和滚动订正技术对2014年1—12月CMAQ模式预报的全国252个环境监测站PM2.5浓度进行非线性滚动订正,即采用各站前10 d的PM2.5浓度逐时预报值与同期实测PM2.5浓度及该站附近的自动气象站风速、风向、温度、湿度、气压逐时实测数据建立非线性统计订正模型,对未来1天各站PM2.5浓度预报值进行滚动订正,分析订正前后PM2.5浓度的时空变化特征,重点分析该方法在秋冬季重霾污染过程的适用性及其改进原因,以期为空气质量预报改进、灰霾天气的预报预警和大气污染的防治提供科学依据.

2 参数设置和统计订正方法(Parameters settings and correction method) 2.1 模式参数设置

MM5-CMAQ源同化实时空气质量预报系统由中国气象科学研究院和国家气象中心共同研发,并于2004年9月开始在国家气象中心实时运行(许建明等,2005),每天08:00(北京时间,下同)起报,预报全国范围(内蒙东北部、黑龙江省东北部部分地区除外,图 1所示)36 km×36 km网格点未来3 d每小时一次的PM10、PM2.5、SO2、NO2、O3、CO浓度.自2013年开始每年采用CMAQ模式“Nudging”源同化方法及全国环境监测站资料,对2006年INTEX-B SO2、NOx初始排放源进行反演更新,得到每年冬夏季中国地区的改进排放源,以改进6种污染物浓度预报.本文采用2014年1—12月MM5-CMAQ模式系统预报的第1天08:00—次日08:00逐时PM2.5浓度进行滚动订正试验.模式系统参数设置详见文献(许建明等,2005Xu et al.,2008Cheng et al.,2010)

图 1 MM5-CMAQ模式系统的预报区域示意图(外框(实线)为MM5模式的预报范围, 内框(虚线)为CMAQ模式的预报范围) Fig. 1 Schematic diagram of the forecasting domains using the MM5-CMAQ model system(The outline and inline borders (solid and dash line) denotes the forecasting scopes of the MM5 and CMAQ model, respectively)
2.2 统计订正方法

本文采用自适应偏最小二乘回归法(Adaptive Partial Least Squares Regression,APLSR)进行动力-统计订正,该方法具有强非线性表达能力,可根据预测对象在自变量空间中的位置,自适应地分析各样本的预测能力,为它们分配回归权值.又考虑到变量间存在交互作用,实施加权的偏最小二乘回归,以建立针对该预测对象的、预报性能良好的软测量模型.该方法在风电预报、石油化工、生物制药、医药、通信等领域得到广泛应用(颜学峰等,2002程兴宏等,2012).自适应偏最小二乘回归法是基于线性回归和最小二乘法的基础上建立的适用于高度非线性体系的统计方法,其核心是计算隐变量、相似度、回归系数矩阵和因变量的预报值,其计算公式分别如下:

(1)
(2)
(3)
(4)

式中,Tn×k维隐变量矩阵,Xn×p维自变量矩阵,Up×k维转换矩阵,SDi*为建模样本xi与预报样本x*之间的相似度,EDi*是两者之间的欧式距离,Yn×q维因变量矩阵,Ck×q维回归系数矩阵,是因变量预报值,n为建模样本数,p为自变量维数,q为因变量维数,k为隐变量数.

样本数选取时参考王茜等(2015)的方法,并考虑不同样本数订正方案在不同地区、不同季节的适用差异,分别采用2014年1、4、7、10月全国和4个重点区域前3、5、7、10、15、20 d的数据进行统计建模.为了比较各种方案的订正效果差异,订正试验均从1月21日0:00开始滚动订正,计算了1月21—31日、4月1—30日、7月1—31日、10月1—31日全国和4个重点区域订正前后PM2.5逐时预报值、订正值与实测值的相关系数及预报和订正误差(统计表略).总体而言,对于不同季节、不同地区采用前7 d和前10 d数据建立的统计订正模型订正效果优于其他4种方案,两种方案在不同季节、不同地区的订正效果略有差异,即全国范围1和7月、京津冀地区1、4、7月、川渝地区4个月采用前7 d的建模方案其订正效果略优于前10 d方案,而长三角地区除1月外,其他3个月前10 d的建模方案订正效果略优.为了兼顾全国不同地区,并且使各季节各地区的订正模型较稳定,本文使用了样本数更多的前10 d数据进行统计建模.

自变量选取时除考虑前期PM2.5实测浓度对预报浓度的影响外,亦考虑了前期气象条件的动态影响.分别计算了2014年1、4、7、10月全国和4个重点区域逐时PM2.5实测浓度与逐时风速、风向、温度、湿度、气压的相关系数,并采用T检验方法进行了99.9%置信度水平的显著性检验(统计表略).可发现4个月5个区域PM2.5浓度与5种气象要素的相关性检验通过率为86%,即多数情况下不同地区、不同季节PM2.5实测浓度与上述5种基本气象要素的相关性均显著,而且通过了99.9%置信度水平检验(样本数均较大).全国和4个重点区域中,除少数月份风向、气温、气压与PM2.5浓度的相关性检验未通过外,多数月份5种气象要素与PM2.5浓度的相关性均通过显著性检验.尽管各地区不同季节5种基本气象要素与PM2.5浓度的相关性及通过T检验的比例略有差异,但为了使不同地区的订正效果具有可比性,本文选取了风速、风向、温度、湿度、气压作为不同季节不同地区的订正建模自变量.

3 使用资料(Data)

数据资料包括2014年1月1日—12月31日全国252个环境监测站(其中,京津冀地区21个、长三角地区37个、珠三角地区16个、川渝地区10个)MM5-CMAQ实时预报的PM2.5浓度、同期PM2.5实测浓度及离环境监测站最近的自动气象站逐时风速、风向、温度、湿度、气压实测数据.采用前10 d的PM2.5浓度预报、实测值与上述气象要素数据建立每天252个非线性订正模型,滚动订正各站当天的PM2.5浓度预报值,以此类推,进行了12个月的逐日滚动订正.

4 结果分析(Results) 4.1 PM2.5浓度的年平均和秋冬季空间分布特征

本文分析了2014年1—12月全年和1、2、3、11、12月秋冬季252个环境监测站平均PM2.5浓度预报值、观测值、订正值及相应的预报、订正平均偏差的空间分布特征.需要说明的是,由于湖北和湖南西部、重庆东北和东南、贵州东部、江西中东部、福建西部部分地区观测资料缺测(图 2图 3中空白部分),造成上述地区的PM2.5观测、订正及预报、订正偏差无法计算,为了便于对比分析,PM2.5浓度预报分布图中上述地区亦做同样处理.

图 2 2014年1—12月中国地区全年平均的PM2.5浓度预报值、252个环境监测站订正和观测值及相应的预报、订正平均偏差空间分布图(a.预报值;b.订正值;c.观测值;d.预报偏差;e.订正偏差) Fig. 2 Spatial distributions of annual average of forecast (a), corrected (b), and observed (c) PM2.5 concentrations, and its forecast (d) and correction (e) deviations at 252 environmental monitoring stations in China during January-December 2014

图 3 2014年1—3月和11—12月中国地区PM2.5浓度逐时预报季节平均值、252个环境监测站订正和观测平均值及相应的预报、订正平均偏差空间分布图(a.预报值;b.订正值;c.观测值;d.预报偏差;e.订正偏差) Fig. 3 Spatial distributions of seasonal average of forecast (a), corrected (b), observed (c) PM2.5 concentrations, and its forecast (d) and correction (e) deviations at 252 environmental monitoring stations in China in January, February, March, November and December, 2014

图 2图 3分别为2014年252个环境监测站年平均和秋冬季平均的PM2.5浓度预报值、观测值、订正值及相应的预报、订正平均偏差空间分布图.由图 2a图 3a可看出,中国中东部地区PM2.5浓度年平均和季节平均预报值明显高于西部地区,尤其是京津冀、长三角、川渝地区及辽宁、山东、河南、湖北、湖南部分地区的年平均预报值均高于80μg·m-3,其他大部分地区均小于40μg·m-3,其中,西部地区小于30μg·m-3.与PM2.5浓度实测值(图 2c图 3c)相比,除辽宁中东部、山东东北部和西南部、川渝地区及华中、华东、华南大部分地区PM2.5浓度预报值高于实测值外,其他地区PM2.5浓度预报值均偏低,尤其是京津冀、山东、吉林、黑龙江和中西部地区预报偏低较明显,这与许建明等(2005)陈彬彬等(2012)程兴宏等(2013)的研究结果较一致.由图 2b图 3b可知,除河北中南部、山东西南部、河南部分地区PM2.5浓度订正偏高外,其他地区滚动订正后PM2.5浓度的高低值分布特征与实测值较一致,即订正后PM2.5预报值的偏高和偏低现象均得到显著改善.从图 2c图 3c可以看出,京津冀、长三角、川渝地区及辽宁、山东、河南、湖北、湖南部分地区、乌鲁木齐地区的PM2.5浓度实测年平均和秋冬季平均值分别介于60~130μg·m-3、80~190μg·m-3之间,中西部地区、珠三角、东南沿海、华南、西南地区的PM2.5浓度实测年平均值和秋冬季平均值分别小于40μg·m-3和50μg·m-3.即2014年污染较重地区位于京津冀、长三角、川渝地区及辽宁、山东、河南、湖北、湖南等中东部地区和乌鲁木齐地区,其他地区污染较轻.由图 2d图 3d图 2e图 3e可发现,PM2.5浓度预报年平均和秋冬季平均偏差分别介于-80~60μg·m-3、-100~60μg·m-3之间,其中,辽宁中东部、山东东北和西南部、川渝地区及华中、华东、华南大部分地区年平均和秋冬季平均PM2.5浓度预报偏高20~60μg·m-3不等;其他地区预报偏低,年平均和秋冬季平均预报误差分别介于-80~-10μg·m-3、-100~-10μg·m-3不等,河北中南部偏低较严重,误差分别介于-80~-40μg·m-3、-100~-60μg·m-3之间.订正后PM2.5浓度预报偏差显著减小,大部分地区年平均和秋冬季平均误差分别介于-5~5μg·m-3、-10~20μg·m-3之间,PM2.5实测浓度分布中,污染较重地区的PM2.5浓度订正偏差多数介于0~5μg·m-3、-5~20μg·m-3之间,但河北中部、山东东南部、河南部分地区秋冬季平均订正偏差亦较大,介于10~30μg·m-3之间.

由上述分析结果可知,CMAQ模式预报的PM2.5浓度年平均误差表现为非均匀空间分布特征,即辽宁中东部、山东东北和西南部、川渝地区及华中、华东、华南大部分地区预报偏高,京津冀和中西部大部分地区预报偏低,这可能与排放源不确定性的非均匀空间分布及不同地区CMAQ模式物理、化学参数化方案的适用性差异有关;滚动订正后PM2.5浓度与实测值的空间分布较一致,订正后PM2.5浓度误差显著减小,而且表现为均匀分布特征,上述预报明显偏高和偏低地区的PM2.5浓度偏差程度显著减小.秋冬季季节平均PM2.5浓度预报值、观测值、订正值及预报、订正平均偏差的空间分布特征与年平均分布类似,但秋冬季PM2.5浓度的预报和订正效果均差于年平均值.

4.2 时间变化特征

图 4图 5分别给出了2014年1—12月全国区域平均和1—3月、11—12月4个重点地区区域平均的PM2.5浓度预报、订正和观测日平均值及其预报、订正日平均偏差的时间变化特征.由图 4a图 5a可看出,全年全国区域平均和秋冬季京津冀、长三角、珠三角、川渝地区区域平均PM2.5浓度实测平均值分别介于30~180μg·m-3、30~330μg·m-3、16~210μg·m-3、7~115μg·m-3、29~245μg·m-3之间.全国区域平均PM2.5浓度实测值存在明显的季节变化特征,秋冬季(1—3月、11—12月)PM2.5浓度较大,极大值出现在1月31日,达到181.05μg·m-3;其他月份PM2.5浓度较小,介于25~70μg·m-3之间;秋冬季4个重点地区PM2.5实测浓度日均值大于75μg·m-3的天数占总样本数的比例分别为71%、36%、6%、53%.即京津冀地区污染最严重,川渝和长三角地区次之,珠三角污染较轻;京津冀、长三角和川渝地区污染程度远高于全国平均水平.

图 4 2014年1—12月中国地区252个环境监测站区域平均的PM2.5浓度预报、订正和观测日平均值及其预报、订正日平均偏差的时间变化图(a.预报、订正和观测日平均;b.预报和订正日平均偏差) Fig. 4 Temporal variation of regional and daily average of forecast, corrected and observed PM2.5 concentrations (a), and its forecast and correction deviations (b) at 252 environmental monitoring stations in China during January-December 2014

图 5 2014年1—3月和11—12月4个重点地区共84个环境监测站区域平均的PM2.5浓度预报、订正和观测日平均值及其预报、订正日平均偏差的时间变化图(a.预报、订正和观测日平均;b.预报和订正日平均偏差) Fig. 5 Temporal variation of regional and daily average of forecast, corrected and observed PM2.5 concentrations (a), and its forecast and correction deviations (b) at 84 environmental monitoring stations in four seriously polluted regions in January, February, March, November and December, 2014

对比图 4图 5a可发现,全年全国区域平均和秋冬季京津冀、长三角、珠三角、川渝地区区域平均PM2.5浓度预报误差较大,分别介于-70~60μg·m-3、-240~180μg·m-3、-100~160μg·m-3、-60~110μg·m-3、-95~185μg·m-3之间,多数时刻全国区域平均PM2.5浓度预报值均小于实测值,尤其是1—3月和11—12月预报值明显偏低,1月19日偏低最多,预报偏差达-70.48μg·m-3.秋冬季4个重点地区中,京津冀72%的时段PM2.5浓度预报值均小于实测值,长三角、珠三角、川渝地区分别有75%、67%、76%的时段PM2.5浓度预报值大于实测值,即4个地区中京津冀地区PM2.5浓度预报明显偏小,而且误差远大于其他3个地区;长三角、珠三角和川渝地区预报偏大,其中,川渝和长三角地区偏大程度大于珠三角地区.

经过滚动订正后,全国区域平均和秋冬季4个重点地区区域平均PM2.5预报值与实测值的时间变化趋势均较一致,而且订正值与实测值较接近,即订正后PM2.5浓度预报偏差明显减小.除1月和2月全国区域平均PM2.5浓度订正偏差较大,介于-47~50μg·m-3之间外,其他月份偏差介于-28~31μg·m-3之间.而且约71%的时刻订正后,PM2.5浓度偏差为±10μg·m-3,该偏差约占全国年平均PM2.5实测浓度(59.29μg·m-3)的17%.与PM2.5实测浓度类似,全国区域平均PM2.5浓度预报和订正偏差亦具有明显的季节变化特征,1—3月和11—12月PM2.5浓度预报和订正绝对平均偏差分别为18.4、14.2μg·m-3,其他月份的绝对平均偏差分别为7.8、6.4μg·m-3,即秋冬季预报和订正偏差明显大于春夏季.

除部分天订正偏差较大外,秋冬季京津冀、川渝地区分别有75%和88%的时段区域平均订正偏差介于±50μg·m-3之间,长三角地区约69%的时段订正偏差介于±30μg·m-3之间,珠三角地区约83%的时段订正偏差介于±20μg·m-3之间,上述偏差明显大于全国年平均PM2.5订正偏差(±10μg·m-3),即4个地区中京津冀地区预报和订正效果较差,川渝地区次之,长三角和珠三角地区预报和订正效果较好.

4.3 散点分布特征

图 6给出了2014年全年和秋冬季全国252个环境监测站逐时PM2.5浓度预报、订正和观测值的散点分布特征.对比图 6a和6b可知,全年逐时PM2.5浓度预报与实测值的散点多分布于对角线下方,即多数时刻预报值低于实测值,而且分布较分散,相关系数较小;经过滚定订正后PM2.5浓度与实测值的分布有较大改进,即散点分布更接近于对角线,预报偏小或偏大的程度得到较大改善,分布较集中,相关系数由原来的0.28提高到0.64.对比图 6c6d可知,与图 6a相比,秋冬季逐时PM2.5浓度预报与实测值的散点更多分布于对角线下方,而且拟合线与对角线的距离较远,即预报值明显低于实测值,而且散点分布更分散,相关系数更小;订正后PM2.5浓度与实测值的分布较集中于对角线附近,预报偏低的现象得到较大改善,相关系数亦提高较明显,由原来的0.25改进为0.61.可见PM2.5浓度订正值与实测值的散点分布特征明显优于预报浓度,即订正值较接近于实测值,而且集中分布于对角线附近.

图 6 2014年1—12月全年和秋冬季中国地区252个环境监测站逐时PM2.5浓度预报、订正和观测值的散点图(a.全年预报;b.全年订正;c.秋冬季预报;d.秋冬季订正) Fig. 6 Scatter plots between hourly forecast (a), corrected (b) and observed PM2.5 concentrations during January-December 2014, and forecast (c), correction (d) and observed values in January, February, March, November and December, 2014 at 252 environmental monitoring stations in China
4.4 概率分布特征

图 7为2014年全年和秋冬季全国252个环境监测站逐时PM2.5浓度预报和订正偏差的概率分布特征.由图 7a可知,全年PM2.5浓度预报和订正偏差均表现为正态分布特征,预报偏差大部分介于-80~80μg·m-3之间,误差出现最大概率为34%,其分布范围为-30~0μg·m-3;订正后约74%的时刻其误差介于-40~40μg·m-3之间,误差出现最大概率为38%,其分布范围为0~40μg·m-3.由图 7b可知,秋冬季PM2.5浓度预报和订正偏差亦为正态分布,预报偏差大部分介于-120~80μg·m-3之间,误差出现最大概率为28%,其分布范围为-40~0μg·m-3;订正后约65%的时刻其误差介于-40~40μg·m-3之间,误差出现最大概率为33%,其分布范围为-40~0μg·m-3.上述分析结果表明,全年和秋冬季PM2.5浓度预报偏差较大,误差分布范围较宽;订正后误差明显减小,而且多数时刻PM2.5浓度偏差集中分布于较小范围,订正效果较显著.

图 7 2014年1—12月全年和秋冬季中国地区252个环境监测站PM2.5浓度逐时预报、订正偏差的概率分布图(a.全年预报和订正;b.秋冬季预报和订正) Fig. 7 Probability distribution of deviations between hourly forecast, corrected and observed PM2.5 concentrations during January-December 2014 (a), and their biases in January, February, March, November and December, 2014 (b) at 252 environmental monitoring stations in China
4.5 误差统计

表 1给出了2014年全年和秋冬季全国252个环境监测站逐时PM2.5浓度预报、订正值与实测值的相关系数、平均偏差、绝对平均偏差、均方根误差和改进比.其中,改进比为某站某个时刻PM2.5浓度订正误差小于预报误差的样本数占总样本数的比例,可总体反映订正改进效果.由表 1可以看出,2014年全国及京津冀、长三角、珠三角、川渝4个重点污染区域PM2.5逐时预报浓度与实测值的相关系数较小,预报平均偏差、绝对平均偏差和均方根误差均较大.但总体而言,4个重点区域中珠三角地区PM2.5浓度预报效果最好(即预报值与实测值的相关系数最大,预报误差最小),川渝和长三角地区次之,京津冀地区预报效果最差.经滚动订正后PM2.5浓度订正值与实测值的相关系数显著增加,各项订正误差显著减小,即全国和上述4个重点区域PM2.5订正浓度与实测浓度的相关系数分别提高了0.36、0.40、0.26、0.24、0.42,平均偏差绝对值分别减小了0.31、19.16、24.12、2.18、22.93μg·m-3,绝对平均偏差分别减小了17.52、16.41、29.03、11.78、32.55μg·m-3,均方根误差分别减小了31.2、32.49、50.56、16.01、50.92μg·m-3,而且全年全国和4个重点污染区域PM2.5浓度订正改进比分别约为65%、58%、69%、67%、73%.就PM2.5浓度订正误差统计而言,4个重点区域中珠三角地区PM2.5浓度订正效果最好,川渝和长三角地区次之,京津冀地区订正效果较差.但就各区域PM2.5浓度订正前后各项指标的变化幅度而言,川渝和长三角地区的订正改进幅度最大,京津冀地区次之,珠三角地区的订正改进幅度相对较小.秋冬季的统计结果与全年时段类似,但全国和各个区域PM2.5浓度的预报和订正效果均差于全年时段.订正后除京津冀和长三角地区相关系数增加幅度小于全年时段外,全国和其他2个地区订正后的相关系数增加幅度和各项误差减小幅度均大于全年时段,4个重点区域PM2.5浓度预报和订正效果的排序与全年情况类似.

表 1 2014年全国252个环境监测站全年和秋冬季逐时PM2.5浓度预报和订正误差统计结果 Table 1 Relative coefficients and bias between hourly forecast, corrected and observed PM2.5 concentrations during January-December 2014 and in autumn and winter at 252 environmental monitoring stations in China

本文亦根据中国环境保护部(2012)发布的PM2.5浓度日均值二级标准和实测浓度资料,将2014年1月1日—12月31日分为污染日和非污染日,分别计算全国252个监测站PM2.5浓度预报、订正日均值的准确率、漏报率和误报率及相关系数、平均偏差、绝对平均偏差、均方根误差、改进比等评估指标(表 2表 3).可以看出,不论是污染日还是非污染日,PM2.5浓度预报的准确率较小,污染日漏报率和非污染日误报率均较大,预报值与实测值的相关系数较小,平均偏差、绝对平均偏差、均方根误差较大;经过滚动订正后其准确率和相关系数均有较大提高,污染日漏报率和非污染日误报率及上述3种误差均大幅减小;总体而言,非污染日PM2.5浓度预报和订正效果总体优于污染日.本文方法均适用于非污染日和污染日全国范围各监测站点的PM2.5预报浓度订正,而4个重点地区中该方法对于改进京津冀地区污染日的PM2.5浓度预报更有效,其他3个地区非污染日的订正改进效果优于污染日.清洁天气川渝地区的PM2.5浓度订正效果明显优于其他3个地区,而污染天气过程京津冀地区的订正效果明显优于其他3个地区.

表 2 2014年1—12月污染日和非污染日全国252个监测站PM2.5浓度预报、订正日均值的准确率、漏报率和误报率及相关系数和各项误差指标统计结果 Table 2 Accurate, failed and false forecasting rate, relative coefficients and bias between daily average of forecast, corrected PM2.5 concentrations and observations in polluted and clean days during January-December 2014 at 252 environmental monitoring stations in China

表 3 2014年1—12月污染日和非污染日全国和4个重点地区各监测站PM2.5浓度日均值的订正改进比 Table 3 Corrected improvement rate of PM2.5 daily average concentrations in polluted and clean days during January-December 2014 at environmental monitoring stations in four key regions and countrywide
6 结论(Conclusions)

本文采用CMAQ模式和自适应偏最小二乘回归相结合的非线性动力-统计订正方法,对2014年1—12月全国252个环境监测站PM2.5浓度预报值进行了滚动订正,分析了订正前后PM2.5浓度的时空变化特征,重点分析了该方法在秋冬季重霾污染过程的适用性及其改进原因,得出以下结论:

1) CMAQ模式预报的PM2.5浓度年平均和秋冬季平均误差表现为非均匀空间分布特征,即辽宁中东部、山东东北和西南部、川渝地区及华中、华东、华南大部分地区预报偏高,京津冀和西部大部分地区预报偏低;滚动订正后PM2.5浓度与实测值的空间分布较一致,表现为均匀分布特征,预报明显偏高和偏低地区的PM2.5浓度偏差程度显著减小.秋冬季PM2.5浓度的预报和订正偏差均大于年平均值.

2) 全国区域平均PM2.5浓度日平均实测值存在明显的季节变化特征,即1—3月、11—12月PM2.5实测值较大,其他月份较小.秋冬季4个重点地区中京津冀地区PM2.5浓度实测值较大,污染较严重,川渝地区次之,长三角和珠三角地区较小;全年和秋冬季全国和4个重点区域PM2.5浓度预报效果均较差,尤其是秋冬季预报误差较大;各月多数时段PM2.5浓度预报值小于实测值,尤其是1—3月和11—12月预报明显偏低.PM2.5订正浓度与实测值的时间变化趋势较一致,而且两者较接近,71%的时段订正后PM2.5浓度偏差为±10μg·m-3之间.PM2.5浓度预报和订正偏差亦具有明显的季节变化特征,秋冬季预报和订正偏差明显大于春夏季.

3) 4个地区的PM2.5浓度预报和订正偏差均大于全国区域平均值,其中,珠三角地区PM2.5浓度预报和订正效果较好,川渝和长三角地区次之,京津冀地区相对较差;经过滚动订正后,全年时段和秋冬季PM2.5浓度订正值与实测值的相关系数均显著增加,各项误差均显著减小,尤其是秋冬季订正改进效果较好.全年时段和秋冬季4个区域中川渝地区的订正改进幅度最大,长三角和京津冀地区次之,珠三角地区的订正改进幅度相对较小.

4) PM2.5浓度订正值与实测值的散点分布特征明显优于预报浓度,即订正值较接近于实测值,而且集中分布于对角线附近.PM2.5浓度预报偏差较大,误差分布范围较宽;订正后误差明显减小,而且多数时刻PM2.5浓度偏差集中分布于较小范围,订正效果较显著.

5) 本文的动力-统计滚动订正方法均适用于非污染日和污染日全国范围的PM2.5预报浓度订正,两种天气过程PM2.5浓度的订正效果均较好;另外,该方法对于改进京津冀地区污染日的PM2.5浓度预报更有效,其他3个地区非污染日的订正改进效果优于污染日.

本文采用CMAQ模式和自适应偏最小二乘回归法相结合的动力-统计预报方法显著改进了PM2.5浓度的预报效果,这是因为前期PM2.5浓度和气象条件实况对CMAQ模式预报的PM2.5浓度进行了实时动态修正.由于现有的排放源不确定性较大及空气质量数值模式对复杂的物理、化学过程刻画能力有限,采用动力-统计预报方法是提高空气质量预报准确率的有效途径之一.

参考文献
[${referVo.labelOrder}] Arnold J R, Dennis R L, Tonnesen G S. 2003. Diagnostic evaluation of numerical air quality models with specialized ambient observation:Testing the Community Multi-scale Air Quality modeling system (CMAQ) at selected SOS 95 ground sites[J]. Atmos Environ , 37 : 1185–1198. DOI:10.1016/S1352-2310(02)01008-7
[${referVo.labelOrder}] Cheng X H, Xu X D, Ding G A. 2010. An emission source inversion model based on satellite data and its application in air quality forecasts[J]. Sci China Earth Sci , 53 : 752–762.
[${referVo.labelOrder}] Dennis R, Byun D, Novak J. 1996. The next generation of integrated air quality modeling:EPA's Models-3[J]. Atmos Environ , 30 : 1925–1938. DOI:10.1016/1352-2310(95)00174-3
[${referVo.labelOrder}] 陈彬彬, 林常城, 杨凯, 等.2012. 基于CMAQ模式产品的福州市空气质量预报系统[J]. 中国环境科学 , 2012, 32 (10) : 1744–1752.
[${referVo.labelOrder}] 程兴宏, 李德平, 彭继达, 等.2013.北京地区CMAQ源同化模式预报PM10产品订正方法研究[C].2013年中国环境科学学会学术年会.昆明
[${referVo.labelOrder}] 程兴宏, 陶树旺, 魏磊, 等.2012. 基于WRF模式和自适应偏最小二乘回归算法的风能预报试验研究[J]. 高原气象 , 2012, 31 (5) : 1461–1469.
[${referVo.labelOrder}] 颜学峰, 陈德钊, 胡上序.2002. 用自适应偏最小二乘回归为药物定量构效关系建模[J]. 分析化 , 2002, 30 (5) : 536–539.
[${referVo.labelOrder}] 刘煜, 李维亮, 周秀骥.2005. 夏季华北地区二次气溶胶的模拟研究[J]. 中国科学D辑:地球科学 , 2005, 35 (增刊Ⅰ) : 156–166.
[${referVo.labelOrder}] 李军, 孙春宝, 刘咸德, 等.2009. 气象因素对北京市大气颗粒物浓度影响的非参数分析[J]. 环境科学研究 , 2009, 22 (6) : 663–669.
[${referVo.labelOrder}] 唐孝炎, 张远航, 邵敏. 2006. 大气环境化学[M]. 第2版. 北京: 高等教育出版社: 447 -449.
[${referVo.labelOrder}] 王庆梅, 张雪梅, 韩光.2008. 兰州市大气污染特征与污染预报技术研究[J]. 中国环境监测 , 2008, 24 (3) : 56–62.
[${referVo.labelOrder}] 王自发, 庞成明, 朱江, 等.2008. 大气环境数值模拟研究新进展[J]. 大气科学 , 2008, 32 (4) : 987–995.
[${referVo.labelOrder}] 王丽涛, 潘雪梅, 郑佳, 等.2012. 河北及周边地区霾污染特征的模拟研究[J]. 环境科学学报 , 2012, 32 (4) : 925–930.
[${referVo.labelOrder}] 谢敏, 钟流举, 陈焕盛.2012. CMAQ模式及其修正预报在珠三角区域的应用检验[J]. 环境科学与技术 , 2012, 35 (2) : 96–101.
[${referVo.labelOrder}] 王茜, 吴剑斌, 林燕芬.2015. CMAQ模式及其修正技术在上海市PM2.5预报中的应用检验[J]. 环境科学学报 , 2015, 35 (7) : 1651–1656.
[${referVo.labelOrder}] Xu X D, Xie L A, Cheng X H, et al. 2008. Application of an adaptive nudging scheme in air quality forecasting in China[J]. J Appl Meteorol Climatol , 47 : 2105–2114. DOI:10.1175/2008JAMC1737.1
[${referVo.labelOrder}] 许建明, 徐祥德, 刘煜, 等.2005. CMAQ-MOS区域空气质量统计修正模型预报途径研究[J]. 中国科学D辑:地球科学 , 2005, 35 (增刊Ⅰ) : 131–144.
[${referVo.labelOrder}] 尤佳红.2014.上海地区霾集合预报研究[D].上海:华东师范大学.1-49
[${referVo.labelOrder}] 张美根.2005. 多尺度空气质量模式系统及其验证Ⅰ.模式系统介绍与气象要素模拟[J]. 大气科学 , 2005, 29 (5) : 805–813.
[${referVo.labelOrder}] 张伟, 王自发, 安俊岭, 等.2010. 利用BP神经网络提高奥运会空气质量实时预报系统预报效果[J]. 气候与环境研究 , 2010, 15 (5) : 595–601.
[${referVo.labelOrder}] 中国环境保护部.2012. GB 3095-2012.环境空气质量标准[S].北京:中国环境科学出版社