环境科学学报  2021, Vol. 41 Issue (11): 4377-4387
长三角地区空气质量国控环境监测点空间代表性评价——以PM2.5为例    [PDF全文]
苏玲1, 高婵婵1, 曹闪闪1, 阎路宇2, 孟紫琪3, 田慧敏1, 刘敏1,4    
1. 华东师范大学生态与环境科学学院, 上海市城市化生态过程与生态恢复重点实验室, 上海 200241;
2. 中国环境监测总站, 北京 100012;
3. 中国科学院地理科学与资源研究所, 北京 100101;
4. 崇明生态研究院, 上海 200241
摘要:2013年我国正式开展了113个环境保护重点城市和国家环境保护模范城市细颗粒物等项目监测,目前已建成国家环境空气质量监测网络.为了较好地将空气质量国控环境监测点(简称国控点)监测结果提升到区域和全球水平,须了解当前空气质量环境监测网络的空间代表性.本文以长三角地区为研究区域,基于国控点空间分布信息,结合区域第二产业比重(POSI)、地区生产总值(GDP)、人口(POP)、风速(WDSP)、降水量(PRCP)、气温(TEMP)、增强型植被指数(EVI)和数字高程模型(DEM)8个影响细颗粒物(PM2.5)相关变量,在1 km×1 km空间分辨率下计算长三角地区129个国控点与研究区域中其他位置(像元)的多维欧氏距离,并结合K均值聚类方法开展区域国控点PM2.5监测的空间代表性评价及优化.结果表明:①长三角地区129个国控点代表区域面积差异明显,其中,上海市淀山湖站点的代表面积最大,为37933 km2,南京市迈皋桥站点的代表面积最小,仅为4 km2;②长三角地区国控点能较好地代表整个区域的PM2.5空间分布,现有国控点对PM2.5空间分布代表的有效范围(即像元与国控点多维欧氏距离低于全区平均值的区域)占总面积的63.23%;③难以被现有国控点代表性的区域主要集中在江苏省太湖、洪泽湖等水域、上海市中心城区与崇明沿海地区及浙江西南部山地地区;④在浙江省绍兴市与衢州市新增2个国控点,中东部丘陵地区的区域代表性可得到明显改善,长三角地区国控点可代表区域面积占比整体提高16.4%.
关键词PM2.5    长三角地区    空气质量国控环境监测点    空间代表性    欧氏距离    K均值聚类    
Spatial representative evaluation of ambient air quality monitoring stations in the Yangtze River Delta: Taking PM2.5 as an example
SU Ling1, GAO Chanchan1, CAO Shanshan1, YAN Luyu2, MENG Ziqi3, TIAN Huimin1, LIU Min1,4    
1. Shanghai Key Lab for Urban Ecological Processes and Eco-Restoration, School of Ecological and Environmental Sciences, East China Normal University, Shanghai 200241;
2. China National Environmental Monitoring Centre, Beijing 100012;
3. Institute of Geographical Sciences and Natural Resources Research, Beijing 100101;
4. Institute of Eco-Chongming, Shanghai 200241
Received 11 February 2021; received in revised from 23 March 2021; accepted 23 March 2021
Abstract: In 2013, China has officially launched the monitoring of fine particle (PM2.5) and other air pollutants in 113 key environmental protection cities and national environmental protection model cities. At present, the national ambient air quality monitoring network was established. To correctly upscale the observations obtained in these stations to the regional and global scale, it is necessary to understand the representativeness of the current monitoring network. Using the Yangtze River Delta as the study area, this paper calculated the multidimensional Euclidean distance between each pixel and the stations to determine the representativeness of the existing monitoring network. Eight variables related to PM2.5, including proportion of secondary industry (POSI), gross domestic product (GDP), population (POP), wind speed (WDSP), precipitation (PRCP), air temperature (TEMP), enhanced vegetation index (EVI) and digital elevation model (DEM) were used to indicate the environmental characteristics of PM2.5 with a spatial resolution of 1 km×1 km. In addition, the K-means clustering method was adopted to improve the spatial representativeness of the existing ambient air quality monitoring network. The results showed that: ① there were obvious differences among the representative area of 129 stations in the Yangtze River Delta. The Dianshan Lake station in Shanghai had the largest representative area(37933 km2), and the representative area of the Maigaoqiao station in Nanjing was only 4 km2; ② the monitoring stations in the Yangtze River Delta could well represent the PM2.5 spatial distribution of the entire region, and the effective area (i.e. the area where the Euclidean distance between the pixels and the stations was lower than the average value) accounted for 63.23% of the total area; ③ the areas that were difficult to be represented mainly concentrated in the Taihu Lake and Hongze Lake, downtown area of Shanghai, the coastal areas of Chongming, and the southwestern mountainous areas in Zhejiang; ④ two additional stations were proposed in Shaoxing city and Quzhou city, which could improve the regional representativeness by 16.4%, especially in the hilly areas in Zhejiang Province.
Keywords: PM2.5    Yangtze River Delta    ambient air quality monitoring station    spatial representativeness    Euclidean distance    K-means clustering    
1 引言(Introduction)

随着我国经济的快速发展和城镇化率的提高, 由城镇化引起的空气粉尘、汽车尾气排放和燃煤等造成的大气污染愈加严重.细颗粒物(Fine Particulate Matter, PM2.5)是指空气动力学当量直径不大于2.5 μm的微小悬浮颗粒, 其能降低大气能见度, 参与大气化学反应, 产生二次污染物, 进而严重影响人类健康(Zhou et al., 2019).医学研究表明, PM2.5进入人体后, 可导致各种呼吸系统及心脑血管疾病, 增加暴露人群的死亡风险(Franklin et al., 2008; Kioumourtzoglou et al., 2016; Zhou et al., 2019).2012年, 中国颁布了新的环境空气质量标准(GB3095—2012), 将PM2.5列为常规重点监测指标.2013年9月, 我国发布了《环境空气质量监测点位布设技术规范(试行)》, 正式开展了全国范围内的环境空气质量监测的相关工作.空气质量监测数据表明, PM2.5是我国现阶段城市空气质量的首要污染物, 2016—2020年地级及以上城市中PM2.5浓度超标城市比例为37.1%~71.9%.

目前我国PM2.5测定主要通过地面采集和自动监测来实现(黄明祥等, 2015).国家环境空气监测点(以下简称国控点)属连续监测系统, 常用的测量方法包括β射线吸收法、微量振荡天平法和光散射法等(冯进, 2014).国控点需建立在地质条件长期稳定且足够坚实, 附近1000 m内的土地使用状况相对稳定, 点位周围50 m内不得有污染源等环境要求之上, 其观测数据具有精度高、时间序列长、监测项目多等优点;但由于点位的建设与管理受到经济、资源等因素的限制, 导致其代表的区域范围有限且呈现空间观测的不连续性, 难以准确描述PM2.5的时空分布情况(黄明祥等, 2015; Liu et al., 2018).因此, 为了将观测数据较好地提升到区域水平, 有必要对地面监测站点的代表性进行评价.

站点空间代表性是指在某一特定时空维度下, 测量数据能够多大程度反映相同或者不同空间尺度上的真实情况(Nappo et al., 1982; 徐保东等, 2015).尽管我国空气质量国控点的数量较多, 但目前监测网络的空间代表性仍不够(徐保东等, 2015).量化监测网络的空间代表性有助于优化网络设计, 避免冗余站, 从而为进一步扩大国家环境空气质量监测网络的覆盖面提供参考(Antonio et al., 2015).评估站点的空间代表性, 可以从观测对象的浓度水平、所测环境空气质量数据的统计属性, 或影响空气质量的外部参数, 如排放和扩散条件等方面开展评价(Spangl et al., 2007).Righini等(2014)将各类污染物排放的空间分异性与排放浓度之间的关系定性化, 并基于网格排放数据, 利用地理信息技术(GIS)的邻域统计算法得到污染排放的空间分异程度, 从而确定目标监测站点的空间代表性.Antonio等(2015)通过计算在超过一定百分比的条件下, 观测浓度与模型浓度的差值小于一个阈值的区域大小来评估地面监测站的空间代表性.我国大气环境监测网络覆盖了城市区域, 然而并没有完全考虑地形、人为活动、植被和环境多样性等因素, 作为一个整体来监测区域尺度的空气质量变异特征仍然缺乏系统的评价.

长江三角洲地区(简称长三角地区)是我国人口最密集、经济最发达的地区之一.随着区域工业和城市的迅速发展, 工业耗煤量、汽车尾气排放量和建筑工地扬尘等大气污染物排放量加大, 导致该地区的大气污染不断加剧, 特别是城市化地区的空气污染愈发频繁, 呈现区域性、复合性及压缩性的特征(陈优良等, 2017; Zhang et al., 2018; 邓发荣等, 2019).长三角地区地形复杂, 大气污染排放源多样, 通过对现有PM2.5监测站点空间代表性进行定量分析评价, 提出区域大气环境PM2.5监测站点的合理布局, 有利于多尺度数据融合, 提高大气环境观测从站点尺度扩展到区域尺度的精度.因此, 本文以长三角地区为研究区域, 基于影响区域PM2.5浓度水平的气象因素、社会经济因素和自然条件等8个变量因子, 比较国控点与区域的变量特征, 利用多维欧氏距离衡量国控点与研究区域中其他位置(像元)之间的相似性, 进而对长三角地区空气质量国控环境监测点的空间代表性进行定量评价.在此基础上, 通过K-means聚类方法在代表性不足的区域寻找额外补充站点, 提出长三角地区空气质量监测站点的优化方向.

2 材料与方法(Materials and methods) 2.1 研究区域概况

长三角地区(116°29′~123°45′ E, 27°14′~35°33′ N)位于中国大陆东部沿海, 覆盖上海市及江苏省与浙江省的25个城市(图 1).该区域土地面积达21.07×104 km2, 属亚热带季风气候, 年平均气温为16.7 ℃, 年平均降水量为1536 mm (She et al., 2017).从地势地貌来看, 该地区地势较为平坦, 平原率约55%, 水面率约10.37%.从社会经济来看, 长江三角洲地区的总常住人口为1.63亿, 约占全国总人口的11.64%, 地区生产总值达20.01万亿元, 约占全国的20.29%(2019年年末).

图 1 长三角地区及空气质量国控环境监测点(国控点)空间分布 (水域及建设用地数据来源: http://www.resdc.cn/data.aspx?DATAID=202) Fig. 1 Overview of the Yangtze River Delta and the spatial distribution of ambient air quality monitoring stations (Data sources of water area and construction land: http://www.resdc.cn/data.aspx?DATAID=202)

长三角地区是全球最大的都市圈和中国最具活力的城市群之一, 也是长江经济带与“一带一路”的重要交汇地, 引领当地及周边地区的经济发展, 是国家社会经济发展的重大推动力(邓发荣等, 2019; Wang et al., 2020).但由于区域资源和能源消耗量过大, 导致长三角地区的生态退化及环境污染日趋严重, 多种大气污染物高强度集中排放, 光化学烟雾、雾霾等大气环境问题突出, 已成为全国大气污染严重的城市群之一(吴蒙等, 2015; 陈优良等, 2017; Ye et al., 2019).

2.2 数据来源

本文收集了长三角地区129个国控点的经纬度信息(来源: http://106.37.208.233:20035/), 作为区域国控点空间代表性分析的基础资料(图 1).同时, 从加拿大达尔豪斯大学的大气成分分析中心获取2017年长三角地区基于遥感产品的PM2.5浓度数据, 用于验证国控点的空间代表性.

城市化是一个地区人口、经济、社会等多种因素综合发展的过程, 可概括为人口城市化、空间城市化、经济城市化和社会城市化4个方面(陈明星等, 2009; 彭霞等, 2016), 城市化的发展对区域大气环境有重要影响.Liang等(2019)与Huang等(2018)研究发现, 人口密度与工业排污量及城镇化率是影响我国PM2.5浓度的主要驱动力.因此, 本文选取人口密度(POP)、地区生产总值(GDP)及第二产业比重(POSI)作为影响区域PM2.5的社会经济因素.

气象因素是影响PM2.5浓度空间扩散的重要因素.研究表明, 高浓度PM2.5多发生于近地面风速较小甚至静风的气象条件, 颗粒物在近地面积累并无法及时扩散(窦以文等, 2019).同时, 气温影响着人类的生产生活方式, 从而间接影响污染物的排放(孙丹丹等, 2019; Xu et al., 2020).降水能将空气中的悬浮颗粒物携带至地面, 显著降低PM2.5浓度(黄小刚等, 2019).因此, 本文选取年均风速(WDSP)、年均气温(TEM)及年均降水量(PRCP)作为影响PM2.5的气象因素.

地形起伏度与植被覆盖率对PM2.5均有显著的负面影响(黄小刚等, 2019; Yu et al., 2019; Xu et al., 2020).地形起伏度可影响近地面风速和风场, 较高的植被覆盖率对城市小气候调节起重要作用.增强型植被指数(EVI)与归一化植被指数(NDVI)相比, 与总初级生产的线性关系更显著(Xiao et al., 2004).因此, 选取数字高程模型(DEM)与增强型植被指数(EVI)作为影响PM2.5浓度的自然条件因素.

综上, 本文共收集了包括气象因素、社会经济因素和自然条件因素在内的8个影响区域PM2.5浓度水平的变量因子(表 1), 空间分辨率为1 km×1 km.其中, 气象资料(年均风速、平均降水量和平均气温)均来自中国气象数据网, 以DEM为协变量, 通过Anusplin软件对气象站点数据进行插值得到连续的栅格数据(Hutchinson et al., 1998).同时, 选取2017年长三角各地区统计年鉴中第二产业产值与总产值的比值作为第二产业比重(POSI);地区生产总值(GDP)和人口(POP)数据来自中科院资源环境科学数据中心.自然条件因素包括增强型植被指数(EVI)与数字高程模型(DEM), 其中, DEM来自于Shuttle Radar Topography Mission (SRTM), 通过中科院资源环境科学数据中心(http://www.resdc.cn)下载.由于可获取数据的时间限制, 所选变量数据部分年份有一定差异, 但在一定程度上能反映各因素对PM2.5的影响状况.本文8个变量均统一为WGS84(World Geodetic System 1984)坐标系, 并采用最邻近法, 将输入栅格上最近的单元中心值分配给输出栅格单元, 将变量统一重采样为空间分辨率为1 km×1 km的栅格数据(行列数956×927).

表 1 本研究数据来源 Table 1 Descriptions of the data sources in this study
2.3 研究方法与数据处理 2.3.1 数据预处理

由于不同变量具有不同的单位和变异程度, 为了消除其带来的影响, 本研究采用Min-Max标准化法(Min-max normalization)对8个变量进行统一标准化处理(式(1)).首先统计每个输入图层所有像元的最大值和最小值, 每个像元值减去最小值后除以最大值与最小值的差值, 从而使每个变量图层的像元值都归一化为0~1 (王绍强等, 2013).假设变量xn个样本, 对序列x1, x2xn进行线性变换, 得到一个新序列y1, y2yn, 其范围在0~1, 且无量纲.本文8个变量标准化后的空间分布如图 2所示.

(1)
图 2 标准化处理后的变量空间分布 Fig. 2 Spatial distribution of eight variables with normalization
2.3.2 站点的空间代表性评价

欧氏距离(Euclidean distance)又称欧几里德度量, 是常见的距离计算方法, 用以衡量二维或多维空间中两点间的绝对距离(Li et al., 2003).它既可表示两点间的直线距离, 也可衡量两个对象的相似性, 距离越远说明个体之间的差异越大.Hargrove等(2004)He等(2015)使用欧氏距离表征各站点的周围环境, 提供了每个地图像元相对于特定站点连续变化的相似性度量.基于该方法, 本文利用多维欧氏距离来衡量国控点与周边环境的相似程度, 即站点的代表性程度, 主要步骤如下.

首先, 建立国控点与区域像元的属性向量.假设对象有n个属性, 则可以把该对象视为n维空间的一个点, 也可视作含n个属性的属性向量(Bradley et al., 1998; 赖桃桃等, 2008).本研究涉及8个环境变量, 即空间上的一个像元拥有8个不同的属性.将标准化后的影响因子叠置, 由于变量的数据来源不同, 导致沿海地区的部分像元属性不全, 剔除掉该部分像元后, 得到长三角地区余下每个像元的属性向量, 即xij.其次, 将国控点所在像元的属性向量赋值给所在站点, 可得到每个国控点的属性向量ykj.由此, 根据多维欧氏距离的计算公式计算国控点与像元之间的相似性, 即站点的代表性程度可定义为(图 3):

(2)
图 3 多维欧式距离示意图 Fig. 3 Schematic diagram of multidimensional Euclidean distance

像元与国控点之间的多维欧式距离越近, 说明两者的相似性就越高, 像元就越能被国控点所代表(Xiao et al., 2011; He et al., 2015).因此, 对于区域中的任意像元来说, 提取像元最小多维欧式距离对应的国控点, 可认为该国控点是研究区域内该像元的代表站点.栅格值低于平均值的像元则被认定为能够较好地被国控点所代表, 反之则像元不能较好地为现有国控点所代表(He et al., 2015).

2.3.3 站点代表性的验证及影响因素识别

对研究区国控点代表性进行影响因素的识别之前, 需验证结果的真实性与准确性, 即是否能真实反映PM2.5的空间分异情况.由于观测对象的浓度水平可用于评估站点的空间代表性(Spangl et al., 2007), 而多维欧氏距离则是PM2.5浓度相关变量的综合评价指标.因此, 本文以基于遥感产品的PM2.5浓度为验证数据, 通过波段统计分析方法, 来判断站点空间代表性与PM2.5浓度空间分异性之间的相关程度.同时探讨站点空间代表性与8个环境变量之间的相关程度, 以进一步评价长三角地区的国控点代表性结果.相关系数(CORR)为两图层间的协方差与标准差乘积的比值, 其计算公式为:

(3)

式中, ij分别为两个不同的图层, COVij为两个图层的协方差, δiδj分别为两个图层的标准差.正相关性表明两个图层间存在直接的线性关系, 当其中一个图层的像元值增大时, 另一个图层的像元值也随之增大;负相关性则表示一个变量随另一个变量反比例变化;相关系数为零时, 表示两个图层之间不存在线性依存关系(Snedecor et al., 1968).

2.3.4 站点空间代表性的改进

K均值算法是空间聚类分析中应用最广泛的方法之一, 属迭代式求解的聚类算法, 具有操作简单且聚类效果较优的特点(Wang et al., 2009; 王绍强等, 2013).为提升长三角地区空气质量监测网络的空间代表性, 将长三角地区代表性不足的区域划分为1~5个不同类别, 采用K-means聚类法在代表性差的地区寻找聚类中心, 用以表征空间代表性不足区域的环境条件(Hoffman et al., 2013);然后基于相同的环境变量, 通过欧氏距离将其分配给最近的像素, 该像素便成为新的站点.

K均值算法的具体步骤为: ①将站点代表性不足区域(包含8个属性)的所有像元作为样本点, 随机选取1~5个像元作为初始聚类中心(簇心);②计算所有样本点到1~5个簇心的多维(N=8)欧式距离, 根据1~5个距离值中的最小值, 归类至对应的簇心;③样本被归为1~5个簇后, 重新计算每个簇的中心位置(均值), 并设定为新的簇心;④由此重复上述过程, 直至在预设迭代次数(1000)内实现准则函数的收敛.

3 结果与讨论(Results and discussion) 3.1 长三角地区国控点现状及分析

长三角地区现有125个城市站点和4个城市对照点(分布在上海市青浦区、苏州市上方山、南通市南郊与杭州市千岛湖).每个地级城市国控点数量为5~11个.就站点空间分布密度而言, 浙江省、江苏省与上海市分别为4.448×10-4、7.032×10-4与14.300×10-4个·km-2.

比较长三角地区国控点与总体研究区域的环境变量特征, 可了解现有国控点周边PM2.5的环境状况, 进而为国控点的空间代表性结果分析提供参考.由表 2可知, 长三角地区现有国控点总体社会经济水平(GDP和POP)均高于区域平均水平, 而自然条件(DEM和EVI)则低于区域平均水平.根据《环境空气质量监测点位布设技术规范(试行)》, 环境空气质量评价城市点应设置在各城市的建成区内, 同时由于环境监测国控点的布设要求周围50 m内不得有污染源, 所以国控点附近的工业活动相比区域水平较少, 其第二产业比重仅为40%.以上结果表明, 长三角地区的空气质量监测站点大多分布在人口和社会经济活动集中的地区, 这与我国的站点布设原则一致.

表 2 长三角地区各变量均值及标准差 Table 2 Mean and standard deviation of 8 variables in the Yangtze River Delta
3.2 长三角地区国控点代表区域的空间分布与下垫面特征分析

通过统计国控点与区域像元之间的欧氏距离, 可发现长三角地区129个国控点代表的像元数量差异明显(图 4a).其中, 上海市淀山湖站点的代表区域面积最大, 为37933 km2, 约占长三角地区总面积的20.84%, 其次为江苏省淮安市钵池山站点, 其代表区域的面积为27267 km2, 约占总面积的15%(图 4b);而江苏省南京市迈皋桥站点的代表区域最小, 面积仅为4 km2.

图 4 长三角国控点代表区域 (a.长三角所有国控点的代表区域, b.淀山湖站点、迈皋桥站点、钵池山站点代表区域) Fig. 4 The area represented by monitoring stations in the Yangtze River Delta (a.the representative scope of all monitoring stations, b.the representative scope of Dianshan Lake station, Maigao Bridge station and Bachi Mountain Station)

上海淀山湖站点地处上海市青浦区, 远离市区, 没有明显工业排放源, 是上海市空气质量的清洁对照点.由图 4b可知, 该站点主要覆盖了浙江中东部城市如绍兴市、宁波市与温州市等.淀山湖靠水且地势开阔, 并未像浙江省现有站点一样布设在山区地形上, 加之覆盖区域目前尚未布置监测点, 所以淀山湖站点与覆盖区域的相似性最高.钵池山站点地处江苏省内陆地区, 该地区空气质量较差, 2013年12月—2014年11月的PM2.5浓度均在130 μg·m-3以上(李玉玲等, 2016).该站点代表了江苏北部除主城区以外的城市地区, 如徐州市、连云港市等重工业城市, PM2.5浓度高居不下.从下垫面类型来说, 相比徐州市, 连云港市等处于城市建设区的站点, 钵池山位于风景区内, 下垫面较为均匀, 更能很好地代表徐州等城市除城区以外的区域.迈皋桥站点代表区域小的原因, 一是由于其附近监测点位可能过于密集, 且城市下垫面类型均为建设用地, 导致该站点分摊的代表面积较少;二是因为该站点位于居民区内, 周围建筑密度较高, 站点的平均风速低于南京市其他站点, 仅为2.18 m·s-1, 不利于PM2.5浓度的扩散(Yu et al., 2019; 孟昭伟等, 2020).

长三角地区129个国控点的代表区域分布显示了每个站点所代表的区域范围, 其代表性程度, 即是否较好地代表了区域PM2.5的空间分异特征, 还需要基于国控点与像元的最小欧氏距离对其进行评价.

3.3 长三角地区国控点的空间代表性验证及评价

基于2017年长三角地区的PM2.5浓度数据, 验证国控点代表结果的真实性与准确性, 发现国控点代表性与PM2.5的浓度分布显著相关(表 3), 相关系数为-0.74.说明通过欧氏距离来衡量站点的空间代表性具有较好的可行性, 其系数为负可能与偏远地区站点的疏密程度有关.

表 3 长三角各地区站点代表性与各变量及PM2.5浓度的相关系数 Table 3 The correlation coefficient between the representativeness of monitoring stations and each variable or PM2.5 concentration in the Yangtze River Delta

提取每个像元与其代表站点的最小欧氏距离, 计算总体平均值, 以此为基准来评价该地区国控点的空间代表性.长三角地区所有像元的平均最小欧氏距离为0.218, 大于平均值的像元被认定为难以较好地为国控点所代表(He et al., 2015).现有国控点代表PM2.5的空间分布的有效范围(即像元与国控点多维欧氏距离低于全区平均值的区域)占总面积的63.23%, 其中, 江苏省与上海市国控点代表的有效范围占该省(市)总面积的96.40%和85.54%, 而浙江省仅为28.36%.总体而言, 长三角地区129个大气环境监测国控点能较好地代表整个区域的PM2.5空间分布;但现有国控点难以较好地代表江苏省部分水域、浙江省西南部山地地区和上海市中心城区及崇明东部沿海地区的PM2.5空间分布情况(图 5).

图 5 长三角地区空气质量监测站点空间代表性及PM2.5浓度空间分布 Fig. 5 Spatial representativeness of monitoring stations in Yangtze River Delta and the PM2.5 spatial distribution

为进一步分析国控点代表性的空间分布特征, 确定影响站点代表性的相关因子, 本文分别从江苏、上海、浙江3个地区对影响PM2.5浓度的8个变量与站点空间代表性进行相关性分析, 以进一步解释长三角地区的站点代表性结果.首先, 从整个研究区域来看, DEM和降水量(PRCP)是影响全区站点空间代表性评价的主要因素.降水与当地地形有一定的相关性, 随着高程的增加, 年降水量及降水频次有显著的增加趋势(α=0.05)(罗贤等, 2012; Ding et al., 2014).在海拔与降水量变化明显的区域, 国控点分布较为稀疏(图 5), 不能完全代表该地区周围的大气环境条件, 导致该地区国控点的空间代表性较差.

江苏省属平原地形, 总体高程变化不大, 其他环境变量与PM2.5的相关系数也均处于较低值, 地面测量值能较好地代表PM2.5像元尺度数据.从图 5可以看出, 江苏省站点代表性较差的区域几乎都处于太湖、洪泽湖等湖泊中, 这是由于水体藻类及沉水植物的EVI值较低, 导致其整体的欧式距离变大.2017年上海市地区GDP位居全国城市首位, 其主城区的人口与经济最为集中和发达, 这两个社会经济因素对上海市PM2.5浓度监测的影响超过了气象与自然条件因素.因此, 未来上海市国控点的调整可考虑区域社会经济因素的空间分异.同时结合图 4a可知, 上海市中部地区与崇明区大多为其他省市的国控点所代表, 因此, 在该地区应考虑增加一定数量的空气监测国控点来反映当地的PM2.5浓度.

浙江省的地势西南高东北低, 西南以山地丘陵为主, 东北以盆地平原为主, 相对较大的地形高差不利于PM2.5的扩散(Xu et al., 2020), 所以DEM成为影响浙江省PM2.5浓度监测的主要影响因素.因此, 浙江省国控点的调整, 应考虑地形的复杂性, 对其西部的山地地区加以重点改善.同时, 由本文3.2节可知, 浙江省的中部丘陵地区大多为上海市的淀山湖站点所代表, 说明该地区可能需要布设更多的国控点, 来反映当地PM2.5浓度的空间变化特征.

3.4 长三角地区国控点空间代表性的改进

对长三角地区现有大气监测站点的空间代表性进行量化后, 本文提出通过K均值聚类的方法, 在代表性较差的地区找出聚类中心作为新站点来提高整体代表性.为最大限度地提高区域代表性, 分别计算增加1~5个站点后的代表性较好的区域面积占比(图 6).图 7展示了未来站点的建设中需要考虑的位置, 以及当新增站点数量分别为2和4时, 长三角地区的站点空间代表性的改善情况.

图 6 长三角地区国控点空间代表性对新增站点的响应 Fig. 6 Response of spatial representativeness in the Yangtze River Delta by adding stations

图 7 长三角地区现有国控点及新增站点后(2个、4个)的空间代表性情况 Fig. 7 The locations of 2 and 4 additional stations and the improvement of the spatial representation in Yangtze River Delta

结果显示, 代表性较好的区域面积占比由63.23%提高到79.63%, 平均欧氏距离由0.218下降到0.159.进一步发现, 随着站点的增加, 代表性较好的区域面积占比与平均欧氏距离的变化幅度变缓, 这为选择合适的新增站点数量提供了可能.理想情况下, 监测点位的数量越多、空间覆盖面越大越好;但在实际的布设工作中, 既要考虑区域面积、人口的数量及空间的代表性, 也要考虑经济和技术等条件(黄明祥等, 2015; Liu et al., 2018).因此, 国控点不可能遍布长三角地区城市、乡村及背景地区.根据图 6, 确定站点的新增数量为2(斜率为0.45), 以有限的监测点位来最大程度地代表长三角地区的空气质量状况, 从而达到最大的经济社会效益.

新增站点分别分布在浙江省绍兴市与衢州市, 该地区均属山地丘陵地区, 这与本文3.3节的结论一致.随着新增站点的增多, 上海市淀山湖站点的部分代表区域, 即浙江省的中东部地区, 区域代表性得到了明显改善(图 7).这说明新增站点能较好地反映当地环境条件, 进一步验证了利用欧式距离确定国控点的空间代表性方法的科学性与实用性, 为调整或改善大气空气质量监测网络提供了参考.

4 结论(Conclusions)

1) 长三角地区现有国控点代表的区域面积差异明显, 其中, 上海市淀山湖站点的代表面积最大, 为37933 km2, 南京市迈皋桥站点的代表面积最小, 仅为4 km2.

2) 长三角地区129个国控点能较好地代表整个区域的PM2.5空间分布, 可被现有国控点代表的区域占总面积的63.23%, 其中, 江苏省与上海市国控点可代表区域面积占比分别为96.40%和85.54%, 浙江省仅为28.36%.

3) 长三角地区现有国控点难以较好地代表江苏省部分水域、浙江省西南部山地地区和上海市中心城区及崇明东部沿海地区的PM2.5空间分布情况.未来上海市国控点的调整可考虑区域社会经济因素的空间分异.对于浙江省, 则应考虑地形的复杂性, 对其西部山地地区加以重点改善.

4) 为最大限度地提高区域代表性, 在浙江绍兴市与衢州市新增2个国控点, 当地中东部丘陵地区的区域代表性得到了明显改善, 长三角地区国控点可代表区域面积占比整体提高了16.4%.

本文虽量化了长三角空气质量监测站点的区域代表性, 但仍存在一些不足.首先, 在PM2.5的影响指标选择上存在一定的主观性, 其他影响因素如城镇化率等尚未考虑在内;其次, 如果直接将欧式距离用于特征向量之间的相似性度量, 可能忽略了特征向量中对应元素之间相似性的影响, 进而带来一定的误差.

参考文献
Antonio P, Lina V, Righini G, et al. 2015. Spatial representativeness of air quality monitoring stations: A grid model based approach[J]. Atmospheric Pollution Research, 6(6): 953-960. DOI:10.1016/j.apr.2015.04.005
Bradley, Fayyad M. 1998. Refining initial points for k-means clustering[C]. Proc. of the 15th Internet Conf. on Machine Learning. San Francisco: 727: 91-99
陈明星, 陆大道, 张华. 2009. 中国城市化水平的综合测度及其动力因子分析[J]. 地理学报, 64(4): 387-398. DOI:10.3321/j.issn:0375-5444.2009.04.001
陈优良, 陶天慧, 丁鹏. 2017. 长江三角洲城市群空气质量时空分布特征[J]. 长江流域资源与环境, (5): 42-52.
邓发荣. 2019.2014-2017年长三角地区典型城市秋冬季大气气溶胶污染特征分析[D]. 南京: 南京信息工程大学
Ding Y H, Liu Y J. 2014. Analysis of long-term variations of fog and haze in China in recent 50 years and their relations with atmospheric humidity[J]. Science China(Earth Sciences), 57(1): 36-46. DOI:10.1007/s11430-013-4792-1
窦以文, 丹利, 胡保昆, 等. 2019. 天气影响下的京津冀气候变化特征与成因[J]. 中国环境科学, 39(2): 506-513. DOI:10.3969/j.issn.1000-6923.2019.02.008
冯进. 2014. PM2.5监测技术的发展及测量数据准确性的保障[J]. 计量与测试技术, 41(2): 52-54+57. DOI:10.3969/j.issn.1004-6941.2014.02.027
Franklin M, Koutrakis P, Schwartz P. 2008. The role of particle composition on the association between PM2.5 and mortality[J]. Epidemiology, 19(5): 680-689. DOI:10.1097/EDE.0b013e3181812bb7
Hargrove W W, Hoffman F M. 2004. Potential of multivariate quantitative methods for delineation and visualization of ecoregions[J]. Environmental Management, 34(1 Supplement): S39-S60.
He H L, Zhang L Y, Gao Y Z, et al. 2015. Regional representativeness assessment and improvement of eddy flux observations in China[J]. Science of the Total Environment, 502: 688-698. DOI:10.1016/j.scitotenv.2014.09.073
Hoffman F M, Kumar J, Mills R T, et al. 2013. Representativeness-based sampling network design for the State of Alaska[J]. Landscape Ecol, 28: 1567-1586. DOI:10.1007/s10980-013-9902-0
Huang T H, Yu Y J, Wei T G, et al. 2018. Spatial-seasonal characteristics and critical impact factors of PM2.5 concentration in the Beijing-Tianjin-Hebei urban agglomeration[J]. Plos One, 13(9). DOI:10.1371/journal.pone.0201364.eCollection2018
黄明祥, 魏斌, 郝千婷, 等. 2015. PM2.5遥感反演技术研究进展[J]. 环境污染与防治, 37(10): 70-76+85.
黄小刚, 邵天杰, 赵景波, 等. 2019. 汾渭平原PM2.5浓度的影响因素及空间溢出效应[J]. 中国环境科学, 39(8): 3539-3548. DOI:10.3969/j.issn.1000-6923.2019.08.049
Hutchinson M F. 1998. Interpolation of rainfall data with thin plate smoothing splines: I two dimensional smoothing of data with short range correlation[J]. Geograph Inf Dec Anal, 2: 152-167.
Kioumourtzoglou M A, Schwartz J D, Weisskopf M G, et al. 2016. Long-term PM2.5 Exposure and Neurological Hospital Admissions in the Northeastern United States[J]. Environ Health Perspect, 124(1): 23-29. DOI:10.1289/ehp.1408973
孔凡秋. 2012. 基于空气污染物散布影响的高层集中区规划对策研究[D]. 哈尔滨: 哈尔滨工业大学
赖桃桃, 冯少荣. 2008. 聚类算法中的相似性度量方法研究[J]. 心智与计算, (2): 176-181.
Li X F, Li J. 2003. Data mining and knowledge discovery[M]. Beijing: Higher Education Press, 95-100.
Liu S H, Su H B, Tian J, et al. 2018. An analysis of spatial representativeness of air temperature monitoring stations[J]. Theoretical and Applied Climatology, 132(3/4): 857-865.
李玉玲, 刘红玉, 娄彩荣, 等. 2016. 江苏省PM2.5时空变化及土地利用影响研究[J]. 环境科学与技术, 39(8): 10-15+21.
罗贤, 许有鹏, 徐光来. 2012. 基于遥测雨量数据的地形对降水特性的影响研究[J]. 水土保持通报, 32(2): 90-95.
孟昭伟, 雷佩玉, 张同军, 等. 2020. 2015-2018年西安市两城区PM2.5质量浓度变化特征及气象影响因素[J]. 卫生研究, 49(1): 75-79+85.
Nappo C J, Caneill J Y, Furman R W, et al. 1982. Workshop on the representativeness of meteorological observations, June 1981, Boulder, Colo[J]. Bulletin of the American Meteorological Society, 63(7): 761-764. DOI:10.1175/1520-0477-63.7.761
彭霞, 郭冰瑶, 魏宁, 等. 2016. 近60a长三角地区极端高温事件变化特征及其对城市化的响应[J]. 长江流域资源与环境, 25(12): 1917-1926. DOI:10.11870/cjlyzyyhj201612016
Righini G, Cappelletti A, Ciucci A, et al. 2014. GIS based assessment of the spatial representativeness of air quality monitoring stations using pollutant emissions data[J]. Atmospheric Environment, 97(nov.): 121-129.
She Q N, Peng X, Xu Q L, et al. 2017. Air quality and its response to satellite-derived urban form in the Yangtze River Delta, China[J]. Ecological Indicators, 75: 297-306. DOI:10.1016/j.ecolind.2016.12.045
Snedecor G W, Cochran W G. 1968. Statistical Methods[J]. Journal of Educational and Behavioral Statistics, 19(3): 304-307.
Spangl W, Schneider J, Moosmann L, et al. 2007. Representativeness and classification of air quality monitoring stations[R]. Wien: Umweltbundesamt. 15-24
孙丹丹, 杨书运, 王体健, 等. 2019. 长三角地区城市O3和PM2.5污染特征及影响因素分析[J]. 气象科学, 39(2): 164-177.
Wang S F, Xu L, Ge S J, et al. 2020. Driving force heterogeneity of urban PM 2.5 pollution: Evidence from the Yangtze River Delta, China[J]. Ecological Indicators, 113. DOI:10.1016/j.ecolind.2020.106210
Wang Y, Song Z B, Pei-Linc W U, et al. 2009. A study on spatial clustering of urban function partition[J]. Areal Research and Development, 28(1): 27-31.
王绍强, 陈蝶聪, 周蕾, 等. 2013. 中国陆地生态系统通量观测站点空间代表性[J]. 生态学报, 33(24): 7715-7728.
吴蒙, 彭慧萍, 范绍佳, 等. 2015. 珠江三角洲区域空气质量的时空变化特征[J]. 环境科学与技术, 38(2): 77-82.
Xiao J F, Zhuang Q L, Beverly E L, et al. 2011. Assessing net ecosystem carbon exchange of U.S.terrestrial ecosystems by integrating eddy covariance flux measurements and satellite observations[J]. Agric For Meteorol, 151: 60-69. DOI:10.1016/j.agrformet.2010.09.002
Xiao X M, Zhang Q Y, Braswell B, et al. 2004. Modeling gross primary production of a deciduous broadleaf forest using satellite images and climate data[J]. Remote Sens Environ, 91: 256-270. DOI:10.1016/j.rse.2004.03.010
Xu G Y, Ren X D, Xiong K N, et al. 2020. Analysis of the driving factors of PM2.5 concentration in the air: A case study of the Yangtze River Delta, China[J]. Ecological Indicators, 202: 110.
徐保东, 李静, 柳钦火, 等. 2015. 地面站点观测数据代表性评价方法研究进展[J]. 遥感学报, 19(5): 703-718.
Ye L, Ou X J. 2019. Spatial-temporal analysis of daily air quality index in the Yangtze River Delta region of China during 2014 and 2016[J]. Chinese Geographical Science, 29(3): 382-393. DOI:10.1007/s11769-019-1036-0
Yu Z, San L, Zhou C S, et al. 2019. Analysis of PM2.5 concentrations in Heilongjiang Province associated with forest cover and other factors[J]. Journal of Forestry Research, 30(1): 269-276. DOI:10.1007/s11676-018-0640-7
Zhang X P, Gong Z Z. 2018. Spatiotemporal characteristics of urban air quality in China and geographic detection of their determinants[J]. Journal of Geographical Sciences, 28(5): 563-578. DOI:10.1007/s11442-018-1491-z
Zhou L, Zhou C, Yang F, et al. 2019. Spatio-temporal evolution and the influencing factors of PM2.5 in China between 2000 and 2015[J]. Journal of Geographical Sciences, 29(2): 253-270. DOI:10.1007/s11442-019-1595-0