环境科学学报  2016, Vol. 36 Issue (11): 4173-4183
广东省土壤镉含量影响因子解析与评估    [PDF全文]
孙慧1,2, 毕如田1, 袁宇志2, 柴敏2, 曹伏龙2,3, 张迁迁1, 郭治兴2    
1. 山西农业大学资源环境学院, 晋中 030800;
2. 广东省生态环境技术研究所, 广东省农业环境综合治理重点实验室, 广州 510650;
3. 广州大学地理科学学院, 广州 510006
摘要: 影响镉(Cd)含量的因子众多,包括自然影响因子和人为影响因子,而治理Cd污染首先应查明Cd污染来源及其影响因子,这对因地制宜制定Cd污染治理措施及指导相关产业布局具有重要意义.广东省地理状况复杂、经济发达,Cd含量分布区域间差异较大.因此,本文基于Cubist构建土壤Cd含量与相关影响因子关系模型,解析影响广东省土壤Cd含量的主要因子.结果表明:土壤pH值与土壤类型是影响广东省Cd含量最主要的因素,土壤Cd含量与土壤pH值呈正相关关系;赤红壤、砖红壤及紫色土中Cd含量相对较低,潮土、红壤、黄壤、水稻土及石灰土中Cd含量相对较高.Cd含量高值主要出现在第四纪、泥盆纪和石炭纪地质构造运动形成的土壤中.此外,植被指数、土壤粉粒、平均气温、高程、距道路及距河流距离也是影响广东省土壤Cd含量的主要因素.其中,土壤Cd含量与土壤粉粒、高程呈正相关关系,与植被指数、距道路距离、距河流距离呈负相关关系.本文研究结果可为土壤Cd污染治理提供科学的参考依据.
关键词: 土壤Cd含量     影响因子     模型     广东     Cubist    
Influence factors analysis and evaluation of soil Cd in Guangdong Province
SUN Hui1,2, BI Rutian1, YUAN Yuzhi2, CHAI Min2, CAO Fulong2,3, ZHANG Qianqian1, GUO Zhixing2    
1. College of Resources and Environment, Shanxi Agriculture University, Jinzhong 030800;
2. Guangdong Institute of Eco-Environment Science & Technology, Guangdong Key Laboratory of Integrated Pest Management in Agriculture, Guangzhou 510650;
3. School of Geographical Sciences, Guangzhou University, Guangzhou 510006
Supported by the Science and Technology Planning Project of Guangdong Province(No. 2014A040401059, 2015A030401068, 2015B070701017), the Science and Technology Tackled Projects of Shanxi(No. 20120311009-1) and the National Natural Science Fundation for Young Scholars (No.41601558)
Biography: SUN Hui(1991-),female,E-mail:sunhuisxau@gmail.com
*Corresponding author: E-mail:zxguo@163.com
Abstract: Cadmium (Cd) concentration is affected by numerous natural factors and human activities. It is very important to identify Cd sources and their affecting factors for optimizing pollution control, policy formulation and industries layout. Cd concentration is quite different within Guangdong Province because of the complicated geographical and economic conditions. Based on the method of Cubist, an optimal model was developed to analyze the major factors affecting the soil Cd concentrations in Guangdong Province. The results show that soil pH and soil type are the most significant factors influencing the concentrations of Cd in this region, and there is a positive correlation between the soil Cd concentrations and soil pH. Cd concentrations are relatively lower in the region of Latosolic red earths, Latosols and Purplish soils, and are higher in the region of Fluvo-aquic soils, Red earths, Yellow earths, Paddy soils and Limestone soils. On the other hand, Cd concentrations are relatively higher in the region of soils which formed from Quaternary, Devonian, and Carboniferous. Moreover, NDVI, silt fractions of soil, annual mean temperature, elevation, distance from the road, and distance from the river are also important factors. Positive correlations were observed between soil Cd concentrations and silt fractions of soil and elevation, while the correlations between soil Cd concentrations and NDVI, distance from the road, and distance from the river are negative. Our conclusions are useful for cadmium control in contaminated soils.
Key words: soil Cd concentration     affecting factors     model     Guangdong Province     Cubist    
1 引言(Introduction)

Cd是人体非必需元素,在自然界中常见以化合态的形式存在,一般含量很少,中国土壤Cd的自然背景值在0.20 mg·kg-1以下(周国华等,2005).然而,随着工农业的大规模发展,含有Cd的废弃物、废水、废气源源不断的输入,使得土壤中的Cd含量不断升高.据统计,全世界每年由于人为因素被排放到自然界中的Cd多达30000 t(曹树青等,2014).自20世纪50年代Cd污染在日本引起“骨痛病”以来(Yeung et al.,2005),Cd污染问题受到世界各国政府和人民的关注(Lark et al.,2006Mamat et al.,2014Mann et al.,2002Vega et al.,2009Das et al.,2011).研究表明,我国土壤Cd污染现状也极其严峻(周建军等,2014),Cd污染超标率已达7.0%(庄国泰,2015).近年来,Cd污染事件在我国频频爆发,公众对土壤Cd污染治理的呼声渐长.同样,土壤Cd污染问题也越来越受到广东各级政府与公众的关注,各界人士也对全省Cd污染的治理积极地出谋划策(Wang et al.,2014蔡美芳等,2014陈三雄,2012高园园,2014刘文华等,2014).

Cd含量分布状况因地而异,不同的自然背景(包括土壤性质、地形地貌、基岩性质等)对Cd的吸附、解析、聚集作用不同(李冰,2014刘琼峰,2013).探讨Cd污染来源及其影响因子,查清不同自然背景下的Cd含量分布特征及其影响因子,对因地制宜地制定Cd污染的治理措施(陈能场,2014)及指导相关产业布局具有重要的意义.国内外许多学者不断致力于识别、解析Cd污染源,评估Cd含量影响因子,对土壤中Cd来源问题及处理做了大量的工作(Iñigo et al.,2013Oporto et al.,2012Zhang et al.,2014Zhi et al.,2016曾希柏等,2013关天霞等,2011).目前,常用的判定Cd含量影响因子的方法有多元统计法(李勇等,2010吕建树等,2012王利军等,2011谢小进等,2010)、因子分析法(方明等,2013胥焘等,2014刘世梁等,2008)、聚类分析法(Micó et al.,2006谢文平等,2012朱恒亮等,2014赵晨等,2014)等.其中,多元统计法需要对数据做正态分布假设,因子分析法需要对数据进行标准化处理,聚类分析法对低维数据处理结果较好,但对于高维数据无法获得较好的结果.同时,这3种方法都对影响因子有一定的要求,且处理的维数有限,耗时较长.Cubist建模方法将样本空间划分为多个子空间,每个子空间用一个线性模型去拟合,可实现对总体空间的非线性关系模拟.该模型可以同时处理离散变量和连续变量,不需要对数据作正态分布或其他分布类型的假设,可以评价输入自变量的重要性,目前该方法已被广泛应用于环境科学及地理科学领域(Schwabacher et al.,2007).

基于此,本研究利用Cubist方法,以广东省土壤中Cd含量值作为评价对象,通过输入土地利用类型、土壤类型、气候类型、地质类型、土壤属性、DEM数据、TM影像数据及人口经济数据等多种自然和人为因子,构建Cd含量与影响因子的最优模型,从大量因子中快速解析出广东省Cd含量的影响因子,从而评估土壤Cd含量影响因子的重要性.

2 材料与方法(Materials and methods) 2.1 研究区概况

广东省位于中国大陆的最南端,界于北纬20°09′~25°31′、东经109°45′~117°20′之间(图 1).因地球内外力综合作用,使广东省地貌复杂多样,地势北高南低,包括山地、丘陵、台地、平原,其面积分别占全省土地总面积的33.7%、24.9%、14.2%和21.7%.广东省河流众多,主要分为六大流域:东江流域、粤桂琼沿海诸河流域、西江流域、北江流域、韩江流域、珠江三角洲河网区及闽东粤东沿海诸河流域,流域面积在100 km2以上的各级干支流614条(刘凤霞,2014).广东省地质时期主要在燕山期和第四纪,其面积分别占全省面积的27.75%和13.96%,其次是石炭纪和泥盆纪,共占全省面积的14.19%.广东省土壤类型以潴育水稻土及各种类型的红壤、黄壤为主,耕地土壤类型主要为赤红壤、水稻土、红壤、砖红壤;采矿用地土壤类型主要为红壤、赤红壤、水稻土;潮土、河积土田、洲积土田主要为建设用地.气候带类型由北到南为中亚热带、南亚热带及北热带,光热水资源充沛.

图 1 采样点分布图 Fig. 1 Spatial distribution of soil sampling sites
2.2 数据来源与处理

研究采用非均匀布点方法共采集表土层0~20 cm土壤样品1000个,覆盖了整个广东省,包括不同土地利用、不同土壤类型的样点,具体位置如图 1所示.每个样点从10 m×10 m正方形的4个顶点及中心点分别采取1 kg的土壤样本,混合均匀后选取1 kg土样代表该点的样品.同时记录采样点的土壤属性、土地利用方式、地形、当天天气情况、距主干道距离等属性.土样经盐酸-硝酸-高氯酸消解,Cd含量值按GB/T 17141-1997石墨炉原子吸收分光光度法测得,分析过程均加入国家标准土壤样品(GSS-1)进行分析质量控制.

研究选取43个自变量代表影响土壤Cd含量的自然因子和人为因子(表 1).这些因子值取自广东省DEM、统计年鉴、土壤属性、土壤类型、土地利用现状、气象、TM影像等数据及采样时同步测试和记录的其他土壤属性、地质、地形数据等.

表 1 模型变量描述 Table 1 Description of model variables

DEM数据来源于地理数据云SRTM DEM 90 m分辨率原始高程数据(数据来源于中国科学院计算机网络信息中心·科学数据中心),原始DEM数据经拼接、裁剪得到广东省DEM数据,经去除异常值、填挖处理得到无误差的广东省DEM数据.利用ArcGIS10.2.2及水文分析工具,从DEM数据中提取坡度信息、河网分级并划分流域,利用空间分析工具计算采样点与不同级别支流间的距离(袁宇志等,2015);搜集2006-2009年广东省统计年鉴数据,整理广东省2006-2009年各县人口数据、农业产值和工业产值数据,利用经济数据空间化方法(李飞等,2014)得到人口密度空间分布图、农业产值空间分布图及工业产值空间分布图;气候数据来源于中国气象科学数据共享服务网中国地面气候1981-2010年标准值年值数据集(中国气象局国家气象信息中心),从数据集中筛选出广东省36个气象站点,分别计算降水量、平均气温、日照时数和相对湿度的平均值,利用最佳插值方法得到全省降水量分布图、平均气温分布图、日照时数分布图、相对湿度分布图;TM影像(数据来源于中国科学院计算机网络信息中心·科学数据中心)由Landsat5成像传感器TM 获取,共7个波段,经辐射校正、拼接、裁剪得到广东省TM影像,在ENVI5.1下计算植被指数NDVI,并经监督分类得到广东省草地、耕地、建设用地、林地、其他用地数据.

将采样点数据与影响因子数据空间叠加,得到本研究的实验样本.计算结果表明,直接使用原始Cd含量值构建模型时,模型结果精度差,当对Cd含量值做对数转换后,模型精度大幅提高.因此,本研究首先对Cd含量值做对数转换处理.之后将样本随机分为两组,其中100个样本组作为独立验证数据集用来验证模型的精度,900个样本组用于构建模型.对两组数据进行K-S检验(Kolmogorov-Smirnov test)(Simard,2011),D=0.05,p=0.978,p值大于0.05,可以认为两个样本来自同一分布.

2.3 分析方法

研究选择的方法需要同时满足分类和回归.对于类别属性,如土壤类型、母质类型、土地利用类型等属性,需要一个分类的模型,将具有相同性质的点归为一类;对于定量变量,如pH值等属性,需要一个回归模型,将具有相同性质的值预测为一个连续的模型.因此,研究选择基于决策树的方法-Cubist方法,该方法类似于分类回归树(CART,Classification And Regression Tree)方法(Olshen et al.,1984),不同之处在于Cubist的叶节点是模型,而CART的叶节点仅仅是值.Cubist模型将CART的树转换成一系列的规则形式,每一个规则对应一个线性模型.从一棵树的顶点到每一个叶节点都简化成一系列的规则.Cubist的每一条规则的形式:If {条件},then 线性模型,例如:

式中,a是连续变量值,pqs是分类变量,b1、b2是线性模型的系数.如果与自变量因子相关的预测变量满足某一个条件,则对应使用相应的线性模型拟合.如果一个预测变量和其相关的自变量因子同时满足多个条件,此时用这些对应线性模型的均值代替.

Cubist回归树的构建与CART方法相似,也是通过递归的方式分割预测变量的空间,两种方法都在寻找一种策略以减少每个子集内部的变异性.然而分裂结点时,CART是用方差来度量误差,Cubist则使用的是标准偏差.Cubist分裂节点的误差表示为:

式中,T表示某一个节点上的训练样本,Ti表示这些样本分裂出的子集的样本,| |表示样本的个数.SD(T)和SD(Ti)表示的是TTi的标准偏差,表示每一个节点的分类误差.Cubist将每一次的误差降到最小,得到更合理的分类.

每一条规则设立条件的好处在于自动地让不同的线性模型拟合不同的变量空间的值,这样可以极大地提高预测精度并减少树的高度.Cubist模型结果同时还包括各个自变量的重要性,分为条件重要性和模型重要性.条件重要性和模型重要性由该变量在分类和构建线性模型时所解释样本数的多少计算,某一个自变量能解释的样本数越多表明对模型的贡献越大,对因变量的影响就越重要.

本文利用开源R语言3.2.2版本(GNU Project)及Cubist 0.0.18版本包(Rulequest Research),以Cd含量为因变量,43个影响因子为自变量,采用900个样本构建模型.最优模型由12条规则构成,此时相关系数为0.63,相对误差为0.82,小于1,表明模型结果可信(Rulequest Research,2016).用100个独立验证样本对模型进行精度验证,借助SPSS 22.0检验观测值和预测值之间的相关性,Kendall′s tau_b、Spearman′s rho及Pearson相关系数分别为0.486、0.655和0.716,其相关性在0.01水平显著,表明模型可以对Cd含量进行精确预测.

3 结果和讨论(Results and discussion) 3.1 Cd含量统计特征

表 2可知,1000个样本中,土壤Cd含量最小值为0.0002 mg·kg-1,最大值为6.056 mg·kg-1,均值为0.148 mg·kg-1,第10分位数为0.014 mg·kg-1,第90分位数为0.320 mg·kg-1,标准差为0.352 mg·kg-1,表明广东省Cd含量最大值与最小值差异显著,但基本分布在小于0.320 mg·kg-1的范围内.根据国家标准(国家环境保护局科技标准司,1996),当土壤pH值小于7.5(郭治兴等,2011)时,Cd含量值0.2 mg·kg-1是为保护区域自然生态,维持自然背景的土壤环境质量设定的限制值,属于一级标准,本文共有167个样点在一级标准范围内;0.3 mg·kg-1是为保障农业生产,维护人体健康设定的土壤限制值,属于二级标准,本文共有108个采样点超过国家二级标准;1.0 mg·kg-1是为保障农林业生产和植物正常生长设定的土壤临界值,本文共有15个采样点超过国家三级标准.

表 2 广东省土壤Cd含量值样点概况 Table 2 Sample survey of soil Cd in Guangdong Province
3.2 影响因子分析

研究模型结果见图 2表 3,模型结果中因子的重要性包括条件重要性和模型重要性.其中,影响因子的条件重要性决定Cd含量整体分布情况,其重要性从大到小为:土壤类型(81%)>土壤pH值(77%)>样点距一级支流的距离(43%)>地质纪(43%)>年均气温(37%)>人口密度(16%)>地下水位埋深(16%)>农业产值(12%)>土壤砂砾(11%)>土壤黏粒(6%).模型重要性决定影响因子对Cd含量局部的影响,其从大到小排序为:土壤pH值(99%)>植被指数(80%)>土壤粉粒(72%)>年均气温(65%)>土壤砂砾(59%)>高程(58%)>样点距三级支流距离(55%)=样点距交通干线距离(55%)>样点距一级支流距离(52%)>日照时数(51%)>样点距四级支流距离(43%)=人口密度(43%)>土壤黏粒(40%)>样点距四级支流距离(32%)=工业产值(32%)>降水量(30%)>坡度(23%)>相对湿度(19%).结果表明,土壤类型是决定广东省Cd含量整体分布的主要因子,土壤pH值是决定广东省Cd含量局部变化的主要因子,广东省Cd含量值主要受自然因素的影响.

图 2 影响因子的条件重要性(a)及模型重要性(b) Fig. 2 Conditions importance(a)and model importance(b)of impact factors

表 3 构成模型条件及公式 Table 3 Model conditions and formulas

土壤pH值对模型的贡献最大,除规则5的模型不受土壤pH影响外,其他所有规则的模型定义的土壤Cd含量均与土壤pH值呈正相关关系,表明土壤pH值是影响广东省土壤Cd含量局部变化的最主要因素.规则5采样点仅有13个,该规则条件中地下水位埋深较深,土壤pH值大于5.86,表明在当土壤pH值大于5.86、地下水位埋深较深时,广东省土壤Cd含量基本不受土壤pH的影响.

植被指数对模型的贡献度为80%,规则1、2、3、6、7、9、10共749个采样点,定义的Cd含量与植被指数相关,且均呈负相关关系.

土壤粉粒、土壤砂砾、土壤黏粒对模型的贡献度分别为72%、59%、40%,土壤粉粒对Cd含量的影响最大.规则1、2、3、6、7、10共673个采样点定义的Cd含量与土壤粉粒相关,且均呈正相关关系.规则1、2、3、6、9、10、11共551个采样点的Cd含量均与土壤砂砾相关,其中,规则1、2、3、10共379个采样点的Cd含量与土壤砂砾呈正相关关系,规则6、9、11共137个采样点的Cd含量与土壤砂砾呈负相关关系.规则2、8、9、10、12共370个采样点的Cd含量与土壤黏粒相关,其中,规则8、9、10、12的采样点的Cd含量与土壤黏粒呈正相关关系,但规则2的采样点的Cd含量与土壤黏粒呈负相关关系.

年均气温对模型的贡献度为65%,规则1、2、7、10、12共603个采样点定义的Cd含量与年均气温相关.其中,规则1、7、10、12定义的Cd含量与年均气温呈负相关关系,但规则2的131个采样点的Cd含量与年均气温呈正相关关系.

高程对模型的贡献度为58%,规则1、3、6、7、10共542个采样点的Cd含量与高程相关,且均与高程呈正相关关系.

与交通干线的距离对模型的贡献度为55%,规则1、6、7、9、10共513个采样点的Cd含量与交通干线的距离相关,且均呈负相关关系,道路交通产生的Cd污染沉降于土壤中造成道路附近土壤的污染(仝致琦等,2014).

样点距河流一、二、三、四级支流的距离对模型的贡献度分别为52%、43%、55%、32%,表明三级支流和一级支流对Cd含量的影响比其他支流更大.规则6、7共297个采样点的Cd含量与距四级支流距离相关,且呈负相关系.规则1、6、7、9、10共513个采样点的Cd含量与距三级支流的距离相关,且均呈负相关关系.规则6、7、9、11共339个采样点的Cd含量与距二级支流的距离相关,且均呈负相关关系.规则6、7、9、12共481个采样点的Cd含量与距一级支流的距离相关,但规则6、9共149个采样点的Cd含量与一级支流距离呈正相关关系,规则7、12共332个采样点的Cd含量与一级支流距离呈负相关关系.表 4表明,规则6、9的采样点均分布在距一级支流199.232 km之外,说明在距离一级支流较远时,距一级支流距离与Cd含量值呈正相关关系.规则6、7的采样点同时与距一、二、三、四级支流距离相关.

日照时数对模型的贡献度为51%,规则3、6、7、9共478个采样点的Cd含量与日照时数相关,规则3共105个采样点的Cd含量与日照时数呈负相关关系,规则6、7、9采样点的Cd含量与日照时数呈正相关关系.

人口密度与工业产值对模型的贡献度分别为43%、32%,表明人口密度和工业产值对局部Cd含量的影响所占比重比自然因素小.规则1、4、7、8、10共401个采样点的Cd含量值与人口密度相关,其中,规则1、7、8、10共391个采样点的Cd含量值与人口密度呈正相关关系,规则4的10个采样点Cd含量值与人口密度呈负相关关系,但规则4仅有10个采样点,人口密度不具代表性,存在预测的误差,因此总的来看,Cd含量与人口密度呈正相关关系.规则6、7共297个采样点的Cd含量与工业产值相关,且呈正相关关系.

降水量和相对湿度对模型的贡献很小,分别为30%、19%.规则2、6、9共280个采样点的Cd含量与降水量相关,规则2共131个采样点的Cd含量与降水量呈负相关关系,规则6、9共149个采样点的Cd含量值与降水量呈正相关关系.规则6、9、11共175个采样点的Cd含量值与相对湿度相关,且均呈正相关关系.

坡度对模型的贡献度为23%,规则1、3共217个采样点的Cd含量值与坡度相关,且均呈正相关关系.

3.3 不同Cd含量区影响因子分析

模型结果中各规则计算的Cd含量情况见图 3表 4,规则的划分、值的范围及误差均由Cubist工具计算.根据《GB 15618-1995 土壤环境质量标准》,把Cd含量划分为高、中、低3个级别进行影响因子分析.Cd含量值小于0.2 mg·kg-1为第一级别,包括规则1~10,这部分规则预测的采样点是广东省Cd含量的低值区;Cd含量均值0.2~0.3 mg·kg-1为第二级别,由规则11计算,这一规则预测的采样点是广东省Cd含量的中值区;Cd含量大于0.3 mg·kg-1是第三级别,大于0.3 mg·kg-1可以认为是广东省Cd含量的高值区,这一级别被认为是即将危害到人体健康的临界值,由规则12计算,可以看出,仅规则12计算的Cd含量均值超过国家二级标准.

图 3 经log转换模型得到的各规则下的Cd含量分位图 Fig. 3 Model of Cd concentration of each rule(by log conversion)

表 4 模型中各规则下的Cd含量情况 Table 4 Cd concentration of Cubist model
3.3.1 Cd含量低值区

规则1~10是广东省Cd含量的低值区,采样点数为799,其Cd含量均值均小于0.2 mg·kg-1,其中,由规则1~5所预测的Cd含量值最低(表 4),其均值均小于0.1 mg·kg-1.其中,规则4定义的Cd含量值最低,Cd含量值范围为0.00079~0.130 mg·kg-1,整体的Cd含量值均小于0.2 mg·kg-1,属于中等变异.规则1~4共358个采样点,其条件表明这些采样点都分布在同样的土壤类型中(赤红壤、砖红壤及紫色土).砖红壤主要位于广东省的西南角,紫色土在广东省所占面积很小,赤红壤面积最大横跨广东省东西部(图 4),表明广东省土壤整体Cd含量较低.

图 4 土壤类型分布图 Fig. 4 Distribution of soil type

规则6~10共428个采样点,Cd含量均值均大于0.1 mg·kg-1,与规则1~4不同,规则6、7、9的条件表明这些采样点都分布在潮土、红壤、黄壤、山地草甸土、水稻土、石灰土中.由于山地草甸土的采样点仅有一个且Cd含量值为0.0493 mg·kg-1,此处不予讨论.图 4表明,潮土和水稻土主要分布在广东省珠三角河网区及南部沿海地区,红壤、黄壤及石灰土主要分布在广东省北部北江流域,表明Cd含量高值区主要聚集在广东省的中北部和中南部地区.当土壤类型为潮土、红壤、黄壤、水稻土、石灰土时,Cd含量相对偏高.潮土受地下水运动的影响明显,Cd含量随雨水冲刷、河流冲刷聚集到潮土中造成潮土中Cd含量的升高;红壤、黄壤及水稻土是广东省主要耕作土壤,有机肥的大量施用会导致土壤Cd含量的升高(徐明岗等,2010);石灰土富含Ca、Mg等元素,导致土壤Cd在石灰土中的积累(宁晓波等,2009).

规则8是Cd含量低值区中预测的Cd含量值最高的部分,其预测的Cd含量均值为0.195 mg·kg-1,属于高等变异.规则8的条件表明,这些采样点位于由奥陶纪、白垩纪、寒武纪、燕山期、震旦纪、侏罗纪地质时期构造运动和母质类型形成的土壤中,相比于规则12,这些时期的地质作用形成的土壤中的Cd含量值相对较低.但规则8的条件中,采样点土壤水位埋深较浅,且土壤pH值大于5.86,因此,这部分土壤中的Cd含量极易聚集偏高.规则8预测的Cd含量值与土壤黏粒、土壤pH值及人口密度呈正相关关系.其中,土壤黏粒对规则8的Cd含量贡献最大,土壤黏粒每增加一个单位,则Cd含量增加1.93个单位.

3.3.2 Cd含量中值区

规则11预测的Cd含量值是广东省Cd含量的中值区,采样点数为26,均值为0.248 mg·kg-1,属于中等变异.规则11的条件表明,这些采样点分布在距离一级支流199.232 km外,其土壤类型为潮土、红壤、黄壤、山地草甸土、水稻土、石灰土,土壤pH小于5.86且土壤砂砾小于21.418%.表明潮土、红壤、黄壤、水稻土、石灰土中的Cd元素容易积累、Cd含量背景值高.相比于Cd含量均值相对较低的规则6区域,规则11区域土壤砂砾小于21.418%,表明土壤砂砾较小的区域,Cd含量值相对较高.土壤含石砾较少时,土壤黏粒和土壤粉粒较高,土壤对镉固定能力较强,土壤中的Cd元素容易聚集,可能造成Cd元素在土壤中的积累(章明奎等,1993).规则11预测的Cd含量与土壤pH值和相对湿度呈正相关关系,与距二级支流距离和土壤砂砾呈负相关关系.

3.3.3 Cd含量高值区

规则12预测的Cd含量值最高,其均值为0.514 mg·kg-1,超过国家标准中二级标准0.3 mg·kg-1,属于高度变异,有可能对人体健康造成危害.规则12的条件表明,这些采样点位于第四纪、二叠纪、加里东期、泥盆纪、三叠纪、石炭纪、下第三纪及喜马拉雅地质时期的地质作用和母质类型形成的土壤中.曾丽婷等(2014)的研究表明,在区域尺度上,土壤母岩是影响土壤Cd含量的主要因子.图 5表明,第四纪、泥盆纪和石炭纪所占面积最大,第四纪主要分布在珠江三角洲地区及南部沿海地区,泥盆纪和石炭纪主要位于北江流域.整体来看,第四纪、石炭纪和泥盆纪主要位于广东省中部地区包括北江流域和珠江三角洲河网区.赖启宏等(2006)研究发现,珠江三角洲冲积平原土壤镉高含量由第四纪的地质作用引起.第四纪海陆交互相沉积物、陆海交互相沉积物是Cd的积累层,表明在三角洲形成的过程中,海进、海退有利于Cd的聚集.石炭纪和泥盆纪有色金属矿产丰富是造成Cd聚集的主要原因.此外,规则12的条件中,采样点土壤水位总体来说相对较浅且土壤pH大于5.86.

图 5 地质类型分布图 Fig. 5 Distribution of geological type

规则12中,Cd含量值与土壤粉粒呈正相关关系,与距一级支流距离及平均气温成负相关关系.章明奎等(1993)的研究表明,土壤粉粒部分具有不可忽略的阳离子交换能力,对土壤阳离子交换量有一定的作用,土壤阳离子交换量与土壤Cd含量呈显著相关性.在规则12中,土壤Cd含量与其到河流一级支流的距离呈负相关关系,可能利用河流湖泊水灌溉或河流湖泊水携带的Cd含量偏高(庄国泰,2015),对河流周边的土壤造成了污染.规则12定义的Cd含量值相对较高,容易造成Cd污染,因此,在规则12定义的区域内,注意尽量避免使用河流湖泊水灌溉,或者对河流湖泊水进行处理之后再使用可以降低土壤中的Cd含量;另一方面,通过植被修复也可以降低Cd的含量.规则7、10、12定义的Cd含量均与年均气温呈负相关关系,尤其是规则12所定义的Cd含量最高.

4 结论(Conclusions)

本文通过现场采集、统计分析、空间运算等方法获取43个变量,采用Cubist工具构建了广东省Cd含量模型,分析其空间分布特征和影响因子.结果发现:

1) 广东省Cd含量的整体分布情况主要取决于土壤类型,赤红壤、砖红壤及紫色土中的Cd含量值相对较低,潮土、红壤、黄壤、水稻土及石灰土中的Cd含量相对较高.土壤pH值是决定Cd含量局部变化的主要因子,且与Cd含量值呈正相关关系.

2) 广东省整体Cd含量相对较低,大部分地区Cd含量均低于国家二级标准.Cd含量高值主要分布在省内北江流域和珠江三角洲河网区,这些区域的土壤由第四纪、泥盆纪和石炭纪地质构造运动形成.广东省高值区的Cd含量与距河流一级支流距离、年均气温呈负相关关系,与土壤pH值、土壤黏粒呈正相关关系.

3) 解析Cd含量局部变化情况的前5位连续变量重要性排序为:年均气温>样点距河流一级支流距离>植被指数>土壤粒径>地形,且与植被指数、距道路距离、距河流距离呈负相关关系,与土壤粉粒、高程呈正相关关系.

本研究选的取影响土壤中Cd含量的因子数量较多,由此可能带来的“噪声”对模型精度有一定的影响,在后续工作中应当继续精炼因子数量,提高模型精度.同时,本项工作对所有Cd含量水平建模,在下一步工作中应当对Cd含量高值区的影响因子进行研究,作出空间预测,有针对性地探讨Cd污染的来源识别并提出相应污染治理措施.

参考文献
[1] 蔡美芳, 李开明, 谢丹平, 等.2014. 我国耕地土壤重金属污染现状与防治对策研究[J]. 环境科学与技术 , 2014, 37 (12) : 223–230.
[2] 曹树青,陈键,阳立波,等.2014.甘露糖在提高植物耐镉及镉积累以及在修复镉污染土壤中的应用[P].中国,A01B79/02,B09C1/00,CN104249075 A.2014-12-31
[3] 陈能场.2014.土壤重金属污染治理需因地制宜[OL].中国生态修复网.2014-12-1.http://er-china.com/.
[4] 陈三雄.2012.广东大宝山矿区水土流失特征及重金属耐性植物筛选[D].南京:南京林业大学.1-17 http://cdmd.cnki.com.cn/article/cdmd-10298-1012446156.htm
[5] Das S K, Grewal A S, Banerjee M. 2011. A brief review: Heavy metal and their analysis[J]. Organization , 11 (1) : 13–18.
[6] 方明, 吴友军, 刘红, 等.2013. 长江口沉积物重金属的分布、来源及潜在生态风险评价[J]. 环境科学学报 , 2013, 33 (2) : 563–569.
[7] 高园园.2014.纳米零价铁强化植物修复电子垃圾污染土壤的效果和机理[D].天津:南开大学.45-48 http://cdmd.cnki.com.cn/article/cdmd-10055-1015531311.htm
[8] 关天霞, 何红波, 张旭东, 等.2011. 土壤中重金属元素形态分析方法及形态分布的影响因素[J]. 土壤通报 , 2011, 22 (2) : 503–512.
[9] 郭治兴, 王静, 柴敏.2011. 近30年来广东省土壤pH值的时空变化[J]. 应用生态学报 , 2011, 22 (2) : 425–430.
[10] 国家环境保护局科技标准司.1996.GB 15618-1995土壤环境质量标准[S].北京:中国标准出版社
[11] Iñigo V, Andrades M S, Alonso-Martirena J I, et al. 2013. Spatial variability of cadmium and lead in natural soils of a humid mediterranean environment: La rioja, Spain[J]. Archives of Environmental Contamination and Toxicology , 64 (4) : 594–604. DOI:10.1007/s00244-012-9869-x
[12] 赖启宏, 杜海燕, 方敬文, 等.2006. 珠江三角洲冲积平原土壤镉高含量区形成原因[J]. 农业环境科学学报 , 2006, 24 (4) : 746–750.
[13] Lark R M, Bellamy P H, Rawlins B G. 2006. Spatio-temporal variability of some metal concentrations in the soil of eastern England and implications for soil monitoring[J]. Geoderma , 133 (3) : 363–379.
[14] 李冰.2014.成都平原农田土壤镉污染成因与阻控技术研究[D].杨凌:西北农林科技大学.16-52
[15] 李飞, 张树文, 杨久春, 等.2014. 社会经济数据空间化研究进展[J]. 地理与地理信息科学 , 2014, 30 (4) : 102–107.
[16] 李勇, 周永章, 窦磊, 等.2010. 基于多元统计和傅立叶和谱分析的土壤重金属的来源解析及其风险评价[J]. 地学前缘 , 2010, 17 (4) : 253–261.
[17] 刘凤霞.2014. 广东年鉴· 2014 简本[J]. 广东史志 , 2014 (5) : 54–54.
[18] 刘琼峰.2013.长沙城郊农田土壤铅镉的空间变异、影响因素与评价研究[D].长沙:湖南农业大学.66-71
[19] 刘世梁, 崔保山, 温敏霞, 等.2008. 路域土壤重金属含量空间变异的影响因子[J]. 环境科学学报 , 2008, 28 (2) : 253–260.
[20] 刘文华, 李媛媛, 赵秋香, 等.2014. 珠三角农用地土壤重金属污染治理修复研究实践与展望[J]. 环境科技 , 2014, 27 (6) : 32–37.
[21] 吕建树, 张祖陆, 刘洋, 等.2012. 日照市土壤重金属来源解析及环境风险评价[J]. 地理学报 , 2012, 67 (7) : 971–984.
[22] Mamat Z, Yimit H, Ji R Z A, et al. 2014. Source identification and hazardous risk delineation of heavy metal contamination in yanqi basin, northwest china[J]. Science of the Total Environment , 493 : 1098–1111. DOI:10.1016/j.scitotenv.2014.03.087
[23] Mann S S, Rate A W, Gilkes R J. 2002. Cadmium accumulation in agricultural soils in Western Australia[J]. Water,Air,and Soil Pollution , 141 (1) : 281–297.
[24] Micó C, Recatalá L, Peris M, et al. 2006. Assessing heavy metal sources in agricultural soils of a European Mediterranean area by multivariate analysis[J]. Chemosphere , 65 (5) : 863–872. DOI:10.1016/j.chemosphere.2006.03.016
[25] 宁晓波, 项文化, 方晰, 等.2009. 贵阳花溪区石灰土林地土壤重金属含量特征及其污染评价[J]. 生态学报 , 2009, 29 (4) : 2169–2177.
[26] Olshen R A, Breiman L, Friedman J, et al. 1984. Classification and Regression Trees[M]. New York: Chapman and Hall .
[27] Oporto C, Smolders E, Vandecasteele C. 2012. Identifying the cause of soil cadmium contamination with Monte Carlo mass balance modelling: A case study from Potosi, Bolivia[J]. Environmental Technology , 33 (5) : 555–561. DOI:10.1080/09593330.2011.586054
[28] 仝致琦, 段海静, 阮心玲, 等.2014. 路旁土壤公路源重金属含量空间分布数值模型的探讨[J]. 环境科学学报 , 2014, 34 (4) : 996–1002.
[29] Rulequest Research.2016. An overview of cubist [OL].2016-01-30.https://www.rulequest.com/cubist-unix.html.
[30] Schwabacher M, Langley P, Potter C, et al. 2007. Discovering Communicable Models from Earth Science Data//Computational Discovery of Scientific Knowledge[M]. Berlin Heidelberg: Springer: 138 -157.
[31] Simard R, L'Ecuyer P. 2011. Computing the two-sided Kolmogorov-Smirnov distribution[J]. Journal of Statistical Software , 39 (11) : 1–18.
[32] Vega F A, Matías J M, Andrade M L, et al. 2009. Classification and regression trees (carts) for modelling the sorption and retention of heavy metals by soil[J]. Journal of Hazardous Materials , 167 (1/3) : 615–624.
[33] 王利军, 卢新卫, 雷凯, 等.2011. 宝鸡市街尘重金属元素含量、来源及形态特征[J]. 环境科学 , 2011, 32 (8) : 2470–2476.
[34] Wang Y T, Björn L O. 2014. Heavy metal pollution in Guangdong province, china, and the strategies to manage the situation[J]. Frontiers in Environmental Science , 2 (9) : 1–12.
[35] 谢文平, 王少冰, 朱新平, 等.2012. 珠江下游河段沉积物中重金属含量及污染评价[J]. 环境科学 , 2012, 33 (6) : 1808–1815.
[36] 谢小进, 康建成, 李卫江, 等.2010. 上海宝山区农用土壤重金属分布与来源分析[J]. 环境科学 , 2010, 31 (3) : 768–774.
[37] 胥焘, 王飞, 郭强, 等.2014. 三峡库区香溪河消落带及库岸土壤重金属迁移特征及来源分析[J]. 环境科学 , 2014, 35 (4) : 1502–1508.
[38] 徐明岗, 武海雯, 刘景.2010. 长期不同施肥下我国3种典型土壤重金属的累积特征[J]. 农业环境科学学报 , 2010, 29 (12) : 2319–2324.
[39] Yeung A T, Hsu C. 2005. Electrokinetic remediation of cadmium-contaminated clay[J]. Journal of Environmental Engineering , 131 (2) : 298–304. DOI:10.1061/(ASCE)0733-9372(2005)131:2(298)
[40] 袁宇志, 张正栋, 蒙金华.2015. 基于Swat模型的流溪河流域土地利用与气候变化对径流的影响[J]. 应用生态学报 , 2015, 26 (4) : 989–998.
[41] 曾丽婷, 陈永康, 王学松.2014. 城市表层土壤重金属与磁化率的多尺度空间变异分析[J]. 环境科学学报 , 2014, 34 (4) : 987–995.
[42] 曾希柏, 徐建明, 黄巧云, 等.2013. 中国农田重金属问题的若干思考[J]. 土壤学报 , 2013, 50 (1) : 186–194.
[43] 章明奎, 朱祖祥.1993. 粉粒对土壤阳离子交换量的影响[J]. 土壤肥料 , 1993 (4) : 41–43.
[44] Zhang X Y, Chen D M, Zhang T Y, et al. 2014. Assessment of cadmium (Cd) concentration in arable soil in china[J]. Environmental Science and Pollution Research , 22 (7) : 4932–4941.
[45] 赵晨, 董世魁, 刘世梁, 等.2014. 漫湾大坝上下游沉积物重金属与营养元素分布特征及环境风险评价[J]. 环境科学学报 , 2014, 34 (9) : 2417–2425.
[46] Zhi Y Z, Li P, Shi J C, et al. 2016. Source identification and apportionment of soil cadmium in cropland of eastern china: A combined approach of models and geographic information system[J]. Journal of Soils and Sediments , 16 (2) : 467–475. DOI:10.1007/s11368-015-1263-7
[47] 周国华, 秦绪文, 董岩翔.2005. 土壤环境质量标准的制定原则与方法[J]. 地质通报 , 2005, 24 (8) : 722–727.
[48] 周建军, 周桔, 冯仁国.2014. 我国土壤重金属污染现状及治理战略[J]. 中国科学院院刊 , 2014, 29 (3) : 315–320.
[49] 朱恒亮, 刘鸿雁, 龙家寰, 等.2014. 贵州省典型污染区土壤重金属的污染特征分析[J]. 地球与环境 , 2014, 42 (4) : 505–512.
[50] 庄国泰.2015. 我国土壤污染现状与防控策略[J]. 中国科学院院刊 , 2015, 30 (4) : 477–483.