2. 国际黑土地协会, 辽宁 沈阳 110034;
3. 中国地质调查局 沈阳地质调查中心, 辽宁 沈阳 110034;
4. 中国科学院遥感与数字地球研究所, 北京 100094;
5. 华中师范大学 城市与环境科学学院, 湖北 武汉 430079
2. International Black Soils Society, Shenyang 110034, China;
3. Shenyang Center of Geological Survey, CGS, Shenyang 110034, China;
4. Institute of Remote Sensing and Digital Earth, CAS, Beijing 100094;
5. School of Urban and Environmental Sciences, Central China Normal University, Wuhan 430079, China
土壤成分信息的定量提取是实现精准农业的前提.快速、准确地获取土壤中养分的含量对指导农业生产以及土壤环境监测等具有重要意义.土壤的光谱反射特性与理化性质密切相关,因此高光谱遥感极高的光谱分辨率在土壤组分含量的研究中具有绝对的优势[1].
有机质、全氮、全磷和全硫是衡量土壤肥力的重要指标.目前国内外对有机质、全氮的光谱特性和反演模型开展了大量研究,并取得了很好的研究成果,而对全磷和全硫的光谱研究相对较少. Dalal等[2]发现近红外(1100~2500 nm)探测有机碳与全氮的最佳波段组合分别是1744、1870、2052 nm和1702、1870、2052 nm. Conforti等[3]运用偏最小二乘回归建立了可见光-近红外范围内的土壤光谱反射率与有机质含量的关系模型,预测精度R2达到0.84,RPD值高于2.4.于雷等[4]基于400~2500 nm的全波段和显著性波段建立了江汉平原土壤有机质的预测模型,发现全波段的连续统去除变换预测精度最为突出,其模型的决定系数R2和RPD值分别为0.84和2.58.张东辉等[5]通过航空高光谱成像系统(CASI)获取了380~1500 nm光谱数据,利用多种光谱变换方法分别建立了有机质、全氮和全磷的反演模型,证明多元散射校正变换后的光谱对有机质和全氮含量最为敏感,预测样本的决定系数分别为0.748和0.673,倒数对数变换对全磷的预测效果最好,决定系数为0.631.
这些研究成果表明,利用高光谱预测土壤养分含量具有切实可行性,但土壤光谱受成土母质、组分含量、主导矿物等多个因素影响[6],在特定区域建立的反演模型不具有推广性,且硫作为作物生长发育不可缺少的营养元素,目前还尚未开展硫的光谱反演研究.故本文以建三江创业农场为研究区,对土壤样本的反射光谱和养分含量进行分析,尝试对土壤光谱进行一阶微分、倒数对数、倒数一阶微分、多元散射校正和连续统去除变换,通过相关性分析挑选特征波段,运用多元逐步回归、偏最小二乘回归和BP神经网络分别建立土壤有机质、全氮、全磷和全硫高光谱的预测模型,并对模型进行验证,确定光谱变换与建模方法最优的组合形式,为研究区土壤养分含量的快速测定提供依据.
1 材料与方法 1.1 样品采集与分析研究区位于黑龙江省建三江垦区创业农场,以水稻种植为主,是国家重要商品粮基地之一.区内地势低平,土地肥沃,土壤类型主要有白浆土、草甸土、沼泽土.本次研究共采集表层0~20 cm混合土样117个,样本采集点分布情况如图 1所示.土样经风干、研磨、过筛等处理后,将样品等分为两份,一份用于光谱测量,另一份用于土壤养分含量测定.有机质(SOM)、全氮(TN)、全磷(TP)、全硫(TS)含量分别采用重铬酸钾容量-外加热法、凯氏蒸馏法、氢氧化钠熔融-钼锑抗比色法、硝酸镁氧化-硫化钡比浊法测定[7].测定结果的统计分析如表 1所示.
地面光谱数据采用美国ASD公司生产的FieldSpec 4便携式光谱仪获取,波长范围在350~2500 nm之间,采样间隔在350~1000 nm为1.3 nm,在1000~2500 nm为2 nm,重采样间隔1 nm,共2151个波段.在黑暗、无自然光的实验室环境内进行土壤光谱的测量,将能提供平行光线的卤素光源(12 V,50 W)放置在距土壤样品60 cm、天顶角30°位置,以减小阴影的影响.光谱数据经过漫反射标准参考板校正得到反射率,每个样品测10次光谱,取其算术平均值作为该样品的标准光谱.为消除光谱的噪声,对平均后的反射率光谱分别采用了移动平均滤波、中值滤波、Savitzky Golay滤波3种方法进行平滑.在滤波窗口大小为9时,中值滤波在平滑程度和光谱特征保持能力较为出色[8],故采用窗口为9的中值滤波对标准光谱进行平滑去噪.
由于土壤光谱受成土母质、理化成分等多方面的影响,光谱特性与成分含量的关系难以准确建立,加之黑土反射率普遍较低,吸收特征不明显,需进行光谱变换增强特征波段信息,提高建模精度[9].结合前人的研究成果[10-11],本研究在原始反射率(reflectance,R)的基础上,进行了一阶微分(first derivative,FD)、倒数的对数(reciprocal logarithm,RL)、倒数一阶微分(first derivative of reciprocal,FDR)、多元散射校正(multivariate scatter correction,MSC)和连续统去除(continuum removal,CR)变换(图 2).
本研究采用多元逐步回归和偏最小二乘回归两种线性建模分析方法.多元逐步回归(stepwise multiple linear regression,SMLR)是研究多个变量之间相互依赖关系的优化方法,通过引入变量的筛选机制,达到建立最优回归方程的目的.多元逐步回归普遍应用于光谱分析领域,其基本思想是按方差贡献度逐一挑选重要变量引入回归方程.当新变量的选入使先前变量的预测误差增大时,则将其剔除;而先前剔除的变量在新变量引入后变得显著时,则可以重新选入,直到没有再引入的变量或可剔除的变量为止,使回归方程中始终只保留重要的变量.
偏最小二乘回归(partial least squares regression,PLSR)是集多元线性回归分析、典型相关分析和主成分分析等方法于一体的全自变量线性回归模型,较好地解决了自变量多重共线性和样本数少于变量数等问题.在光谱建模过程中,PLSR能有效辨识光谱信息与噪声,降低光谱维数,减少数据冗余[12]. PLSR的重点在于主成分个数的确定,主成分的个数会直接影响模型的稳健性.本研究采用交叉验证的方法确定最佳主成分个数,有效地避免了过拟合和欠拟合状况的出现.
1.3.2 非线性模型非线性模型包括随机森林、支持向量机和人工神经网络等多种建模方法.本研究采用人工神经网络中最具代表性的BP神经网络算法参与非线性模型的建立. BP神经网络(back propagation neural network,BPNN)由输入层、隐含层和输出层组成,每层包含若干节点,通过自学习计算出每个节点的权重,得出训练结果.将训练结果与预想结果进行误差分析,若训练结果不能满足期望,则修改权值来减小误差,通过不断迭代使训练结果与预想结果一致,达到误差最小化.
1.4 精度评价本研究选用决定系数(determination coefficients,R2)、均方根误差(root mean squared error,RMSE)和相对分析误差(relative percent deviation,RPD)对两种建模方法的建模集和验证集的精度进行评价. R2用来评价回归模型系数的拟合优度,取值范围在0~1之间,越接近1,说明拟合程度越好. RMSE用来衡量预测值与观测值之间的偏差,RMSE越小,说明预测效果越好. RPD是样本观测值的标准差与均方根误差比,用来衡量模型的预测能力.一般认为RPD≥2时,模型具有极好的定量预测能力;当1.4≤RPD<2时,表明模型可粗略估算样品含量;当RPD<1.4时,表明模型无法对样品进行预测.
2 结果与分析 2.1 养分含量与光谱指标的相关性分析分别计算土壤有机质、全氮、全磷、全硫含量与反射率光谱及其变换形式的相关系数,计算结果如图 3所示.将通过α=0.01显著性检验的波段选作特征波段,参与后续的建模.
从图 3中可以看出,反射率光谱(R)经过多种变换与有机质、全氮和全硫含量间的相关性明显增强,而与全磷含量的相关性变化微弱.有机质与全氮含量的较强相关性,致使其含量与光谱的相关趋势具有相似性. R与各养分含量均呈负相关,相关系数曲线平滑,整体相关性不强,在350~1300 nm的部分宽波段达到极显著相关;FR增强了有机质和全氮在550 nm、1250 nm、1600 nm附近的相关性,最大相关系数超过0.4,与全硫相关系数较高的峰值出现在1400、1915、2200和2220 nm四个波段,在1400 nm相关系数达到0.63;RL与各养分含量呈正相关,与R的相关系数绝对值变化趋势基本一致;FDR在600~1700 nm之间与有机质、全氮、全硫存在多个极显著相关的宽波段,与有机质、全氮、全硫的最大相关系数均达到0.5;MSC与各养分的相关系数变化最大,在350~550 nm与各养分含量均达到极显著正相关,而在600 nm附近相关性陡降,呈现极显著负相关,在1700 nm后存在相关性较高的宽波段,其中在500 nm附近与有机质和全氮的相关性分别高达0.71和0.64;CR与有机质、全氮、全硫在450~950 nm都存在高相关性的宽波段,且在2200 nm附近与各养分含量都有相关性峰值,该波段主要存在Al-OH黏土矿物的吸收带,可见CR变换后增强了此处的吸收特征.
2.2 养分含量分析及样本筛选利用SPSS软件对土壤有机质、全氮、全磷和全硫含量进行相关性分析,相关系数矩阵如表 2所示.结果显示,各土壤养分间具有较强的正相关性,均在0.01水平上显著相关.其中有机质与全氮的相关系数高达0.96,其余含量间的相关系数也在0.56以上,表明这几种土壤养分存在明显的依附关系.
土壤样品的采集、加工、化学分析会带来不同程度的误差.为减少异常样本对后续建模的影响,采用箱型图对异常值进行剔除.将剔除后的土壤样本按照各养分含量由高到低进行排序,等间隔挑选出2/3作为建模集,其余作为验证集.将挑选的特征波段作为自变量,对应样本的土壤养分含量作为因变量,带入各建模方法中进行回归分析.
2.3 线性模型回归分析将基于不同光谱指标挑选的特征波段与对应的养分含量带入SMLR和PLSR中进行回归分析,并利用验证集样本对建立的模型进行精度评价,分析结果如表 3所示. SMLR与PLSR分别在SPSS和Matlab软件中实现.为了增强PLSR模型的预测能力,本研究采用了10次交叉检验来确定最佳主成分个数.
在SMLR模型中,经过MSC变换后的光谱对有机质和全氮进行预测时效果最好,建模集与验证集的R2均大于0.6,但RPD值小于2,表明只能对有机质和全氮含量进行粗略估测,而对于全磷和全硫含量,6种光谱指标的RPD值均未达到1.4,无法对其含量进行预测.
在PLSR模型中,基于光谱变换建立的模型相较于原始反射率有效提高了有机质含量的反演精度,FD、FDR、MSC和CR的建模集R2都在0.96以上,同时检验精度也较理想.其中MSC和CR的PRD值在2.5以上,说明对有机质含量具有极好的定量预测能力;MSC对全氮含量的预测精度达到0.75,且RPD值达到2.06,表明MSC变换对全氮也具有定量预测的能力;全磷含量的预测效果依然不理想,6种光谱指标预测模型的RPD值均小于1.4,无法有效预测全磷含量;光谱变换形式对全硫含量的预测效果也同样优于原始反射率,其中FDR的预测效果最为理性,R2与RPD值分别达到0.65和1.68.
2.4 非线性模型回归分析采用一个输出节点的经典三层BP神经网络对土壤养分含量进行预测,网络参数的选择对模型至关重要.根据前人的经验和多次试验[13-14],模型主要参数设置如表 4所示.隐含层节点个数根据下式确定:
$ h=\sqrt{m+n}+a $ |
式中:h为隐含层节点,m为输入层节点数(即特征波段的数量),n为输出层节点,a为1~10的常数.
取步长为2(a=2,4,6,8,10),同时隐含层传递函数分别选择logsig和tansig,对每种光谱指标建立10个子网模型用于对各样本的土壤养分含量进行预测,取其验证精度最优的子网对各养分含量进行预测,预测结果如表 5所示.有机质和全氮在隐含层传递函数为logsig、光谱指标分别为一阶微分和多元散射校正时,验证集的RPD值大于2,说明BP神经网络具有通过土壤光谱对有机质和全氮含量定量预测的能力.由于最优子网模型对土壤全磷和全硫含量的验证集RPD均小于2,表明BP神经网络只能对二者的含量进行粗略估算,而无法定量预测.
依据上述分析,6种光谱指标基于PLSR和BPNN建立的SOM、TN、TP和TS反演模型的预测精度相较于SMLR均有所提高. SMLR只能粗略估算SOM、TN的含量,无法预测TP和TS的含量,而PLSR具有定量预测SOM、TN含量和粗略估算TS含量的能力,说明PLSR经过自变量信息提取后,减少了数据冗余,光谱与土壤养分含量的关系显著提高,预测模型的精度也得到提升,但仍无法预测TP含量.非线性模型BPNN的SOM和TN预测能力较PLSR略微下降,而TP和TS的预测精度有所提升,具备了对TP含量粗略估算的能力.图 4是综合3种建模方法选取的最优预测模型对土壤养分含量的预测散点图,模型越理想,样本点越聚合在1: 1直线的两侧.
为减少水分等理化性质对土壤光谱的影响,突出土壤养分的光谱特性,本研究采用了土壤室内反射率光谱.采用中值滤波去除光谱噪声后,进行了一阶微分、倒数对数、倒数一阶微分、多元散射校正和连续统去除变换来增强光谱特征.基于6种光谱指标分别对土壤有机质、全氮、全磷和全硫含量进行了相关性分析并提取了特征波段,运用线性回归方法SMLR、PLSR和非线性回归方法BPNN分别对有机质、全氮、全磷和全硫含量进行定量预测研究.
结果表明:1)PLSR和BPNN模型对土壤养分含量的整体预测能力优于SMLR模型,究其原因是算法特性存在差别.相比SMLR将使误差增大的特征波段剔除的算法特点,PLSR和BPNN模型包含了全部的特征波段,保留了更加丰富的光谱信息,因而模型具有更高的精度. 2)各土壤养分与反射率在可见光-近红外波段范围内均呈负相关,在350~1300 nm的部分宽波段达到极显著相关,经光谱变换后相关性有所增强.其中MSC与有机质在1200 nm、CR与全硫在2220 nm的相关系数绝对值达到0.8,且利用SMLR和PLSR两种方法预测土壤养分含量效果最优的光谱变换形式具有一致性,表明适当的光谱变换能够有效增强有价值波段信息,提高建模精度. 3)使用PLSR与BPNN两种方法建立的有机质和全氮含量最优预测模型的RPD值均大于2,建立的全硫含量预测模型的RPD值大于1.4,表明可利用可见光-近红外光谱在研究区内实现土壤有机质和全氮含量的定量预测以及全硫含量的粗略估算. 4)使用3种方法建立的6种光谱指标的全磷含量反演模型均不理想,仅有CR-BPNN模型达到了粗略估算全磷含量的标准,其余模型均不具有对全磷含量的预测能力,这与薛利红等[15]在综合土壤样本下建立的全磷预测模型不理想的结论一致,而周鼎浩等[16]和张婷婷等[17]针对特定土壤类型的全磷反演获得了较好的效果,这表明全磷的预测模型可能存在土壤类型的适用性差异.由于全磷在土壤中多以无机态存在,没有明显的特征吸收峰,同时研究区内存在白浆土、草甸土等多种黑土类型,土壤性质多样且光谱反射率普遍偏低,经过光谱变换后,各光谱指标与全磷含量的相关性依然较低,造成了全磷含量的预测效果不佳.
研究还发现,土壤养分含量间具有较强的相关性,与有机质相关性由高到低分别是全氮、全硫、全磷,相关系数分别为0.96、0.82、0.59,这与3种养分的预测精度排序一致.国内外大量研究表明,土壤有机质在可见光-近红外波段范围内具有明显的光谱吸收特性[18-20],且有机质的光谱反演研究是土壤成分预测中最为成功和稳定的.根据有机质与全磷和全硫的赋存关系,开展基于有机质的全磷和全硫的间接预测,以提高其预测精度,有待于进一步研究.
[1] |
史舟. 土壤地面高光谱遥感原理与方法[M]. 北京: 科学出版社, 2014: 6-7.
|
[2] |
Dalal R C, Henry R J. Simultaneous determination of moisture, organic carbon, and total nitrogen by near infrared reflectance spectrophotometry[J]. Soil Science Society of America Journal, 1986, 50(1): 120-123. DOI:10.2136/sssaj1986.03615995005000010023x |
[3] |
Conforti M, Buttafuoco G, Leone A P, et al. Studying the relationship between water-induced soil erosion and soil organic matter using Vis NIR spectroscopy and geomorphological analysis:a case study in southern Italy[J]. CATENA, 2013, 110: 44-58. DOI:10.1016/j.catena.2013.06.013 |
[4] |
于雷, 洪永胜, 耿雷, 等. 基于偏最小二乘回归的土壤有机质含量高光谱估算[J]. 农业工程学报, 2015, 31(14): 103-109. DOI:10.11975/j.issn.1002-6819.2015.14.015 |
[5] |
张东辉, 赵英俊, 秦凯, 等. 光谱变换方法对黑土养分含量高光谱遥感反演精度的影响[J]. 农业工程学报, 2018, 34(20): 141-147. DOI:10.11975/j.issn.1002-6819.2018.20.018 |
[6] |
徐彬彬. 土壤剖面的反射光谱研究[J]. 土壤, 2000, 32(6): 281-287. DOI:10.3321/j.issn:0253-9829.2000.06.001 |
[7] |
杜森, 高祥照. 土壤分析技术规范[M]. 2版. 北京: 中国农业出版社, 2006: 166-167.
|
[8] |
黄明祥, 王珂, 史舟, 等. 土壤高光谱噪声过滤评价研究[J]. 光谱学与光谱分析, 2009, 29(3): 722-725. DOI:10.3964/j.issn.1000-0593(2009)03-0722-04 |
[9] |
刘焕军, 张柏, 赵军, 等. 黑土有机质含量高光谱模型研究[J]. 土壤学报, 2007, 44(1): 27-32. DOI:10.3321/j.issn:0564-3929.2007.01.005 |
[10] |
陈奕云, 齐天赐, 黄颖菁, 等. 土壤有机质含量可见-近红外光谱反演模型校正集优选方法[J]. 农业工程学报, 2017, 33(6): 107-114. |
[11] |
卢艳丽.东北平原土壤有机质及主要养分高光谱定量反演[D].北京: 中国农业科学院, 2007. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y1422793
|
[12] |
汪大明, 秦凯, 李志忠, 等. 基于航空高光谱遥感数据的黑土地有机质含量反演:以黑龙江省建三江地区为例[J]. 地球科学, 2018, 43(6): 2184-2194. |
[13] |
沈润平, 丁国香, 魏国栓, 等. 基于人工神经网络的土壤有机质含量高光谱反演[J]. 土壤学报, 2009, 46(3): 391-397. DOI:10.3321/j.issn:0564-3929.2009.03.003 |
[14] |
刘妍.基于Hymap数据的土壤As含量反演研究[D].北京: 中国地质大学(北京), 2018. http://cdmd.cnki.com.cn/Article/CDMD-11415-1018084036.htm
|
[15] |
薛利红, 周鼎浩, 李颖, 等. 不同利用方式下土壤有机质和全磷的可见近红外高光谱反演[J]. 土壤学报, 2014, 51(5): 993-1002. |
[16] |
周鼎浩, 薛利红, 李颖, 等. 基于可见-近红外光谱的水稻土全磷反演研究[J]. 土壤, 2014, 46(1): 47-52. DOI:10.3969/j.issn.1009-2242.2014.01.009 |
[17] |
Zhang T T, Li L, Zheng B J. Estimation of agricultural soil properties with imaging and laboratory spectroscopy[J]. Journal of Applied Remote Sensing, 2013, 7(1): 073587. DOI:10.1117/1.JRS.7.073587 |
[18] |
何挺, 王静, 林宗坚, 等. 土壤有机质光谱特征研究[J]. 武汉大学学报(信息科学版), 2006, 31(11): 975-979. |
[19] |
贺军亮, 蒋建军, 周生路, 等. 土壤有机质含量的高光谱特性及其反演[J]. 中国农业科学, 2007, 40(3): 638-643. DOI:10.3321/j.issn:0578-1752.2007.03.030 |
[20] |
沙晋明, 陈鹏程, 陈松林. 土壤有机质光谱响应特性研究[J]. 水土保持研究, 2003, 10(2): 21-24, 54. DOI:10.3969/j.issn.1005-3409.2003.02.006 |