文章信息
- 姚雄, 曾琪, 刘健, 郑文英, 余坤勇
- YAO Xiong, ZENG Qi, LIU Jian, ZHENG Wenying, YU Kunyong
- 毛竹林分冠层叶面积指数高光谱估测
- Hyperspectral estimation of Phyllostachys edulis forest canopy LAI
- 森林与环境学报,2018, 38(1): 44-49.
- Journal of Forest and Environment,2018, 38(1): 44-49.
- http://dx.doi.org/10.13324/j.cnki.jfcf.2018.01.008
-
文章历史
- 收稿日期: 2017-03-17
- 修回日期: 2017-10-18
2. 福建农林大学林学院, 福建 福州 350002
2. College of Forestry, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China
叶面积指数(leaf area index,LAI)是指单位地表面积上所有绿叶面积总和的一半[1],是表征森林冠层结构的基本参数,它控制着多个生物和物理过程,与森林植被的光合作用、蒸腾作用、净初级生产力、水分利用等密切相关[2],是森林生态系统进行物质交换和能量流动过程的重要参数,也是林地质量、林地生产力评价的重要指标。因此,研究LAI对于林地生物量估测及森林生态系统碳循环的进一步研究都具有重要意义。传统的森林植被LAI测量方法以地面直接测量法为主,这类方法虽然技术成熟,精度较高,但工作量大、对植被破坏性较大的特点影响了其在大区域森林植被定点重复监测上的应用,因此该方法难以应用于大区域森林LAI的监测。近年来,随着遥感信息技术的迅速发展,特别是高光谱遥感技术的应用,高光谱遥感估算法成为快速无损监测大范围森林植被LAI变化的有效手段[3-4]。目前,LAI高光谱估测法主要包括植被指数法和物理模型法[5],植被指数法通过建立植被指数与实测LAI之间的回归关系来反演大区域的LAI,该方法简单易行,是估算植被LAI的重要手段。国外研究学者基于植被指数法开展了大量植被LAI高光谱估测研究,如LIU et al[6]针对玉米、大豆和小麦等不同作物,构建了LAI的不同植被指数模型,指出增强植被指数(enhanced vegetation index,EVI)的预测效果最好; GITELSON et al[7]提出了绿波段比值植被指数(green ratio vegetation index, GRVI),并利用GRVI与LAI的数学关系进行LAI空间反演。国内大部分学者利用高光谱植被指数建立了作物LAI估算的一元回归模型[8-9]; 一些学者为了提高LAI估算精度,引入机器学习模型进行LAI的监测,如夏天等[10]通过BP神经网络法进行冬小麦LAI的估测,估测精度达99.0%;韩兆迎等[11]对比了支持向量机模型和随机森林模型应用于苹果树冠LAI的高光谱估测精度,指出随机森林预测模型精度优于支持向量机模型。目前基于高光谱植被指数的棉花、大豆、水稻以及小麦等作物的LAI估测研究已取得了较大的进展,而针对南方毛竹林LAI进行高光谱估测的研究仍然比较缺乏。基于此,本研究以中国十大竹乡之一的福建省顺昌县大干镇为研究地,以毛竹[Phyllostachys edulis (Carr.) H. de Lehaie]林为目标对象,采用ISI921VF-256野外地物光谱辐射计和LAI-2200冠层分析仪测量的毛竹林LAI及冠层反射率,利用BP神经网络法、支持向量回归法和随机森林模型法构建了毛竹林冠LAI的高光谱遥感估算模型,比对3种模型的估测精度,旨在为大范围毛竹林长势及笋量估产提供科学依据。
1 研究地概况与方法 1.1 研究地概况试验区位于福建省南平市顺昌县大干镇,北纬26°52′~27°02′,东经117°30′~117°47′,地处武夷山脉南麓,总面积约210 km2(图 1)。该区属中亚热带海洋性季风气候,年平均气温18.5 ℃,年均降雨量1 756 mm,地貌以山地丘陵为主,土壤类型主要是红壤。大干镇是我国南方重点林区之一,森林资源丰富,林业用地占土地总面积的78.8%,主要优势树种有毛竹、杉木[Cunninghamia lanceolata (Lamb.) Hook.]等,其中毛竹林面积多达3 533.33 hm2。试验区的毛竹林属高度集约化人工林,林龄结构以1~2度竹为主。
1.2 数据采集与处理2016年7月,在试验区开展数据采集工作,以优劣兼顾为原则,在试验区布设了35个毛竹纯林标准样地,样地设置是基于研究区竹林小班图,建立方格网,方格网的交点落在小班图上即为样地的设置地点,在实地设置半径为3.26 m的样圆串(3个相切的样圆),每个样地在其样圆中心定位3次,取平均值作为样地坐标,并分别进行林分冠层叶面积指数和光谱数据的采集。
利用中国仪思特光电技术有限公司生产的ISI921VF-256野外地物光谱辐射计进行光谱数据的采集。该仪器光谱范围为380~1 080 nm,光谱分辨率为4 nm,输出波段数为256。为了提高测量精度,选择晴朗无云、无风的天气进行光谱反射率的采集。测量时,将目标树砍下,在空旷且阳光充足处模拟毛竹冠层,在冠层上随机选取3个测定点,每个测定点采集10组冠层光谱数据,以30组光谱数据平均值作为毛竹林分冠层光谱反射率数据。各测定点在测量前均进行对照白板校正。为了减少噪声对实际光谱数据的影响,对原始光谱数据进行傅里叶低通滤波平滑及重采样处理,重采样间隔为1 nm,并将边缘波段范围的380~399 nm和901~1 080 nm波段去除。
采用Li-COR公司生产的LAI-2200植物冠层分析仪进行叶面积指数的测定。选用90°的遮盖帽,并用“ABBBB”的方式测量LAI值,即在样地外空旷处测量1次A值作为对照值,再进入样地内测定4次B值,测量结束后,仪器自动记录LAI值。每个样地重复测量3次,以3次LAI平均值作为毛竹林分冠层LAI值。
1.3 敏感波段选取不同LAI水平下的毛竹林分冠层光谱反射率情况见图 2。总体而言,毛竹林分冠层光谱反射率在可见光-近红外波长范围内随着LAI值的增加而增加,不同LAI水平毛竹林冠光谱特征存在明显差异。与其它绿色植物一样,毛竹林冠光谱反射率在可见光范围内主要受叶绿素的影响,由于蓝光波段和红光波段是叶绿素的强吸收带,因而在可见光波段范围内LAI越高的毛竹林分,其反射率也偏高。此外,绿光波段550 nm附近出现反射率小峰,红光波段650 nm附近出现反射率低谷,主要是因为550 nm附近和650 nm附近分别是叶绿素的强反射峰区和强吸收带,结合光谱反射率与LAI的相关性曲线,选择绿光波段563 nm和红光波段674、687 nm作为敏感波长。不同LAI水平的毛竹林冠光谱反射率在近红外波长范围内表现出高反射率,主要与叶片的细胞结构有关,由于叶肉海绵组织结构有许多空腔,具有很大的反射表面,因而具有较高的反射率,通过分析近红外波长范围相关性曲线,选取与LAI相关性最高的波段(800 nm)作为敏感波长。
1.4 植被指数构建高光谱遥感数据具有波段连续性强和数量多的特点,可以构建许多与LAI敏感程度较好的植被指数。根据毛竹冠层光谱反射率特点及LAI与原始光谱相关系数,选取563、674、687、800 nm等敏感波段构建归一化植被指数(normalized difference vegetation index,NDVI)、绿色归一化植被指数(green normalized difference vegetation index,GNDVI)、绿波段比值植被指数(green ratio vegetation index, GRVI)、比值植被指数(ratio vegetation index,RVI)、差值植被指数(difference vegetation index,DVI),并在前人基础上选取与LAI相对敏感的4种植被指数[8, 12]:优化土壤调整植被指数(optimized soil adjusted vegetation index,OSAVI)、新型植被指数(new vegetation index,NVI)、修正归一化植被指数(modified normalized difference vegetation index,mNDVI)、修正简单比值植被指数(modified simple ratio index,mSRI),利用上述12个植被指数建立毛竹林分冠层LAI高光谱估测模型。不同植被指数表达式及来源见表 1。
植被指数 Vegetation index |
计算公式 Calculation formula |
来源 Source |
NDVI674 | (R800-R674)/(R800+R674) | 本文The paper |
NDVI687 | (R800-R687)/(R800+R687) | 本文The paper |
GNDVI563 | (R800-R563)/(R800+R563) | 本文The paper |
GRVI563 | R800/ R563-1 | 本文The paper |
RVI674 | R800/ R674 | 本文The paper |
RVI687 | R800/ R687 | 本文The paper |
DVI674 | R800-R674 | 本文The paper |
DVI687 | R800-R687 | 本文The paper |
OSAVI | 1.16×(R800-R670)/(R800+R670+0.16) | 文献[8]Referance[8] |
NVI | (R777-R747)/R673 | 文献[8]Referance[8] |
mNDVI | (R750-R705)/(R750+R705-2R445) | 文献[12]Referance[12] |
mSRI | (R750-R445)/(R750+R445) | 文献[12]Referance[12] |
采用随机森林回归(random forest regression,RFR)、支持向量回归(support vector regression,SVR)和反向传播(back propagation,BP)神经网络3种机器学习模型建立毛竹林分冠层LAI高光谱估测模型。
随机森林(random forest,RF)是一种基于组合分类回归树的新的机器学习方法,是由许多分类回归树组合而成,最终通过投票法得到预测结果[13-14]。由于该模型在实现过程中进行了两次随机抽样,故其具有很好的抗噪声能力,而且模型不容易陷入过拟合。目前该模型已在经济学、生态学等领域广泛应用。RFR建模的核心问题是确定ntree(森林中决策树的数量)和mtry(分割节点的随机变量数)。研究利用R语言中的random Forest软件包实现RFR模型。
支持向量机(support vector machine,SVM)是VAPNIK在1995年提出的基于内核统计学理论的机器学习方法[15]。SVM最初用于解决分类问题,即支持向量分类(support vector classification,SVC),现已发展至可解决回归问题,即SVR。SVR回归预测精度很大程度上由核函数类型决定,目前常用的核函数主要有线性核函数、多项式核函数、径向基核函数和Sigmoid核函数4种,因此,核函数的确定是SVR建模的核心问题。利用R语言中的kernlab软件包实现SVR模型。
人工神经网络(artificial neural network,AAN)是一种模仿生物神经网络进行数据处理的数学模型。随着人工神经网络技术的发展,已形成众多神经网络模型,如BP神经网络、径向基神经网络、随机神经网络等,在众多神经网络模型中,BP神经网络是应用最广泛的非线性映射学习算法,它的中心思想是调整神经元节点权值使输出总误差最小[16]。本研究中,BP算法结构采用典型的三层网络标准结构,由输入层、隐含层和输出层组成,通过交叉验证优化得到各个参数,采用Matlab R2014b编程实现BP模型。
1.6 精度评价采用保留样本交叉检验方式将35个样地数据中随机抽取24个作为建模集用来建立毛竹林分冠层LAI高光谱估测模型,将剩下的11个作为检验集用来验证模型,并采用决定系数(coefficient of determination,R2)、均方根误差(root mean square error,ERMS)、平均绝对误差(mean absolute error,EMA)、LAI实测值与估测值回归线的斜率(slope)来评价模型的准确性,具体计算公式为:
$ {R^2} = \sum\limits_{i = 1}^n {{{\left( {{{\hat y}_i}-\bar y} \right)}^2}} /\sum\limits_{i = 1}^n {{{\left( {{y_i}-\bar y} \right)}^2}} $ | (1) |
$ {E_{{\rm{RMS}}}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{\left( {{y_i}-{{\hat y}_i}} \right)}^2}} } $ | (2) |
$ {E_{{\rm{MA}}}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{y_i}-{{\hat y}_i}} \right|} $ | (3) |
式中: yi为第i个样地LAI实测值;
对LAI原始数据及训练集和验证集进行统计分析,结果见表 2。从表中可以看出,试验区总样本集、训练集和验证集的LAI平均值分别为3.21、3.24和3.14,对应的变异系数分别为38.94%、41.67%和33.12%,均属于中等变异,可用于模型的构建与分析。
样本集Sample sets | 最小值 Minimum value |
最大值 Maximum value |
平均值 Mean value |
标准差 STDE V |
变异系数 CV/% |
样本数 No. of samples |
训练集Calibration | 1.19 | 6.54 | 3.24 | 1.35 | 41.67 | 24 |
验证集Validation | 1.30 | 4.95 | 3.14 | 1.04 | 33.12 | 11 |
总样本Total samples | 1.19 | 6.54 | 3.21 | 1.25 | 38.94 | 35 |
利用新建的8类植被指数与前人建立的4类植被指数和毛竹林LAI进行相关性分析,结果见表 3。从表中可知,12类植被指数与LAI的相关性均达到极显著水平(P < 0.01),最高相关系数为0.780,说明所选择的12类植被指数都能较好地反映毛竹林LAI的变化,可作为构建毛竹林LAI高光谱监测模型的参数。
植被指数 Vegetation indexes |
相关系数 Correlation coefficient |
NDVI674 | 0.755* |
NDVI687 | 0.744* |
GNDVI563 | 0.483* |
GRVI563 | 0.511* |
RVI674 | 0.780* |
RVI687 | 0.759* |
DVI674 | 0.472* |
DVI687 | 0.488* |
OSAVI | 0.494* |
NVI | 0.689* |
mNDVI | 0.715* |
mSRI | 0.554* |
注:*表示在0.01水平上极显著相关,样本数为35。Note: * indicates significant correlation at 0.01 level, sample number is 35. |
利用划分好的建模集,以12类植被指数为自变量,对应的毛竹林LAI为因变量,分别构建基于RFR算法、SVR算法和BP算法的毛竹林分冠层LAI高光谱估测模型。本文中RFR算法通过误差分析及反复试验,最终选择模型参数ntree为1 000、mtry为3。SVR算法的实现包括核函数和相关参数的选取,通过对比前人研究结果,本研究中核函数选用高斯核函数,惩罚因子C取10,核函数参数σ取0.1。本文中BP算法结构采用典型的三层网络标准结构,通过交叉验证优化得到输入层到隐含层和隐含层到输出层的传递函数分别为tansig和logsig、训练方式为Levenberg-Marquardt算法、迭代次数为1 000的BP模型。
利用建模集对应的检验集,根据所构建的3类LAI估算模型,得到不同模型的LAI估测值,通过与对应的LAI实测值比较,评价不同模型的预测能力,同时对LAI实测值和估测值进行回归分析,并绘制3类模型LAI实测值和估测值的1:1关系线,结果见表 4和图 3。从中可以看出,基于RFR算法、SVR模型算法和BP算法所建立的毛竹林LAI高光谱估算模型,其LAI实测值与估测值回归线的R2均高于0.4,特别是RFR模型,其R2达到0.732 3,比SVR模型和BP模型至少提高了10%,对应的ERMS和EMA分别为0.646 3和0.406 2,其回归线基本与1:1关系线重合,说明RFR模型具有极高的LAI高光谱估测能力。SVR模型的ERMS和EMA与RFR模型基本相当,但其回归线与1:1关系线较为偏离,斜率仅为0.638 3,为3类模型最低。BP模型的回归线虽然与1:1关系线较为接近,但其R2最低,对应的ERMS和EMA均最大,预测精度较低。以上分析表明,与SVR模型和BP模型相比,基于RFR模型的毛竹林LAI高光谱估算结果较为理想。
本研究的RFR模型表现出比其他两类模型更好的预测效果,其原因在于RFR模型在实现过程中不需要检查变量的交互作用是否显著。此外,该模型进行了两次随机抽样,使其在异常值和噪声方面具有较高的容忍度,而且不容易出现过拟合现象,因此该模型具有较高的估测能力[17]; SVR模型的估测性能取决于核函数及其参数的选取,目前对核函数及其参数的选取均为人为经验选择,带有一定随意性和盲目性,本研究亦如此,这在一定程度上制约了模型的估测能力; BP模型的预测效果最差,原因可能是模型在训练过程中陷入了局部最优状态或模型的学习能力过强,导致学习出的模型已表现不出训练样本所包含的规律,最终弱化了模型的泛化能力。
3 结论对毛竹林分冠层光谱反射率与LAI进行相关性分析,选取了敏感波长563、674、687、800 nm,并依此构建了NDVI674、NDVI687、GNDVI563、GRVI563、RVI674、RVI687、DVI674、DVI687 8类植被指数,所构建的植被指数与毛竹林LAI值均极显著相关(P < 0.01)。建立3类基于机器学习算法的毛竹林LAI高光谱估算模型,并进行精度评价,结果表明:RFR模型的R2为0.73,分别比SVR模型和BP模型提高了10%和24%;相应EMA为0.406 2,分别比SVR模型和BP模型减少了0.044 8和0.481 1;其ERMS为0.646 3,略高于SVR模型,但远小于BP模型; 其实测值与估测值的回归线斜率接近1,优于SVR模型和BP模型的回归线斜率。以上结果表明,RFR模型对试验区毛竹林分冠层LAI的高光谱估测效果优于SVR模型和BP模型,因此下一步工作可以用RFR模型进行大区域范围毛竹林冠LAI的高光谱估测。
[1] | CHEN J M, BLACK T A. Defining leaf area index for non-flat leaves[J]. Plant, Cell & Environment, 1992, 15(4): 421–429. |
[2] | DONG T F, LIU J G, QIAN B D, et al. Estimating winter wheat biomass by assimilating leaf area index derived from fusion of Landsat-8 and MODIS data[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 49: 63–74. DOI:10.1016/j.jag.2016.02.001 |
[3] | 赵丽芳. 利用Hypeion高光谱遥感数据估测森林叶面积指数[D]. 北京: 北京林业大学, 2007. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y1055002 |
[4] | 刘振波, 刘杰. 森林冠层叶面积指数遥感反演:以小兴安岭五营林区为例[J]. 生态学杂志, 2015, 34(7): 1930–1936. |
[5] | 吴见, 彭道黎. 基于改进支持向量机算法的退耕地树种信息提取[J]. 光谱学与光谱分析, 2011, 31(4): 1038–1041. |
[6] | LIU J G, PATTEY E, JÉGO G. Assessment of vegetation indices for regional crop green LAI estimation from Landsat images over multiple growing seasons[J]. Remote Sensing of Environment, 2012, 123: 347–358. DOI:10.1016/j.rse.2012.04.002 |
[7] | GITELSON A A, KAUFMAN Y J, MERZLYAK M N. Use of a green channel in remote sensing of global vegetation from EOS-MODIS[J]. Remote Sensing of Environment, 1996, 58(3): 289–298. DOI:10.1016/S0034-4257(96)00072-7 |
[8] | 贺佳, 刘冰锋, 李军. 不同生育时期冬小麦叶面积指数高光谱遥感监测模型[J]. 农业工程学报, 2014, 30(24): 141–150. DOI:10.3969/j.issn.1002-6819.2014.24.017 |
[9] | 夏天, 吴文斌, 周清波, 等. 基于高光谱的冬小麦叶面积指数估算方法[J]. 中国农业科学, 2012, 45(10): 2085–2092. DOI:10.3864/j.issn.0578-1752.2012.10.022 |
[10] | 夏天, 吴文斌, 周清波, 等. 冬小麦叶面积指数高光谱遥感反演方法对比[J]. 农业工程学报, 2013, 29(3): 139–147. |
[11] | 韩兆迎, 朱西存, 房贤一, 等. 基于SVM与RF的苹果树冠LAI高光谱估测[J]. 光谱学与光谱分析, 2016, 36(3): 800–805. |
[12] | SIMS D A, GAMON J A. Relationships between leaf pigment content and spectral reflectance across a wide range of species, leaf structures and developmental stages[J]. Remote Sensing of Environment, 2002, 81(2/3): 337–354. |
[13] | 岳继博, 杨贵军, 冯海宽. 基于随机森林算法的冬小麦生物量遥感估算模型对比[J]. 农业工程学报, 2016, 32(18): 175–182. DOI:10.11975/j.issn.1002-6819.2016.18.024 |
[14] | 张密芳, 杨玉峰, 李明阳, 等. 紫金山国家森林公园全极化雷达图像分类比较[J]. 森林与环境学报, 2016, 36(1): 124–128. |
[15] | VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1995. |
[16] | 郭孝玉, 孙玉军, 王轶夫, 等. 基于改进人工神经网络的植物叶面积测定[J]. 农业机械学报, 2013, 44(2): 199–204. |
[17] | RODRIGUEZ-GALIANO V, MENDES M P, GARCIA-SOLDADO M J, et al. Predictive modeling of groundwater nitrate pollution using random forest and multisource variables related to intrinsic and specific vulnerability: a case study in an agricultural setting (Southern Spain)[J]. Science of the Total Environment, 2014, 476: 189–206. |