森林与环境学报  2021, Vol. 41 Issue (6): 620-628   PDF    
http://dx.doi.org/10.13324/j.cnki.jfcf.2021.06.008
0

文章信息

龙依, 蒋馥根, 孙华, 邱湘龙, 顾兴贵
LONG Yi, JIANG Fugen, SUN Hua, QIU Xianglong, GU Xinggui
基于HLS数据的森林蓄积量遥感反演
Remote sensing inversion of forest volume based on HLS data
森林与环境学报,2021, 41(6): 620-628.
Journal of Forest and Environment,2021, 41(6): 620-628.
http://dx.doi.org/10.13324/j.cnki.jfcf.2021.06.008

文章历史

收稿日期: 2021-07-20
修回日期: 2021-08-28
基于HLS数据的森林蓄积量遥感反演
龙依1,2 , 蒋馥根1,2 , 孙华1,2 , 邱湘龙3 , 顾兴贵3     
1. 中南林业科技大学林业遥感信息工程研究中心, 湖南 长沙 410004;
2. 南方森林资源经营与监测国家林业与草原局重点实验室, 湖南 长沙 410004;
3. 中南林业科技大学芦头实验林场, 湖南 岳阳 414000
摘要:通过对比陆地卫星8号(Landsat 8)与协同陆地卫星和哨兵2号(HLS)数据在波段信息及森林蓄积量建模效果的差异,探索HLS数据源在森林蓄积量反演中的应用潜力。以内蒙古自治区旺业甸林场为研究区,以Landsat 8和HLS为数据源提取遥感变量,结合森林蓄积量样地实测数据,利用线性逐步回归(LSR)和逐步随机森林(SRF)进行特征变量筛选,分别构建线性和非线性模型开展森林蓄积量反演,并进行精度验证及对比分析。结果表明:HLS影像中的7个波段与Landsat 8影像各对应波段均表现为极显著相关,相关系数绝对值均大于0.7(P < 0.01),在波段信息上具有较好的一致性;基于Landsat 8及HLS影像数据构建多元线性回归和随机森林模型,其最优模型决定系数(R2)分别为0.55和0.54,均方根误差(RMSE)分别为65.66和68.15 m3·hm-2,结果无显著性差异(P > 0.05)。利用HLS影像进行森林蓄积量估测,可得到与Landsat 8相似的效果,且HLS数据无需进行繁琐的预处理,能显著提高森林蓄积量估测效率,为大尺度森林蓄积量遥感反演和森林资源监测提供参考。
关键词森林蓄积量    遥感反演    协同陆地卫星和哨兵2号    随机森林    
Remote sensing inversion of forest volume based on HLS data
LONG Yi1,2 , JIANG Fugen1,2 , SUN Hua1,2 , QIU Xianglong3 , GU Xinggui3     
1. Research Center of Forestry Remote Sensing & Information Engineering, Changsha, Hunan 410004, China;
2. Key Laboratory of State Forestry & Grassland Administration on Forest Resources Management and Monitoring in Southern Area, Changsha, Hunan 410004, China;
3. Lutou Experimental Forest Farm, Central South University of Forestry and Technology, Yueyang, Hunan 414000, China
Abstract: By comparing the differences between Landsat 8 and Harmonized Landsat and Sentinel-2 (HLS) data in terms of band information and forest volume modeling, the application potential of the HLS source in forest volume inversion was explored. Considering Wangyedian Forest Farm in the Inner Mongolia Autonomous Region as the study area, Landsat 8 and HLS images were used as data sources to extract remote sensing variables. In combination with the measured data of forest volume sample plots, linear stepwise regression and stepwise random forest were used to screen characteristic variables. Linear and nonlinear models were constructed to perform forest volume inversion, followed by accuracy verification and comparative analysis. The results showed that the seven bands in HLS were highly significantly correlated with each corresponding band of the Landsat 8 image, and the absolute values of the correlation coefficients were all greater than 0.7 (P < 0.01), indicating good consistency in terms of band information. Based on the Landsat 8 and HLS images, multiple linear regression and random forest models were constructed. The R2 values of these optimized models were 0.55 and 0.54, while the RMSE values were 65.66 and 68.15 m3·hm-2, respectively, indicating no significant differences (P > 0.05).Therefore, using HLS imagery for forest volume estimation can yield results similar to those of Landsat 8; further, HLS data do not require tedious preprocessing, which can significantly improve the efficiency of forest volume estimation. Thus, this study provides a reference for large-scale forest volume remote sensing inversion and forest resource monitoring.
Key words: forest volume     remote sensing inversion     harmonized Landsat and Sentinel-2     random forest    

森林作为陆地生态系统不可或缺的组成部分,在维持区域生态平衡中发挥重要作用[1]。森林蓄积量作为关键的林分调查因子之一,能直接反映森林资源数量及质量,是评价森林经营管理水平的关键指标[2]。迅速、准确地估算森林蓄积量对森林经营、成效监测及资源林政管理具有指导意义[3]。传统的森林蓄积量调查主要为人工地面测量,即对样地区域内的林木进行每木检尺,利用调查的单木参数计算单木材积,从而估算样地林分蓄积量[4-5]。该法虽能得到较为准确的蓄积量数据,但费时费力,效率低下。遥感技术监测范围广、信息获取便捷,利用卫星影像提取特征变量,结合地面样地实测数据,构建各种参数及非参数模型反演森林蓄积量已成为区域尺度森林蓄积量估测的主要手段[6-7]

陆地卫星8号(Landsat 8) 卫星数据具备全球覆盖能力,获取质量稳定且公开免费,已被广泛应用于土地覆盖变化监测及森林参数反演[8-10]。Sentinel-2作为唯一一个具有3个红边波段的高分辨率多光谱成像卫星,重返周期最快仅需5 d,对监测植被信息非常有效[11-12]。然而,受传感器自身限制、云雨天气等因素的影响,单一卫星所获取的影像信息有限,实现多源遥感数据组合互补因此得到广泛研究[13-14]。由于Sentinel-2携带的多光谱传感器数据与Landsat 8比较接近,不少学者对两种数据源进行了对比研究,并给出改善其数据一致性的回归系数及各波段间相互转换的关系方程,为二者卫星传感器数据在实际应用中的互补使用提供了依据[15-16]。但Sentinel-2与Landsat 8数据在交互使用时需考虑传感器间的许多差异,实际应用时处理过程较为复杂[17]。协同陆地卫星和哨兵2号(harmonized Landsat and Sentinel-2,HLS) 项目由美国航天局与美国地质勘探局合作推出[18]。它将Landsat 8和Sentinel-2遥感卫星上的陆地成像仪和多光谱仪进行适配,通过大气校正、云和云阴影掩蔽、空间协同配准等一系列算法,实现传感器数据在光谱、波段、空间分辨率的统一,最终生成无缝、协同的表观及地表反射率数据集[19]。HLS可实现全球30 m空间分辨率下地面观测每2~3 d全面覆盖,极大地提高了时间分辨率,对森林资源和土地覆盖变化监测具有重要意义。HLS Landsat 8是HLS直接提供的产品,与Landsat 8原始数据集相比,协同数据已经过一系列预处理,可直接用于波段信息提取和处理[19]。目前已有部分研究探寻HLS数据产品在监测森林干扰[20]、表征地表物候[21-22]等方面的潜力,且HLS数据均表现良好。然而,对HLS数据在森林资源定量估测的验证研究仍然较少。

以内蒙古自治区赤峰市旺业甸林场为研究区,基于Landsat 8和HLS遥感影像,提取光谱变量和纹理特征等遥感因子,结合蓄积量野外调查数据,分别构建多元线性回归和随机森林模型用于研究区蓄积量估测,并制作蓄积量空间分布图。以期通过对比Landsat 8与HLS影像数据在原始波段信息和森林蓄积量估测上的差异,探索HLS数据源在森林蓄积量反演中的应用潜力,为森林蓄积量遥感动态监测提供方法和数据参考。

1 研究区概况与研究方法 1.1 研究区概况

旺业甸林场地处内蒙古自治区赤峰市喀喇沁旗西南部(118°07′~118°30′ E,41°33′~41°49′ N)。林场经营面积2.8万hm2,地势西南高、东北低,大部分为中山山地,平均海拔800~1 900 m。研究区属温带大陆性季风气候,年平均气温4.2 ℃, 雨量充沛,年平均降水量400~600 mm,多集中在夏季,无霜期117 d, 日照时间长,平均年日照时间2 700~3 100 h。林场内人工林主要树种为落叶松[Larix gmelinii (Rupr.) Kuzen.]、油松(Pinus tabuliformis Carr.),天然林主要树种为白桦(Betula platyphylla Suk.)、柞树(Quercus mongolica Fisch. ex Ledeb),活立木总蓄积141万m3,年蓄积生长量4.8万m3

1.2 蓄积量样地数据采集与处理

样地实测数据采集时间为2019年9月,按照4 km的间距进行系统抽样,将研究区划分为22个4 km×4 km的矩形采样区域,在每个4 km×4 km矩形中选取合适局部区域布设群团样地。采用四点群团样地设置方式,即每个群团样地包含4个能代表该样地群所在区域蓄积量平均水平的样地,其中1号样地点位于中心,2、3及4号样地点分别位于1号样地点的0°、120°和240°方向,并与1号样地点距离0.5 km。在实地调查中根据实际情况,对部分样地位置进行了调整, 最终在研究区共确定大小为25 m×25 m的子样地88个,其中,优势树种为落叶松的子样地41个,油松45个,樟子松(Pinus sylvestris var. mongolica Litv.) 2个。对样地内胸径大于5 cm的单木进行每木检尺,测量其胸径、树高及冠幅。利用实测胸径及树高数据,结合主要树种二元材积表[23]计算样地蓄积量并换算成单位面积蓄积量。

1.3 遥感影像处理

HLS通过对陆地成像仪及多光谱仪传感器数据进行大气校正、云掩膜、几何校正、重采样、双向反射分布函数归一化及波段调整操作,产生兼容的地表反射率数据[18]。研究所用的HLS Landsat 8影像来自HLSL30v015产品,通过网站(https://search.earthdata.nasa.gov/) 下载,获取时间为2021年3月8日,空间分辨率为30 m。运用最近邻法对遥感影像进行尺度转换,以保证影像像元与样地点的匹配,获取更准确的影像信息。对影像进行影像裁剪得到研究区的HLS多光谱影像。为了验证数据的有效性,研究将利用Landsat 8影像进行对比分析,二者影像波段介绍见表 1。通过美国地质调查局官网(http://glovis.usgs.gov/) 获取Landsat 8影像,成像时间为2021年3月8日,空间分辨率为30 m。对Landsat 8影像进行辐射定标、FLAASH大气校正、尺度转换和影像裁剪,得到研究区Landsat 8多光谱影像。

表 1 Landsat 8与HLS波段 Table 1 Landsat 8 and HLS bands
波段名
Band name
陆地卫星8号波段
Landsat 8 band
协同陆地卫星和哨兵2号波段
HLS band
波长
Wavelength/μm
海岸气溶胶Coastal aerosol B1 B1 0.43~0.45
蓝Blue B2 B2 0.45~0.51
绿Green B3 B3 0.53~0.59
红Red B4 B4 0.64~0.67
近红外Near Infrared B5 B5 0.85~0.88
短波红外Short wave infrared 1 B6 B6 1.57~1.65
短波红外Short wave infrared 2 B7 B7 2.11~2.29
1.4 特征变量提取

植被指数由不同遥感光谱波段以一定形式组合构成,对植被信息具有指示意义,被广泛用于定性和定量评价植被生长状况[24]。分别基于Landsat 8及HLS影像进行波段计算与提取,得到单波段反射率、两波段比值植被指数(simple ratio,Sij)、大气阻抗植被指数、差值植被指数(difference vegetation index,DVI)、增强型植被指数、归一化差值植被指数、红绿植被指数和土壤调节植被指数等常用的植被指数[9]。遥感影像纹理特征(texture feature,T) 指图像中色调变化的频率,它能反映物体表面特性,对图像解译与参数提取具有重要意义[4]。利用灰度共生矩阵的方法,选择3×3、5×5、7×7、9×9共4个不同大小的移动窗口,提取各影像单波段的8种纹理特征,包括均值、方差、均匀性、对比度、异质性、熵、二阶矩和相关性[25]。将同一波段不同窗口大小提取的共32个纹理特征进行主成分分析,包含85%以上的总信息量,最终得到第i波段纹理特征的第j个主成分Tij

1.5 蓄积量反演模型与精度评价

合适的变量组合能显著地提高森林蓄积量模型的反演精度。本研究将利用线性逐步回归(linear stepwise regression,LSR) 和逐步随机森林(stepwise random forest,SRF) 分别进行特征变量筛选以探索线性和非线性特征变量筛选方法在森林蓄积量反演上的有效性。线性逐步回归法首先需要计算所有遥感变量与样地蓄积量之间的Pearson相关系数矩阵,选择与蓄积量显著相关的变量,引入方差膨胀因子[26]进行共线性诊断(阈值设为10),采用线性逐步回归进行变量筛选。重要性越高代表在随机森林建模的贡献越大,逐步随机森林通过对所有特征变量进行重要性排序,然后根据误差变化确定最终的变量组合[11]。多元线性回归(multiple linear regression,MLR) 模型能描述多个自变量与因变量的线性关系,其一般形式为:

${Y_i} = {\rm{ }}{\beta _0} + {\rm{ }}{\beta _1}{X_1} + {\rm{ }}{\beta _2}{X_{2}} + {\rm{ }} \ldots {\rm{ }} + {\rm{ }}{\beta _i}{X_i} + {\rm{ }}\mu \;\;\;\;\;\;\;\;\;\;\;\;\;i = {\rm{ }}1, 2, \cdots , n$ (1)

式中:X1X2Xi为解释变量;β1β2βi为回归参数;β0为常数项;μ为残差项。

随机森林(random forest,RF) 使用bootstrap抽样依次训练构建多个不同的决策树,并将其预测结果的平均作为最终的预测[26]。模型参数ntrees为决策树的个数,设置为默认值500;mtry为构建决策树时最大特征数。最终的参数设置以获得最小误差为原则。随机选取2/3的样地作为建模样本,1/3的样地作为验证样本,进行模型构建及精度验证。选用决定系数(R2)、均方根误差(root mean squared error,RMSE)、相对均方根误差(relative root mean squared error,rRMSE) 和预测图平均值(mean value of prediction map,μmap) 对模型进行精度评价[9]

2 结果与分析 2.1 Landsat 8与HLS统计特征值对比

表 2是基于研究区获得的Landsat 8与HLS各波段地表反射率描述性统计值。整体来看,两个数据源存在一定的差异,但各对应波段之间具有较好的一致性。HLS与Landsat 8各对应波段特征值均值及标准差均相差0~0.02,且HLS的地表反射率平均值低于Landsat 8的。除B1 (海岸气溶胶波段)及B3(绿波段) 外,其余各对应波段变异系数之差均小于5%。从相关系数来看,HLS与Landsat 8各对应波段均表现为显著相关,其中B1的相关性最小,为0.73;其次是B2 (蓝波段); 波长较长的B6波段(短波红外1) 及B7波段(短波红外2) 相关性相对较高,分别为0.89和0.90。

表 2 基于研究区的Landsat 8与HLS影像波段特征值统计 Table 2 Statistical eigenvalues of Landsat 8 and HLS image bands based on the study area
波段
Band
陆地卫星8号Landsat 8 协同陆地卫星和哨兵2号HLS 相关系数
Correlation coefficient
平均值
Mean
标准差
Standard deviation
变异系数
Coefficient of variation/%
平均值
Mean
标准差
Standard deviation
变异系数
Coefficient of variation/%
B1 0.06 0.04 59.38 0.04 0.03 78.01 0.73**
B2 0.06 0.04 64.81 0.05 0.03 61.39 0.79**
B3 0.07 0.04 54.76 0.07 0.03 45.64 0.84**
B4 0.10 0.05 49.97 0.09 0.04 46.60 0.87**
B5 0.17 0.05 30.14 0.16 0.05 28.89 0.84**
B6 0.18 0.10 52.31 0.18 0.09 51.81 0.89**
B7 0.14 0.08 57.51 0.14 0.08 57.39 0.90**
注:*表示P<0.05;**表示P<0.01。Note: * indicates P<0.05, ** indicates P<0.01.
2.2 遥感变量选择

分别基于Landsat 8及HLS影像,采用LSR、SRF进行特征变量选择,最终所得变量筛选结果具有一定的差异。以Landsat 8为影像源,利用LSR筛选得到3个特征变量,包括纹理主成分1个(T43),植被指数2个(DVI、S56);利用SRF筛选得到6个特征变量,包括单波段反射率2个(B2、B1),纹理主成分4个(T53T12T32T21)。以HLS为影像源,利用LSR筛选得到3个特征变量,包括纹理主成分1个(T63),植被指数2个(S13S32);利用SRF筛选得到9个特征变量,包括植被指数1个(DVI),纹理主成分8个(T32T12T22T33T53T63T11T71)。从各模型变量选择结果来看,纹理特征主成分对于蓄积量较为敏感。

2.3 模型结果与精度评价

表 3可知,基于Landsat 8和HLS影像构建的多元线性回归模型,其决定系数(R2) 均为0.46,均方根误差(RMSE) 仅相差0.18 m3·hm-2,相对均方根误差(rRMSE) 之差为0.10%,3个评价指标在数值上均无显著性差异(P>0.05),但两者预测图平均值差值在45 m3·hm-2以上,差异较大。基于Landsat 8和HLS影像构建的随机森林模型,均方根误差(RMSE) 相差2.49 m3·hm-2、相对均方根误差(rRMSE) 相差1.26%。相比于多元线性模型,基于两种影像构建的随机森林模型预测图平均值相对比较接近。整体来看,基于Landsat 8与基于HLS所构建的参数模型及非参数模型,结果均不存在显著性差异(P>0.05)。

表 3 不同模型的估测精度 Table 3 Estimation accuracy of the different models
影像数据源
Image source
模型
Model
决定系数
R2
均方根误差
RMSE/(m3·hm-2)
相对均方根误差
rRMSE/%
预测图平均值
μmap/(m3·hm-2)
陆地卫星8号Landsat 8 多元线性回归MLR 0.46 64.56 32.79 163.73
随机森林RF 0.55 65.66 33.35 182.01
协同陆地卫星和哨兵2号HLS 多元线性回归MLR 0.46 64.74 32.89 117.64
随机森林RF 0.54 68.15 34.61 194.85

图 1为蓄积量实测值与不同模型预测值的拟合图,各模型均存在一定低值高估与高值低估现象。对于蓄积量大于300 m3·hm-2的样地,各模型均存在明显的高值低估。对比不同模型拟合曲线与理想曲线的偏离程度,多元线性回归模型偏离程度小于随机森林模型的偏离程度;从回归拟合曲线两侧的散点分布情况来看,相比于多元线性回归模型,随机森林模型的散点则更为紧凑地聚集于拟合曲线的两侧。基于Landsat 8与基于HLS所构建的同类模型,在拟合曲线偏离程度及散点聚集状态上大体一致。

图 1 不同模型蓄积量实测值与预测值 Fig. 1 Comparison between estimated volume stock values and observed values based on different models

此外,各模型残差绝对值与建模变量间的相关程度大小不一,其相关系数绝对值在0.02~0.31之间,但相关性均不显著(P>0.05),说明变量几乎没有对模型残差造成影响,变量筛选方式是合理的。

分别以Landsat 8、HLS影像为数据源,结合旺业甸林场蓄积量样地实测数据,构建多元线性回归、随机森林模型进行森林蓄积量反演,得到研究区蓄积量空间分布(图 2)。基于Landsat 8影像所得的蓄积量空间分布[图 2(a)图 2(b)] 与基于HLS影像获得的蓄积量空间分布[图 2(c)图 2(d)] 状况具有一定差异。基于Landsat 8影像所得的蓄积量空间分布层次更多、更为平滑,效果较好。与多元线性回归模型相比,利用随机森林反演所得的蓄积量空间分布与实际情况更为一致。基于HLS影像构建多元线性回归模型获得的蓄积量空间分布,存在部分负值估计现象[图 2(c)],且对于蓄积量大于150 m3·hm-2的地区存在过低估计,制图效果一般。

图 2 研究区蓄积量空间分布图 Fig. 2 Spatial distribution of forest volume in the study area
2.4 不确定性分析

为评估Landsat 8、HLS影像所构建的模型对不同树种蓄积量估测的效果,对各模型预测结果进行分类讨论(表 4),并对基于两种影像构建的同类模型残差绝对值进行显著性检验(表 5)。因优势树种为樟子松的样地数量过少,故仅对落叶松及油松进行分析。从结果来看,各模型对油松样地林分蓄积量的反演效果均优于落叶松,基于Landsat 8、HLS影像构建的同类模型,其模型效果相近,无显著性差异。落叶松样地,基于Landsat 8、HLS影像构建的多元线性回归模型,其决定系数(R2) 分别为0.40、0.48,均方根误差(RMSE) 分别为69.72、65.88 m3·hm-2,其残差绝对值检验t值为0.81,二者不存在显著性差异(P>0.05);构建的随机森林模型,其决定系数(R2) 分别为0.60、0.43,RMSE分别为71.45、75.00 m3·hm-2,残差绝对值不存在显著差异(P>0.05)。油松样地,基于Landsat 8及HLS影像构建的多元线性回归模型,其决定系数(R2) 分别为0.39、0.34,均方根误差(RMSE) 分别为61.43、64.59 m3·hm-2,相对均方根误差(rRMSE) 分别为28.72%、30.20%;构建的随机森林模型,其决定系数(R2) 分别为0.53、0.59,均方根误差(RMSE) 分别为58.61、60.79 m3·hm-2,相对均方根误差(rRMSE) 分别为27.49%、28.42%;两类模型残差绝对值均无显著差异(P>0.05)。

表 4 不同树种的模型估测精度比较 Table 4 Comparison of model estimation accuracy of different tree species
影像数据源
Image source
模型
Model
树种
Tree species
决定系数
R2
均方根误差
RMSE/(m3·hm-2)
相对均方根误差
rRMSE/%
陆地卫星8号Landsat 8 多元线性回归MLR 落叶松L. gmelinii 0.40 69.72 40.53
油松P. tabuliformis 0.39 61.43 28.72
随机森林RF 落叶松L. gmelinii 0.60 71.45 41.53
油松P. tabuliformis 0.53 58.61 27.49
协同陆地卫星和哨兵2号HLS 多元线性回归MLR 落叶松L. gmelinii 0.48 65.88 38.30
油松P. tabuliformis 0.34 64.59 30.20
随机森林RF 落叶松L. gmelinii 0.43 75.00 43.60
油松P. tabuliformis 0.59 60.79 28.42
表 5 模型残差绝对值显著性差异检验结果 Table 5 Significant difference test results for the absolute value of model residuals
模型
Model
树种
Tree species
t
t value
P
P value
多元线性回归MLR 落叶松L. gmelinii 0.81 0.43
油松P. tabuliformis -0.56 0.58
随机森林RF 落叶松L. gmelinii 0.02 0.99
油松P. tabuliformis -0.16 0.87
3 讨论与结论

样地的蓄积量多分布于100~250 m3·hm-2之间,蓄积量低值与高值的样地数较少,使得训练样本所包含的信息不全面,导致各模型对于样地蓄积量估测均存在不同程度的低值高估与高值低估现象。可结合以往的蓄积量调查数据综合考虑,使所布设样地尽可能包含多个级别的蓄积量值。由于官方尚未发布与样地调查时间一致的HLS产品,为尽可能降低时间差异带来的影响,选取了相同日期的HLS与Landsat 8影像,但难以避免造成蓄积量估测精度的降低。对建模结果分树种进行讨论时发现,同一模型对于不同树种蓄积量的预测效果不一致。对不同优势树种的林分分别进行蓄积量反演,在一定程度上可提高蓄积量估测精度[11]。光学遥感影像被广泛用于蓄积量反演,然而,对于植被覆盖度过高的成熟或过熟林分,容易出现光谱信息溢出。纹理特征揭示图像水平结构信息,可以在一定程度上弥补这一问题[27]。本文提取了常见植被指数及纹理特征用于蓄积量估算,但光谱信息溢出导致的结果偏差仍不能完全消除。合成孔径雷达和激光雷达作为主动遥感方式,能穿透森林冠层,获取垂直结构信息,可以有效地缓解光谱信息溢出[28-29]。然而,目前并不能获取高时间分辨率的主动遥感数据,这限制了主动遥感在大尺度林业参数反演中的应用。

分别以HLS、Landsat 8影像为数据源,构建蓄积量预测模型,其模型精度均不具有显著性差异。但在最终的反演制图中,二者所得的蓄积量空间分布具有较大的差异。这可能是因为Sentinel-2与Landsat 8数据的一致性受气溶胶、地形等因素的影响[15, 19],协同数据综合考虑Sentinel-2相应波段信息后,与Landsat 8各对应波段虽整体上具有较好的一致性,但在局部上存在不同程度的差异。可考虑使用地统计学方法或构建局部模型,如地理加权回归,降低因局部差异而造成的影响。以HLS为数据源构建的多元线性回归与随机森林模型,两者反演所得结果差异也较大,这可能是多元线性回归模型易产生过拟合现象,而随机森林模型抗过拟合能力较强,虽然在实际应用中会受到噪声的干扰,不能完全消除过拟合,但一般不易产生过度估计。此外,在线性特征变量筛选时,虽采用逐步回归并引入方差膨胀因子以降低变量相关性,但变量间共线性问题无法根除,可能导致预测结果的偏差;而随机森林算法作为非参数模型的代表,通过构建大量决策树进行预测,可以较好规避变量之间复杂的交互作用,其预测能力几乎不受因子共线性的影响[30]

遥感影像光谱分布的不均衡可能导致信息集中从而影响估测结果,因此对遥感影像进行常规的直方图均衡化后,进行了特征变量提取及筛选、蓄积量反演模型构建及精度评价等相应研究,并与未进行直方图均衡化所得的结果进行对比。结果表明,基于Landsat 8、HLS影像所构建的多元线性回归模型,其决定系数(R2) 均为0.29,均方根误差(RMSE) 分别为66.99和66.91 m3·hm-2;基于二者构建的随机森林模型,其决定系数(R2) 分别为0.19和0.24,均方根误差(RMSE) 分别为71.66和69.35 m3·hm-2。从整体来看,多元线性回归模型所得结果精度显著高于随机森林模型所得结果,但相比于直方图均衡化前,影像进行直方图均衡化后模型精度整体有所下降。这可能是因为本研究中的影像大部分波段直方图有高峰,直方图均衡化虽使影像光谱信息分布更为均衡,但也可能导致其对比度不自然的增强,同时增加背景噪声对比度、降低有效信息对比度[31]。各影像波段进行直方图均衡化后,其像素值出现较多的异常值,可能加剧多元线性回归模型的过拟合现象。随机森林模型作为机器学习模型,直方图均衡化改变了原有影像像素值分布,且变化后的影像灰度级减少,可能会影响其样本训练及最终的回归预测。直方图均衡化能增强影像对比度,但重新分配了影像像素值,相比于回归反演,可能更适合于分类、变化检测等研究[32-33]

利用HLS影像与Landsat 8影像进行森林蓄积量估测,可得到相似结果,且相比于Landsat 8影像,协同数据产品可直接利用,无需进行繁琐的影像预处理。但本论文选取的研究区范围和影像信息均有限,且只构建了多元线性回归模型和随机森林模型进行对比分析,基于上述两种影像数据构建其它参数及非参数模型进行蓄积量估测是否存在显著性差异未知。

本文以内蒙古自治区旺业甸林场为研究区,基于Landsat 8与HLS影像,通过影像波段特征值统计、模型精度评价、不确定性分析和反演制图,对比Landsat 8与HLS影像数据在森林蓄积量估测上的差异。结果表明:HLS影像与Landsat 8影像各对应波段均表现为极显著相关,在整体上具有较好的一致性;基于HLS影像与Landsat 8影像构建的参数和非参数蓄积量估测模型结果无显著性差异(P>0.05)。利用HLS代替Landsat 8影像进行森林蓄积量估测具有一定可行性,能为森林资源监测提供参考,但对于大尺度、多时相的森林蓄积量反演仍需进一步验证。

参考文献(References)
[1]
毛行元, 徐志扬. 皖南山区森林碳储量及其动态变化[J]. 森林与环境学报, 2018, 38(2): 185-190.
[2]
PAN Y D, BIRDSEY R A, PHILLIPS O L, et al. The structure, distribution, and biomass of the world's forests[J]. Annual Review of Ecology, Evolution, and Systematics, 2013, 44: 593-622. DOI:10.1146/annurev-ecolsys-110512-135914
[3]
岳振兴, 岳彩荣, 邹会敏. 哑变量在森林蓄积量模型估测中的应用[J]. 中南林业科技大学学报, 2020, 40(7): 65-72.
[4]
陈松, 孙华, 吴童, 等. 基于Sentinel-2与机载激光雷达数据的误差变量联立方程组森林蓄积量反演研究[J]. 中南林业科技大学学报, 2020, 40(12): 44-53.
[5]
ZHANG H B, ZHU J J, WANG C C, et al. Forest growing stock volume estimation in subtropical mountain areas using PALSAR-2 L-band PolSAR data[J]. Forests, 2019, 10(3): 276. DOI:10.3390/f10030276
[6]
蒋馥根, 孙华, ZHAO F, 等. 基于方差优化k最近邻法的森林蓄积量估测[J]. 森林与环境学报, 2019, 39(5): 497-504.
[7]
HU Y, XU X L, WU F Y, et al. Estimating forest stock volume in Hunan Province, China, by Integrating In situ plot data, Sentinel-2 images, and linear and machine learning regression models[J]. Remote Sensing, 2020, 12(1): 186. DOI:10.3390/rs12010186
[8]
贾臣, 孙林, 陈允芳, 等. 深度置信网络算法反演Landsat 8 OLI气溶胶光学厚度[J]. 遥感学报, 2020, 24(10): 1180-1192.
[9]
SUN H, WANG Q, WANG G X, et al. Optimizing kNN for mapping vegetation cover of arid and semi-arid areas using Landsat images[J]. Remote Sensing, 2018, 10(8): 1248. DOI:10.3390/rs10081248
[10]
LI C, LI M Y, LIU J, et al. Comparative analysis of seasonal landsat 8 images for forest aboveground biomass estimation in a subtropical forest[J]. Forests, 2020, 11(1): 45.
[11]
JIANG F G, KUTIA M, SARKISSIAN A J, et al. Estimating the growing stem volume of coniferous plantations based on random forest using an optimized variable selection method[J]. Sensors, 2020, 20(24): 7248. DOI:10.3390/s20247248
[12]
FILHO M G, KUPLICH T M, DE QUADROS F L F. Estimating natural grassland biomass by vegetation indices using Sentinel 2 remote sensing data[J]. International Journal of Remote Sensing, 2020, 41(8): 2861-2876. DOI:10.1080/01431161.2019.1697004
[13]
李萌, 年雁云, 边瑞, 等. 基于多源遥感影像的青海云杉和祁连圆柏分类[J]. 遥感技术与应用, 2020, 35(4): 855-863.
[14]
刘焕军, 张美薇, 杨昊轩, 等. 多光谱遥感结合随机森林算法反演耕作土壤有机质含量[J]. 农业工程学报, 2020, 36(10): 134-140. DOI:10.11975/j.issn.1002-6819.2020.10.016
[15]
钟函笑, 边金虎, 李爱农. Landsat-8 OLI与Sentinel-2 MSI山区遥感影像辐射一致性研究[J]. 遥感技术与应用, 2018, 33(3): 428-438.
[16]
徐光志, 徐涵秋. Sentinel-2A MSI和Landsat 8 OLI两种传感器多光谱信息的交互对比[J]. 遥感技术与应用, 2021, 36(1): 165-175.
[17]
ZHANG H K, ROY D P, YAN L, et al. Characterization of Sentinel-2A and Landsat-8 top of atmosphere, surface, and nadir BRDF adjusted reflectance and NDVI differences[J]. Remote Sensing of Environment, 2018, 215: 482-494. DOI:10.1016/j.rse.2018.04.031
[18]
FRANCH B, VERMOTE E, SKAKUN S, et al. A method for Landsat and Sentinel 2(HLS) BRDF normalization[J]. Remote Sensing, 2019, 11(6): 632. DOI:10.3390/rs11060632
[19]
CLAVERIE M, JU J C, MASEK J G, et al. The harmonized Landsat and Sentinel-2 surface reflectance data set[J]. Remote Sensing of Environment, 2018, 219: 145-161. DOI:10.1016/j.rse.2018.09.002
[20]
CHEN N, TSENDBAZAR N E, HAMUNYELA E, et al. Sub-annual tropical forest disturbance monitoring using harmonized Landsat and Sentinel-2 data[J]. International Journal of Applied Earth Observations and Geoinformation, 2021, 102: 102386. DOI:10.1016/j.jag.2021.102386
[21]
PASTICK N J, DAHAL D, WYLIE B K, et al. Characterizing land surface phenology and exotic annual grasses in dryland ecosystems using Landsat and Sentinel-2 data in harmony[J]. Remote Sensing, 2020, 12(4): 725. DOI:10.3390/rs12040725
[22]
BOLTON D K, GRAY J M, MELAAS E K, et al. Continental-scale land surface phenology from harmonized Landsat 8 and Sentinel-2 imagery[J]. Remote Sensing of Environment, 2020, 240: 111685. DOI:10.1016/j.rse.2020.111685
[23]
刘琪璟. 中国立木材积表[M]. 北京: 中国林业出版社, 2017.
[24]
ZANG Z, WANG G X, LIN H, et al. Developing a spectral angle based vegetation index for detecting the early dying process of Chinese fir trees[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 171: 253-265. DOI:10.1016/j.isprsjprs.2020.11.005
[25]
菅永峰, 韩泽民, 黄光体, 等. 基于高分辨率遥感影像的北亚热带森林生物量反演[J]. 生态学报, 2021, 41(6): 2161-2169.
[26]
高超, 林红蕾, 胡海清, 等. 我国林火发生预测模型研究进展[J]. 应用生态学报, 2020, 31(9): 3227-3240.
[27]
刘俊, 周靖靖, 菅永峰, 等. Worldview-2不同波段纹理特征对森林蓄积量估算精度影响[J]. 西北林学院学报, 2021, 36(3): 175-181. DOI:10.3969/j.issn.1001-7461.2021.03.26
[28]
张国飞, 岳彩荣, 王雷光, 等. 运用机载激光雷达数据和立地质量分级对亚热带森林蓄积量遥感反演[J]. 东北林业大学学报, 2020, 48(7): 60-65. DOI:10.3969/j.issn.1000-5382.2020.07.012
[29]
李增元, 赵磊, 李堃, 等. 合成孔径雷达森林资源监测技术研究综述[J]. 南京信息工程大学学报(自然科学版), 2020, 12(2): 150-158.
[30]
邢晓语, 杨秀春, 徐斌, 等. 基于随机森林算法的草原地上生物量遥感估算方法研究[J]. 地球信息科学学报, 2021, 23(7): 1312-1324.
[31]
毕秀丽, 邱雨檬, 肖斌, 等. 基于统计特征的图像直方图均衡化检测方法[J]. 计算机学报, 2021, 44(2): 292-303.
[32]
SUN J Y, KIM S W, LEE S W, et al. A novel contrast enhancement forensics based on convolutional neural networks[J]. Signal Processing: Image Communication, 2018, 63: 149-160. DOI:10.1016/j.image.2018.02.001
[33]
AEDLA R, DWARAKISH G S, REDDY D V. Automatic shoreline detection and change detection analysis of netravati-gurpurrivermouth using histogram equalization and adaptive thresholding techniques[J]. Aquatic Procedia, 2015, 4: 563-570. DOI:10.1016/j.aqpro.2015.02.073