-
项目名称
- 国家重点研发计划“南方低效人工林改造与特色生态产业技术”(2017YFC05064)
-
第一作者简介
- 王书韬(1993—),男,硕士研究生。主要研究方向:3S技术在土壤侵蚀评价中的应用。E-mail:562858083@qq.com
-
通信作者简介
- 史明昌(1969—),男,教授,博士。主要研究方向:遥感和地理信息系统在生态环境中的应用。E-mail:shimc@dtGIS.com
-
文章历史
-
收稿日期:2021-01-23
修回日期:2021-11-30
土壤侵蚀易导致土壤退化,土质恶化和作物减产, 威胁生态环境和社会经济的可持续发展。高效、精准分析区域土壤侵蚀空间分布信息,把握生态环境的时空格局和演变规律,为生态修复和土地优化利用决策提供支撑,对调节土壤侵蚀风险具有重要意义[1]。
土壤侵蚀的研究结果受尺度效应影响较明显,该区域土壤侵蚀空间分布研究主要是在>100 km2的区域研究土壤侵蚀在空间上的分布格局和规律,研究仍处于探索阶段[2]。深度学习可使用多隐藏层、多感知器的网络结构,抽象、深层次获取属性和特征[3]。近年来,有学者应用传统神经网络模型对土壤侵蚀空间分布进行有益探索,但该类模型缺乏对区位信息的考虑,对深层信息的表达有待提高[4]。
针对传统神经网络的不足,笔者在区域尺度上,引用UNet++神经网络,利用多层卷积核,建立土壤侵蚀因子和强度之间的深层联系,借助具有局部感知空间信息特点的感受野,表达区位信息,优化土壤侵蚀空间模型。
1 研究区概况湖北省位于长江中游地区,地处第二、三阶梯的过渡带,地貌类型多样;海拔西高东低,存在明显空间差异;土壤和植被类型复杂,包括水稻土、潮土、黄棕壤等土类,木本植物达1 300余种。湖北省林冠层覆盖度较大,但70%为针叶林,导致林下水土流失严重。
2 数据与方法 2.1 输入因子空间数据获取地理空间数据云发布的30 m分辨率Landsat 8 OLI遥感数据;NASA发布的30 m分辨率ASRTER GDEM V2数据;南京土壤所发布的1∶100万土壤数据;中科院资源与环境中心发布的1 km分辨率湖北省2015年土壤侵蚀空间分布数据;湖北省及周边108个气象站点2015年逐月降水数据。
笔者选择降雨侵蚀力、土壤可蚀性、地表覆盖、植被覆盖、坡度、地形起伏度因子作为土壤侵蚀空间分布信息的输入因子,各因子计算方法[5-10]如表 1所示。
| 表 1 土壤侵蚀因子计算方法 Tab. 1 Calculation method of soil erosion factor |
根据神经网络特点,在Jupyter Notebook平台对植被覆盖因子和地表覆盖类型进行处理,将非植被类型设为0,对地表覆盖类型进行独热编码,通过UNet++神经网络的自动拟合能力,获取地表覆盖因子,避免因子间的共线性问题。
2.2 样本选取将湖北省的降雨侵蚀力、土壤可蚀性、地表覆盖、植被覆盖、坡度和地形起伏度因子空间分布栅格数据进行叠加,获取含各因子空间分布信息的数据集。将数据集按面积平均分成10个区域,在Jupyter Notebook平台下,通过tf.random_clip模块在各区域内随机提取100个16×16像元窗口。将像元窗口按1∶1分为训练集和验证集,用于UNet++神经网络训练。
BP神经网络以UNet++神经网络训练集和验证集窗口内的像元作为训练集和验证集。
2.3 UNet++神经网络法计算土壤侵蚀空间分布UNet++神经网络是Unet模型的改进算法[11](图 1)。模型计算土壤侵蚀空间分布过程为:训练集输入模型,对土壤侵蚀各因子进行卷积计算,完成区位和深层信息的表达,映射至卷积层;经过池化操作,完成土壤侵蚀因子深层信息的简化和裁剪,传递到池化层;经过转置卷积操作,进行土壤侵蚀因子的分析表达,上采样为含土壤侵蚀空间分布拟合结果的像元窗口,作为模型输出;将训练集输出结果与对土壤侵蚀空间分布数据对比,获取训练精度;借助优化算法,对卷积核的权重进行调整,实现模型训练;将验证集像元窗口输入模型,输出结果与真实的土壤侵蚀分布数据对比,防止模型过拟合。训练精度与验证精度均达预期,表示模型训练完成;将研究区土壤侵蚀因子输入训练完成的模型运算,获得全区域的土壤侵蚀空间分布结果和总体精度。
|
图 1 BP和UNet++神经网络框架 Fig. 1 BP and UNet++ network structure |
UNet++神经网络构造设定为卷积层、池化层和转置卷积层各4层,可以保持模型的复杂度和鲁棒性。卷积操作中,前2层卷积核设置为5×5像元、后2层为3×3像元,通过改变感受野大小,实现不同尺度下土壤侵蚀因子深层信息的分析。池化层选择池化单元为2的最大池化方法,对土壤侵蚀因子进行降维和去除冗余。转置卷积层根据卷积层设置,对图层信息进行分析和上采样操作,保证模型输入输出的空间一致性。
土壤侵蚀的发生、发展具有连续和非负性,对比tan、RELU等函数,激活函数(Activation Function)选择sigmoid函数,如式(1),更符合土壤侵蚀物理意义,便于求导,对数据有压缩和土壤侵蚀因子标准化的功能,便于向前传输。
| $ S(x) = \frac{1}{{1 + {{\rm{e}}^{ - x}}}}。$ | (1) |
式中:S(x)为输出;x为输入。
丢失率用式(2)的交叉熵损失函数(Cross Entropy Loss)。该函数能保持较高梯度状态,改进sigmoid函数在训练结果接近真实值时的梯度弥散现象[12]。
| $ H(p, q) = - \sum {(p(} x)\lg q(x))。$ | (2) |
式中:H(p, q)为交叉熵;p(x)为实际输出概率;q(x)为期望输出概率。
Kingma等[13]试验证明,梯度下降方法选用Adam优化器,在大型模型和数据集的情况下,能高效解决局部深度学习问题,适用于区域尺度土壤侵蚀空间分布研究。
2.5 BP神经网络法计算土壤侵蚀空间分布利用BP神经网络前馈型人工神经网络的原理[14](图 1),计算过程为:将训练集像元输入模型中,映射至隐含层;通过矩阵运算,获得土壤侵蚀强度作为模型输出;将输出结果与土壤侵蚀空间分布数据对比,获取训练精度;调整神经元权重,进行模型训练;借助验证集观察过拟合情况;训练完成后,将土壤侵蚀各因子输入模型,获得研究区整体土壤侵蚀空间分布结果和总体精度。
2.6 BP神经网络的构造和超参数BP神经网络包含4个隐藏层,各层神经元数分别设置为64、128、256、512个。其余超参数设置与UNet++保持一致。
3 结果与分析 3.1 最优模型选取如图 2所示,UNet++神经网络随训练次数增加,训练精度和验证精度不断提高,直至训练4万5 000次后,训练精度和验证精度出现震荡并逐渐平稳,说明模型难以进一步优化土壤侵蚀拟合结果。最终用于土壤侵蚀空间分布研究的UNet++模型验证精度为96.52%。
|
图 2 模型训练过程 Fig. 2 Training process of neural networks |
BP神经网络随迭代次数增加,验证精度先增大后减小,说明模型已出现过拟合现象,继续训练会导致模型对训练集外的土壤侵蚀空间分布结果拟合精度下降。最终用于土壤侵蚀强度空间分布研究的BP神经网络验证精度为94.91%。
3.2 模型精度分析采用BP神经网络和UNet++神经网络对研究区进行试验,用式(3)总体精度(overall accuracy)作为指标对土壤侵蚀空间分布结果进行评价。表 2评价结果显示,UNet++神经网络总体精度为95.7%,BP神经网络总体精度91.4%,均超过90%,说明深度学习模型都能较好反映真实土壤侵蚀空间分布状况;UNet++神经网络精度比BP神经网络高4.3%,在评价精度上表现更为优越。
| $ {\rm{OA}} = \frac{1}{n}\sum\limits_{k = 1}^n {{a_{kk}}} 。$ | (3) |
| 表 2 不同模型侵蚀结果总体精度对比 Tab. 2 Overall accuracy comparison of erosion results by different models |
式中:OA为总体精度;n为像元数;kk为坐标中(k, k)处位置;akk为(k, k)处像元。
获取侵蚀空间分布(图 3),根据SL190—2007《土壤侵蚀分类分级标准》,统计结果中各级土壤侵蚀强度像元数、面积(表 3),结果表明:1)2种模型计算所得土壤侵蚀空间分布结果在空间格局上与真实数据具有一致性;2)2种方法得到的土壤侵蚀空间分布结果均未出现明显区块化特征,未呈现与单一因子空间分布趋势一致性过高的现象;3)BP神经网络结果中,中部微度侵蚀集中区域呈现大量点状分布的极强度侵蚀像元“椒盐”现象;UNet++神经网络结果中未出现明显“椒盐”现象;4)BP神经网络和UNet++神经网络结果中各级土壤侵蚀强度面积的构成与真实数据接近。
|
图 3 土壤侵蚀强度空间分布对比图 Fig. 3 Comparison of spatial distribution of soil erosion |
| 表 3 侵蚀强度面积统计 Tab. 3 Area statistics of erosion intensity |
由表 3可得:BP神经网络结果中,微度、轻度、中度、强度、极强度侵蚀面积误差分别为-2.53%、0.33%、5.41%、8.10%、166.99%。极强度侵蚀面积仅占湖北省全区域的0.49%,训练集样本数量严重不足,导致识别能力差。如图 4所示,BP神经网络结果中,在西北部高山区和中部平原区错分像元呈明显的聚集型分布。对比高山区错分像元分布坡度因子发现,误差大部分发生在坡度因子较高的地方,说明随坡度因子增大,模型对其敏感度下降。平原区误差聚集于地形起伏度<5 m的区域,是由于激活函数将地形起伏度因子中较小的值进一步压缩导致该区域坡度因子未能正常反映侵蚀轻度的实际情况。
|
图 4 不同模型的误差空间分布图 Fig. 4 Error space distribution among the different models |
UNet++神经网络结果中,微度、轻度、中度、强度和极强度侵蚀面积误差分别为-0.55%、12.51%、-5.58%、-19.61%和6.38%。轻度侵蚀误差较大,错分像元主要分布在微度、轻度和强度侵蚀交织处,区域内轻度侵蚀比例大,模型训练该类像元窗口时,易将微度和中度侵蚀错分为轻度侵蚀。强度侵蚀面积误差较大主要是由于比例仅3.99%,样本数量少。极强度侵蚀比例更小,却与BP神经网络一样出现误差,是由于该类型侵蚀集中分布,且UNet++神经网络以像元窗口的形式输入,对集中分布的侵蚀类型有较好的识别能力。
如图 4所示,Unet++结果未呈现明显聚集型分布,错分像元未聚集在土壤侵蚀强度较大或较小区域,说明该模型能较好拟合土壤侵蚀因子极端区域。用像元窗口对UNet++误差进行区域分析,发现错分像元集中在2类像元窗口中。一类像元窗口内有4个土壤侵蚀因子跨度>50%;另一类像元窗口为微度、轻度和中度侵蚀交织处。2类像元窗口误差的产生原因都是由于样本数量不足,导致模型难以针对该情况进行拟合。
4 结论选择降雨侵蚀力、土壤可蚀性、地表覆盖、植被覆盖、坡度和地形起伏度因子作为输入数据,利用UNet++神经网络输出结果,总体精度达95.7%,与真实数据在空间格局上具有一致性;误差在各强度侵蚀、空间分布上都较为均匀,没有明显误差聚集现象和“椒盐”现象,该模型可以用于土壤侵蚀强度空间分布计算。
结合sigmoid函数和交叉熵损失函数能在符合土壤侵蚀物理意义的情况下,改进梯度弥散现象;使用Adam优化算法能修正梯度,能有效避免模型过早进入局部最优解范围的同时,保证模型的训练速度。
5 讨论湖北省位于长江中游,是长江径流里程最长的省份,地貌、土壤和植被状况复杂,土壤侵蚀状况对长江水质具有较大影响。利用其地形、植被、土壤多样性的特点,模型训练过程中能够减少过拟合现象的发生,最终建立推广性强的深度学习模型。
构建的UNet++神经网络,在输入数据和模型参数上,是传统BP神经网络的百倍以上;如图 2所示,UNet++神经网络的迭代次数也是BP神经网络的3倍左右;随着输入数据量的增加,精度会提高,但运算时间随之几何增长。现阶段根据不同生产需求,学者对土壤侵蚀分辨率选择存在差异,刘宝元等选取10 m分辨率对中国水力侵蚀进行抽烟调查[15];BATJES等选取0.5°分辨率对全球的土壤侵蚀进行研究[16]。1 km分辨率土壤侵蚀等级空间分布信息足以支撑省级区域的资源调查评价、植被的土壤保持效应评估[15, 17]; 选用1 km分辨率的土壤侵蚀因子作为输入数据,可以满足生产需要,同时缩短模型运算时间。
本模型加入地形起伏度,表达径流路径对侵蚀的影响,更切实地反映区域侵蚀特征,模型建立的各因子与侵蚀强度间的联系,更适合中国复杂的地形状况。在地表覆盖因子的分类上仍存在不足,未划分永久灌概地及稻田,未考虑作物种类及作物轮作。
| [1] |
YIN Shuiqing, ZHU Zhengyuan, WANG Li, et al. Regional soil erosion assessment based on a sample survey and geostatis[J]. Hydrology and Earth System Sciences, 2018, 22(3): 1695. DOI:10.5194/hess-22-1695-2018 |
| [2] |
徐涛, 杨勤科, 赵米金. 区域土壤侵蚀模型参数选择[J]. 水土保持研究, 2005, 12(6): 126. XU Tao, YANG Qinke, ZHAO Mijin. Parameterization of regional soil erosion model[J]. Research of Soil and Water Conservation, 2005, 12(6): 126. |
| [3] |
郑远攀, 李广阳, 李晔. 深度学习在图像识别中的应用研究综述[J]. 计算机工程与应用, 2019, 55(12): 20. ZHENG Yuanpan, LI Guangyang, LI Ye. Survey of application of deep learning in image recognition[J]. Computer Engineering and Applications, 2019, 55(12): 20. |
| [4] |
刘婷, 邵景安. 基于BP神经网络的三峡库区土壤侵蚀强度模拟[J]. 自然资源学报, 2018, 33(4): 669. LIU Ting, SHAO Jing'an. Simulation of soil erosion intensity in the Three Gorges Reservoir Area using BP neural network[J]. Journal of Natural Resources, 2018, 33(4): 669. |
| [5] |
刘秉正. 渭北地区R的估算及分布[J]. 西北林学院学报, 1993, 8(2): 21. LIU Bingzheng. Estimation and distribution of R in northern Weihe[J]. Journal of Northwest Forestry University, 1993, 8(2): 21. |
| [6] |
WILLIAMS J R, JONES C A, DYKE P T. A modeling approach to determining the relationship between erosion and soil productivity[J]. Transactions of the Asae, 1984, 27(1): 129. DOI:10.13031/2013.32748 |
| [7] |
蔡崇法, 丁树文, 史志华, 等. 应用USLE模型与地理信息系统IDRISI预测小流域土壤侵蚀量的研究[J]. 水土保持学报, 2000, 14(2): 19. CAI Chongfa, DING Shuwen, SHI Zhihua, et al. Study of applying USLE and geographical information system IDRISI to predict soil erosion in small watershed[J]. Journal of Soil and Water Conservation, 2000, 14(2): 19. |
| [8] |
刘宝元, 毕小刚, 符素华, 等. 北京土壤流失方程[M]. 北京: 科学出版社, 2010: 60. LIU Baoyuan, BI Xiaogang, FU Suhua, et al. Beijing soil loss equation[M]. Beijing: Science Press, 2010: 60. |
| [9] |
舒天竹, 王晓红. 基于3S技术的地形起伏度与区域土壤侵蚀的相关性研究[J]. 水土保持研究, 2017, 24(4): 127. SHU Tianzhu, WANG Xiaohong. Research for the correlation between relief amplitude and regional soil erosion based on 3S technology[J]. Research of Soil and Water Conservation, 2017, 24(4): 127. |
| [10] |
靳秋桐, 史明昌, 张举涛, 等. 基于TRMM数据提取降雨侵蚀力的校正方法: 以蓟运河上游地域为例[J]. 中国水土保持科学, 2015, 13(4): 94. JIN Qiutong, SHI Mingchang, ZHANG Jutao, et al. Calibration of rainfall erosivity calculation based on TRMM data: A case study of the upriver basin of Jiyun River, North China[J]. Science of Soil and Water Conservation, 2015, 13(4): 94. |
| [11] |
ZHOU Z, SIDDIQUEE M, TAJBAKHSH N, et al. UNet++: A nested U-Net architecture for medical image segmentation[M]// Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support. Springer, Cham, 2018: 3.
|
| [12] |
ZHAO H, GALLO O, FROSIO I, et al. Loss functions for image restoration with neural networks[J]. IEEE Transactions on Computational Imaging, 2017, 3(1): 47. DOI:10.1109/TCI.2016.2644865 |
| [13] |
KINGMA D P, BA J L. ADAM: A method for stochastic optimization[EB/OL]. Computer Science: [2019-04-20]. https://arxiv.org/abs/1412.6980.
|
| [14] |
BUSCEMA M. Back Propagation Neural Networks[J]. Substance Use & Misuse, 1998, 33(2): 233. |
| [15] |
刘宝元, 郭索彦, 李智广, 等. 中国水力侵蚀抽样调查[J]. 中国水土保持, 2013(10): 26. LIU Baoyuan, GUO Suoyan, LI Zhiguang, et al. Sampling survey of water erosion in China[J]. Soil and Water Conservation in China, 2013(10): 26. |
| [16] |
BATJES N H. Global assessment of land vulnerability to water erosion on a 1/2° by 1/2° grid[J]. Land Degradation & Development, 1996, 7(4): 353. |
| [17] |
刘文超, 刘纪远, 匡文慧. 陕北地区退耕还林还草工程土壤保护效应的时空特征[J]. 地理学报, 2019, 74(9): 1835. LIU Wenchao, LIU Jiyuan, KUANG Wenhui. Study of soil erosion in the southern hillside area of China based on RUSLE model[J]. Acta Geographica Sinica, 2019, 74(9): 1835. |
2022, Vol. 20 
