2. 哈尔滨工程大学信息与通信工程学院, 哈尔滨 150001
2. College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China
0 引言
土地利用变化反映了经济社会发展对土地资源利用的影响,是环境变化以及可持续发展的重点研究内容,同时也是全球土地利用领域研究的难点[1]。近年来,对土地利用变化情况进行预测成为了LUCC(land use/cover change)的主要研究方向,得到了公众的广泛关注[2-3]。客观、科学地分析土地利用变化趋势,不仅可以使土地的开发和建设更具科学性[4],对自然环境的改善和保护更加符合大自然的客观规律,也可以为经济的可持续发展提供建设性的意见和建议[5]。近十多年来,借助于计算机、遥感和GIS技术[6],无论是统计土地利用信息方法,还是遥感影像进一步处理技术都得到了迅猛的发展,涌现出了许多值得借鉴的模型,包括随机森林、CLUE-S等空间显示模型[7]和以Markov链模型为主的非空间显示模型[8],这些模型有其各自的优势,也都存在着问题。
随着“重振东北老工业基地”政策的提出,哈尔滨作为省会城市,整体土地利用格局发生了显著的变化,探索其中的变化规律,对于东北地区的土地格局规划有着重要的参考意义。由此,本文选取哈尔滨市香坊区为研究区域,对卫星遥感图像解析出栅格数据,采用人工神经网络(artificial neural network, ANN)与元胞自动机(cellular automata, CA)耦合模型,加入自适应可变滤镜方法预测下一时期哈尔滨市香坊区的土地利用分布情况。
1 研究区域概况及数据来源 1.1 研究区域概况香坊区位于哈尔滨市东南部[9](图 1),面积为339.55 km2,地势略有起伏,土壤肥沃,是哈尔滨市重要的农业区之一,城市化进程相对落后。2015年,香坊区面积的65%以上都是农业区,占据优势地位,其次是城镇用地和农村居民点,草地、林地所占比例较小,表明该区域以农业生产为主,比较符合东北地区的特点。近20年来,耕地面积持续缩减45.52 km2,主要归因于人口增长、经济发展和城镇化进程的加速。在经济利益的驱使下,人们扩大了对耕地开发利用的规模,导致区域人口压力增大和生态环境恶化等一系列问题。
1.2 数据来源和预处理选取哈尔滨2000年、2005年、2010年和2015年的Landsat遥感影像为基础数据(数据下载于地理空间数据云[10],http://www.gscloud.cn/),应用ENVI 5.1对遥感影像进行波段融合、图像校正等预处理。应用ArcGIS10.2把数据解译成为分辨率为100 m栅格形式,按照图 2范围剪裁栅格数据作为训练数据,即将待预测区域及其周围数据作为输入数据,在得到模型预测结果之后,使用香坊区的矢量文件对结果再次剪裁;这是为了将区域边界也加入到模型训练中,可以提高数据的使用效率,消除由于数据缺失对预测边界区域准确率的影响。
解译过程借助谷歌地图及实地考察进行校准,参考LUCC分类标准和研究区实际情况[11-12],将香坊区的土地利用类型分为耕地、林地、草地、城镇用地、农村居民点、其他建设用地和未利用地7个分类[13],如表 1所示,解译结果如图 3所示。为了便于机器识别、消除由于土地分类编码差异在模型训练时的影响,本文采用二进制代码来描述不同的土地利用类型,如“1000000”代码表示耕地,“0100000”代表林地。
编码 | 一级 | 二级 | |
1000000 | 耕地 | 水田 | 旱地 |
0100000 | 林地 | 林地 | 疏林地 |
0010000 | 草地 | 高覆盖草地 | 低覆盖草地 |
0001000 | 城镇用地 | 城镇用地 | |
0000100 | 农村居民点 | 农村居民点 | |
0000010 | 其他建设用地 | 其他建设用地 | |
0000001 | 未利用地 | 盐碱地 |
元胞自动机(CA)是一种经典的动力学模型,具有强大的空间运算能力,能够有效模拟复杂的动态系统,是描述、理解和模拟复杂系统行为的一种强有力的方法[14-15],其原理为
式中:St+1表示t+1时元胞的状态;Ud表示d维栅格单元;Nt表示t时刻元胞周围其他元胞状态的组合;f表示转换规则。在土地利用研究中,每个元胞有各自的属性(如土地利用类型),下一时刻的元胞状态由该元胞当前状态、其邻域内元胞状态以及转换规则共同决定[16]。
综合考虑了模型的预测精度和所花费的时间,本文中元胞区域取5×5的范围,元胞分辨率统一取100 m×100 m,元胞区域内上一时期的25个元胞状态共同决定下一时期中心位置元胞的状态。但是由于土地系统的转换规律难以捕捉,制定CA模型元胞之间的转换规则较为困难,容易受到主观因素的干扰,很难做出完全客观的判断,这也正是CA模型的局限性所在[17]。
2.2 CA_ANN模型人工神经网络(ANN)是近年来伴随着大数据发展而迅速崛起的信息处理技术,具有强大的非线性运算能力,被广泛用于包括土地利用预测在内的各个方面。将ANN与CA模型耦合而成的CA_ANN模型同时具有了CA的空间计算能力和ANN的非线性处理能力,是目前土地预测领域效果最好的模型。在训练ANN模型时,输入2000年土地利用分布的元胞土地类别,参照表 1编码为7位数,故ANN模型输入神经元数目为7;而在CA_ANN模型中,将5×5区域的元胞作为输入,故CA_ANN模型输入神经元数目为175。
2.3 CA_Markov模型Markov模型在土地变化预测研究领域中有广泛的应用[18],在土地利用预测的问题上,一般将它与CA方法相结合。CA_Markov模型综合了二者模拟空间变化的能力和对时间模拟的可靠性,可以对未来土地利用类型的变化进行预测。本文通过IDRISI SELVA软件在2005年和2010年土地利用数据的基础上,建立了Markov转移概率矩阵,并制作了适应性图集,预测了香坊区2015年的土地利用分布图。但制定转换规则时仍需要人为选择,这样就不能完全做到客观,这也是CA_Markov模型的局限性所在。
2.4 自适应可变滤镜CA_ANN耦合模型模拟流程尽管有学者曾尝试耦合CA与ANN模型来预测土地类型的分布[19],但研究将训练数据集输入到单一神经网络中,不断迭代校正精度后,由于土地类别之间数量差距较大(如2015年哈尔滨香坊区耕地类型占68.54%),很容易产生“过学习”的现象。当使用数量较少的土地类别(如其他建设用地)作为输入数据时,模型会倾向于将其预测为耕地来提高模型的“准确率”,使得网络对于不同地类的泛化性能大打折扣。此外,在网络的训练过程中,随着模型误差的减小,权值和偏置更新的速度也会越来越慢,导致模型训练时间过长。
本文中“自适应可变滤镜”新模型就是针对上述问题提出的,“滤镜”是指5×5大小的区域,“自适应可变”是指训练模型时,程序会自动判断当前滤镜内存在的地类数,并按照地类数的不同存入不同的数据集用于训练不同的网络模型。预测时,根据滤镜内不同类别数量区域,由程序自动匹配对应的模型进行预测,这样得到的每一个网络模型能针对不同土地利用情况得出更准确的预测结果。如图 4所示,首先对解译好的土地利用数据进行筛选,选出所有5×5大小的区域。然后根据每一个5×5大小区域内包含的土地利用类型数量进一步分类,经过统计分析,2000—2015年香坊区所有5×5大小的区域内最多只有4种土地类别,分别是一类、二类、三类和四类。这样就建立好4个数据集作为训练样本,分别输入到4个结构相同、权系数各异的网络模型中,输出的目标样本分别为对应4个数据集5×5区域内中心位置5年后的土地利用数据。训练出来的不同参数的4个网络模型输入层有175个神经元,隐藏层有16个神经元,输出层有7个神经元。在预测未来土地利用情况时,用滤镜截取每一个5×5大小的区域,首先判断当前5×5区域内包含土地类别的数目,根据数目的不同,自适应地选择不同参数的网络模型,将待预测数据输入到对应的网络进行预测,因此叫做“自适应可变滤镜”模型。从表 2可以看出,自适应可变滤镜模型相比于已存在的最优模型CA_ANN模型,预测准确率和时间都有优化,相比传统方法将所有训练数据输入到一个神经网络模型里训练,自适应可变滤镜模型准确率更高。
模型 | 网络数 | 输入数 | 输出数 | 总体准确率/% | 时间/s |
ANN | 1 | 7 | 7 | 95 | 24.20 |
CA_ANN | 1 | 175 | 7 | 97 | 1 291.77 |
CA_Markov | 无 | 无 | 无 | 85 | 210.35 |
自适应可变滤镜 | 4 | 175 | 7 | 98 | 652.72 |
本文使用ANN、CA_ANN、CA_Markov以及自适应可变滤镜4种方法分别预测2015年哈尔滨市香坊区的土地利用分布,将结果解译成图,如图 5所示。实验使用的编译平台为MATLAB R2016a,电脑处理器为Intel® CoreTM i5-2410M CPU @2.30 GHz,运行内存为6 GB。
3.2 结果分析及模型选择由表 2和图 5分析得到以下结论:CA_Markov模型的预测精度最低,且出现了相当数量的错误预测;ANN模型训练时间最短,但存在不稳定的问题,实验过程中经常出现错判一整类地类的情况,这是因为没有考虑到元胞邻域其他元胞对其变化产生的影响;CA_ANN模型和自适应可变滤镜模型总体准确率较高;自适应可变滤镜模型的训练时间远远少于CA_ANN模型,平均时间由1 291.77 s缩短到了652.72 s,训练时间缩短了49.47%。本文提出的自适应可变滤镜模型相比于其他3种模型精度更高,模型训练所需时间也更合理,可以作为香坊区未来土地预测的模型。
混淆矩阵(表 3、表 4)可以很好地反映各地类的预测情况。以城镇用地为例:2015年香坊区共有17 545个耕地类型元胞,CA_ANN模型预测正确了15 957个,错误1 588个,其中1 476个被误判为耕地,112个被误判为农村居民点;而自适应可变滤镜模型预测正确16 336个,误判为城镇和农村居民点的数目分别为1 117和92个。显然自适应可变滤镜的预测效果要好于CA_ANN模型。
土地利用 类型 | 2015年实际 元胞数 | 2015年模拟元胞数 | 地类精 度/% | 总体精 度/% | ||||||
耕地 | 林地 | 草地 | 城镇用地 | 农村居民点 | 其他建设用地 | 未利用地 | ||||
耕地 | 70 500 | 70 500 | 0 | 0 | 0 | 0 | 0 | 0 | 97.53 | 97.00 |
林地 | 796 | 0 | 796 | 0 | 0 | 0 | 0 | 0 | 100.00 | |
草地 | 361 | 0 | 0 | 361 | 0 | 0 | 0 | 0 | 100.00 | |
城镇用地 | 17 545 | 1 476 | 0 | 0 | 15 957 | 112 | 0 | 0 | 90.95 | |
农村居民点 | 7 872 | 73 | 0 | 0 | 0 | 7 799 | 0 | 0 | 99.07 | |
其他建设用地 | 1 265 | 233 | 0 | 0 | 0 | 14 | 1 018 | 0 | 80.47 | |
未利用地 | 358 | 0 | 0 | 0 | 0 | 0 | 0 | 358 | 100.00 |
土地利用 类型 | 2015年实际 元胞数 | 2015年模拟元胞数 | 地类精 度/% | 总体精 度/% | ||||||
耕地 | 林地 | 草地 | 城镇用地 | 农村居民点 | 其他建设用地 | 未利用地 | ||||
耕地 | 70 500 | 70 500 | 0 | 0 | 0 | 0 | 0 | 0 | 98.08 | 98.00 |
林地 | 796 | 0 | 796 | 0 | 0 | 0 | 0 | 0 | 100.00 | |
草地 | 361 | 0 | 0 | 361 | 0 | 0 | 0 | 0 | 100.00 | |
城镇用地 | 17 545 | 1 117 | 0 | 0 | 16 336 | 92 | 0 | 0 | 93.10 | |
农村居民点 | 7 872 | 58 | 0 | 0 | 0 | 7 814 | 0 | 0 | 99.26 | |
其他建设用地 | 1 265 | 203 | 0 | 0 | 0 | 9 | 1 053 | 0 | 83.24 | |
未利用地 | 358 | 0 | 0 | 0 | 0 | 0 | 0 | 358 | 100.00 |
另外,在短短5年的时间内,大部分土地利用类型并没有发生改变。经过对预测结果的统计,一共有5种转化类型,表 5列出了这5种类型两个模型的预测精度。自适应可变滤镜的预测精度都要高于CA_ANN模型,可以用于区域土地利用类型的预测。
转化类型 | CA_ANN/% | 自适应可变 滤镜/% | 精度提高/% |
耕地→城镇用地 | 1.86 | 25.73 | 23.87 |
耕地→农村居民点 | 37.07 | 50.00 | 12.93 |
耕地→其他建设用地 | 0.42 | 13.25 | 12.82 |
农村居民点→城镇用地 | 0.82 | 24.59 | 23.77 |
农村居民点→其他建设用地 | 6.67 | 40.00 | 33.33 |
利用自适应可变滤镜模型预测2020年香坊区土地利用分布,结果如图 6所示,耕地继续转化为城镇用地、农村居民点及其他建设用地。从2020年与2015年土地利用类型差值图(图 7)可以更直观地看出,城镇用地将集中出现在中部,农村居民点偏向北部发展,其他建设用地会偏向南部发展。实际上,2015年香坊区城镇化水平只有17%,远低于国家平均水平。随着经济发展水平的提升,城镇化水平必将逐步提高,耕地数量也会减少。到2020年,香坊区城镇化水平进一步提高,这符合我们对未来趋势的预测。
4 结论1) 本文创新性地提出了“自适应可变滤镜”模型,并预测了哈尔滨市香坊区2020年的土地利用类型图。
2) 相比于传统神经网络预测地类变化,自适应可变滤镜模型按照每一块5×5区域内地类数量分别训练参数权值不同的神经网络。在进行预测时,程序会自动判断当前待预测区域应输入的训练后网络,相比于传统模型中效果最好的CA_ANN模型,不仅总体精度提高了1%~3%,各种地类转化精度提高了12.82%~33.33%,模型预测时间也缩减了49.47%。
3) 本文提出的基于自适应可变滤镜模型对土地系统模拟结果是可信的,可以准确、高效地反映出香坊区未来土地利用变化的趋势。
[1] |
Sterk B, Leeuwis C, van Ittersum M K. Land Use Models in Complex Societal Problem Solving:Plug and Play or Networking[J]. Environmental Modelling and Software, 2008, 24(2): 165-172. |
[2] |
张新荣, 刘林萍, 方石, 等. 土地利用、覆被变化(LUCC)与环境变化关系研究进展[J]. 生态环境学报, 2014, 23(12): 2013-2021. Zhang Xinrong, Liu Linping, Fang Shi, et al. Research Progress on the Relationship Between Land Use and Cover Change (LUCC) and Environmental Change[J]. Journal of Eco-Environment, 2014, 23(12): 2013-2021. DOI:10.3969/j.issn.1674-5906.2014.12.020 |
[3] |
骈宇哲, 姜朋辉, 陈振杰, 等. LUCC研究进展及其对干旱区生态环境的意义[J]. 水土保持研究, 2015, 22(5): 358-364. Pian Yuzhe, Jiang Penghui, Chen Zhenjie, et al. Research Progress of LUCC and Its Significance to the Ecological Environment in Arid Area[J]. Research of Soil and Water Conservation, 2015, 22(5): 358-364. |
[4] |
张丽, 杨国范, 刘吉平. 1986-2012年抚顺市土地利用动态变化及热点分析[J]. 地理科学, 2014, 34(2): 185-191. Zhang Li, Yang Guofan, Liu Jiping. Analysis of Land Use Dynamic Changes and Hot Spots in Fushun City from 1986 to 2012[J]. Geographical Sciences, 2014, 34(2): 185-191. |
[5] |
Mazzocchi C, Corsi S, Sali G. Agricultural Land Consumption in Periurban Areas:A Methodological Approach for Risk Assessment Using Artificial Neural Networks and Spatial Correlation in Northern Italy[J]. Applied Spatial Analysis and Policy, 2017, 10(1): 3-20. DOI:10.1007/s12061-015-9168-9 |
[6] |
Tauhid R, Faheemah T, Md R, et al. Temporal Dynamics of Land Use/Land Cover Change and Its Prediction Using CA_ANN Model for Southwestern Coastal Bangladesh[J]. Environmental Monitoring and Assessment, 2017, 189(11): 10-12. |
[7] |
Ganbold G, Chasia S. Comparison Between Possibilistic c-Means (PCM) and Artificial Neural Network (ANN) Classification Algorithms in Land Use/Land Cover Classification[J]. International Journal of Knowledge Content Development & Technology, 2017, 7(1): 57-58. |
[8] |
韩会然, 杨成凤, 宋金平. 北京市土地利用空间格局演化模拟及预测[J]. 地理科学进展, 2015, 34(8): 976-986. Han Huiran, Yang Chengfeng, Song Jinping. Simulation and Prediction of Land Use Spatial Pattern Evolution in Beijing[J]. Progress in Geography, 2015, 34(8): 976-986. |
[9] |
金明一, 钱坤. 基于遥感数据的哈尔滨土地利用/覆被变化研究[J]. 测绘与空间地理信息, 2016, 39(12): 110-111. Jin Mingyi, Qian Kun. Study on Land Use/Cover Change in Harbin Based on Remote Sensing Data[J]. Surveying and Mapping and Spatial Geography Information, 2016, 39(12): 110-111. DOI:10.3969/j.issn.1672-5867.2016.12.033 |
[10] |
李晓东, 姜琦刚. 吉林西部多时相遥感数据分类方案的构建及应用[J]. 吉林大学学报(地球科学版), 2017, 47(3): 907-915. Li Xiaodong, Jiang Qigang. Construction and Application of Multi-Temporal Remote Sensing Data Classification Scheme in Western Jilin Province[J]. Journal of Jilin University (Earth Science Edition), 2017, 47(3): 907-915. |
[11] |
修春亮, 程林, 宋伟. 重新发现哈尔滨地理位置的价值:基于洲际航空物流[J]. 地理研究, 2010, 29(5): 811-819. Xiu Chunliang, Cheng Lin, Song Wei. Rediscovering the Value of Harbin's Geographical Location:Based on Intercontinental Aviation Logistics[J]. Geographical Research, 2010, 29(5): 811-819. |
[12] |
朱利凯, 蒙吉军. 国际LUCC模型研究进展及趋势[J]. 地理科学进展, 2009, 28(5): 782-790. Zhu Likai, Meng Jijun. Research Progress and Trend of International LUCC Models[J]. Progress in Geography, 2009, 28(5): 782-790. |
[13] |
白穆, 刘慧平, 乔瑜, 等. 高分辨率遥感图像分类方法在LUCC中的研究进展[J]. 国土资源遥感, 2010(1): 19-23. Bai Mu, Liu Huiping, Qiao Yu, et al. Research Progress of High Resolution Remote Sensing Image Classification Methods in LUCC[J]. Remote Sensing for Land & Resources, 2010(1): 19-23. |
[14] |
周嵩山, 李红波. 元胞自动机(CA)模型在土地利用领域的研究综述[J]. 地理信息世界, 2012, 10(5): 6-10. Zhou Songshan, Li Hongbo. A Survey of Cellular Automata (CA) Models in the Field of Land Use[J]. The World of Geographic Information, 2012, 10(5): 6-10. DOI:10.3969/j.issn.1672-1586.2012.05.001 |
[15] |
陆秋琴, 牛倩倩, 黄光球. 记忆原理的元胞自动机优化算法及其收敛性证明[J]. 计算机科学, 2013, 40(4): 249-255. Lu Qiuqin, Niu Qianqian, Huang Guangqiu. Cellular Automata Optimization Algorithm of Memory Theory and Proof of Its Convergence[J]. Computer Science, 2013, 40(4): 249-255. DOI:10.3969/j.issn.1002-137X.2013.04.054 |
[16] |
杨俊, 解鹏, 席建超, 等. 基于元胞自动机模型的土地利用变化模拟:以大连经济技术开发区为例[J]. 地理学报, 2015, 70(3): 461-475. Yang Jun, Xie Peng, Xi Jianchao, et al. Land Use Change Simulation Based on Cellular Automata Model:A Case Study of Dalian Economic and Technological Development Zone[J]. Acta Geographica Sinica, 2015, 70(3): 461-475. |
[17] |
赛莉莉, 王涛, 陈坤, 等. 2000-2010年威海城市土地利用变化及马尔科夫预测[J]. 鲁东大学学报(自然科学版), 2016, 32(2): 162-167. Sai Lili, Wang Tao, Chen Kun, et al. Urban Land Use Change and Markov Prediction in Weihai City from 2000 to 2010[J]. Journal of Ludong University (Natural Science), 2016, 32(2): 162-167. DOI:10.3969/j.issn.1673-8020.2016.02.011 |
[18] |
李志明, 宋戈, 鲁帅, 等. 基于CA_Markov模型的哈尔滨市土地利用变化预测研究[J]. 中国农业资源与区划, 2017, 38(12): 41-48. LI Zhiming, Song Ge, Lu Shuai, et al. Research on Land Use Change Prediction in Harbin Based on CA_Markov Model[J]. China Agricultural Resources and Regional Planning, 2017, 38(12): 41-48. |
[19] |
范晓锋.基于ANN_CA模型的珲春市土地利用格局模拟研究[D].长春: 吉林大学, 2016. Fan Xiaofeng. Simulation of Land Use Pattern in Hunchun City Based on ANN_CA Model[D]. Changchun: Jilin University, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10183-1016187921.htm |