南京农业大学学报  2020, Vol. 43 Issue (6): 1124-1133   PDF    
http://dx.doi.org/10.7685/jnau.202001030
0

文章信息

白浩然, 赵美芳, 王飞, 张培育, 谢龙涛, 朱燕香, 潘剑君
BAI Haoran, ZHAO Meifang, WANG Fei, ZHANG Peiyu, XIE Longtao, ZHU Yanxiang, PAN Jianjun
基于模糊c-均值算法的水耕人为土土系预测制图
Prediction and mapping of Stagnic Anthrosols soil series based on fuzzy c-means algorithm
南京农业大学学报, 2020, 43(6): 1124-1133
Journal of Nanjing Agricultural University, 2020, 43(6): 1124-1133.
http://dx.doi.org/10.7685/jnau.202001030

文章历史

收稿日期: 2020-01-14
基于模糊c-均值算法的水耕人为土土系预测制图
白浩然1 , 赵美芳2 , 王飞1 , 张培育1 , 谢龙涛1 , 朱燕香1 , 潘剑君1     
1. 南京农业大学资源与环境科学学院, 江苏 南京 210095;
2. 南京农业大学白马教学科研基地, 江苏 南京 211226
摘要[目的]本文旨在研究模糊c-均值算法(fuzzy c-means,FCM)在平原农区水耕人为土土系预测制图中的应用。[方法]挖掘28个标准土壤剖面,深度100 cm,并根据中国土壤系统分类体系与各大成土因素对水耕人为土土系空间变异的影响,遴选13种土壤类型诊断依据。结合FCM对所有土壤剖面样点数据进行模糊聚类分析,利用2种地统计学插值方法对其输出结果进行插值,并去模糊化得到土系预测图。利用土钻采集48个土系类型验证点,计算土系预测图与验证样点的混淆矩阵。[结果]28个土壤剖面共被分为10种土系类型,与手动检索建立的土系类型一致。比较利用2种插值技术得到的土系预测图,发现利用反距离加权插值(inverse distance weighted,IDW)获取的土系预测图更为准确、合理。选择基于IDW方法获取的土系预测图进行制图精度验证,发现验证点参与模糊连续聚类或不参与模糊连续聚类,其Kappa系数均为0.61,总分类精度均为0.65,满足土壤制图精度的基本要求。[结论]FCM算法与地统计学插值方法相结合能很好地实现平原农区水耕人为土土系的制图预测。在土壤诊断依据选择合理的前提下,可以广泛应用于平原农区景观变化较小区域土系的空间预测与制图。
关键词模糊c-均值算法   平原农区   水耕人为土   土系预测制图   
Prediction and mapping of Stagnic Anthrosols soil series based on fuzzy c-means algorithm
BAI Haoran1, ZHAO Meifang2, WANG Fei1, ZHANG Peiyu1, XIE Longtao1, ZHU Yanxiang1, PAN Jianjun1    
1. College of Resources and Environmental Sciences, Nanjing Agricultural University, Nanjing 210095, China;
2. Baima Teaching and Research Base, Nanjing Agricultural University, Nanjing 211226, China
Abstract: [Objectives] The study was to explore the application of fuzzy c-means(FCM) in mapping and forecasting of Stagnic Anthrosols soil series in the plain agricultural area. [Methods] 28 standard soil profiles with a depth of 100 cm were excavated. Based on the Chinese Soil Taxonomy and the effects of 5 soil-forming factors on the spatial variability of Stagnic Anthrosols soil series, 13 diagnosis bases of soil were selected. The data of all soil profiles samples were fuzzy clustered using FCM, and the output results were interpolated by two geostatistical interpolation methods. The interpolation results were used to defuzzify to obtain the soil prediction map. 48 samples of soil series verification points were collected by soil drills to calculate the confusion matrix of the soil series prediction map and verification samples. [Results] The 28 soil profiles were divided into 10 types of soil series, which were consistent with the soil series types established by manual retrieval. The soil series prediction maps obtained by using two interpolation methods were compared. The soil series prediction map obtained by inverse distance weighted(IDW) was more accurate and reasonable. The soil system prediction map obtained based on the IDW method was selected to verify the accuracy of the mapping. The Kappa coefficients of verification points participating in fuzzy continuous clustering and verification points not participating in fuzzy continuous clustering were all 0.61, and the total classification accuracies were all 0.65, which met the basic requirements of soil mapping accuracy. [Conclusions] The combination of FCM algorithm and geostatistical interpolation method could realize the spatial prediction of soil series well in plain agricultural areas. Under the premise that the diagnosis bases of soil is reasonable, it can be widely applied to the spatial prediction and mapping of soil series in plain agricultural areas with small landscape changes.
Keywords: fuzzy c-means algorithm    plain agricultural area    Stagnic Anthrosols    soil series prediction mapping   

土系作为中国土壤系统分类的基层分类单元, 与生产应用的结合性较强[1]。土系的划分与预测制图更是精准把握区域土壤质量状况的重要手段。水耕人为土作为平原农区的一种重要土壤亚类类型是我国具有重大经济意义的土壤资源, 其前身水稻土早在20世纪30年代就被分为独立的土类[2]。因此, 平原农区水耕人为土亚纲下土系预测制图的研究具有重要的理论和实践意义。

在土壤预测制图的过程中选择合适的方法十分重要, 相比常规的土壤调查制图, 数字土壤制图(digital soil mapping)技术的发展, 使快速获取高精度土壤信息成为可能[3]。例如:针对土壤类型之间不是突变的而是连续渐变的特点, 20世纪80年代后期, 模糊逻辑理论开始应用于土壤地理学领域。综合许多学者的研究发现, 模糊c-均值算法(fuzzy c-means, FCM)可以成功完成土壤的数值化分类[4-5], 结合地统计学手段[6-7], 是进行土壤分类与制图的重要方法。

由于我国仍有大量土系尚未建立[8], 人们对土系的研究绝大多数还停留在土系类型的建立与确定上[9-10]。特别是在平原农区这类景观缓变区, 因无法用地形和景观来辅助寻找土系类型的空间分布边界, 导致目前在平原农区土系类型预测与制图领域中的研究缺乏, 并且尚无将FCM算法应用到土系层次土壤制图的研究[4-7, 11-12]。因此, 本文的目的是寻找一种更加方便快捷, 且适用于景观缓变区的土系制图方法, 即结合日益完善的中国土壤系统分类体系, 利用FCM算法和地统计分析方法, 根据土壤诊断层、诊断特性等土壤属性进行水耕人为土土系的预测与制图, 以期为研究精准农业管理[13]、生态环境建模、土壤和水文过程模拟等领域提供更加细致的土壤基础资料。

1 材料与方法 1.1 研究区概况

研究区位于江苏省南京市江宁区周岗镇, 地理坐标为北纬31°46′9″~31°49′42″, 东经118°53′42″~119°0′5″, 总面积约41 km2。气候为北亚热带季风落叶常绿阔叶林气候, 四季分明, 年均气温15.5 ℃, 年降水量1 004 mm, 无霜期225 d, 年积温4 931 ℃。研究区作为秦淮河冲积平原的一部分, 位于高阳河和二干河之间, 内部河网、沟渠广泛分布, 属于河流阶地地貌。其地势中间高, 南北两边低(图 1)。域内耕地(水田)面积约为25.4 km2, 占该区土地总面积的62.0%。作为开展平原农区水耕人为土土系制图研究的典型区域, 具有很好的区域代表性。

图 1 研究区概况 Fig. 1 Study area overview
1.2 数据来源

研究区高分一号影像来自于中国资源卫星应用中心。影像拍摄时间为2015年4月22日, 产品等级为1A级产品, 包括多光谱波段影像与全色波段影像各一景, 该影像主要用于土地利用现状分类图的解译。数字高程模型(DEM)由比例尺为1:10 000研究区地形图在ArcGIS10.2中数字化, 并按照相关参数转化为与影像投影坐标一致的WGS1984坐标系统后提取生成, 像元大小为5 m×5 m。

根据母质来源、地形部位和土地利用方式, 按照文献[14]的指导, 于2017年10—11月, 在研究区水田内布设标准土壤剖面样点28个, 采集分层土壤样品160个, 深度100 cm。记录样点的地理位置、高程及其周围的景观信息, 记录土壤剖面形态特征, 分层采集土壤样品。采集的土样经过室内自然风干, 磨碎过2 mm筛后, 在实验室完成相关理化性质的检测。具体检测方法参见文献[15]。于2019年6—7月, 在研究区内根据土系制图结果, 布设土钻采样点48个, 深度100 cm, 同样记录采样点相关信息并完成理化性质分析, 作为土系预测图的精度验证数据。

1.3 土壤类型诊断依据遴选与赋值

本研究所有剖面点均为水耕人为土, 因此依据文献[16]仅挑选水耕人为土各级分类单元的诊断依据进行统计分析。并参照文献[1, 17], 共选取13个土壤类型的诊断依据用于土系及以上各分类单元的划分。分别为:水耕表层、水耕氧化还原层、人为滞水水分状况、矿质土表至60 cm内部分土层(≥10 cm)有潜育特征(潜育特征)、水耕氧化还原层的DCB浸提性铁至少为表层的1.5倍(铁聚特征)、矿质土表下60~100 cm部分土层(≥10 cm)有潜育特征(底潜特征)、控制层段土壤颗粒大小、土壤矿物学特性、土壤酸碱性、土壤温度状况、表层土壤质地、水耕表层厚度、水耕氧化还原层厚度。

对于样点土壤而言, 在某一分类层级上特定诊断层、诊断特性是否被使用是其赋值的主要依据。例如水耕氧化还原层, 如果被用于样点土壤分类就赋值为10, 未使用则为0。对于控制层段土壤颗粒大小、土壤矿物学特性、土壤酸碱性等组合土壤属性指标, 需将其赋予不同数值以最大限度表现土壤属性差异, 提升数值化土壤分类效果(表 1)[6], 本文选择的特征值范围是1~10。

表 1 土壤类型诊断依据赋值 Table 1 Value assignment in soil diagnosis basis
土壤属性
Soil properties
土壤分类因子
Soil classification factors
特征值
Eigenvalues
控制层段土壤颗粒大小
Soil particle-size
黏壤质 Clay loamy
壤质 Loamy
10
5
土壤矿物学特性
Mineralogy class
硅质混合型 Silica mixed type
混合型 Mixed type
10
5
土壤酸碱性
Soil acidity and basicity
非酸性 Non-acidic
酸性 Acidic
石灰性Calcaric
10
5
1
土壤温度状况
Soil temperature regime
热性 Thermic
温性 Mesic
冷性 Frigid
10
5
1
表层土壤质地
Surface soil texture
粉砂壤土 Silty loam
黏壤土 Clay loam
壤土 Loam
10
5
1
水耕表层厚度(x)/cm
Anthrostagnic epipedon thickness
25 < x≤30
20 < x≤25
0 < x≤20
10
5
1
水耕氧化还原层厚度(y)/cm
Hydragric horizon thickness
60 < y≤80
40 < y≤60
20 < y≤40
10
5
1
1.4 土壤分类因子权重的确定

用于分类单元划分的诊断依据是最先把土壤类型在高级层级区分开来, 之后的较低层级的单元续分都是在此基础上进行的。因此, 将不同层级间的离散分类转换为同一层级上的连续分类, 应赋予划分高层级单元的土壤属性更高的权重[6]。土类、亚类、土族和土系权重依次为:1.0、0.8、0.6、0.4。本研究所有剖面土壤均属于水耕人为土, 所以在数值化土壤分类因子赋值和权重分配时可将土纲、亚纲忽略。

1.5 模糊c-均值聚类算法模型

定义一个n×p模糊集X, n为研究区样点数量, p为样点土壤的类型诊断依据。n包括28个剖面样点, p=10, 将n个样点的土壤样本划分到c个类别中。FCM基本原理是利用统计方法计算每个样本与每类原型在多属性空间中的距离, 以隶属度进行加权, 最终达到类内加权误差平方和即目标函数(JF)最小化。具体FCM算法步骤参照文献[18]。

最优类别数C和模糊加权指数m是应用FCM算法的2个关键参数。m控制着聚类的模糊性, m越小, 越接近于1, 聚类结果越趋向于明确; m越大, 更易于反映空间的渐变性, 但聚类结果越模糊。因此, 对m的选取需要在模糊度与清晰的聚类结构间进行权衡。这里采用模糊性能指数(fuzziness performance index, FPI)和函数-[(δJF/δm)c0.5]来确定最优类别数C和最优模糊加权指数m[19]

1.6 地统计学空间插值方法

FCM算法输出的是土壤离散样点数据, 必须进行空间插值才能形成空间上的连续分布图。由于每个样点属于所有类别的隶属度值之和为1, 且隶属度值都为正数, 是一种典型的成分数据, 因此在进行单一类别隶属度值空间插值之前, 必须对原始数据进行转换。本研究将隶属度数据用中心对数比转换(centered log-ratio)的方法进行转换, 公式参照文献[20]。之后采用普通克里格(ordinary Kriging)和反距离加权(inverse distance weighted, IDW)进行空间插值。半变异函数分析和插值运算均基于ArcGIS 10.2完成。

1.7 使用混淆矩阵验证制图精度

精度评价是评判土系预测图质量的有效方法, 目前最常用的方法就是建立混淆矩阵(confusion matrix)进行分类精度评价, 该方法主要用于比较最终土系预测图和地表真实土壤信息之间的差异[21]。本文使用混淆矩阵、生产精度、用户精度、Kappa系数、总分类精度的方法分析验证土系预测图的精度。其中, Kappa系数是一种衡量2幅分类图之间吻合程度的客观指标。根据Kappa系数数值大小可以将其划分为6段, 用来表明2幅图一致性程度的强弱:当Kappa≤0时, 一致性程度极差; 0 < Kappa≤0.2, 一致性程度微弱; 0.2 < Kappa≤0.4, 一致性程度弱; 0.4 < Kappa≤0.6, 一致性程度中度; 0.6 < Kappa≤0.8, 一致性程度显著(或一致性高); 0.8 < Kappa≤1.0, 一致性程度极佳。

2 结果与分析 2.1 土壤类型的检索与划分

研究区水田内布设标准剖面样点28个。结合土样的理化性质与剖面描述记录, 建立本研究区水田的土壤系统分类体系, 共检索出1个土纲、1个亚纲、3个土类和5个亚类, 续分为8个土族, 建立了10个土系(表 2)。土纲只有人为土, 亚纲只有水耕人为土, 土类则有潜育水耕人为土、简育水耕人为土和铁聚水耕人为土3类。土纲至土族的命名采用土壤性质连续命名法, 土系则采用更加简单易记的地名命名法[17]。从5种亚类中各选1个土壤剖面, 作为代表性剖面。其性状描述与土壤属性见表 3

表 2 研究区水耕人为土土系类型 Table 2 Soil series classification of Stagnic Anthrosols in the study area
亚类
Subgroup
土族
Soil families
土系
Soil series
剖面编号
Profile No.
铁聚潜育水耕人为土
Fe-Accumuli-Gleyi-Stagnic Anthrosols
壤质硅质混合型热性非酸性-铁聚潜育水耕人为土
Loamy silica mixed type thermicnon-acidic-Fe-Accumuli-Gleyi-Stagnic Anthrosols
马场系 Machang series 21、5、12、9
普通潜育水耕人为土
Typic Gleyi-Stagnic Anthrosols
黏壤质硅质混合型热性非酸性-普通潜育水耕人为土
Clay loamy silica mixed type thermicnon-acidic-Typic Gleyi-Stagnic Anthrosols
若城系 Ruocheng series
刘古庄系 Liugu series
绿杨村系 Lüyang series
22、16、3、266、24、127、8、7
黏壤质混合型热性非酸性-普通潜育水耕人为土
Clay loamy mixed type thermicnon-acidic-Typic Gleyi-Stagnic Anthrosols
杜家边系 Dujiabian series 18、14
普通简育水耕人为土
Typic Hapli-Stagnic Anthrosols
壤质硅质混合型热性非酸性-普通简育水耕人为土
Loamy silica mixed type thermicnon-acidic-Typic Hapli-Stagnic Anthrosols
石辣村系 Shila series 28
黏壤质硅质混合型热性非酸性-普通简育水耕人为土
Clay loamy silica mixed type thermicnon-acidic-Typic Hapli-Stagnic Anthrosols
下圩庄系 Xiawei series 25、20
黏壤质混合型热性非酸性-普通简育水耕人为土
Clay loamy mixed type thermicnon-acidic-Typic Hapli-Stagnic Anthrosol
周岗系 Zhougang series 10、23、13
底潜简育水耕人为土
Endogleyic Hapli-Stagnic Anthrosols
壤质混合型热性非酸性-底潜简育水耕人为土
Loamy mixed type thermicnon-acidic-Endogleyic Hapli-Stagnic Anthrosols
徐家系 Xujia series 17、11、2、4
普通铁聚水耕人为土
Typic Fe-Accumuli-Stagnic Anthrosols
黏壤质硅质混合型热性非酸性-普通铁聚水耕人为土
Clay loamy silica mixed type thermicnon-acidic-Typic Fe-accumuli-Stagnic Anthrosols
东释系 Dongshi series 15、19
表 3 剖面样点基本属性 Table 3 Basic properties of section samples
剖面编号
ProfileNo.
经纬度
Latitude andlongitude
层次
Soillayers
深度/cm
Depth
成土母质
Parent material
质地
Soil texture
pH
(H2O)
游离铁含量/(g·kg-1)
Fe2O3 content
容重/(g·cm-3)
Bulk density
13 118°56′18.24″E
31°47′45.25″N
Ap1 0~20 河流冲积物
River alluvialdeposit
黏壤土 Clay loam 6.96 15.93 1.43
Ap2 >20~35 黏壤土 Clay loam 7.10 17.47 1.13
Btr >35~60 黏壤土 Clay loam 6.61 18.23 1.18
Btm1 >60~80 黏壤土 Clay loam 6.89 16.08 1.40
Btm2 >80~100 黏壤土 Clay loam 6.78 16.97 1.44
9 118°56′56.57″E
31°48′42.39″N
Ap1 0~18 下蜀黄土
Xiashu Loes
黏壤土 Clay loam 5.80 18.38 1.48
Apg >18~25 壤土 Loam 6.69 16.28 1.32
Bg1 >25~55 壤土 Loam 6.92 17.03 1.46
Bg2 >55~80 黏壤土 Clay loam 7.08 19.72 1.46
BC >80~100 黏壤土 Clay loam 6.84 25.26 1.34
27 118°57′41.88″E
31°46′52.44″N
Ap1 0~18 下蜀黄土
Xiashu Loes
粉砂壤土 Silt loam soil 6.08 17.26 1.30
Apg >18~26 粉砂壤土 Silt loam soil 6.34 17.43 1.47
Br1 >26~50 粉砂壤土 Silt loam soil 6.76 18.11 1.45
Br2 >50~85 粉砂壤土 Silt loam soil 6.83 16.55 1.56
Bg >85~100 壤土 Loam 6.88 15.39 1.55
11 118°57′58.13″E
31°48′46.40″N
Ap1 0~20 河流冲积物
River alluvialdeposit
黏壤土 Clay loam 5.47 16.11 1.30
Apg >20~27 黏壤土 Clay loam 5.91 21.55 1.31
Br1 >27~50 黏壤土 Clay loam 6.49 20.16 1.49
Br2 >50~70 黏壤土 Clay loam 6.72 17.24 1.40
Bg >70~100 黏壤土 Clay loam 7.06 17.03 1.56
19 118°59′49.69″E
31°47′46.78″N
Ap1 0~17 下蜀黄土
Xiashu Loes
粉砂壤土 Silt loam soil 6.24 11.02 1.16
Ap2 >17~30 粉砂壤土 Silt loam soil 7.30 8.74 1.18
Btr1 >30~42 黏壤土 Clay loam 7.39 11.70 1.22
Btr2 >42~70 黏壤土 Clay loam 7.45 7.98 1.25
BC >70~100 黏壤土 Clay loam 7.59 19.86 1.36
  注:Ap1:耕作层Cultivated horizon; Ap2:犁地层Plow pan; Apg:犁地层含有潜育现象Gleyic of plow pan; Br1、Br2:氧化还原特征层Redox layer; Btr、Btr1、Btr2:黏粒淀积层, 且呈现出氧化还原特征Argic and redox layer; Btm1、Btm2:黏磐特征层Panic layer; Bg、Bg1、Bg2:潜育层Gleyic layer; BC:B层到C层的过渡层Transition layer from layer B to layer C。

以9号剖面点为例简单介绍土系的检索与建立过程。由于其剖面上具有水耕表层和水耕氧化还原层, 得9号为水耕人为土。由9号剖面构型Ap1-Apg-Bg1-Bg2-BC及其深度, 发现其在矿质土表至60 cm内部分土层(≥10 cm)有潜育特征, 且水耕氧化还原层BC层游离铁含量为表层Apg的1.57倍, 得9号为铁聚潜育水耕人为土。9号点pH值为5.80~7.08, 为非酸性。研究区年平均气温15.5 ℃, 依据土表下50 cm处土温相当大气温度加上1 ℃的结论, 确定土壤温度大于16 ℃, 土壤温度等级为热性。再考虑其成土母质与土壤质地, 得9号为壤质硅质混合型热性非酸性-铁聚潜育水耕人为土。最终结合采集的所有剖面样点数据, 依据表层土壤质地和水耕表层、水耕氧化还原层不同的厚度建立马场系土系(包含9号点)。

2.2 最优类别数c和最优模糊指数m的确定

统计各个模糊度下模糊性能指数(FPI)值, 选择某一特定模糊度下的最优类别数。FPI取值0~1, 越接近0表示聚类时共用数据越少, 类别间的划分越明显, 此时对应c的值为最优类别数。当聚类结果在多个模糊度下都有较好效果时, 可以引进目标函数(JF)对模糊加权指数m的导数与分类数方根的积的负数, 即函数-[(δJF/δm)c0.5]来进行m的优化选择。根据Odeh等[22]的方法, 选择函数-[(δJF/δm)c0.5]峰值时对应的m作为最优模糊指数m

不同mc时, FPI和-[(δJF/δm)c0.5]统计分析结果见图 2图 3。由图 2可知:函数-[(δJF/δm)c0.5]的峰值均出现在m=2.3, 则本研究最优模糊加权指数m=2.3, 在该模糊度下, 统计FPI值(图 3)。从图 3可知:在m=2.3的情况下, FPI有4个极小值, 分别为c=3、c=5、c=8、c=10, 对应研究区土壤类型的3个土类、5个亚类、8个土族、10个土系。这也验证了FCM算法在土壤分类中应用的合理性。因此, 本文在土系制图的应用条件下, 取m=2.3和c=10为最佳聚类组合, 即模糊加权指数m取2.3, 研究区28个土壤剖面样点细分为10种土系类型。

图 2 不同类别数(c)下函数-[(δJF/δm)c0.5]随模糊加权指数(m)的变化 Fig. 2 Changes of -[(δJF/δm)c0.5] for the fuzzinessexponent(m)under different numbers of classes(c)
图 3 不同模糊加权指数(m)下模糊性能指数(FPI)随类别数(c)的变化 Fig. 3 Changes of fuzziness performance index(FPI)for the number of classes(c)under differentvalue of fuzziness exponent(m)
2.3 模糊c-均值聚类结果

FCM算法输出结果包括聚类类别对应的聚类中心, 即每一类别对应的不同土壤数值化诊断依据的质心值(表 4), 和每一样点属于各个类别的隶属度值。输入最优类别数C和最优模糊加权指数m, 运行FCM算法模型, 研究区土壤被自动划分为10种类别, 分别对应10个土系。各土系类型中相应土壤诊断依据的平均值见表 5。从表 4表 5可以看出, 各土系诊断依据的质心值与平均值十分接近。这是因为定义的模糊集X中的土壤分类诊断依据与常规手动检索土壤类型所依据的完全一致, 所以依照手动检索建立的最优的10类土系应与模糊连续分类的结果相对应。

表 4 土壤类型诊断依据的质心值 Table 4 The cluster center of soil diagnosis
土系
Soil series
潜育特征
Surface gleyic features
铁聚特征
Fe-accumu-lation features
底潜特征
Subsurface gleyic features
颗粒大小
Soil particle-size
矿物学特性
Mineralogy class
酸碱性
Soil acidity and basicity
温度状况
Soil temperature regime
表层质地
Surface soil texture
水耕表层厚度
Anthrostagnic epipedon thickness
氧化还原层厚度
Hydragric horizon thickness
若城系 Ruocheng series 9.93 0.15 3.94 5.87 5.85 6.00 6.00 3.66 2.03 1.50
石辣村系 Shila series 0.05 0.08 0.10 3.15 5.93 6.00 6.00 3.98 3.94 3.91
下圩庄系 Xiawei series 0.05 0.07 0.11 5.95 5.80 6.00 6.00 3.98 2.21 3.77
东释系 Dongshi series 0.08 7.94 0.06 5.80 5.80 6.00 6.00 3.87 2.01 2.11
刘古庄系 Liugu series 9.97 0.06 3.98 5.95 5.94 6.00 6.00 2.10 3.90 0.56
马场系 Machang series 9.96 7.96 0.26 3.11 5.91 6.00 6.00 3.94 2.90 1.91
徐家系 Xujia series 0.04 0.04 7.95 3.41 3.21 6.00 6.00 3.46 2.70 3.85
绿杨村系 Lüyang series 9.93 0.15 3.90 5.75 5.90 6.00 6.00 3.77 3.76 1.63
周岗系 Zhougang series 0.02 0.04 0.04 5.98 3.02 6.00 6.00 2.10 0.50 3.98
杜家边系 Dujiabian series 9.95 0.11 0.18 5.96 3.19 6.00 6.00 3.94 2.09 1.96
表 5 土壤类型诊断依据的平均值 Table 5 The average value of soil diagnosis
土系
Soil series
潜育特征
Surface gleyic features
铁聚特征
Fe-accumu-lation features
底潜特征
Subsurface gleyic features
颗粒大小
Soil particle-size
矿物学特性
Mineralogy class
酸碱性
Soil acidity and basicity
温度状况
Soil temperature regime
表层质地
Surface soil texture
水耕表层厚度
Anthrostagnic epipedon thickness
氧化还原层厚度
Hydragric horizon thickness
若城系 Ruocheng series 10.00 0.00 4.00 6.00 5.63 6.00 6.00 3.66 1.77 1.20
石辣村系 Shila series 0.00 0.00 0.00 3.00 6.00 6.00 6.00 4.00 4.00 4.00
下圩庄系 Xiawei series 0.00 0.00 0.00 6.00 6.00 6.00 6.00 4.00 2.33 4.00
东释系 Dongshi series 0.00 8.00 0.00 6.00 6.00 6.00 6.00 4.00 2.00 2.50
刘古庄系 Liugu series 10.00 0.00 4.00 6.00 6.00 6.00 6.00 2.00 4.00 0.67
马场系 Machang series 10.00 8.00 1.00 3.75 5.52 6.00 6.00 3.50 2.60 1.60
徐家系 Xujia series 0.00 0.00 8.00 3.75 3.75 6.00 6.00 3.50 2.60 3.50
绿杨村系 Lüyang series 10.00 0.00 4.00 5.50 6.00 6.00 6.00 4.00 4.00 1.47
周岗系 Zhougang series 0.00 0.00 0.00 6.00 3.00 6.00 6.00 2.67 0.67 4.00
杜家边系 Dujiabian series 10.00 0.00 0.00 6.00 3.00 6.00 6.00 4.00 2.00 2.00
2.4 基于模糊连续分类与地统计方法完成土系预测制图

首先对FCM算法输出的每一样点土壤属于各个土系类别的模糊隶属度值进行中心对数比转换后, 再进行克里格插值。根据插值生成栅格图, 像元大小为5 m×5 m, 利用栅格计算功能将插值结果逆转换后, 得到每一种土系的模糊隶属度图。依据隶属度值最大、土壤属性相似程度最高原则, 将空间任意一点的土壤划入点上隶属度最高的土壤类型之中, 从而实现连续制图的去模糊化, 获得研究区水耕人为土土系空间分布预测图(图 4)。本研究只在研究区的耕地(水耕人为土)范围内进行土系制图, 研究区内的其他土地利用类型还包括住宅用地、林地、水域及水利设施用地、交通运输用地。土地利用类型的分类方式采用《土地利用现状分类:GB/T 21010—2017》中的一级类[23]。从图 4可知:通过普通克里格插值去模糊化得到的土系预测图最终只有5种土系, 明显存在剖面样点的误分。结合表 2图 4, 分析每种土系的误分情况, 发现有多达9种土系存在剖面样点的误分。例如:28号点为石辣村系被误分为下圩庄系; 12号点为马场系被误分为周岗系等。

图 4 普通克里格插值去模糊化处理后土系预测图 Fig. 4 Predictive soil series mapping by defuzzification of the ordinary Kriging interpolation

反距离加权插值(IDW)法是基于相近相似这种空间自相关性原理的一种插值方法, 这种插值技术以插值点与样本点间的距离为权重进行加权平均, 距离插值点越近的样本点被赋予的权重越大。应用IDW方法, 获得土壤土系预测图(图 5)。

图 5 反距离加权插值(IDW)去模糊化处理后土系预测图 Fig. 5 Predictive soil series mapping by defuzzification of inverse distance weighted(IDW)

对比图 4图 5可以发现, 图 4中3种主要土系的位置与图 5中的位置分布大致相似, 但面积在图 5中明显变小。与图 4中存在大量剖面样点被误分的结果不同, 基于IDW方法获取的土壤土系预测图不存在剖面样点误分的情况, 各土壤剖面样点均处于其对应的土壤类型图斑中, 说明IDW法比普通克里格插值法更适合于土系预测图去模糊化处理。这主要是因为普通克里格插值法在计算的过程中会剔除数据中过大和过小的隶属度, 导致部分隶属度插值结果值域缩小, 造成在去模糊化的过程中剖面样点土系类型的误分。因此, 选择基于IDW方法获取的水耕人为土土系预测图作为最终结果, 并进一步完成精度验证。

2.5 结合混淆矩阵验证土系预测图精度

将研究区样点划分为训练样点28个, 验证样点48个。在预测制图及精度验证的过程中对验证点采用2种处理方式:一是验证样点不参与研究区样点的模糊分类过程和后续的土系预测制图过程, 只用来验证制图精度; 二是验证样点参与前期连续模糊分类, 但不参与后期的预测制图过程。

2.5.1 验证点不参与模糊连续聚类

48个验证点的位置分布见图 6。完成48个土壤验证点的土系检索与建立之后, 发现有17个验证点的土系类型与预测图不一致, 分析计算得到土系预测图与验证样点的混淆矩阵(表 6)。所有验证点均是土钻采样点, 导致土壤层次厚度与性状的描述与记载存在一定的误差。有5个土系类型的生产精度达到0.60以上, 8个土系类型的用户精度都在0.60以上, 说明土系预测图能够较好反映研究区土系分布情况。最终计算得到Kappa系数为0.61, 在0.60~0.80的范围内, 一致性程度显著。土系预测图与所采集验证点的土系类型分布基本一致, 因此土系预测图的总分类精度为0.65是真实可信的, 并且满足土壤制图精度的基本要求[24]

图 6 研究区验证点位置 Fig. 6 Verification point location in study area
表 6 土系预测图与验证样点的混淆矩阵 Table 6 The confusion matrix of soil series prediction map and verification samples
预测图采样
Predicted soil mapsamples
野外验证采样 Field verification point samples 预测图采样点合计
Total samplingpoints ofsoil map
用户精度
Useraccuracy
若城系
Ruocheng series
石辣村系
Shila series
下圩庄系
Xiawei series
东释系
Dongshi series
刘古庄系
Liugu series
马场系
Machang series
徐家系
Xujia series
绿杨村系
Lüyang series
周岗系
Zhougang series
杜家边系
Dujiabian series
若城系 Ruocheng series 4 1 1 6 0.66
石辣村系 Shila series 2 1 3 0.67
下圩庄系 Xiawei series 1 3 1 5 0.60
东释系 Dongshi series 1 3 1 5 0.60
刘古庄系 Liugu series 4 1 5 0.80
马场系 Machang series 1 1 3 1 6 0.50
徐家系 Xujia series 1 4 5 0.80
绿杨村系 Lüyang series 1 3 4 0.75
周岗系 Zhougang series 2 3 5 0.60
杜家边系 Dujiabian series 1 1 2 4 0.50
野外采样点合计
Total sampling points in field
7 3 6 4 6 4 4 6 6 2 48
生产精度
Production accuracy
0.57 0.67 0.50 0.75 0.57 0.75 1.00 0.50 0.50 1.00
2.5.2 验证点参与模糊连续聚类

由于2种方式的数据处理过程相同, 所以其计算过程不在文章中重复列出。结合全部76个土壤样点聚类得到的质心值(表 7), 计算研究区28个土壤剖面样点的隶属度, 利用IDW法完成土系预测制图(图 7)。

表 7 土壤类型诊断依据的质心值(验证点参与模糊连续聚类) Table 7 Centroid value of soil diagnosis(verification points participating in fuzzy continuous clustering)
土系
Soil series
潜育特征
Surface gleyic features
铁聚特征
Fe-accumu-lation features
底潜特征
Subsurface gleyic features
颗粒大小
Soil particle-size
矿物学特性
Mineralogy class
酸碱性
Soil acidity and basicity
温度状况
Soil temperature regime
表层质地
Surface soil texture
水耕表层厚度
Anthrostagnic epipedon thickness
氧化还原层厚度
Hydragric horizon thickness
若城系 Ruocheng series 9.96 0.09 3.86 5.88 5.77 6.00 6.00 3.65 2.01 1.54
石辣村系 Shila series 0.03 0.05 0.05 3.15 5.97 6.00 6.00 4.00 3.96 3.91
下圩庄系 Xiawei series 0.05 0.01 0.05 5.84 5.88 6.00 6.00 4.00 2.10 3.98
东释系 Dongshi series 0.06 7.94 0.04 5.98 5.98 6.00 6.00 3.99 2.01 2.00
刘古庄系 Liugu series 9.98 0.04 3.95 5.95 5.91 6.00 6.00 2.13 3.89 0.59
马场系 Machang series 9.98 7.91 0.28 3.13 5.89 6.00 6.00 3.94 2.91 1.90
徐家系 Xujia series 0.06 0.02 7.93 3.41 3.22 6.00 6.00 3.46 2.70 3.85
绿杨村系 Lüyang series 9.95 0.10 3.84 5.72 5.79 6.00 6.00 3.77 3.71 1.61
周岗系 Zhougang series 0.03 0.01 0.03 5.98 3.02 6.00 6.00 2.10 0.49 3.99
杜家边系 Dujiabian series 9.93 0.11 0.20 5.95 3.09 6.00 6.00 3.94 2.12 1.96
图 7 IDW去模糊化处理后土系预测图(验证点参与模糊连续聚类) Fig. 7 Predictive soil series mapping by defuzzification of IDW(verification points participatingin fuzzy continuous clustering)

对比2种方式的土系预测结果, 发现2种方式得到质心值十分相似, 并且土系预测图差别很小。同样的17个验证点的土系类型与预测图不一致, 即2种方式的土系预测图与验证样点的混淆矩阵也完全相同。这是因为28个土壤剖面样点包括研究区的所有土系类型, 所以2种方式得到的土系聚类数目相同; 选择合适的土壤诊断依据, 使得不同土系间差别明显, 又保证了质心值的准确性。因此, 影响土系预测制图精度的主要因素有2个:一是选择的预测样点要包括研究区所有土系类型; 二是选择合适的土壤诊断依据。

3 讨论

土壤类型诊断依据的选择对土壤数值化分类结果有很大影响。在土壤高级分类单元上, 选择典型的土壤理化性质[12]或地表景观变化较大地区的环境因子[13]作为土壤类型诊断依据能获得较好的土壤分类结果。由于土壤聚类的诊断依据并不是土壤系统分类中应该参照的土壤诊断层和诊断特性, 因此最终土壤类型预测结果在土系层级甚至土族、土类和亚类的层级上都无法与土壤系统分类判别的土壤类型完全匹配, 更无法生成满足制图精度要求的土系预测图。为了保证质心值在土系层级上的准确性, 本研究结合中国土壤系统分类体系、水耕人为土本身的土体特征和建立土系应当与农业生产应用具有较强结合性的特点, 选择13种土壤类型诊断依据, 均是在土系的检索与建立的过程中用到的土壤诊断层、诊断特性和土壤剖面性状等。在验证点参与和不参与土壤模糊连续聚类2种聚类情况下得到的质心值都能与手动检索建立的土系类型建立良好的对应关系, 是保证良好的土系预测制图精度的重要条件。

本研究中, 不同地形上不同地下水的埋藏深度是影响土壤发生演化的重要因素, 是形成水耕人为土不同土类和亚类的重要条件; 地形还进一步影响河流沉积物的空间分配格局与物质组成特性, 从而产生不同的成土母质, 形成不同土族; 剧烈的人为活动在水耕人为土剖面上形成不同的土壤表层质地和特征土层厚度, 产生不同的土系。因此, 各土壤类型的空间分布与成土因素的空间变异关系密切。

FCM算法与地统计学插值方法相结合能很好实现平原农区水耕人为土土系的空间预测, 在合理选择土壤诊断依据的前提下, 可以广泛应用于平原农区景观变化较小区域的土系类型的空间预测与制图。然而, 本研究通过隶属度插值结果去模糊化得到的各土系类型的制图边界不够准确, 位于土系边界附近的验证点更容易出现误差。根据应用目的, 如果需要精度更高的土系图, 可以借助内插法[25], 布设大量的检查剖面与定界剖面进行内插, 使其逐步接近要求的误差范围, 从而确定土系制图边界。随土系研究的不断深入, 结合模糊逻辑理论, 利用数字土壤制图, 获取更高精度的土系图将是未来的研究趋势。

参考文献(References)
[1]
张甘霖, 黄成敏, 武继承, 等. 土系研究与制图表达[M]. 合肥: 中国科学技术大学出版社, 2001: 8-9.
Zhang G L, Huang C M, Wu J C, et al. Soil Series Research and Mapping Expressions[M]. Hefei: University of Science and Technology of China Press, 2001: 8-9 (in Chinese).
[2]
陈小梅, 姚玉才, 麻万诸, 等. 闽浙两省水耕人为土的优势类型及其分布特点研究[J]. 土壤通报, 2016, 47(5): 1025-1028.
Chen X M, Yao Y C, Ma W Z, et al. Dominant types and distribution of Stagnic Anthrosols in Fujian and Zhejiang Provinces[J]. Chinese Journal of Soil Science, 2016, 47(5): 1025-1028 (in Chinese with English abstract).
[3]
Ma Y X, Minasny B, Malone B P, et al. Pedology and digital soil mapping(DSM)[J]. European Journal of Soil Science, 2019, 70(2): 216-235. DOI:10.1111/ejss.12790
[4]
Bhargavi P, Jyothi S. Fuzzy c-means classifier for soil data[J]. International Journal of Computer Applications, 2010, 6(4): 35-38. DOI:10.5120/1065-1391
[5]
孙亚洲, 陈杰, 吴克宁, 等. 基于模糊k-均值算法模型的土壤数值化分类:以河南省境内分布的雏形土为例[J]. 土壤, 2017, 49(6): 1262-1267.
Sun Y Z, Chen J, Wu K N, et al. Numerical soil classification based on fuzzy k-means algorithm model:a case study of cambisols in Henan Province[J]. Soils, 2017, 49(6): 1262-1267 (in Chinese with English abstract).
[6]
Odeh I O A, Chittleborough D J, McBratney A B. Fuzzy-c-means and kriging for mapping soil as a continuous system[J]. Soil Science Society of America Journal, 1992, 56(6): 1848-1854. DOI:10.2136/sssaj1992.03615995005600060033x
[7]
檀满枝, 陈杰. 模糊c-均值算法在区域土壤预测制图中的应用[J]. 土壤学报, 2009, 46(4): 571-577.
Tan M Z, Chen J. Application of fuzzy c-means algorithm to predictive soil mapping on regional scale[J]. Acta Pedologica Sinica, 2009, 46(4): 571-577 (in Chinese with English abstract).
[8]
李德成, 张甘霖. 中国土壤系统分类土系描述的难点与对策[J]. 土壤学报, 2016, 53(6): 1563-1567.
Li D C, Zhang G L. On difficulties and countermeasures in describing soil series in Chinese Soil Taxonomy[J]. Acta Pedologica Sinica, 2016, 53(6): 1563-1567 (in Chinese with English abstract).
[9]
曲潇琳, 龙怀玉, 谢平, 等. 宁夏中部地区典型灰钙土的发育特性及系统分类研究[J]. 土壤学报, 2018, 55(1): 75-87.
Qu X L, Long H Y, Xie P, et al. Genetic characteristics and classification of typical sierozem in central Ningxia, China[J]. Acta Pedologica Sinica, 2018, 55(1): 75-87 (in Chinese with English abstract).
[10]
张楚, 袁大刚, 宋易高, 等. 川西地区具有机土壤物质特性土壤的系统分类[J]. 土壤学报, 2018, 55(5): 1085-1097.
Zhang C, Yuan D G, Song Y G, et al. Taxonomy of soils featuring organic soil materials in west Sichuan, China[J]. Acta Pedologica Sinica, 2018, 55(5): 1085-1097 (in Chinese with English abstract).
[11]
刘鹏飞, 宋轩, 刘晓冰, 等. 基于k-均值算法模型的区域土壤数值化分类及预测制图[J]. 生态学报, 2012, 32(6): 1846-1853.
Liu P F, Song X, Liu X B, et al. Numerical soil classification using fuzzy k-means algorithm and predictive soil mapping at regional scale[J]. Acta Ecologica Sinica, 2012, 32(6): 1846-1853 (in Chinese with English abstract).
[12]
杨琳, 朱阿兴, 李宝林, 等. 应用模糊c均值聚类获取土壤制图所需土壤-环境关系知识的方法研究[J]. 土壤学报, 2007, 44(5): 784-791.
Yang L, Zhu A X, Li B L, et al. Extraction of knowledge about soil-environment relationship for soil mapping using fuzzy c-means(FCM)clustering[J]. Acta Pedologica Sinica, 2007, 44(5): 784-791 (in Chinese with English abstract).
[13]
Bhakta I, Phadikar S, Majumder K. State-of-the-art technologies in precision agriculture:a systematic review[J]. Journal of the Science of Food and Agriculture, 2019, 99(11): 4878-4888. DOI:10.1002/jsfa.9693
[14]
张甘霖, 李德成. 野外土壤描述与采样手册[M]. 北京: 科学出版社, 2017: 7-9, 22-42.
Zhang G L, Li D C. Field Guidelines for Describing and Sampling Soils[M]. Beijing: Science Press, 2017: 7-9, 22-42 (in Chinese).
[15]
张甘霖, 龚子同. 土壤调查实验室分析方法[M]. 北京: 科学出版社, 2012: 8-29, 38-58, 82-94, 193-201.
Zhang G L, Gong Z T. Soil Survey Laboratory Methods[M]. Beijing: Science Press, 2012: 8-29, 38-58, 82-94, 193-201 (in Chinese).
[16]
中国科学院南京土壤研究所土壤系统分类课题组, 中国土壤系统分类课题研究协作组. 中国土壤系统分类检索[M]. 3版. 合肥: 中国科学技术大学出版社, 2001: 100-104.
Chinese Soil Taxonomic Classification Research Group, Institute of Soil Science, Chinese Academy of Sciences, Cooperative Research Group on Chinese Soil Taxonomy. Keys to Chinese Soil Taxonomy[M]. 3rd ed. Hefei: University of Science and Technology of China Press, 2001: 100-104 (in Chinese).
[17]
张甘霖, 王秋兵, 张凤荣, 等. 中国土壤系统分类土族和土系划分标准[J]. 土壤学报, 2013, 50(4): 826-834.
Zhang G L, Wang Q B, Zhang F R, et al. Criteria for establishment of soil family and soil series in Chinese Soil Taxonomy[J]. Acta Pedologica Sinica, 2013, 50(4): 826-834 (in Chinese with English abstract).
[18]
Zeraatpisheh M, Ayoubi S, Brungard C W, et al. Disaggregating and updating a legacy soil map using DSMART, fuzzy c-means and k-means clustering algorithms in central Iran[J]. Geoderma, 2019, 340: 249-258. DOI:10.1016/j.geoderma.2019.01.005
[19]
Sun X L, Zhao Y G, Wang H L, et al. Sensitivity of digital soil maps based on FCM to the fuzzy exponent and the number of clusters[J]. Geoderma, 2012, 171/172: 24-34. DOI:10.1016/j.geoderma.2011.03.016
[20]
Wang Z, Shi W J. Mapping soil particle-size fractions:a comparison of compositional kriging and log-ratio Kriging[J]. Journal of Hydrology, 2017, 546: 526-541. DOI:10.1016/j.jhydrol.2017.01.029
[21]
马延慈, 明艳芳, 王凯, 等. 基于高分辨率人工识别地表类型的Globeland 30产品精度评价[J]. 山东科技大学学报(自然科学版), 2018, 37(5): 1-10, 26.
Ma Y C, Ming Y F, Wang K, et al. Precision evaluation of Globeland 30 products based on high-resolution artificial identification land type[J]. Journal of Shandong University of Science and Technology(Natural Science Edition), 2018, 37(5): 1-10, 26 (in Chinese with English abstract).
[22]
Odeh I O A, McBratney A B, Chittleborough D J. Soil pattern recognition with fuzzy-c-means:application to classification and soil-landform interrelationships[J]. Soil Science Society of America Journal, 1992, 56(2): 505-516. DOI:10.2136/sssaj1992.03615995005600020027x
[23]
中华人民共和国国土资源部.土地利用现状分类: GB/T 21010-2017[S].北京: 中国标准出版社, 2017.
Ministry of Land and Resources of the People's Republic of China. Current Land Use Classification: GB/T 21010-2017[S]. Beijing: Standards Press of China, 2017(in Chinese).
[24]
潘剑君. 土壤调查与制图[M]. 3版. 北京: 中国农业出版社, 2010: 349-350.
Pan J J. Soil Survey and Mapping[M]. 3rd ed. Beijing: China Agriculture Press, 2010: 349-350 (in Chinese).
[25]
黄礼辉, 潘剑君, 雷学成, 等. 基于土壤系统分类的土壤类型和界线确定研究:以句容大顶山研究区为例[J]. 土壤, 2011, 43(4): 630-636.
Huang L H, Pan J J, Lei X C, et al. Identification of soil types and boundaries based on soil taxonomy:a case study of Dading mountain of Jurong[J]. Soils, 2011, 43(4): 630-636 (in Chinese with English abstract).