收稿日期: 2015-12-24; 修改日期: 2016-06-10; 优先数字出版日期: 2017-01-25
基金项目: 高分辨对地观测系统重大专项(编号:11-Y20A40-9002-15/17)
第一作者简介: 王文静(1989—),女,硕士研究生,研究方向为遥感分类及信息提取。E-mail:wangwenjlkfl@126.com
通讯作者简介: 张霞(1972— ),女,研究员,研究方向为光谱响应机理、图像处理与信息提取。E-mail:zhangxia@radi.ac.cn
中图分类号: TP79
文献标识码: A
文章编号: 1007-4619(2017)01-0115-10
|
摘要
传统的多时相遥感图像分类大多拘泥于单一特征,本文基于多时相的Landsat 8遥感数据,开展了综合多特征的特征提取与特征选择方法研究。综合了NDVI时间序列、最佳时相反射率光谱特征以及纹理特征作为初始分类特征,并采用基于属性重要度的粗糙集特征选择算法对其进行特征约简。分类结果表明:(1)利用初始分类特征,分类的总体精度达到92.81%,棉花提取精度达87.4%,与仅利用NDVI时间序列相比,精度分别提高5.53%和5.05%;(2)利用粗糙集选择后的特征分类,分类总体精度可达93.66%,棉花分类精度达92.73%,与初始分类特征提取结果相比,棉花分类精度提高5.33%。基于属性重要度的粗糙集特征选择不仅提高了分类精度,同时有效降低了分类器的计算复杂度。
关键词
多时相Landsat 8数据 , 综合多特征 , NDVI , 棉花提取 , 特征选择
Abstract
Cotton is a significant economic crop, and cotton extraction plays an important role in effective and controllable agricultural management. Multi-temporal remote sensing images have been widely used in cotton extraction, but these studies mainly focused on sole features, such as the Normalized Difference Vegetation Index (NDVI). An effective method of integrated multi-features based on multi-temporal Landsat 8 images was proposed to extract cotton information. In this study, we chose north-central Shawan County in Xinjiang Uygur Autonomous Region as the study area. Nine images taken by Landsat 8 in 2013 were collected for cotton extraction. NDVI time series were generated to characterize the phenological pattern of each land cover type. The optimal temporal reflectance image was selectedby analyzing the difference in NDVI profile between cotton and other crop types. Texture features were calculated by the gray-level co-occurrence matrix method. NDVI time series, optimal temporal reflectance image, and texture features were combined as the original classification features. When the training samples were sufficient, butthe featureswereexcessive, the classification accuracy may decrease because of redundant information. We completed feature selection by using the rough set method and then obtained the selective features of the original features. The NDVI time series, original features, and selective features were used for classification by the support vector machine. The cotton distribution map was generated based on the classification result of the highest accuracy. Finally, we evaluated the accuracy of classification results by confusion matrix. The selection of the optimal temporal reflectance image for cotton identification is important, and the optimum phase of this studyis on September 4. In this period, wheat was harvested; corn and sunflower were in the mature period; andcotton was in the blossom period. Significant differences were observed among these crops in the optimum phase. The original features achieved accuracies of 87.4% and 87.93% for cotton producers and users, respectively, and the overall accuracy was 92.81%. Compared with the classification results of the NDVI time series, the overall accuracy increased by 5.53% and the accuracy of cotton producers increased by 5.05%.Moreover, the classification accuracies of other land cover types increased to varying extents. The selective features achieved accuracies of 92.73% and 90.36% for cotton producers and users, respectively, and the overall accuracy was 93.66%. Compared with the classification results of the original features, the overall accuracy increased by 0.85% and the accuracy of cotton producers increased by 5.33%. Experiments showed that feature selection by the rough set method not only improved the classification accuracy but also effectively reduced the classification complexity. The proposed method achieved an accuracy of 92.73% for cotton extraction. The method of integrated multi-features based on multi-temporal Landsat 8 images is promising for crop extraction, even for land cover classification.
Key words
multi-temporal Landsat 8 images , integrated multi-features , NDVI , cotton extraction , feature selection
1 引言
棉花是中国重要的经济作物,及时、准确地掌握棉花种植分布对国家制定相应的农业政策和经济计划具有十分重要的意义。传统的地面抽样调查和层层上报方式由于时效性、经济性、准确性等方面的限制,难以满足农情监测的需求(郑长春,2008),遥感具有观测面积大、监测周期短等优点,已经被广泛地应用于农业领域(刘玫岑等,2005),为快速、准确、客观地获取作物信息提供了强大的手段(曹卫彬等,2004)。
地物的“异物同谱”等现象使得仅靠单一时相的遥感影像进行作物提取存在明显不足,难以达到精度要求。通过作物全生长期多时相遥感影像数据间的综合分析和相互补充,能够增加信息量,有利于提高作物提取精度。Hlavka等人(1980)认为多时相遥感数据能够提高不同作物间的区分能力;Conese和Maselli (1991)通过比较单时相与多时相的分类结果,发现多时相影像法分类精度较单时相有较大提高。
基于多时相遥感影像生成的植被指数时间序列可以很好的反映作物的季相节律性和物候变化规律,识别不同类型间作物的精度较高,已被广泛应用于作物种植信息提取中。其中,基于MODIS植被指数时间序列数据的作物面积提取的研究较多,Vintrou等人(2012)基于MODIS13Q1时间序列数据,采用景观分层的方法,进行了非洲马里南部农业用地的分类研究;Brown等人(2013)利用MODIS植被指数时间序列开展了巴西Mato Grosso地区多年的农用地分类研究。然而MODIS数据空间分辨率较低,仅适用于大尺度区域农作物信息提取,对于中小尺度研究区域容易出现较大误差,无法保证提取结果的精度。美国陆地卫星Landsat数据空间分辨率较高、获取方便、成本低,在作物信息提取中发挥着重要作用(Oguro等,2003)。朱良等(2013)采用多时相的Landsat TM数据,利用一种时间差异的决策树水稻提取模型,得到的提取结果精度较高;刘吉凯等(2015)基于多时相的Landsat 8数据,构建提取不同作物的决策树模型,实现了多种作物信息的提取。
多特征综合方法极大地丰富了遥感数据的信息量,但会造成信息冗余、波段间相关性较大等问题,不利于遥感数据的有效利用。因此,如何进行特征选择是首要问题。传统的特征选择算法主要分两类:基于信息量的特征选择及基于类间可分性的特征选择。常用的基于信息量的特征选择算法主要有:熵与联合熵(尹继豪等,2010)、最佳波段指数法(谷延锋和张晔,2003)、自适应特征选择法等(吴昊等,2010);常用的类间可分性的度量包括:Bhattacharyya距离(简称B距离)、均值间的标准距离(赵春晖等,2007)、离散度等。近年来,在传统特征波段选择的基础上,结合新的理论方法,出现了新的特征选择策略。粗糙集理论是一种模糊理论(Thangavel和Pethalakshmi,2009),基于粗糙集的特征选择方法主要是以约简思想为基础,结合不同的约简标准和方法对类别属性进行约简,达到降维的目的,无需原始数据的隶属度、概率分布等先验知识,只依赖数据内部的知识,可大大提高特征选择的客观性和真实性(王国胤等,2009)。潘远等人(2012)将基于粗糙集的约简算法应用于神经网络遥感分类的特征选择中,取得了较好的分类精度。
目前,基于多时相遥感影像作物提取的研究多数仅依靠一类特征(如植被指数),用于分类识别的特征单一。遥感影像中,不同地物类型的反射率存在差异,作物关键生长期的反射率光谱可有效地将其与其他地物相区别。同时,与其他地类相比,植被的空间纹理特征更为鲜明,加入纹理特征,有利于作物信息的准确提取。鉴于此,本文利用多时相Landsat 8数据,研究综合归一化植被指数(NDVI)时间序列、反射率光谱与几何纹理的特征提取方法,以及基于粗糙集约简算法的特征选择方法,以期提高棉花提取的准确性。
2 研究区与数据
2.1 研究区概况
沙湾县位于新疆天山北麓中段,准噶尔盆地南缘,归属塔城地区,属大陆性中温带干旱气候,年均气温为6.5 ℃,全年太阳实照时数为2800 h,无霜期为170-180 d,年降水量为140-350 mm,是棉花的主要种植区。沙湾县地势南高北低,南部为天山支脉,中部为山前洪积-冲积绿洲平原,北部为沙漠。选取沙湾县北部和中部为研究区,其经纬度范围为:84°57′E-86°09′E,44°01′N-45°20′N (图 1)。除了主要作物棉花外,同期大田作物还包括玉米、小麦、向日葵、瓜。表 1归纳了沙湾县主要作物的物候历信息,由表 1可看出,玉米的生长规律与棉花较为接近,均为4月中下旬播种,玉米成熟期稍早;小麦生长期与棉花差异较大,棉花处于蕾期时,小麦已成熟。
表 1 研究区主要作物物候历
Table 1 The phenological calendar of main crops in study area
月份 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||||||||||||||||||||||||||||||||
旬 | 上 | 中 | 下 | 上 | 中 | 下 | 上 | 中 | 下 | 上 | 中 | 下 | 上 | 中 | 下 | 上 | 中 | 下 | 上 | 中 | 下 | ||||||||||||||||||
棉花 | 播种 | 出苗 | 苗期 | 蕾期 | 花铃期 | 吐絮期 | 拔杆 | ||||||||||||||||||||||||||||||||
玉米 | 播种 | 出苗 | 苗期 | 拔节 | 抽穗 | 乳熟 | 成熟 | ||||||||||||||||||||||||||||||||
小麦 | 拔节 | 抽穗 | 乳熟 | 成熟 | |||||||||||||||||||||||||||||||||||
向日葵 | 播种 | 出苗 | 苗期 | 开花 | 成熟 |
2.2 数据与预处理
2.2.1 Landsat 8数据
研究区棉花生长期为4月到10月,选取该时期内9景无云影响、质量较高的Landsat 8数据,成像时间分别为2013-04-13、2013-05-15、2013-05-31、2013-06-16、2013-08-03、2013-08-19、2013-09-04、2013-10-06和2013-10-22。本文选择Landsat 8 OLI传感器30 m分辨率的波段2-7进行实验,这6个波段依次为蓝、绿、红、近红和两个短波红外波段,波段具体信息如表 2所示。Landsat 8数据经过系统的几何校正和辐射校正,投影坐标系为UTM-WGS84。
表 2 本文采用的Landsat 8波段信息
Table 2 Band information of Landsat 8 data used in the experiment
/μm | |
波段名称 | 波段 |
B2(蓝) | 0.45-0.52 |
B3(绿) | 0.53-0.60 |
B4(红) | 0.63-0.68 |
B5(近红) | 0.85-0.89 |
B6(短波红外1) | 1.56-1.66 |
B7(短波红外2) | 2.10-2.30 |
为提高遥感影像的质量,保证分类精度,对参与实验的影像进行了预处理,主要包括辐射定标和大气校正。大气校正采用ENVI软件的FLAASH模块。
2.2.2 验证数据
野外实地调查于2013年5月24至25日,9月25至30日进行,共获取了358个GPS样点数据,其中包括98个棉花点,52个小麦点,63个玉米点,39个向日葵点及28个瓜样点。
本文结合研究区实地调查数据,谷歌地图高分辨率遥感数据及全球30 m地表覆盖数据Globe Land30(http://www.globallandcover.com/[2015-12-24]),共选取13850个样本点:包含棉花、玉米、小麦、向日葵、瓜、草地、裸地、建设用地、水体9类典型地物,样本分布均匀,其中10%作为训练样本,剩余作为验证样本。
3 研究方法
3.1 特征提取
3.1.1 NDVI时间序列
NDVI能够反映植被在可见光、近红外波段反射与土壤背景之间的差异,具有较强的植被监测能力。NDVI随时间的变化与植被的物候信息呈现一定的规律性,成为区分地物的重要特征。利用式(1)分别计算9个时相的NDVI数据,构建NDVI时间序列。
$ {\rm{NDVI}} = \frac{{{\rho _{\rm NIR}} - {\rho _{\rm red}}}}{{{\rho _{\rm NIR}} + {\rho _{\rm red}}}} $ | (1) |
式中,ρNIR为近红外(NIR)波段的反射率,ρred为红波段(Red)的反射率。
在此基础上,计算NDVI时间序列的统计特征:NDVI最大值(NDVImax)、最小值(NDVImin)及均值(NDVIavg)。
图 2显示了典型地物的NDVI时间序列曲线,经分析可知:(1)整个棉花生长期,裸地、建设用地、水体3类地物的NDVI基本呈稳定趋势,6月16日到10月6日这5个时相,3类地物与棉花差异显著;(2)小麦6月下旬成熟收割后,裸地特征突出,NDVI处于较低水平,而6月末到9月末棉花处于生长旺盛期,二者易被区分;(3)玉米与棉花生长规律较相似,但玉米成熟期早于棉花,9月初棉花处于吐絮盛期,而玉米等作物已成熟,此时棉花差异显著,容易被区分。
3.1.2 最佳时相反射率特征选择
据3.1.1分析得,9月4日为区分棉花与其他地物的最佳时相,而地物的反射率光谱差异性特征是识别地物的基础,因此选取最佳时相的反射率特征作为分类特征。图 3为提取得到的最佳时相的反射率光谱,此时棉花处于吐絮旺期,植株茂盛,植被光谱特征明显突出,在近红外波段反射率很高。玉米和甜瓜在9月初均进入成熟期,在近红外波段反射率均低于棉花;小麦和向日葵已收获,裸地特征大于植被光谱特征,在近红外波段反射率较低。经分析可得知,最易区分棉花的波段为近红外波段;蓝、绿波段易将小麦,向日葵与其他地类相区分。
因此,最佳时相的反射率有助于将棉花与其他作物相区分,同时能降低NDVI时间序列特征相近的地类间的混淆度。
3.1.3 纹理特征
纹理是物体表面具有的内在特性,描述的是图像像元邻域灰度空间分布规律,不依赖亮度或颜色变化。与其他地类相比,植被的空间纹理特征更为鲜明,在空间分辨率适宜的遥感影像中,作物在田地块尺度,具有一定的纹理特征。加入纹理特征,有利于作物信息的准确提取。
灰度共生矩阵是通过研究两种灰度级像元的联合分布情况得到图像灰度级的空间相关性规律(Haralick等,1973),是遥感图像中最常用的纹理提取方法。首先对反射率数据进行主成分变换,保留前3个主成分分量(累积贡献率达97.6%)。经多次试验对比分析,选用3×3大小的移动窗口,利用灰度共生矩阵分别计算前3个分量的8种纹理特征:均值(Mean)、方差(Variance)、同质性(Homogeneity)、对比度(Contrast)、差异性(Dissimilarity)、熵(Entropy)、二阶矩(Second Moment)、相关性(Correlation)。
综上所述,本文提取3类特征:NDVI时间序列、最佳时相反射率光谱特征及纹理特征,共计42个特征,各类特征具体信息如表 3所示。
表 3 用于分类的特征信息
Table 3 Information of the feature used in classification
特征类组 | 波段数目 | 波段命名 | 波段含义 |
a (NDVI时间序列) | 12 | a1, a2, …, a12 | a1-a9依次为4月13日-10月22日9个时相的NDVI,
a10、a11、a12分别为NDVI最大值、最小值及均值 |
b (反射率光谱特征) | 6 | b1, b2, …, b6 | b1-b6依次代表 9月4日的B2-B7波段 |
c (纹理特征) | 24 | c1, c2, …, c24 | c1-c8, c9-c16, c17-c24依次为Landsat 8影像主成分变换第一、 第二、第三分量的纹理特征 |
3.2 基于属性重要度的粗糙集特征选择
通过特征提取可以综合了多时相的多类别特征,有利于提高地物的区分度,但因参与分类的特征数目较多,会导致分类器的计算复杂性增加、计算效率降低等问题,因此分类前有必要进行特征选择。
3.2.1 粗糙集约简
基于粗糙集的特征选择方法主要是以约简思想为基础,结合不同的约简标准和方法对类别属性进行约简,达到降维的目的,无需原始数据的隶属度、概率分布等先验知识,只依赖数据内部的知识,极大地提高了特征选择的客观性和真实性。
定义1:给定知识库K=(U, R),若P
定义2:给定K=(U, R)和一个等价关系簇P∈R,对于任意的S∈R,若S满足IND (P-{S})≠IND (P),则称S为P中必要的,P中所有必要的知识构成P的核,用CORE (P)来表示。
定义3:给定K=(U, R)和一个等价关系簇P
定义4:对于知识库K=(U, R),R=C∪D,C∩D=
定义决策属性表为DT=(U, C∪D),设定
$ \begin{array}{*{20}{l}} {sig\left( {\mathit{\boldsymbol{a}},\mathit{\boldsymbol{B}},\mathit{\boldsymbol{D}}} \right) = }\\ {\left\{ {\left| {po{s_{\mathit{\boldsymbol{B}} \cup \left\{ \mathit{\boldsymbol{a}} \right\}}}\left( \mathit{\boldsymbol{D}} \right)} \right| - \left| {po{s_\mathit{\boldsymbol{B}}}\left( \mathit{\boldsymbol{D}} \right)} \right|} \right\}/\left| \mathit{\boldsymbol{U}} \right|} \end{array} $ | (2) |
式中,posB(D)为D的B正域,posB∪{a}(D)为D的B∪{a}正域。
常用的粗糙集约简方法主要有一般约简法,基于差别矩阵的约简法和基于属性重要度的约简法(许新征,2012)。属性重要度算法是一种启发式算法,计算量较小、简单易行。与其他约简算法相比,基于属性重要度的约简算法计算量小,复杂度较低。本文采用基于属性重要度的粗糙集特征选择方法,考虑到该方法对样本敏感,其特征选择结果可能会随样本不同而出现差异,故采用动态约简来提高结果的稳定性。
3.2.2 基于属性重要度的粗糙集特征选择
基于属性重要度的粗糙集特征选择算法基本流程如下:
(1)结合实地调查数据选取各类地物的样本对象,将约简前各特征作为条件属性C,样本类别作为决策属性D,构建决策属性表DT=(U, C∪D);
(2)对决策表中的条件属性C进行离散化;
(3)计算知识系统的核COREDC,令初始约简结果B=COREDC,若posB(D)=posC(D)转向步骤6;
(4)对于
(5)若posB(D)≠posC(D),返回步骤4,否则执行步骤6;
(6)约简结束,输出约简结果集B。
4 结果与分析
4.1 特征选择结果
利用基于属性重要度的粗糙集算法分别对表 3中3组特征进行选择。为了获得稳定的优选特征集,本文使用动态约简,每次从训练样本中抽取20%的样本,重复20次试验,最后选取出现频数较高的特征作为优选特征。
对于特征组a,将样本对象的NDVI特征作为属性约简的条件属性,所属类别作为决策属性,构建决策属性表,然后执行特征选择。表 4列出了a组进行20次特征选择所得的结果,由表可看出20次实验中a1、a2、a3、a4、a6、a7和a11出现频数分别为18、16、17、16、15和16,均在15次以上,其余特征出现频数均低于10次,取阈值为15,即选择出现频数高于15的特征作为优选特征,得a组特征波段选择结果为{a1,a2,a3,a4,a6,a7,a11},保留特征为NDVI4/13,NDVI5/15,NDVI5/31,NDVI6/16,NDVI8/19,NDVI9/4 (下标代表日期)及NDVImin。结合图 2分析得,构成各类地物NDVI时间序列差异的关键时相都被保留,能充分发挥NDVI时间序列在棉花提取中的重要性。
表 4 特征组a选择结果
Table 4 Selection results of feature set a
实验编号 | 选择结果 |
1 | {a1, a2, a3, a4, a7, a11} |
2 | {a1, a2, a3, a4, a6, a11} |
3 | {a1, a2, a3, a4, a6, a7, a11} |
4 | {a1, a3, a4, a5, a6, a8, a9, a12} |
5 | {a1, a2, a3, a4, a7, a11} |
6 | {a1, a2, a3, a4, a6, a7, a11} |
7 | {a1, a3, a4, a5, a6, a7, a11} |
8 | {a1, a2, a3, a4, a5, a6, a11} |
9 | {a1, a2, a3, a4, a6, a11} |
10 | {a2, a3, a5, a6, a7, a8, a9, a11} |
11 | {a1, a2, a3, a4, a7, a11} |
12 | {a1, a2, a3, a4, a6, a7, a11} |
13 | {a1, a2, a5, a6, a7, a8, a9, a12} |
14 | {a1, a3, a5, a6, a7, a9, a10, a12} |
15 | {a1, a2, a5, a9, a10, a11} |
16 | {a2, a3, a4, a5, a6, a7, a11} |
17 | {a1, a2, a4, a5, a6, a7, a9} |
18 | {a1, a2, a3, a4, a6, a7, a11} |
19 | {a1, a2, a3, a4, a5, a7, a11} |
20 | {a1, a3, a4, a6, a7, a8, a11} |
同样取阈值为15,在20次试验结果中,特征b1、b2、b4和b5出现次数均高于阈值,因此,特征b组特征选择结果为{b1,b2,b4和b5},保留特征为最佳时相的蓝波段、绿波段、近红波段和短波红外波段反射率光谱;特征c1、c9和c17出现次数高于阈值,则c组特征选择结果为{c1,c9和c17},保留特征为Landsat 8影像主成分变换前3个分量的均值。
综上所述,波段选择的最终结果为{a1,a2,a3,a4,a6,a7,a11,b1,b2,b4,b5,c1,c9,c17},共保留14个特征,分别为NDVI4/13,NDVI5/15,NDVI5/31,NDVI6/16,NDVI8/19,NDVI9/4和NDVImin;最佳时相的蓝波段,绿波段,近红波段和短波红外波段反射率光谱;影像主成分变换前3个分量的均值纹理特征。
得到优选波段组合后,通过计算J-M距离,检验不同地类间的可分性。表 5显示了不同地类间J-M距离的计算结果,可看出各地类间的可分性均达到分类要求,可见特征选择结果较为理想。
表 5 基于优选波段组合的各地类间J-M距离
Table 5 J-M distance between different classes based on the optimized features
类别 | J-M距离 | ||||||||
草地 | 小麦 | 玉米 | 向日葵 | 棉花 | 甜瓜 | 裸地 | 建设 | 水体 | |
草地 | 0 | ||||||||
小麦 | 1.9999 | 0 | |||||||
玉米 | 1.9995 | 2.0000 | 0 | ||||||
向日葵 | 1.9999 | 1.9999 | 1.9799 | 0 | |||||
棉花 | 1.9999 | 2.0000 | 1.9561 | 1.9892 | 0 | ||||
甜瓜 | 1.9947 | 2.0000 | 1.9697 | 1.9423 | 1.9599 | 0 | |||
裸地 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 0 | ||
建设 | 1.9593 | 1.9999 | 2.0000 | 1.9999 | 2.0000 | 1.9999 | 1.9349 | 0 | |
水体 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 2.0000 | 0 |
4.2 分类及精度评价
采用支持向量机分类器,进行了如下3组分类实验:(1)仅利用NDVI时间序列进行分类;(2)利用特征提取的全部42个特征进行分类;(3)利用经特征选择后保留的14个优选特征进行分类。表 6列出了基于14个优选波段所得分类结果的混淆矩阵,表 7为3组实验的分类结果精度对比。
表 6 基于优选特征分类的混淆矩阵
Table 6 Confusion matrix of classification based on the optimized features
类别 | 草地 | 小麦 | 玉米 | 向日葵 | 棉花 | 甜瓜 | 裸地 | 建设 | 水体 | 总计 |
草地 | 1064 | 0 | 2 | 1 | 0 | 10 | 0 | 6 | 0 | 1083 |
小麦 | 0 | 1511 | 0 | 0 | 0 | 0 | 8 | 2 | 0 | 1521 |
玉米 | 16 | 0 | 752 | 0 | 82 | 4 | 0 | 0 | 0 | 854 |
向日葵 | 6 | 6 | 5 | 1012 | 0 | 9 | 0 | 0 | 0 | 1038 |
棉花 | 9 | 0 | 97 | 0 | 1097 | 11 | 0 | 0 | 0 | 1214 |
甜瓜 | 30 | 0 | 16 | 2 | 4 | 916 | 1 | 9 | 0 | 978 |
裸地 | 0 | 7 | 0 | 1 | 0 | 0 | 3066 | 61 | 0 | 3135 |
建设 | 4 | 0 | 0 | 8 | 0 | 0 | 373 | 1218 | 0 | 1603 |
水体 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1038 | 1038 |
总和 | 1129 | 1524 | 872 | 1024 | 1183 | 950 | 3448 | 1296 | 1038 | 12464 |
表 7 分类精度统计
Table 7 Classification accuracy statistics
类别 | NDVI时间序列 | NDVI+反射率光谱+纹理特征(42个) | NDVI+反射率光谱+纹理特征选择后(14个) | |||||
PU/% | UA/% | PU/% | UA/% | PU/% | UA/% | |||
草地 | 86.01 | 92.65 | 94.07 | 95.08 | 94.24 | 98.25 | ||
小麦 | 87.01 | 89.78 | 99.02 | 99.28 | 99.15 | 99.34 | ||
玉米 | 66.51 | 76.42 | 81.77 | 84.08 | 86.24 | 88.06 | ||
向日葵 | 93.95 | 92.86 | 97.36 | 95.96 | 98.83 | 97.50 | ||
棉花 | 82.35 | 78.5 | 87.4 | 87.93 | 92.73 | 90.36 | ||
甜瓜 | 83.47 | 84.99 | 94.21 | 92.94 | 96.42 | 93.66 | ||
裸地 | 89.27 | 88.83 | 89.30 | 98.75 | 88.92 | 97.80 | ||
建设用地 | 77.39 | 78.91 | 96.22 | 75.81 | 93.98 | 75.98 | ||
水体 | 100 | 100 | 100 | 100 | 100.00 | 100.00 | ||
总体精度/% | 87.28 | 92.81 | 93.66 | |||||
Kappa系数 | 0.85 | 0.91 | 0.92 | |||||
注:表中PU、UA分别代表各类的生产精度和使用精度。 |
由表 6可看出,1183个棉花真实像元中,1097个被正确分类,82个像元被错分为玉米;而872个玉米真实像元中,752个被正确分类,97个被错分为棉花,16个被错分为瓜,由此可看出棉花与玉米混淆较严重,影响了棉花提取精度。这主要是因为沙湾县棉花与玉米生长规律相似,两种作物虽在6月16日和9月4日这两个时相有差别,但作物长势参差不齐,会使部分玉米、棉花间差距减小,造成误分。裸地和建设用地也出现了一定程度的误分,1296个建设用地真实像元中,61个被误分为裸地,其他地物分类精度都较高。
由表 7分类结果精度对比可以看出:
(1)综合NDVI时间序列、最佳时相反射率光谱特征及纹理特征,分类的总体精度达92.81%,棉花的生产精度和用户精度分别为87.4%、87.93%;与仅利用NDVI时间序列的分类结果相比,分类的总体精度提高5.53%,棉花的生产精度和用户精度分别提高了5.05%、9.43%,其他各类地物的分类精度均有不同的程度的提高,这是因为加入最佳时相的反射率数据和纹理特征,增加了各地物间的光谱差异性和可分性。只利用NDVI时间序列进行分类,各地类分类精度都相对较低,这说明仅利用单一特征进行分类不是最佳选择,采用综合多特征的方法能有效提高分类精度。
(2)与利用特征提取的全部42个特征分类结果相比,利用14个优选特征波段分类的总体精度达到93.66%,提高了0.85%;棉花的生产精度和分类精度为92.73%和90.36%,分别提高了5.33%和2.43%;裸地、建设用地的分类精度稍有降低,其他各类地物分类精度均提高。在训练样本充足的情况下,参与分类特征过多时,可能会由于信息冗余导致分类精度降低,经基于属性重要度的粗糙集特征选择后,只保留了对分类起关键作用的波段信息,避免了冗余信息对分类的干扰,提高了分类精度。同时分类特征数目大大减少,有效降低了分类器的计算复杂度。
5 结论
本文基于多时相的Landsat 8遥感数据,提取NDVI时间序列、最佳时相反射率光谱特征及纹理特征作为初始分类特征,进而采用基于属性重要度的粗糙集特征选择算法对其进行选择。以新疆沙湾县中北部为研究区,采用支持向量机分类器,基于优选后的特征进行分类,最终获得棉花提取结果。得出以下结论:
(1)通过分析典型地物的NDVI时间序列及反射率光谱曲线,选择棉花遥感提取的最佳时相,加入最佳时相反射率数据及纹理特征后,分类的总体精度及棉花精度都有较大提高。综合多特征的分类方式,有助于提高分类精度。
(2)利用粗糙集优选的特征分类,分类总体精度可达93.66%,棉花提取精度达92.73%,较特征选择前,分类总体精度和棉花提取精度分别提高0.85%和5.33%。基于属性重要度的粗糙集特征选择不仅提高了分类精度,同时有效降低了分类器的计算复杂度。
本文通过综合多特征的方法得到较为满意的棉花提取结果,后续将增加其他地物场景的分类实验以进一步验证该方法的适用性。
参考文献(References)
-
Brown J C, Kastens J H, Coutinho A C, de Castro Victoria D, Bishop C R.2013.Classifying multiyear agricultural land use data from Mato Grosso using time-series MODIS vegetation index data. Remote Sensing of Environment, 130 : 39–50[DOI: 10.1016/j.rse.2012.11.009]
-
Cao W B, Yang B J, Song J P.2004.Spectral information based model for cotton identification on Landsat TM image. Transactions of the CSAE, 20 (4): 112–116 ( 曹卫彬, 杨邦杰, 宋金鹏. 2004. TM影像中基于光谱特征的棉花识别模型. 农业工程学报, 20 (4): 112–116)[DOI: 10.3321/j.issn:1002-6819.2004.04.025]
-
Conese C, Maselli F.1991.Use of multitemporal information to improve classification performance of TM scenes in complex terrain. ISPRS Journal of Photogrammetry and Remote Sensing, 46 (4): 187–197[DOI: 10.1016/0924-2716(91)90052-W]
-
Gu Y F, Zhang Y.2003.Feature extraction based on automatic subspace partition for hyperspectral images. Remote Sensing Technology and Application, 18 (6): 384–387 ( 谷延锋, 张晔. 2003. 基于自动子空间划分的高光谱数据特征提取. 遥感技术与应用, 18 (6): 384–387)[DOI: 10.3969/j.issn.1004-0323.2003.06.006]
-
Haralick R M, Shanmugam K, Dinstein I H.1973.Textural features for image classification. IEEE Transactions on Systems, Man, and Cybernetics, 3 (6): 610–621[DOI: 10.1109/TSMC.1973.4309314]
-
Hlavka C A, Haralick R M, Carlyle S M, Yokoyama R.1980.The discrimination of winter wheat using a growth-state signature. Remote Sensing of Environment, 9 (4): 277–294[DOI: 10.1016/0034-4257(80)90034-6]
-
Liu J K, Zhong S Q, Liang W H.2015.Extraction on crops planting structure based on multi-temporal Landsat 8 OLI images. Remote Sensing Technology and Application, 30 (4): 775–783 ( 刘吉凯, 钟仕全, 梁文海. 2015. 基于多时相landsat8 OLI影像的作物种植结构提取. 遥感技术与应用, 30 (4): 775–783)[DOI: 10.11873/j.issn.1004-0323.2015.4.0775]
-
Liu M C, Li X, Jiang P A, Sheng J D.2005.The application of ASTER data in cotton information classification-taking 16 farm of Nongyishi of production and construction group as an example. Remote Sensing Technology and Application, 20 (6): 591–595 ( 刘玫岑, 李霞, 蒋平安, 盛建东. 2005. ASTER数据在棉花信息提取中的应用--以兵团农一师十六团为例. 遥感技术与应用, 20 (6): 591–595)[DOI: 10.3969/j.issn.1004-0323.2005.06.010]
-
Oguro Y, Suga Y, Takeuchi S, Ogawal H, Tsuchiya K.2003.Monitoring of a rice field using Landsat-5 TM and Landsat-7 ETM+ data. Advances in Space Research, 32 (11): 2223–2228[DOI: 10.1016/S0273-1177(03)90546-1]
-
Pan Y, Yang J H, Wu W B.2012.Neural network based on rough sets reduction and its application to remote sensing image classification. Remote Sensing Information, 27 (4): 86–90 ( 潘远, 杨景辉, 武文波. 2012. 粗糙集约简的神经网络遥感分类应用. 遥感信息, 27 (4): 86–90)[DOI: 10.3969/j.issn.1000-3177.2012.04.015]
-
Thangavel K, Pethalakshmi A.2009.Dimensionality reduction based on rough set theory:a review. Applied Soft Computing, 9 (1): 1–12[DOI: 10.1016/j.asoc.2008.05.006]
-
Vintrou E, Desbrosse A, Bégué A, Traoré S, Baron C, Lo Seen D.2012.Crop area mapping in West Africa using landscape stratification of MODIS time series and comparison with existing global land products. International Journal of Applied Earth Observation and Geoinformation, 14 (1): 83–93[DOI: 10.1016/j.jag.2011.06.010]
-
Wang G Y, Yao Y Y, Yu H.2009.A survey on rough set theory and applications. Chinese Journal of Computers, 32 (7): 1229–1246 ( 王国胤, 姚一豫, 于洪. 2009. 粗糙集理论与应用研究综述. 计算机学报, 32 (7): 1229–1246)[DOI: 10.3724/SP.J.1016.2009.01229]
-
Wu H, Li S J, Lin L, Wan D S.2010.Multiple-strategy combination based approach to band selection for hyper-spectral image classification. Journal of Frontiers of Computer Science and Technology, 4 (5): 464–472 ( 吴昊, 李士进, 林林, 万定生. 2010. 多策略结合的高光谱图像波段选择新方法. 计算机科学与探索, 4 (5): 464–472)[DOI: 10.3778/j.issn.1673-9418.2010.05.009]
-
Xu X Z. 2012. Study on Granular Neural Networks based on Rough Sets. Beijing:China University of Mining and Technology (许新征. 2012.基于粗糙集的粒度神经网络研究.北京:中国矿业大学)) http://www.wenkuxiazai.com/doc/99e5b926cfc789eb172dc8f4.html
-
Yin J H, Wang Y S.2010.An algorithm of rapid optimum band selection from hyperspectral remote sensing image. Remote Sensing Information, 25 (3): 3–6,12 ( 尹继豪, 王义松. 2010. 高光谱遥感影像中最佳谱段的快速选择方法. 遥感信息, 25 (3): 3–6,12)[DOI: 10.3969/j.issn.1000-3177.2010.03.001]
-
Zhao C H, Chen W H, Yang L.2007.Research advances and analysis of hyperspectral remote sensing image band selection. Journal of Natural Science of Heilongjiang University, 24 (5): 592–602 ( 赵春晖, 陈万海, 杨雷. 2007. 高光谱遥感图像最优波段选择方法的研究进展与分析. 黑龙江大学自然科学学报, 24 (5): 592–602)[DOI: 10.3969/j.issn.1001-7011.2007.05.007]
-
Zheng C C. 2008. Study on Remote Sensing Information Extraction of Paddy Rice Planting Area. Urumqi:Xinjiang Agriculture University (郑长春. 2008.水稻种植面积遥感信息提取研究.乌鲁木齐:新疆农业大学[DOI:10.7666/d.y1256827])
-
Zhu L, Ping B, Su F Z, Du Y Y, Su W G.2013.Using decision tree model to extract paddy rice information from multi-temporal TM images. Journal of Geo-information Science, 15 (3): 446–451 ( 朱良, 平博, 苏奋振, 杜云艳, 苏伟光. 2013. 多时相TM影像决策树模型的水稻识别提取. 地球信息科学学报, 15 (3): 446–451)[DOI: 10.3724/SP.J.1047.2013.00446]