出版日期: 2018-09-25
点击次数:
下载次数:
DOI: 10.11834/jrs.20187068
2018 | Volumn22 | Number 5
上一篇  |  下一篇


  
PCA和布谷鸟算法优化SVM的遥感矿化蚀变信息提取
expand article info 吴一全1,2,3,4,5,6 , 盛东慧1 , 周杨1
1. 南京航空航天大学 电子信息工程学院,南京 211106
2. 中国地质科学院矿产资源研究所 国土资源部成矿作用与资源评价重点实验室,北京 100037
3. 国土资源部 地质信息技术重点实验室,北京 100037
4. 成都理工大学 国土资源部地学空间信息技术重点实验室,成都 610059
5. 兰州大学 甘肃省西部矿产资源重点实验室,兰州 730000
6. 东华理工大学 江西省数字国土重点实验室,南昌 330013

摘要

为了进一步提高遥感矿化蚀变信息提取的精度,本文提出了一种基于主成分分析PCA (Principal Component Analysis)和布谷鸟算法优化支持向量机SVM (Support Vector Machine)的遥感矿化蚀变信息提取方法。首先,通过波段比值法增强研究区遥感图像中的矿化蚀变信息,并获得比值图像;然后,对比值图像进行主成分分析,进而提取训练样本;接着,利用SVM对训练样本进行训练,同时采用布谷鸟算法求取SVM的最优核参数及惩罚因子,构造最优SVM模型;最后,运用最优SVM模型完成矿化蚀变信息提取。选择青海省五龙沟地区为研究区,提取羟基及铁染蚀变信息。实验结果表明,与主成分分析法、基于光谱角法和SVM的方法、基于粒子群和SVM的方法及基于波段比值、PCA和粒子群优化SVM的方法等4种方法相比,本文方法获得的遥感矿化蚀变信息和已知矿点的吻合度最高,提取效果最好。

关键词

遥感, 矿化蚀变信息提取, 主成分分析(PCA), 支持向量机(SVM), 布谷鸟算法, 波段比值法

Remote sensing mineralization alteration information extraction based on PCA and SVM optimized by cuckoo algorithm
expand article info WU Yiquan1,2,3,4,5,6 , SHENG Donghui1 , ZHOU Yang1
1.College of Electronic and Information Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China
2.Key Laboratory of Metallogeny and Mineral Assessment, Ministry of Land and Resources, Institute of Mineral Resources, Chinese Academy of Geological Sciences, Beijing 100037, China
3.Key Laboratory of Geological Information Technology, Ministry of Land and Resources, Beijing 100037, China
4.Key Laboratory of Geo-Spatial Information Technology, Ministry of Land and Resources, Chengdu University of Technology, Chengdu 610059, China
5.Key Laboratory of Mineral Resources in Western China (Gansu Province), Lanzhou University, Lanzhou 730000, China
6.Digital Land Key Laboratory of Jiangxi Province, East China Institute of Technology, Nanchang 330013, China

Abstract

With the rapid development of the economy, the demand for mineral resources is growing, and the contradiction between supply and demand is increasing. The shortage of mineral resources has become one of the important factors that restrict national economic development. Therefore, research on how to efficiently and accurately explore mineral resources is a critical endeavor. Remote sensing mineralization alteration information extraction is an important application of remote sensing technology in geological exploration, which is of utmost significance to mineral exploration and evaluation. Owing to the influence of vegetation, cloud, and snow, alteration information from remote sensing mineralization is often superimposed with the complex geological background and exists only in the form of a weak signal in the background of the remote sensing image. Research on effective remote sensing mineralization alteration information extraction methods can provide the basis for the study of regional metallogenic prognosis and speed up the evaluation of mineral resources exploration, which helps promote the healthy and stable development of the local mining economy. To improve the accuracy of remote sensing mineralization alteration information extraction method, a remote sensing mineralization alteration information extraction method based on Principal Component Analysis (PCA) and Support Vector Machine (SVM) optimized by cuckoo algorithm is proposed in this study. First, the mineralization alteration information in the remote sensing image of the study area is enhanced by band ratio method, and the ratio images are obtained. Then PCA is applied to the ratio images of the study area. The hydroxyl principal components and iron staining principal components are selected, after which the training samples are extracted. Subsequently, the training samples are trained by SVM, while cuckoo algorithm is used to find the optimal kernel parameter and penalty factor of SVM. Thus, the optimal SVM model is determined. Finally, the optimal SVM model is used to accomplish the extraction of remote sensing mineralization alteration information in the study area. Wulonggou area of Qinghai Province, which is rich in mineral resources, is selected as the study area where the hydroxyl alteration information and iron alteration information are extracted. A detailed comparison among the proposed method and four methods proposed recently, namely, the PCA method, the method based on spectral angle mapper and SVM, the method based on particle swarm optimization and SVM, and the method based on band ratio, PCA, and SVM optimized by particle swarm optimization in terms of extraction effect and matching rate, is given in this paper. Experimental results show that by using the proposed method, the extracted information can comprehensively reflect the remote sensing mineralization alteration information of the study area. Moreover, the matching degree of hydroxyl alteration information and iron alteration information are 86.5% and 69.2%, respectively. Meanwhile, compared with the four methods, the proposed method can obtain the highest matching degree with the best extraction effect. The proposed remote sensing mineralization alteration information extraction method based on PCA and SVM optimized by cuckoo algorithm is an effective method that provides a new idea for mineral exploration and metallogenic prediction.

Key words

remote sensing, mineralization alteration information extraction, principal component analysis, support vector machine, cuckoo algorithm, band ratio method

1 引 言

近年来经济发展十分迅猛,对矿产资源的需求也越来越大,许多大型矿山都面临资源枯竭的困境,现在已发现的矿床已无法满足经济发展的需求。矿产资源的紧缺已成为制约国家经济发展的重要因素,因此,如何实现矿产资源高效、准确的勘探,己成为地质勘查行业的首要任务(Pour 等,2013)。遥感矿化蚀变信息提取是遥感探矿的重要步骤,对于矿产的勘测与评价具有重要指示意义(Mia 等,2014)。诸多干扰因素如植被、云、雪等会使得矿化蚀变信息和背景的各种地物信息混合在一起,其往往是以微弱信号的形式存在于遥感图像的背景里(Sadeghi 等,2013Xu 等,2014)。因此,怎样从遥感图像中准确地提取出矿化蚀变信息,一直是遥感找矿领域的热点与难点之一(高景刚 等,2008)。近年来,矿化蚀变信息提取方法主要包括波段比值法(Imbroane 等,2007)、主成分分析法PCA(Principal Component Analysis) (陈建平 等,2009)、光谱角填图法(Hecker 等,2008)、支持向量机法SVM (Support Vector Machine)等。波段比值法通过对各个波段进行算术运算,加强各种地物间的光谱差异来获得蚀变信息,但是仅仅运用简单的波段运算无法获得理想的提取效果(何凯涛 等,2009)。因此,常常把波段比值法用于蚀变带信息的加强(沈利霞 等,2008)。PCA能够高效地实现数据的降维,利用数学变换把相关的多维数据转换为互不相关的数据,在矿化蚀变信息提取中得到了广泛的运用(刘磊 等,2013)。刁海等人(2011)首先通过PCA获得反映蚀变信息的主成分,然后利用分形模型求取蚀变异常的阈值,实现了白乃庙地区蚀变异常信息的定位,但是其获取的结果中存在较多伪信息。张永庭等人(2012)通过PCA和光谱角法实现宁夏区铁染和羟基蚀变异常信息的定位,进而对该地区蚀变信息的分布特点进行了分析。赵小星等人(2013)针对云南江城大团包铜矿的ETM+遥感数据,运用PCA和最大似然法,获取了高植被覆盖区遥感影像上铜、铅等异常信息。但是仅运用PCA和简单的分类算法,往往无法获得理想的提取精度(吴浩 等,2016)。SVM是一种基于监督学习模型的机器学习算法,对有限样本、非线性及高维条件下的分类问题展现出优良的性能(Wang和Zheng,2010杨佳佳 等,2012)。傅文杰等人(2006)首先采用光谱角制图法获得训练样本,进而通过SVM来实现蚀变异常信息的获取,但其提取的训练样本没有综合考虑光谱间大小及方向的不同,对提取精度造成了影响。针对该问题,于浩等人(2014)运用光谱能级匹配法获得矿化样本,进而通过SVM实现矿化蚀变信息的获取,提升了提取精度,但其中的核参数及惩罚因子依据经验设定,会对识别性能产生影响。

鉴于此,可以使用自适应的智能优化方法来进一步提升SVM的分类精度。布谷鸟算法(Yang和Deb,2009)通过对布谷鸟种群的寄生育雏(Brood Parasitism)与莱维飞行(Lévy Flights)等行为进行模拟来实现最优化问题的求解,具有效率高、飞行路径优良等特性,在实际工程中的参数优化问题中得到了较多的应用(Walton 等,2011Tuba 等,2011)。因此,利用布谷鸟算法对SVM进行改进,获得最优的惩罚因子和核参数,有望提高遥感矿化蚀变信息提取的效果。因此,本文提出一种基于PCA和布谷鸟算法优化SVM的矿化蚀变信息提取方法,以进一步提高矿化蚀变信息提取的精度。

2 研究区成矿地质背景

本文以五龙沟地区为研究区,其处于青海省中北部,东西长约22.5 km,南北宽约18.5 km,面积约400 km2,地理坐标:95°44′00″—96°02′00″E,36°08′00″—36°19′00″N。研究区的韧性剪切变形现象较为剧烈,总体构造线以北西–南东向分布,产生了三道梁–苦水泉、萤石沟–红旗沟、岩金沟等3条剪切带,即为研究区中3个最重要的构造控矿带(易桂花,2011)。其中,岩金沟剪切带呈西北向展布,岩金沟金矿即产出于该剪切带;萤石沟–红旗沟剪切带呈西北偏西向带状展布,其处在五龙沟岩体的北边,淡水沟–红旗沟金矿即产出于该剪切带;三道梁–苦水泉剪切带呈西北偏西向展布,其处在五龙沟岩体南边,该剪切带南侧的西北偏西及西北向断裂破碎带中已探测出若干金矿床(化)点(易桂花,2011)。五龙沟地区拥有丰厚的矿产资源,目前已知的矿床(点)共有52个,包含金矿(化)点32个,另有多金属矿 (化)点8个,铅矿 (化)点5个,铜矿 (化)点3个,铁矿 (化)点3个,钼矿 (化)点1个,是青海省矿产勘探最有潜力的地区之一。研究区的矿石矿化蚀变现象较为强烈,其类型包括硅化、绢云母化、高岭土化、黄铁矿化等,因此羟基及铁染蚀变信息对研究区内的矿产勘探最具有指示意义(吴浩 等,2016)。研究数据取自美国陆地卫星Landsat ETM+影像,成像日期为2015年8月1日,使用其中的波段。研究区遥感影像没有云雪等干扰因素的影响,植被覆盖量很小,且气候较为干燥,符合矿化蚀变信息提取实验的需求。图1给出了研究区的ETM+假彩色遥感图像。

图 1 研究区ETM+假彩色遥感图像(R(7)G(4)B(1))
Fig. 1 ETM+ false color remote sensing image of study area

3 原理及方法

3.1 基于波段比值法和PCA的矿化样本提取

3.1.1 波段比值法

波段比值法可以依据各种地物的光谱特性,充分运用遥感图像各个波段间的算术运算,在进行矿化蚀变信息提取之前,实现图像中植被等干扰因素的抑制及目标信息的凸显。本文重点研究如何有效提取研究区的羟基及铁染蚀变信息,因此首先对富含羟基的黏土类矿物及富含铁离子的矿物的光谱特征进行分析。由于含羟基的粘土类矿物的光谱特性为:在ETM 5波段(1.55—1.75 μm)反射率较高、在ETM 7(2.08—2.35 μm)波段剧烈吸收,因此利用ETM+5/7可增强羟基信息在ETM 5波段和ETM 7波段之间的反差,突出羟基蚀变信息;含铁离子的矿物具有在ETM5波段反射率较高,在ETM1(0.45—0.52 μm)、ETM2(0.52—0.60 μm)、ETM3(0.63—0.69 μm)、ETM4(0.76—0.90 μm)波段明显吸收的光谱特征,因此比值分量ETM 5/4、ETM 5/3、ETM 5/2、ETM 3/1都可反映铁染蚀变信息;且植被具有在ETM 3到ETM 4波段反射率剧烈升高的特征,因此利用ETM 3/4可压制植被等干扰对提取结果的影响。本文首先分别计算研究区遥感图像ETM 5/7、ETM 5/4、ETM 5/3、ETM 5/2、ETM 3/4、ETM 3/1的比值,抑制干扰因素的同时突出羟基及铁染蚀变信息,以提高矿化样本的质量,改善矿化蚀变信息提取的效果。

3.1.2 主成分分析

PCA为一种能够将高维变量降维、实现数据压缩的数学分析方法。PCA可将遥感图像多波段的数据转换到数目较少且互不相关的分量中,亦相当于完成了蚀变信息提取前的特征提取。PCA提取图像主成分的主要步骤为:首先,实现输入图像的标准化处理,获得归一化样本矩阵;然后,求得样本矩阵的协方差矩阵,进而获得其特征值与特征向量;最后,选择组分,获得降维后的数据(陈建平 等,2009)。式(1)给出了对多波段遥感图像进行PCA的公式:

$\begin{array}{c}{{{Y}}_1}{\rm{ = }}{B_{11}}{{{X}}_1}{\rm{ + }}{B_{12}}{{{X}}_2}{\rm{ + }} \cdots {\rm{ + }}{B_{1P}}{{{X}}_P}\\ {{{Y}}_2}{\rm{ = }}{B_{21}}{{{X}}_1}{\rm{ + }}{B_{22}}{{{X}}_2}{\rm{ + }} \cdots {\rm{ + }}{B_{2P}}{{{X}}_P}\\ \vdots \\ {{{Y}}_P}{\rm{ = }}{B_{P1}}{{{X}}_1}{\rm{ + }}{B_{P2}}{{{X}}_2}{\rm{ + }} \cdots {\rm{ + }}{B_{PP}}{{{X}}_P}\end{array}$ (1)

式中, ${{{X}}_1}, {{{X}}_2}, \cdots, {{{X}}_P}$ 为输入的P个波段的遥感图像; ${{{Y}}_{\rm{1}}}, {{{Y}}_{\rm{2}}}, \cdots, {{{Y}}_P}$ 为其主成分分量,所包含的信息逐渐减小; $\left[ {\begin{array}{*{20}{c}} {{B_{11}}}&{{B_{12}}}& \cdots &{{B_{1P}}} \\ {{B_{21}}}&{{B_{22}}}& \cdots &{{B_{2P}}} \\ \vdots & \vdots &{}& \vdots \\ {{B_{P1}}}&{{B_{P2}}}& \cdots &{{B_{PP}}} \end{array}} \right]$ 为实现线性变换的特征矩阵。本文将PCA用于选取与矿化蚀变信息有关的主成分分量,进而获得训练样本,凸显目标物的同时减小干扰因素对提取性能的影响,以进一步提升训练样本的提取质量。

综上所述,本文首先利用波段比值法求得图像的比值分量ETM 5/7、ETM 5/4、ETM 5/3、ETM 5/2、ETM 3/4、ETM 3/1,然后对各比值分量进行主成分分析,获得主成分分量 ${\rm{\{ PC1}}, {\rm{PC2}}, \cdots, {\rm{PC6\} }}$ ,接着依据主成分分析特征矩阵分别选择铁染主成分及羟基主成分,设定合适的阈值实施密度分割等操作,获得羟基及铁染的训练样本各200个。通过对研究区内主要岩石地层和蚀变岩的初步分类,确定研究区的其他主要地物有6类,分别为:花岗岩、花岗闪长岩、斜长花岗岩、闪长玢岩、黑云斜长片麻岩及凝灰质板岩,然后在典型地区对各类岩石分别选取具有代表性的样本点各200个,由此完成研究区8类矿化样本的选取。

3.2 基于布谷鸟算法优化的SVM

3.2.1 支持向量机

SVM的基本思想是:利用非线性变换实现输入样本空间至高维空间的映射,继而在高维空间内搜寻最优分类平面,由此完成样本数据的分类或识别。设l个训练样本为 $({x_1}, {y_1}), ({x_2}, {y_2}), \cdots, ({x_l}, {y_l})$ d维数据空间内的线性分类函数是: $g({{x}}) = {{{w}}^{\rm{T}}} \cdot {{x}} + b$ ,其中,“·”代表向量点积, ${{w}}$ 为SVM的权值向量,b代表偏置。可以通过解决二次规划问题来获得最优分类平面H

$\begin{array}{l}\mathop {\min }\limits_{{{w}},b} \displaystyle\frac{1}{2}{\left\| {{w}} \right\|^2}\\{\rm{s}}{\rm{.t}}{\rm{.}} {y_i} \cdot ({{{w}}^{\rm{T}}} \cdot {{{x}}_i} + b) \geqslant 1,\;\;\;i = 1,2, \cdots ,l\end{array}$ (2)

而对于非线性数据样本,通过引入松弛变量 ${\xi _i}$ 及惩罚因子 $C$ 来处理误差问题。即将问题转化为

$\begin{array}{l}\mathop {\min }\limits_{{{w}},b} \displaystyle\frac{1}{2}{\left\| {{w}} \right\|^2}{\rm{ + }}C\displaystyle\sum\limits_{i = 1}^l {{\xi _i}} \\{\rm{s}}{\rm{.t}}{\rm{. }}{y_i} \cdot ({{{w}}^{\rm{T}}} \cdot {{{x}}_i} + b) \geqslant 1 - {\xi _i},\;\;i = 1,2, \cdots ,l\end{array}$ (3)

根据泛函理论,通过在最优分类面中引入某一合适的内积函数 $K(x, {x_i})$ ,可以完成输入空间到高维空间的转换(丁世飞 等,2011)。该内积函数又被称为核函数,本文采用径向基核函数RBF(Radial Basis Function),其定义为

$K(x, {x_i}) = \exp \left( { - \frac{{{{\left\| {x - {x_i}} \right\|}^2}}}{{2{\sigma ^2}}}} \right)$ (4)

式中,σ2为核参数。最优分类面对应的分类决策函数如式(5)所示。

$h(x) = \operatorname{sgn} \left({\sum\limits_{j = 1}^l {{a_i}{y_i}K({x_i}, x) + b} } \right)$ (5)

核函数的种类对SVM分类效果的影响较小,但核参数及惩罚因子对SVM的分类结果有着较大的影响(杨国鹏 等,2008)。现通过布谷鸟算法实现SVM中的核参数σ2及惩罚因子C的寻优。

3.2.2 基于布谷鸟算法的SVM最优参数选取

受布谷鸟寄生孵化、莱维飞行等行为的启示,Yang和Deb(2009)提出布谷鸟算法,其是一种新型智能优化算法,具有优良的全局寻优性能(董崇杰,2016)。将布谷鸟算法用于SVM核参数和惩罚因子的寻优,有望提高SVM的分类精度,从而提升矿化蚀变信息提取的效果。其基本思想是:采用随机性较强的莱维飞行实现飞行路线的搜索,同时通过“精英留存方法”对鸟窝位置进行更新(薛浩然 等,2015)。布谷鸟算法假设3个理想条件:

(1) 布谷鸟一次仅生出一枚蛋,然后随机地选取鸟窝对这个蛋进行孵育;

(2) 针对随机选取的鸟窝,仅仅把最优的鸟窝留存至下一代;

(3) 能够使用的鸟窝的总数 $N$ 是不变的,设置鸟窝宿主可以察觉到外来鸟蛋的概率 ${P_a} \in [0, 1]$

假定第 $i$ 个鸟窝在第 $t$ 代的位置是 $x_i^{(t)}$ ,布谷鸟搜寻鸟窝的路径及对位置进行更新的公式为

$x_i^{(t + 1)} = x_i^{(t)} + \alpha \oplus L(\lambda)$ (6)

式中, $\alpha $ 代表步长,通常情况下取值为1; $ \oplus $ 表示点对点乘积; $L\left(\lambda \right)$ 表示莱维随机搜寻路线,它的随机游走步长遵循莱维分布,即 $L(\lambda) \sim \mu = {t^{ - \lambda }}(1 \leqslant \lambda \leqslant 3)$ 。位置更新后,随机产生一个数 $r \in [0, 1]$ ,如果 $r > {P_a}$ ,那么鸟窝位置发生了变化,反之则没有发生变化,最后将效果更优的一组鸟窝位置 $y_i^{(t + 1)}$ 留存到下一代,仍记作 $x_i^{(t + 1)}$ 。因此,可将式(6)拓展如下:

$x_i^{(t + 1)}{\rm{ = }}x_i^{(t)} + \alpha \oplus L(\lambda) \sim 0.01\frac{u}{{{{\left| v \right|}^{1/\lambda }}}}(x_i^{(t)} - x_b^{(t)})$ (7)

式中, $x_b^{(t)}$ 为第 $t$ 代最佳的鸟窝位置;uv都遵循正态分布,即: $u \sim N(0, \sigma _u^2)$ $v \sim N(0, \sigma _v^2)$ ,其中, ${\sigma _u} =$ $\left( {\displaystyle\frac{{\Gamma (1 + \lambda)\sin ({\pi }\lambda /2)}}{{{2^{(\lambda - 1)/2}}\Gamma ((1 + \lambda)/2)\lambda }}} \right)$ ${\sigma _v} = 1$ $\Gamma $ 为标准Gamma函数。

现利用布谷鸟算法实现SVM核参数 ${\sigma ^2}$ 及惩罚因子 $C$ 的寻优,其输入是一组随机产生的 $(C, {\sigma ^2})$ 值以及基于波段比值法和PCA获得的训练集,输出为一组最优的惩罚因子及核参数,其详细的流程如下:

(1) 初始化布谷鸟种群。将初始概率参数设定为 ${P_a}{\rm{ = }}0.25$ ,并随机产生 $N{\rm{ = }}25$ 个鸟窝位置 ${{p}}_i^{(0)} = $ ${\left[ {x_1^{(0)}, x_2^{(0)}, \cdots, x_n^{(0)}} \right]^{\rm{T}}}$ ,每一个鸟窝对应SVM一组待优化的参数 $(C, {\sigma ^2})$ ;设置最大迭代次数 ${K_{\max }}$ =100。

(2) 求出每组鸟窝位置对应训练集的k-折交叉验证值,把它当作其适应度值 ${h_{{\rm{fit}}}}$ ,找到目前最好的鸟窝位置 $x_b^{(0)}$ 以及最好的适应度值 ${h_{{\rm{fitmax}}}}$

(3) 依据式(6)更替其他鸟窝的位置;然后将新获得的鸟窝位置和上一代的相比较,用更佳的位置取代不佳的位置,由此确定更新后的鸟窝位置 ${{{p}}_t} = {\left[ {x_1^{(t)}, x_2^{(t)}, \cdots, x_n^{(t)}} \right]^{\rm{T}}}$

(4) 将 ${P_a}$ 和随机数 $r$ 进行比较,留存被察觉概率较小的鸟窝并更替其中被察觉概率更大的鸟窝;然后求出新鸟窝的适应度值,进而将它与 ${{{p}}_t}$ 中鸟窝位置的适应度值相比较,适应度值较小的鸟窝将被适应度值更大的鸟窝所取代,由此获取新的且性能更优的鸟窝位置 ${{{p}}_t}$

(5) 找出(4)中最好的鸟窝位置 $x_b^{(t)}$ ,判断其适应度值是否符合要求,若满足要求或已达到迭代次数的最大值 ${K_{\max }}$ ,那么停止搜寻,输出此刻的最优鸟窝 $x_b^{(t)}{\rm{ = (}}{C_b}, {\sigma _b}{\rm{)}}$ ,即为惩罚因子 $C$ 及核参数 ${\sigma ^2}$ 的最优解;如果不满足要求且此时的迭代次数小于 ${K_{\max }}$ ,那么回到(4)接着搜寻。

4 基于PCA和布谷鸟算法优化SVM的矿化蚀变信息提取方法的具体步骤

综上所述,本文提出的基于PCA和布谷鸟算法优化SVM的遥感矿化蚀变信息提取的流程图如图2所示,其具体步骤如下:

(1) 输入待处理的研究区遥感图像,利用ENVI遥感影像处理软件完成大气校正、几何校正、地理裁剪等预处理步骤。

(2) 通过波段比值法实现比值图像的获取。针对预处理后的ETM+1—5、7波段的图像,分别计算ETM+5/7、5/4、5/3、5/2、3/4、3/1的比值, 即为比值图像。

(3) 将比值图像进行组合,进而通过主成分分析获得组合后比值图像的主成分分量{PC1, PC2, $ \cdots $ , PC6}。

(4) 训练样本的提取。分别选择羟基主成分及铁染主成分,设定合适的阈值实施密度分割等操作,同时和已知矿床进行比较,分别选择羟基及铁染的训练样本每类200个;然后结合研究区的地质信息选取其他样本6类各200个。

(5) 利用(4)获得的训练样本(即通过基于波段比值法和PCA获取的训练样本)及布谷鸟算法获得SVM的最优核参数及惩罚因子;

(6) 通过(5)获得的SVM最优核参数及惩罚因子及(4)获得的训练样本对SVM分类器进行训练,由此构造最优SVM模型。

(7) 利用训练后的最优SVM模型,实现整幅研究区遥感图像的矿化蚀变信息提取, 将获得的羟基及铁染蚀变信息输出。

图 2 遥感矿化蚀变信息提取方法的流程图
Fig. 2 The flow chart of the remote sensing mineralization alteration information extraction method

5 实验结果与分析

为了验证本文提出的基于PCA和布谷鸟算法优化SVM的矿化蚀变信息提取方法的有效性,选择青海省五龙沟地区为研究区进行实验,并将本文方法与主成分分析法(连艺昕和姜勇彪,2013)、基于光谱角法和SVM的方法(傅文杰 等,2006)、基于粒子群和SVM的方法(王东,2008)及基于波段比值、PCA和粒子群优化SVM的方法进行了对比。利用1:50000地质矿产图定位6种矿床(点),研究区的52个已知矿点如图3所示,其中包含金矿(化)点32处、多金属矿(化)点8处、铅矿(化)点5处、铜矿(化)点3处、铁矿(化)点3处、钼矿(化)点1处。实验运行环境为:CPU为Intel core i5,2.0 GHz,内存为8 GB的PC机,64位Win10操作系统,ENVI 5.1,Matlab 2014b。

图 3 研究区已知矿点分布图
Fig. 3 Known deposits of the study area

图4所示为利用波段比值法获得的研究区的比值图像,其中,ETM+5/7比值图像能够凸显羟基蚀变信息,而ETM+5/4,5/3,5/2,3/1比值图像反映了铁染蚀变信息,ETM+3/4比值图像可以压制植被的干扰。图5所示为将比值图像进行组合后,通过主成分分析获得的组合后比值图像的主成分分量图像。表1给出了通过主成分分析获得比值图像的主成分分量后,研究区的主成分特征矩阵。可以看出,PC1、PC3、PC5、PC6分别主要凸显了ETM+3/1、5/4、5/2、5/3比值分量的信息,因此选取PC1、PC3、PC5、PC6作为铁染主成分,进而运用密度分割提取铁染蚀变样本200个左右;PC4主要反映了ETM+5/7比值图像的信息,同时引入主要反映ETM+3/4比值图像信息的PC2,以避免植被等干扰影响蚀变信息提取的性能,即选取PC2、PC4作为羟基主成分,然后实施密度分割等操作获得羟基蚀变样本200个左右。

图 4 研究区比值图像
Fig. 4 Ratio images of study area
图 5 比值图像的主成分分量
Fig. 5 The principal components of the ratio images

表 1 研究区主成分变换特征矩阵
Table 1 Feature matrix of principal component transformation in study area

下载CSV 
特征矩阵 ETM+5/7 ETM+5/4 ETM+5/3 ETM+5/2 ETM+3/4 ETM+3/1
PC1 0.073172 0.403947 0.266078 0.590942 0.057558 0.638866
PC2 –0.381388 0.302953 –0.343040 –0.303970 0.712571 0.211969
PC3 –0.070950 0.594556 0.339025 0.177445 0.152477 –0.686873
PC4 –0.918323 –0.129216 0.152642 0.137151 –0.311887 0.024545
PC5 –0.028938 –0.340227 –0.465753 0.712631 0.290116 –0.272896
PC6 –0.000666 0.509016 –0.675546 0.015829 –0.533141 –0.007023

利用本文方法及4种对比方法获得的羟基蚀变信息结果对比如图6所示。由图6(a)可知,主成分分析法提取的羟基蚀变信息均匀地分布在金矿(化)点集中的萤石沟—红旗沟剪切带中,而在岩金沟剪切带及多金属矿(化)点附近未提取出蚀变信息,且有较多的冗余信息,不能全面地反映研究区的成矿情况。图6(b)反映了采用基于光谱角法和SVM的方法获得的羟基蚀变信息,可以发现其呈西北偏北向分布在萤石沟—红旗沟剪切带上,但提取的蚀变信息偏少,且有较多的信息分布在非矿化区内。利用基于粒子群和SVM的方法获得的结果如图6(c)所示,在已知矿(化)点附近存在较多的羟基蚀变信息,能基本反映研究区3个主要剪切带的成矿情况,但其分布较为分散,且存在一些干扰信息。图6(d)反映了利用基于波段比值、PCA和粒子群优化SVM的方法获得的羟基蚀变信息,其在三道梁—苦水泉等剪切带中提取出较多的蚀变信息,但存在较多无关信息,无法全面地突出研究区的成矿分布情况。由图6(e)可以看出,利用本文方法提取的羟基蚀变信息主要以西北向分布于三道梁—苦水泉与萤石沟—红旗沟之间的五龙沟岩体中,且在岩金沟剪切带上亦分布着大量的蚀变信息,总体分布较为均匀,信息丰富,能较为全面地反映研究区的成矿情况。

图 6 5种方法的羟基蚀变信息提取结果对比
Fig. 6 Comparison of five methods of hydroxyl alteration information extraction results in study area

图7给出了利用本文方法及4种对比方法获得的铁染蚀变信息的结果对比。通过图7(a)可以看出,主成分分析法提取的铁染信息未能均匀分布在包含大量金矿(化)点的3个剪切带内,且在铅锌矿(化)点周围未提取出蚀变信息,并存在较多的无关信息。图7(b)为采用基于光谱角法和SVM的方法获得的铁染蚀变信息,能够发现,其与羟基蚀变信息的分布情况基本相似,信息量偏少,不能很好地反映研究区成矿情况。图7(c)给出了利用基于粒子群和SVM的方法获得的铁染蚀变信息,虽然在三道梁—苦水泉等剪切带中获取到了蚀变信息,但其信息量与提取的羟基蚀变相比,明显减少,且分布较为分散。图7(d)为基于波段比值、PCA和布谷鸟算法优化SVM方法获得的铁染蚀变信息,其在三道梁—苦水泉剪切带中提取到了蚀变信息,但在岩金沟剪切带中未提取出丰富的蚀变信息,且存在较多的冗余信息,不能突出各个剪切带的成矿情况。由图7(e)可知,本文方法获得的铁染蚀变信息的分布特征与羟基蚀变信息的分布特征基本一致,基本以西北偏北向分布在五龙沟岩体中,冗余信息较少,在4种方法中提取效果最好。

图 7 5种方法的铁染蚀变信息提取结果对比
Fig. 7 Comparison of five methods of iron staining alteration information extraction results in study area

现将获得的羟基及铁染蚀变信息与已知的52个矿点进行空间叠合分析,利用吻合度对4种方法的提取效果进行定量评价,吻合度越高,说明蚀变信息提取的精度越高,方法的性能更优,其定义如下:

${R_{{\rm{correct}}}} = \frac{{{N_{{\rm{in}}}}}}{{{N_{{\rm{total}}}}}}$ (8)

式中, ${N_{{\rm{in}}}}$ 为已知矿点落在提取的矿化蚀变区域的个数, ${N_{{\rm{total}}}}$ 为已知矿点的总数。

表23给出了4种方法获取的羟基及铁染蚀变信息的吻合度对比。主成分分析法对于金矿(化)点的吻合度较高,但多金属矿(化)点及铅锌矿(化)点的吻合度偏低。基于光谱角法和SVM的方法提取的蚀变信息对于金矿(化)点及铜矿(化)点的吻合度尚可,但对其他6类矿化(点)的吻合度较低,因此,基于光谱角法和SVM的方法不能全面地反映研究区的矿化蚀变信息,总体吻合度在4种方法中最低。基于粒子群和SVM的方法获得的羟基蚀变信息对于各矿化(点)的吻合度均比较高;而对于铁染蚀变信息,金矿(化)点的吻合度下降到48.4%,铁矿(化)点的吻合度下降到0,因此,基于粒子群和SVM的方法能够很好地提取出羟基蚀变信息,而对于铁染蚀变信息的提取性能并不是太理想。通过基于波段比值、PCA和粒子群优化SVM的方法获得的羟基蚀变信息对各矿点的吻合度较高,总体吻合度仅次于本文方法;而其提取的铁染蚀变信息对多金属矿(化)点、铜矿(化)点等的吻合度较低,提取效果不太理想。采用本文方法获得的蚀变信息不仅与金矿(化)点的吻合度较高,对于铜矿(化)点、铅锌矿(化)点、钼矿(化)点及铁矿(化)点亦能获得较高的吻合度,羟基蚀变的总体吻合度达86.5%,铁染蚀变的总体吻合度达69.2%,在4种方法中吻合度最高,即在己知矿床(化)点的周围,包含大量的羟基和铁染信息,因此本文方法可以更为准确有效地获得矿化蚀变信息,精度最高。

表 2 5种方法的羟基蚀变信息提取吻合度对比
Table 2 Comparison of five methods in matching rate of hydroxyl alteration information extraction results

下载CSV 
矿(化)点 主成分分析法 基于光谱角法
和SVM的方法
基于粒子群和
SVM的方法
基于波段比值、
PCA和粒子群
优化SVM的方法
本文方法
金矿(化)点 27/31=87.1% 20/31=64.5% 27/31=87.1% 27/31=87.1% 28/31=90.3%
多金属矿(化)点 0/8=0 0/8=0 3/8=37.5% 2/8=25% 6/8=75.0%
铜矿(化)点 2/3=66.7% 1/3=33.3% 2/3=66.7% 3/3=100% 3/3=100.0%
铅锌矿(化)点 3/5=60.0% 2/5=40.0% 5/5=100% 5/5=100% 5/5=100.0%
钼矿(化)点 1/1=100.0% 0/1=0 1/1=100% 1/1=100% 1/1=100.0%
铁矿(化)点 3/3=100.0% 2/3=66.7% 3/3=100% 2/3=66.7% 2/3=66.7%
矿(化)点总数 36/52=69.2% 25/52=48.1% 41/52=78.8% 40/52=76.9% 45/52=86.5%

表 3 5种方法的铁染蚀变信息提取吻合度对比
Table 3 Comparison of five methods in matching rate of staining alteration information extraction results

下载CSV 
矿(化)点 主成分分析法 基于光谱角法
和SVM的方法
基于粒子群和
SVM的方法
基于波段比值、
PCA和粒子群
优化SVM的方法
本文方法
金矿(化)点 21/31=64.5% 17/31=54.8% 15/31=48.4% 20/31=64.5% 23/31=74.2%
多金属矿(化)点 1/8=12.5% 1/8=12.5% 3/8=37.5% 1/8=12.5% 3/8=37.5%
铜矿(化)点 2/3=66.7% 2/3=66.7% 1/3=33.3% 1/3=33.3% 2/3=66.7%
铅锌矿(化)点 1/5=20% 1/5=20% 5/5=100% 5/5=100% 5/5=100%
钼矿(化)点 0/1=0 1/1=100% 1/1=100% 1/1=100% 1/1=100%
铁矿(化)点 1/3=33.3% 1/3=33.3% 0/3=0 1/3=33.3% 2/3=66.7%
矿(化)点总数 26/52=50.0% 23/52=44.23% 25/52=48.1% 29/52=55.8% 36/52=69.2%

6 结 论

本文提出了一种基于PCA和布谷鸟算法优化SVM的遥感矿化蚀变信息提取方法。首先利用波段比值法实现多波段遥感图像蚀变信息的增强,获得比值图像;然后通过PCA求取比值图像的主成分,进而获得羟基及铁染矿化样本;充分利用布谷鸟算法高效、搜索能力强的优势获得SVM的最优核参数及惩罚因子;最后,运用最优SVM模型实现矿化蚀变信息的获取。

本文方法首次将布谷鸟算法用于遥感矿化蚀变信息的提取中,克服了人为设定SVM模型参数的不确定性,进一步提升了SVM的分类精度。实验结果表明,与近年来提出的主成分分析法、基于光谱角法和SVM的方法、基于粒子群和SVM的方法以及基于波段比值、PCA和粒子群优化SVM的方法相比,本文方法能更为准确地提取出遥感矿化蚀变信息,提取性能更优,给矿产勘查及成矿分析提供了一个新思路。在本文方法的基础上,下一步的研究工作将在降低算法复杂度、简化流程、减少耗时方面进行改进。

参考文献(References)

  • Chen J P, Wang Q, Dong Q J and Cong Y. 2009. Extraction of remote sensing alteration information in Lilotuohe, Qinghai Province. Earth Science—Journal of china University of Geosciences, 34 (2): 314–318. [DOI: 10.3321/j.issn:1000-2383.2009.02.014] ( 陈建平, 王倩, 董庆吉, 丛源. 2009. 青海沱沱河地区遥感蚀变信息提取. 地球科学——中国地质大学学报, 34 (2): 314–318. [DOI: 10.3321/j.issn:1000-2383.2009.02.014] )
  • Diao H, Zhang D, Di Y J, Wang Z, Wang H R and Xiong G Q. 2011. The extraction of alteration anomalies from ASTER data based on principal component analysis and fractal model. Remote Sensing for Land and Resources (2): 75–80. ( 刁海, 张达, 狄永军, 王振, 王浩然, 熊光强. 2011. 基于主成分分析和分形模型的ASTER蚀变异常信息提取. 国土资源遥感 (2): 75–80. )
  • Ding S F, Qi B J and Tan H Y. 2011. An overview on theory and algorithm of support vector machines. Journal of University of Electronic Science and Technology of China, 40 (1): 2–10. [DOI: 10.3969/j.issn.1001-0548.2011.01.001] ( 丁世飞, 齐丙娟, 谭红艳. 2011. 支持向量机理论与算法研究综述. 电子科技大学学报, 40 (1): 2–10. [DOI: 10.3969/j.issn.1001-0548.2011.01.001] )
  • Dong C J, Liu Y and Peng Y. 2016. Improved cuckoo search algorithm applied to multi-objective optimization of crowd evacuation. Journal of System Simulation, 28 (5): 1063–1069. [DOI: 10.16182/j.cnki.joss.2016.05.009] ( 董崇杰, 刘毅, 彭勇. 2016. 改进布谷鸟算法在人群疏散多目标优化中的应用. 系统仿真学报, 28 (5): 1063–1069. [DOI: 10.16182/j.cnki.joss.2016.05.009] )
  • Fu W J, Hong J Y and Zhu G C. 2006. The extraction of mineralized and altered rock information from remote sensing image based on SVM. Remote Sensing for Land and Resources (2): 16–19. ( 傅文杰, 洪金益, 朱谷昌. 2006. 基于SVM遥感矿化蚀变信息提取研究. 国土资源遥感 (2): 16–19. )
  • Gao J G, Xue C J, Wu G G, Wang X H, Zhou G, Yang W P, Wang X and Chen J. 2008. Method of fast extracting alteration remote sensing abnormal information based on knowledge and prospecting application. Journal of Remote Sensing, 12 (1): 186–192. [DOI: 10.11834/jrs.20080124] ( 高景刚, 薛春纪, 吴淦国, 王晓虎, 周刚, 杨文平, 王祥, 陈静. 2008. 基于知识的蚀变遥感异常信息快速提取及找矿应用实践. 遥感学报, 12 (1): 186–192. [DOI: 10.11834/jrs.20080124] )
  • He K T, Gan F P and Wang Y J. 2009. The extraction of geological micro-structure and altered rock information with high-resolution satellite images in a small range. Remote Sensing for Land and Resources (1): 97–99. ( 何凯涛, 甘甫平, 王永江. 2009. 高空间分辨率卫星遥感地质微构造及蚀变信息识别. 国土资源遥感 (1): 97–99. )
  • Hecker C, Van Der Meijde M, Van Der Werff H and Van der Meer F D. 2008. Assessing the influence of reference spectra on synthetic SAM classification results. IEEE Transactions on Geoscience and Remote Sensing, 46 (12): 4162–4172. [DOI: 10.1109/TGRS.2008.2001035]
  • Imbroane M A, Melenti C and Gorgan D. 2007. Mineral explorations by Landsat image ratios//Proceedings of 2007 International Symposium on Symbolic and Numeric Algorithms for Scientific Computing. Timisoara: IEEE: 335–340 [DOI: 10.1109/SYNASC.2007.52]
  • Lian Y X and Jiang Y B. 2013. Extracting mineralized alteration information of iron and argillation based on remote sensing technology—taking the mining area of Makeng-Datian, Fujian Province as an example. Journal of East China Institute of Technology, 32 (3): 384–389. ( 连艺昕, 姜勇彪. 2013. 基于遥感技术的铁染和泥化蚀变异常信息提取——以福建马坑—大田整装勘查区矿区为例. 东华理工大学学报(社会科学版), 32 (3): 384–389. )
  • Liu L, Zhou J, Yin F and Feng M. 2013. Alteration mineral mapping and ore prospecting based on ASTER data in Balikun, Xinjiang. Remote Sensing Technology and Application, 28 (4): 556–561. [DOI: 10.11873/j.issn.1004-0323.2013.4.556] ( 刘磊, 周军, 尹芳, 冯敏. 2013. 基于ASTER数据的巴里坤地区蚀变矿物填图及找矿. 遥感技术与应用, 28 (4): 556–561. [DOI: 10.11873/j.issn.1004-0323.2013.4.556] )
  • Mia M B, Nishijima J and Fujimitsu Y. 2014. Exploration and monitoring geothermal activity using Landsat ETM + images: a case study at Aso volcanic area in Japan. Journal of Volcanology and Geothermal Research, 275 : 14–21. [DOI: 10.1016/j.jvolgeores.2014.02.008]
  • Pour A B, Hashim M and Van Genderen J. 2013. Detection of hydrothermal alteration zones in a tropical region using satellite remote sensing data: bau goldfield, Sarawak, Malaysia. Ore Geology Reviews, 54 : 181–196. [DOI: 10.1016/j.oregeorev.2013.03.010]
  • Sadeghi B, Khalajmasoumi M, Afzal P, Moarefvand P, Yasrebi A B, Wetherelt A, Foster P and Ziazarifif A. 2013. Using ETM+ and ASTER sensors to identify iron occurrences in the Esfordi 1:100,000 mapping sheet of Central Iran. Journal of African Earth Sciences, 85 : 103–114. [DOI: 10.1016/j.jafrearsci.2013.05.003]
  • Shen L X, Liu L P, Su X X, Zhu Y and Zhao F. 2008. Study on identification of altered wall-rock in areas of different vegetation coverages based on remote sensing. Geoscience, 22 (2): 293–298. [DOI: 10.3969/j.issn.1000-8527.2008.02.017] ( 沈利霞, 刘丽萍, 苏新旭, 祝艳, 赵芳. 2008. 不同植被覆盖率地区遥感矿化蚀变提取研究. 现代地质, 22 (2): 293–298. [DOI: 10.3969/j.issn.1000-8527.2008.02.017] )
  • Tuba M, Subotic M and Stanarevic N. 2011. Modified cuckoo search algorithm for unconstrained optimization problems//Proceedings of the 5th European Conference on European Computing Conference. Paris: ACM: 263–268
  • Walton S, Hassan O, Morgan K and Brown M R. 2011. Modified cuckoo search: a new gradient free optimisation algorithm. Chaos, Solitons and Fractals, 44 (9): 710–718. [DOI: 10.1016/j.chaos.2011.06.004]
  • Wang D. 2008. Research of Remote Sensing Ore-Finding Method Based on Particle Swarm Intelligence. Changsha: Central South University (王东. 2008. 基于粒子群智能的遥感找矿方法研究. 长沙: 中南大学 [DOI: 10.7666/d.y1538461])
  • Wang Z H and Zheng C Y. 2010. Rocks/Minerals information extraction from EO-1 hyperion data base on SVM//Proceedings of 2010 International Conference on Intelligent Computation Technology and Automation. Guangzhou: IEEE: 229–232 [DOI: 10.1109/ICICTA.2010.341]
  • Wu H, Xu Y J, Fan G J and Meng P Y. 2016. Using ETM+ data for extraction of alteration information based on singular value decomposition: a case study of Wulonggou gold deposit, Qinghai. Geography and Geo-Information Science, 32 (2): 40–45. [DOI: 10.3969/j.issn.1672-0504.2016.02.008] ( 吴浩, 徐元进, 范高晶, 孟鹏燕. 2016. 奇异值分解在ETM+遥感蚀变信息提取中的应用——以青海省五龙沟金矿勘查区为例. 地理与地理信息科学, 32 (2): 40–45. [DOI: 10.3969/j.issn.1672-0504.2016.02.008] )
  • Xu Y J, Ma H C and Peng S Y. 2014. Study on identification of altered rock in hyperspectral imagery using spectrum of field object. Ore Geology Reviews, 56 : 584–595. [DOI: 10.1016/j.oregeorev.2013.07.004]
  • Xue H R, Zhang K H, Li B and Peng C H. 2015. Fault diagnosis of transformer based on the cuckoo search and support vector machine. Power System Protection and Control, 43 (8): 8–13. ( 薛浩然, 张珂珩, 李斌, 彭晨辉. 2015. 基于布谷鸟算法和支持向量机的变压器故障诊断. 电力系统保护与控制, 43 (8): 8–13. )
  • Yang G P, Yu X C, Chen W and Liu W. 2008. Hyperspectral remote sensing image classification based on kernel fisher discriminant analysis. Journal of Remote Sensing, 12 (4): 579–585. [DOI: 10.11834/jrs.20080476] ( 杨国鹏, 余旭初, 陈伟, 刘伟. 2008. 基于核Fisher判别分析的高光谱遥感影像分类. 遥感学报, 12 (4): 579–585. [DOI: 10.11834/jrs.20080476] )
  • Yang J J, Jiang Q G, Zhao J, Xu Y and Meng X C. 2012. Standard mineral quantitative calculation based on the improved SVM and hyperspectral remote sensing. Journal of Jilin University (Earth Science Edition), 42 (3): 864–871. [DOI: 10.3969/j.issn.1671-5888.2012.03.034] ( 杨佳佳, 姜琦刚, 赵静, 徐言, 孟翔冲. 2012. 基于改进的SVM技术和高光谱遥感的标准矿物定量计算. 吉林大学学报(地球科学版), 42 (3): 864–871. [DOI: 10.3969/j.issn.1671-5888.2012.03.034] )
  • Yang X S and Deb S. 2009. Cuckoo search via Lévy flights//Proceedings of 2009 World Congress on Nature and Biologically Inspired Computing. Coimbatore: IEEE: 210–214 [DOI: 10.1109/NABIC.2009.5393690]
  • Yi G H. 2011. Corresponding Analysis Metallogenic Prognosis of Geochemical and Remote Sensing Anomaly at Wu Long Gou Gold Mineralized Concentrate District in East Kunlun Mountain. Chengdu: Chengdu University of Technology (易桂花. 2011. 东昆仑五龙沟金矿集中区化探异常与遥感异常响应及成矿预测. 成都: 成都理工大学)
  • Yu H, He H, Chang L and Sun W D. 2014. Alteration information extraction from remote sensing imagery based on support vector machines and spectral energy level matching. Remote Sensing Information, 29 (2): 74–78. [DOI: 10.3969/j.issn.1000-3177.2014.02.013] ( 于浩, 何浩, 常玲, 孙卫东. 2014. 基于光谱能级匹配的支持向量机蚀变信息提取. 遥感信息, 29 (2): 74–78. [DOI: 10.3969/j.issn.1000-3177.2014.02.013] )
  • Zhang Y T, Zhang X D, Liu Z Z, Zhang Y J and Zhang H J. 2012. The extraction of fault structure and wall rock alteration remote sensing information in Ningxia. Remote Sensing for Land and Resources (1): 132–136. [DOI: 10.6046/gtzyyg.2012.01.23] ( 张永庭, 张晓东, 刘自增, 张永杰, 张慧娟. 2012. 宁夏区地质构造与围岩蚀变遥感信息提取. 国土资源遥感 (1): 132–136. [DOI: 10.6046/gtzyyg.2012.01.23] )
  • Zhao X X, Qian J P, Qin S Q, Huang K C and Han S. 2013. Remote sensing prospecting in high vegetation coverage area——a case study of the in Datuanbao copper ore deposit and its environs, Jiangcheng, Yunnan Province. Remote Sensing Technology and Application, 28 (5): 879–889. ( 赵小星, 钱建平, 覃顺桥, 黄克宸, 韩帅. 2013. 云南江城大团包铜矿及外围高植被区遥感找矿预测. 遥感技术与应用, 28 (5): 879–889. )