地球物理学报  2013, Vol. 56 Issue (3): 799-811   PDF    
基于时间序列的InSAR相干性量级估计
蒋弥1 , 丁晓利1 , 李志伟2 , 汪驰升1 , 朱武1 , 柯灵红1     
1. 香港理工大学土地测量与地理资讯学系, 香港 九龙;
2. 中南大学信息物理工程学院, 长沙 410083
摘要: 本文提出了一种适用于InSAR数据处理的自适应相干性量级估计方法, 该方法能够满足复信号随机平稳的假设前提, 并兼顾运算效率与估计精度.此方法生成的相干图具有很好的分布特征, 避免了影像空间分辨率的损失.提出的算法分为两个步骤:(1)根据地物后向散射特性, 对时间序列SAR影像进行聚类分析, 选择具有同分布的样本, 保证SAR影像质地平稳条件; (2)对干涉图进行条纹频率估计, 采用极大似然(ML)条纹频率估计方法去除系统相位引起的复信号非平稳性, 并根据Cramer-Rao边界条件改善条纹频率的估计精度.以美国南加州洛杉矶地区的ENVISAT ASAR数据集为例, 本文将新方法与现有方法进行了量化分析.结果表明, 较传统方法而言, 基于时间序列的相干性估计方法能够得到更可靠、精度更高、空间特征更鲜明的干涉相干图.
关键词: 合成孔径雷达干涉测量(InSAR)      相干性估计      假设检验      条纹率估计     
InSAR coherence magnitude estimation based on data stack
JIANG Mi1, DING Xiao-Li1, LI Zhi-Wei2, WANG Chi-Sheng1, ZHU Wu1, KE Ling-Hong1     
1. Dept. of Land Surveying & Geo-Informatics, The Hong Kong Polytechnic University, Hong Kong;
2. School of Info-Physics and Geomatics Engineering, Central South University, Changsha 410083, China
Abstract: In this paper, we present a novel approach for accurate coherence estimation, based on InSAR data stack. The main advantage of the proposed method is to meet the assumptions that the complex signals are local stationary, and meanwhile take into account the computational efficiency. Therefore, it is possible to obtain a very accurate coherence estimate without loss of resolution. Concretely, two-step is applied to adaptive algorithm: (1) nonparametric hypothesis test is firstly employed to cluster pixels with same statistical distributions; (2) the modified version of maximum likelihood fringe rate estimate is then used to eliminate the non-stationarity of complex signals. The accuracy of such estimation is improved by Cramer-Rao bounds. Experimental results with Envisat ASAR datasets over Los Angeles areas show that the new method performs well under different situations..
Key words: Interferometric synthetic aperture radar (InSAR)      Coherence estimation      Hypothesis test      Fringe rate estimate     
1 引言

雷达回波的相干性是合成孔径雷达干涉测量(InSAR)系统中最基本的观测量[1-2],是评价干涉相位质量的最优指标[3],也是指导后续数据处理的关键参数之一[4-6].由于相干系数对后向散射体特性的变化十分敏感,近十年来它已被拓展成为InSAR技术另一个重要的数据源,广泛应用于地表变化检测[7-8]、土地利用分类[9-10]、植被参数提取[11-14]、积雪深度估计[15-16]和InSAR形变监测预报分析等方面[17-18].

上述技术的适用性完全依赖于有意义的相干性量级估计.理论上,相干系数定义在两个随机平稳序列s1(t)和s2(t)上,用公式表示为[19-20]

(1)

而在实际应用中,由于SAR传感器不可能在同一时刻获得L次观测,即使采用统计实验的方法,公式(1)中的期望E[·]都很难获得.因此往往假设平稳过程s1(t),s2(t)和s1(t)s2*(t)是各态历经的,用估计窗口中L个像素的空间平均代替汇集平均,从而求得相干性量级的估计量:

(2)

公式(2)衍生出两个问题,首先相干性量级估计必须满足一个基本条件,即s1(t),s2(t)和s1(t)s2*(t)是平稳序列,当估计窗中的样本不满足平稳性要求时,(2)中的估计是无意义的.然而,就InSAR技术而言,由于实际成像区域的地表特征十分复杂,上述假设在绝大多数情况下是不成立的.复杂的地物类型会引起固定窗口内强度影像的不匀质,进而导致过程s1(t)和s2(t)分别不平稳[21-22]; 起伏不均的地势会引起估计窗口内系统相位的变化,进而导致过程s1(t)s2*(t)不平稳[20-23].有部分学者针对这一问题进行了研究,其工作主要分为两类:一是采用外部数据或相位模型去除因地形引起的相位变化[20, 22-24],此时公式(2)中的s1(L)s2*(L)增加了正弦因子e-jφL; 二是根据SAR强度特征,采用区域生长法或对固定窗口进行加权处理[25-28],对局部非平稳的信号进行补偿.近两年来,以局部统计选点的时间序列方法更为瞩目[29-30].在提取具有相同分布的样本之后,对这些点进行相干性估计,可以减小或避免质地非平稳的问题.与区域生长法类似,这类算法采用的是非规则窗口.

第二个问题是样本估计量的有偏性.已有研究表明,在圆高斯复随机过程下,样本估计量是参数的极大似然估计,该估计量是有偏的[20, 31-33],偏差随着参数的增加而减小,随着样本数量L的增加渐近到无偏.若估计窗可以近似为的无偏估计,且估计精度(如以估计量的方差表示)提高.但这一要求在实际条件下无法满足,样本数的增加容易触犯随机平稳的假设,且SAR影像的幅宽也是有限的.另外,即便上述条件满足了,由于采用了大量的样本,干涉相干图的空间分布特征也无法体现.因此,一般的做法是考虑L个样本的估计结果,然后采用的统计模型进行偏差去除.

概况而言,目前国际上对InSAR相干性估计的研究和探索仍有两个方面的局限性和不足之处:①对于去除系统相位,现有文献大多只考虑了因地形相位引起的信号不平稳,而很少关注因形变相位贡献引起的系统相位对随机信号平稳性产生的影响;②同分布的像素选择对聚类算法的精度要求较高,而目前较为流行的区域增长法、两个样本的Kolmogorov-Smirnov检验,它们的估计精度很难令人满意.尤其在小样本情况下,聚类结果可靠性差.上述两个问题的局限性容易引起错误的偏差纠正,进而导致无意义的相干性估计.此外,估计精度和影像空间分辨率存在矛盾,在保证估计精度的前提下,低分辨率的相干图很难满足以相干系数为数据源的对地观测应用的需求.

因此,非平稳信号对相干系数估计的结果产生多大影响,怎样避免无意义的相干性估计,使得估计窗内样本保持平稳的特性,以及如何获取兼顾估计精度和影像空间分辨率的相干图是本文将要解决的问题.本文从估计相干性的误差源人手,分析误差特性并制定相应的策略,进而得到最优的相干图.该相干图将兼具精度和良好空间分布特征,有助于InSAR技术在分类和变化检测领域的应用.以下是本文的结构安排:第2节分析了相干性估计的误差源; 第3节提出具体的解决方案和处理步骤; 第4节针对新方法采用真实数据进行验证,并与传统算法的估计结果进行分析对比; 第5节是讨论与总结.

2 相干性估计误差源分析 2.1 SAR强度非平稳性

在工程应用中,对于一个被研究的随机过程,如果前后的环境和主要条件不随时间发生变化,则认为该过程是平稳的[34].对干涉测量技术,由于不同地物类型的后向散射特性不同,回波信号携带不同的能量,反映在SAR影像上表现出不同的纹理特征,此时质地的变化影响了平稳的外部条件,造成了估计窗内信号s1(t)和s2(t)不平稳.为量化研究非平稳性对互相关估计产生的影响,本文对两个随机信号的皮尔逊相关系数进行了数学建模,并将问题简化至一维实数信号.皮尔逊相关系数是实相关系数的统计量:

(3)

在各态历经的假设条件下,随机过程的数字特征可以由它的一族时间样本来描述.所以此处用随机变量XY分别代替随机信号s1(t)和s 2(t),其中XY为均值.假设估计窗内平稳序列XY具有相同方差σ2和均值μ,和互相关系数ρxy.现将长度为N的序列转换成非平稳序列AB,它们可以用分段函数表示成:

(4)

其中l1l4为常数.根据公式(3),非平稳序列AB的互相关系数ρab可由下述推导获得:

A的均值A可以表示为:

(5)

若样本N足够大,结合方程(4)和(5)A可以重写为:

(6)

同理可得B的均值B.AB的混合矩有:

(7)

XY的混合矩可以由式(3)和已知条件得到:

(8)

则联合公式(6) -(8)可求得相关系数ρab的分子为:

(9)

对于ρab分母部分,可从已知条件获得X的二阶矩:

(10)

A的方差为:

(11)

同理可推出B的方差具有相同表述形式.最后联立方程(9)和(11)解得AB的互相关系数ρab为:

(12)

从式(12)可知只要常量,必有ρab > ρxy,说明非平稳信号的相关性估计结果是高估的.注意以上论证同样适用于二维信号或复信号.因此,SAR强度非平稳性对相干性估计的影响是产生高估偏差.另外,从式(12)可以将两类非平稳信号的估计继续推广至r类非平稳信号的情形(r类地物特征).表达式的具体形式为:

(13)

(14)

以上讨论表明我们并不能直接得出地物类别越多(r越大),估计偏差越大的论断.事实上,相关系数ρab更加依赖于样本均值的差异.对SAR影像,窗口内各类后向散射系数均值的差异比地物特征类别更影响相干系数的估计结果并引起高估偏差.

2.2 系统相位非平稳性

前已述及,估计窗内存在系统相位变化会导致过程s1(t)s2*(t)不平稳,进而影响了相干性估计的结果,这一论断在很多文献中都有详细的介绍[20, 35].但是,引起系统相位的原因有很多,如地形、形变以及大气引起的相位贡献[2, 36]. -般,相干性估计问题仅考虑了去除因地形引起的系统相位,这在无其它相位分量或其它分量不起主导作用的情况下是合适的.然而,一旦其它相位贡献产生较大的条纹率,那么即使估计窗内的地形相位被去除,复信号仍然不能满足平稳假设.尤其对于两次成像期间地表运动剧烈、影响范围广的情形,如地震,火山和人类活动引起的快速地表沉降等,形变相位贡献对相干性估计的影响是显而易见的.为描述这一现象,现假设两个SAR回波信号s1s2:

(15)

其中c表示两个信号的公共部分,n1n2表示两个不相关的系统噪声.如果两次成像期间包含地形和形变相位贡献知φtopoφdef,则公共部分c在两个信号之间不相等,存在一个相位偏移:

(16)

相干性估计量式(2)的分子可表述为:

(17)

由于噪声不相关且噪声和信号不相关,后面三项的期望为0, 则:

(18)

假如外部DEM被用于补偿窗内地形相位并考虑用条纹率表示形变相位,式(18)可以改写成:

(19)

其中fRfA分别表示方位向和距离向条纹的空间频率.从式(19)可知,由于正弦因子项ei2πL(fR+fA)的存在,估计窗内信号累加取模的估值必定小于原始假设,离差大小取决于条纹率fRfA.除非形变不存在,否则相干性估计产生低估偏差.

2.3 估计量的有偏性

对式(2)统计属性的研究已十分成熟.从现有结论可知,估计量(2)是有偏并且产生高估偏差,即估计量的期望大于真值.它随着视数L的增加渐近达到无偏.根据文献[20, 32],的方差小于它的克拉美-罗(Cramer-Rao)方差下限.由于L的限制,一般在进行相干性估计之后,需反推文献[20]中的公式(6)得到无偏相干性量级,接着根据克拉美-罗下限重新计算方差.然而,常规统计式(6)的方差过大.因此,该方法无论从理论上还是实际应用上都存在缺陷.相比之下,基于梅林变换的第二类统计矩方法(log-moment)具有更好的性质[31],使得具有更小的偏差和方差.

3 解决方案

以上本文分析了InSAR相干性估计的误差源.针对这些问题,我们提出了相应的解决方案:聚类分析将基于SAR影像时间维样本的假设检验展开; 采用修正的极大似然条纹率算法对系统相位进行去除.最后,根据已发展的第二类统计方法对有偏估计量(2)进行纠正.图 1概括了算法的技术路线.

图 1 基于时间序列SAR影像的相干性量级估计流程图,SLC表示单视复数影像 Fig. 1 The flowchart of coherence estimation based on data stack, SLC denotes the single look complex image
3.1 基于BWS检验的像元聚类算法

窗口内的随机信号是否代表了相同的地物后向散射特性,是相干性估计的基本问题.从式(14)可知,非均质的信号产生相干性高估作用.因此,在相干性估计之前对像素进行划分,仅选取与目标值具有相同属性的样本进行计算,是最为关键的步骤.这就涉及到分类问题.由于SAR影像的斑点噪声和图像质地的复杂性,一般的自动化聚类算法获得的结果不可靠.而监督分类方法又需要人工干预,不便于系统设计,并具有主观性.从最新的研究成果来看,对SAR数据堆栈的时间维进行假设检验是一种行之有效的聚类方法,可以弥补上述缺点[29].然而,选择何种假设检验方法可以得到最好的估计,这正是数理统计领域中一个亟待解决的问题.一般地,参数化假设检验优于非参数假设检验.然而,SAR时间维样本是否可以用K、瑞利或者韦伯分布模型来描述,是不确定的.主要是各时刻的SAR强度值是不能保证平稳的.因此,在总体连续性的假设下,非参数的Kolmogorov-Smirnov检验是目前的主流方法.

Kolmogorov-Smirnov检验以两个样本经验概率分布函数Fn(x)和Fm(x)的最大离差作为检验统计量,来判断两组样本之间有无显著性差异[37-38].类似的检验方法还有通过(Fn(x)-Fm(x))2来判断群体差异的Cramer-von Mises检验[39](注:Anderson-Darling检验是Cramer-von Mises检验的特例[37]).这些检验的零假设为:H0:Fn(x)=Fm(x),即两组样本来自同一总体,它们对备择假设H1:Fn(x)≠Fm(x)的敏感度有一定差异.如Kolmogorov-Smirnov检验对于两个分布尾部的差异不敏感,对分布的位置(location)不敏感,而对尺度(scale)敏感.相比之下,Cramer-vom Miss检验由于在尾部增加了权因子,因此在设计上优于Kolmogorov-Smirnov检验,提高了检验法的功效(power),减小了犯第Ⅱ类错误的概率.

Baumgartner等提出了一种新的非参数的秩检验方法[40](Baungarter-Weiβ-Schindler test) (BWS),其基本思想是对(Fn(x) -Fm(x))2用其方差进行加权处理.结果表明,在给定的显著性水平α下,BWS检验较典型检验法具有更好的功效,特别是在小样本的情况下.具体地,对于两组样本X1X2,…,XnY1Y2,…,Ym,BWS检验统计量为[40-41]

(20)

其中

R1 < … < Rn表示在合并样本中样本数为n的第一组数据的秩,H1 < … < Hm表示在合并样本中样本数为m的第二组数据的秩.当检验统计量B取拒绝域C中的值时,则拒绝原假设H0.B的渐近分布详见文献[40],式(2.5).

本文采用蒙特卡罗(Monte Carlo)随机模拟实验对上述三种检验法的功效进行了测试.其中显著性水平为α=0.05,实验次数为10000. 图 2图 3分别展现了三种方法在韦伯(Weibull)分布下以位置参数和尺度参数为自变量的功效函数.实验中,在改变其中某一个参数的情况下,其他参数保持不变.如改变位置参数时,固定了尺度参数以及形状(Shape)参数. 图 4描述了在不同分布下(韦伯和瑞利分布),三种方法以样本数为自变量的功效函数,注意模拟中自变量t应取较小的值(0~1之间),因为在差异很大的情况下,任何检验方法都无显著性差异.从这些结果可以看出,无论在哪种情况下,BWS检验都表现出了更高的功效.随着两个样本差异逐渐增大,BWS检验识别出这些差异的能力最强.因此,对于SAR强度影像来说,BWS检验从理论上可以更准确地对像元进行划分,分类结果更可靠.

图 2 韦伯分布下以位置参数t为自变量的功效函数. BWS: Baumgartner-Weiβ-Schindler检验;CM: Cramer-vonMises检验;KS: Kolmogorov-Smirnov检验.样本大小为m=n=20 Fig. 2 The power functions of different tests under Weibull distribution with the locate parameter t. BWS: Baumgartner-Weiβ-Schindler test; CM: Cramer-von Mises test; KS: Kolmogorov-Smirnov test; the sample size is m=n=20
图 3 韦伯分布下以尺度参数t为自变量的功效函数. BWS: Baumgartner-Weiβ-Schindler检验;CM: Cramer- vonMises检验;KS: Kolmogorov-Smirnov检验.样本大小为m=n=20 Fig. 3 The power functions of different tests under Weibull distribution with the scale parameter t. BWS: Baumgartner-Weiβ-Schindler test; CM: Cramer-von Mises test; KS: Kolmogorov-Smirnov test; the sample size is m=n=20
图 4 以样本大小为自变量的功效函数,其中X~Weibull(l,2.7),Y~Rayleigh(0.8).BWS:Baumgartner-Weiβ-Schindler检验;CM: Cramer-von Mises检验; KS: Kolmogorov-Smirnov检验 Fig. 4 The power as a function of sample sizeL:X~Weibull (l, 2. 7), Y~Rayleigh (0. 8) BWS: Baumgartner-Weiβ-Schindler test; CM: Cramer-von Mises test; KS: Kolmogorov-Smirnov test

在选定BWS检验法后,总的聚类算法流程为:(1)以目标像素P为中心,定义一定大小的估计窗口,用BWS检验比较窗口内所有像素与目标像素的分布差异;(2)选取与目标像素具有同分布的点,抛弃那些无法与P直接或间接相连的点;(3)对像素进行编组,每当对P进行处理时,仅选用组内像素进行相干性估计.

3.2 自适应ML条纹频率估计

要补偿形变相位分量引起的信号不平稳性或在无外部DEM的条件下估计地形相位,就要用到条纹频率估计[42-44].在这些风格迥异的条纹频率估计算法中,较为瞩目的是ML方法.该方法方便易用、无需假设、估计精度尚可,因此被广泛用于相位重构和滤波,并首次被Zebker等应用到相干性估计中[23].与滤波重构不同的是,相干性估计需要去除干涉图中的干涉条纹,保留噪声.

本文提出的自适应条纹频率估计方法是在Zebker算法上的改进,考虑到典型算法具有以下三点不足:(1)估计窗口固定,没有先验信息引导,易引起窗口内相位信号不平稳;(2)估计精度依赖于对二维频谱的补零处理,过多的补零影响计算效率,补零不足又影响估计精度;(3)典型算法实行分块处理,窗口间无重叠,导致重构的相位不连续.针对上述问题,改进的ML条纹频率算法简述如下.

假设原始干涉图可以用正弦波模型表述为:

(21)

其中fxfy分别表示斜距向和方位向条纹频率,ρ表示残余相位.接着,采用二维FFT:

(22)

根据极大似然原则,与频谱峰值对应的频率为局部条纹率的估计值,而与峰值对应的相位近似为初相ρ.为改善估计精度,需对频谱主瓣进行插值.补零大小nxny可由估计量方差的Cramer-Rao边界自适应确定[42]

(23)

SNR表示局部窗口内信噪比,NxNy代表估计窗口大小.至此,估计的相位信号可以描述为:

(24)

其中虽然补零大小nxny是自适应的,但是NxNy仍然固定.这对于实际条纹估计影响很大,特别是当估计窗口内噪声占据主频的时候,估计的条纹率明显是错误的.因此,Nz和必须随图像质量自适应变化.执行该步骤的动机是:如果估计的区域噪声较大,那么采用大的估计窗能减小窗口内噪声占主频的概率,除非所有区域都是噪声,否则总能估计出原始信号的低频分量(因为在绝大多数情况下,大窗口内的相位是非平稳的);如果估计区域信号占据了主频,那么小的估计窗口有助于保证相位平稳,因而提高估计精度和运算效率.对大范围的噪声区域,我们放弃条纹率估计以免为式(2)增加负作用.

窗口选取依赖于先验知识,本文将根据相位标准偏差以及下式选择估计窗口:

(25)

式(25)是一个经验的线性函数,系数由模拟确定,代表了相位标准偏差与窗口大小呈正比关系,局部偏差σφ越大,噪声越强,则窗口越大; round表示四舍五人操作.而先验σφ的估计根据初始相干图和视数L的函数关系确定[3, 24, 45],最后采用5×5窗口估计均值mean(σφ).注意直接利用初始相干图作为判断噪声强弱的依据不够合理,因为此时的视数L对每个目标像素是不同的(详见3. 1节),这与固定窗有很大区别.

(26)

考虑到非重叠窗的不连续性,上述操作均用滑动窗口代替,这势必增加了运算量.例如对于1000 ×1000幅宽的影像,如果取窗口大小5×5, 典型算法只需40000次条纹率估计,而自适应方法需要106次运算.减小计算量的途径之一是分别对方位向和距离向进行一次一维FFT来代替二维FFT.自适应算法的具体应用详见图 6.

图 6 条纹频率估计 (a)原始相位;(b)典型ML估计(16×16窗口);(c)典型ML估计(8×8窗口);(d)自适应ML估计. Fig. 6 Fringe rate estimation (a) Original; typical ML estimate with (b) 16×16 and (c) 8×8 boxcar window; (d) adaptive ML estimate.
3.3 偏差纠正

在完成3. 1和3. 2两步操作之后,就可以对相干性进行偏差纠正了.本文采用的方法是第二类统计方法[31, 46](log-moment).与第一类统计方法相比,log矩有两个优点:(1)估计量的期望具有更小的偏差;(2)估计量方差小于传统方法的方差.其中第一点说明用更少的样本就能将纠正到无偏[31],这对于有限的样本是十分重要的.

相干性量级的一阶log矩的形式可以表示为[31]:

(27)

log矩m1的等效一阶矩为:

(28)

E(·)表示期望.因此,相干性估计偏差纠正的流程为:根据3. 1和3. 2估计的,平均均质区域样本数为N的估计量级的对数值:

(29)

根据中心极限定理,如果N足够大,趋于正态分布,且有.则无偏的可以通过反式(27)求得:

(30)

如果式(2)中L很大,则偏差是无需纠正的,3. 3的方法可以忽略(见图 1)这是因为估计量是渐近无偏的,L越大,偏差越趋近于0,.有关偏差应用的具体事例详见图 9.

图 9 相干性偏差纠正,BWS检验样本为46 (a)带有偏差的相干图;(b)偏差纠正后的相干图. Fig. 9 Bias correction for coherence estimation (a) Biased coherence; (b) Bias corrected coherence.
4 实例分析 4.1 实验区和实验数据

第一节的讨论表明相干性估计的误差源十分复杂.除此之外,时空去相关等也在不同程度地影响着相干性估计的结果.因此,在进行测试时,所选择的实验区必须具备影响相干性估计的所有因素,如地形的崎岖程度、地表类别的多样性等.在天然的InSAR试验场之中,美国南加州洛杉矶市及其周边是较为理想的选择之一,涵盖了相干性估计的误差源.由于该区域地表形变颇为复杂,也成为国际地学界研究的热点.

为说明新算法的优越性和适用性.我们在该区域选择了一个具有不同地形地貌特征的子区域.该区域位于洛杉矶市区周边的EI Toro海军军用机场(图 5),地形十分平坦,分布着裸地、植被、跑道等各种人工建筑.由于地表纹理显著,因此是测试比较聚类和条纹率算法(3. 1节和3. 2节)的很好实验区.

图 5 EI Toro地区(a) GoogleEarth光学影像;(b) SAR影像强度平均值,其中A为均质区域,B为异质区域 Fig. 5 (a) Google Earth optical image over EI Toro airport and (b) incoherent average of ENVISAT ASAR images; the A denotes homogeneous area, and the B denotes texture significant area

本文将采用Envisat卫星2003年9月至2009年12月获取的46景降轨SAR影像作为数据源.该传感器工作模式为C波段,空间分辨率约为方位向6 m,地距向25 m.在选取2005年6月18日获取的影像作为主影像之后,将其余45景影像与主影像配准并重采样至相同的SAR几何.

4.2 EI Toro区域相干性估计

本文选用2007年12月15日和2008年2月23日的影像作为干涉对进行相干性估计,其中垂直基线约为一39 m,时间基线70天.并以2003年9月至2005年7月23日的7景SAR强度图进行聚类分析.图 5b给出了46景SAR强度时间平均影像和相应的GoogleEarth光学影像.从这些图中可以清楚地看到该区域(面积约4. 8km×5km)分布着不同散射属性的地物目标、点散射体和分布式散射体.

图 6首先展现的是改进的ML条纹率估计算法与现有典型算法的比较.受局部噪声的影响,()中小窗口易造成条纹的误估计,而(b)中加大窗口尺寸又丢失分辨率.在没有先验信息引导的情况下,错误的条纹实际上又为补偿后的干涉图增添了系统相位.此外,窗口边缘的非连续性也使得整个影像失真,在分块边缘产生冗余相位.相比之下,(d)的估计逼近原始相位,在强噪声区域,估计并未产生错误的条纹,而是取零值,这与滤波和重构是有区别的,因为相干性估计需要的是只含有干涉噪声的信号分量.用(d)对原始干涉图进行相位补偿之后,原始噪声并未改变.

在确保过程s1(t)s2*(t)联合平稳之后,我们将着重比较传统相干性估计、当前较为流行的基于区域增长算法的相干性估计以及本文的基于BWS算法的时间序列相干性估计.图 7给出了估计结果.通过目视判读可以看出标准的固定窗口方法估计的相干图空间分布特征最差,分辨率很低.这与窗口大小本身有关.窗口太大容易引起周围的异质像素加入,引起过程s1(t)s2(t)不平稳,结果是高估的(详见式(13) -(14)).窗口太小,样本容量少,估计量有偏,并且估计精度低.从实例研究来看,有偏产生的差异比异质分布产生的偏差更明显.

图 7 相干性量级估计 (a)7×7固定窗;(b)区域增长法,其中阈值犜1=0.34,犜2=2犜1,样本阈值140;(c)基于时间序列的BWS检验方法,估计窗口为21×7,影像数为7. Fig. 7 Coherence estimation (a) 7×7 boxcar; (b) Region growing with thresholds T1=0.34, T2=2T1, the maximum sample size is set to be 140; (c) BWS test based on 7 images, the window size is 21×7.

区域增长算法通过寻找与种子点具有相同属性的像素来估计相干性.原理上是数据分割,和假设检验的方法类似,都是以统计推断为工具,寻找同分布样本.又有别于假设检验,这种方法利用SAR影像理论分布(瑞利分布)的置信区间作为判断依据,研究对象是空间上的像元.然而,由于单视影像噪声很大,并且实际强度值服从重尾分布[47-48](重尾瑞利,K,韦伯分布等),像素的准确划分是很困难的.这种划分又十分主观,依赖于置信度和设定的最大样本上限.不同的设置结果偏差较大.为使该方法与时间序列方法具有可比性,本例中设定的样本上限为140.可以看出,与(a)相比,(b)的分辨率有所改善,高估偏差也减小了,这说明样本异质性在减少.而(c)具有更鲜明的空间分布特征,分辨率显著提高.如机场跑道的顶部、中下部、永久散射体的特征等.虽然本例中数据栈的数量仅为7景,BWS检验由于较高的功效减小了假设检验的第二类错误的概率,进而增强了影像分辨率.

有关窗口内待估点选取像元的事例描述详见图 8.在局部散射特征对比度不足的情况下,算法在选取同分布样本的优劣程度十分显著.传统估计方法的矩形窗口在选取像素的时候未考虑质地信息,而区域生长法依赖图像本身的质量.当斑点噪声较大时,很容易引起算法终止,导致每个待估点样本选取不足的情况,如本例的42个样本.而基于7个样本的BWS更为稳健,可以最大程度地选择样本,达到92个.

图 8 不同算法选点示意图 其中红色点代表种子点,绿色点代表算法选择的点(中括号内值代表选点个数),估计范围如(b)所示;(a)背景强度;(b)传统方法;(c)区域增长法;(d)7个样本的BWS检验;(e)46个样本的BWS检验. Fig. 8 The cases of homogeneous sample selection Red point denotes the seedpoint, and the green point denotes the selected samples (the sample number is given in the square brackets). (a) Background; (b) Conventional method; (c) Region growing method; BWS tests based on 7 samples (d) and 46 samples (e).

考虑到样本的容量是统计推断最重要的条件,大样本意味着更精确的推断.基于此,本文将46个影像全部进行BWS假设检验,从(e)可以看到,此时的样本选择是最为合理的,几乎没有选到异质的点.但是估计结果中似乎又有些点没有选到.其主要原因可能是这些点的时间变化特征与种子点差异较大,也就是尺度上的差异较大.

在完成上述两个步骤之后,可以对带有系统偏差的相干图进行纠正.图 9给出了纠正前后的结果,偏差纠正后的影像(图 9b)对比度增强了很多.特别是在中低相干性的地区,矫正是必要的.另外与图 7的比较可以看出,检验样本数量的提升是增强相干图空间分辨率的关键,机场的结构特征已与图 5的强度影像十分接近.

表 123给出了基于上述三种估计方法的定量描述,如均值(Mean)、标准偏差(STD)以及估计相干性时使用的平均像元数(Num),这些比较将以大样本的估计结果作为参照.其中表示固定窗估计的相干性,表示基于区域增长法估计的相干性,分别代表 7个样本的BWS检验估计的相干性,是采用46个时间样本的BWS检验估计的结果,, 是对偏差纠正后的无偏相干性.

表 1 匀质区域A相干性数字特征 Table 1 The characteristics of coherence in homogeneous area A
表 2 异质区域B相干性数字特征 Table 2 The characteristics of coherence in inhomogeneous area B
表 3 PS候选点的相干性数字特征 Table 3 The characteristics of coherence of PS candidates

表 1代表了匀质区域A(图 5)的统计.所选区域相干性十分的低,具有最大的均值.考虑到区域增长法的保守性,在每一次估计中,它平均使用的样本仅有42个,低于固定窗口,产生了更大的估计偏差.相比之下,BWS方法表现较好,它在最大程度上选择样本,得到的估计值具有更小的标准偏差,因而更加可靠.再看无偏估计, 它与理论公式(7)计算的已十分接近.值得注意的是,理论上在中低相干值,相干性无偏估计的标准差大于有偏估计[20-32].因此,偏差纠正会对估计精度产生影响.

在纹理明显的区域B, 由于样本选取受限,估计量的有偏性会增加.这是在表 2出现最大均值的原因.比较,我们发现STD值出现了反弹.其主要原因是还是包含了一些异质样本,因此在纹理区STD减小了.当用于检验的时间样本充足时,体现出更大的STD值完全是由质地本身引起的.

最后给出的是永久散射体(PS)候选点的相干值情况.PS点在时间上维持高稳定性,其特征与周围分布式目标区别较大,具有很高的相干性.从表 3来看,由于固定窗选取了PS点周围的低相干点,导致PS自身的相干值被污染.区域增长减少了污染,然而SLC的强噪声使得该方法很难避免误选.注意看项Num,BWS选择了最少的样本数,这更符合点目标拥有较少兄弟样本的特性.

5 讨论与结论

本文提出了一种基于时间序列影像的InSAR相干性估计算法.新方法建立于对雷达回波信号误差源的详细分析之上,由两个核心部分组成:(1)采用BWS非参数假设检验进行像元聚类,选取独立同分布样本;(2)采用修正的ML条纹频率估计补偿系统相位.实例结果表明,新提出的数据处理链较传统方法而言,不论在估计精度和准确度、还是在维护图像空间分布特征上,都具有显著的优势.更为关键的是,整个数据处理链的复杂度并未降低计算效率.与区域增长法相比,假设检验耗费的时间要多出一倍.不过这种计算的冗余换来的是上述N(N -1)/2景相干图的精确估计.而区域增长估计的仅仅是一对干涉数据的参数.在条纹率估计步骤中,新的修正方法带来较大的计算量,经过1D FFT的优化,计算时间可以与已有方法持平.

除了上述讨论的特点,新方法还有以下三个方面的优点:(1)无需人工干预,不需要经验值设定,几乎不受主观性因素的影响,整个数据处理都是自适应的.这对于不同的科研人员处理同一批数据是十分重要的;(2)数据量具有灵活性.小数据集明显改善相干性估计精度,增加数据量能够更好地增强影像分辨率;(3)检验方法为PS候选点的选择提供了理论依据.以上节的实例为例,当影像数量为46景时,PS候选点拥有的样本只有2个.因此,在检验之后,我们可以掩膜所有样本大于2个的点,对剩余的点做进一步的选点分析,这些点很可能就是PS点.

虽然新方法的优势明显,但是也存在着一些缺点,其中最大的问题是序列影像的时间分辨率不足引起的散射点特性的变化,这种变化使得时间信号不能满足平稳的假设,进而导致检验结果的误判,影响InSAR相干性估计.然而,随着新一代SAR卫星的发射成功,分辨率更高,重访周期更短的SAR数据集将显著提高时间序列SAR影像统计分析的精度[4],进而提高相干性甚至SAR/InSAR所有参数的估计精度.这将为InSAR对地观测的应用,如分类、变化检测等提供高质量的观测源奠定基础.

参考文献
[1] 郭华东, 邵芸, 王长林. 雷达对地观测理论与应用. 北京: 科学出版社, 2000 . Guo H D, Shao Y, Wang C L. Theory and Application of Radar Earth Observation (in Chinese). Beijing: Science Press, 2000 .
[2] Zebker H A, Villasenor J. Decorrelation in interferometric radar echoes. IEEE Transactions on Geoscience and Remote Sensing , 1992, 30(5): 950-959. DOI:10.1109/36.175330
[3] Rosen P A, Hensley S, Joughin I R, et al. Synthetic aperture radar interferometry. Proceedings of the IEEE , 2000, 88(3): 333-382. DOI:10.1109/5.838084
[4] 王腾, PerissinD, RoccaF, 等. 基于时间序列SAR影像分析方法的三峡大坝稳定性监测. 中国科学(地球科学) , 2010, 54(5): 720–732. Wang T, Perissin D, Rocca F, et al. Three Gorges Dam stability monitoring with time-series InSAR image analysis analysis. Sci. China Earth Sci. (in Chinese) , 2010, 54(5): 720-732.
[5] 张红, 王超, 吴涛. 基于相干目标的DInSAR方法研究. 北京: 科学出版社, 2009 . Zhang H, Wang C, Wu T. The Study of DINSAR Technique Based on the Coherent Targets (in Chinese). Beijing: Science Press, 2009 .
[6] Feng G, Ding X, Li Z, et al. Calibration of an InSAR-Derived coseimic deformation map associated with the 2011Mw9.0 Tohoku-Oki earthquake. IEEE Geoscience and Remote Sensing Letters , 2012: 1-5.
[7] Rignot E J M, van Zyl J J. Change detection techniques for ERS-1 SAR data. IEEE Transactions on Geoscience and Remote Sensing , 1993, 31(4): 896-906. DOI:10.1109/36.239913
[8] Wegmuller U, Werner C L. SAR interferometric signatures of forest. IEEE Transactions on Geoscience and Remote Sensing , 1995, 33(5): 1153-1161. DOI:10.1109/36.469479
[9] Wegmuller U, Werner C. Retrieval of vegetation parameters with SAR interferometry. IEEE Transactions on Geoscience and Remote Sensing , 1997, 35(1): 18-24. DOI:10.1109/36.551930
[10] Engdahl M E, Hyyppa J M. Land-cover classification using multitemporal ERS-1/2 InSAR data. IEEE Transactions on Geoscience and Remote Sensing , 2003, 41(7): 1620-1628. DOI:10.1109/TGRS.2003.813271
[11] Askne J I H, Dammert P B G, Ulander L M H, et al. C-band repeat-pass interferometric SAR observations of the forest. IEEE Transactions on Geoscience and Remote Sensing , 1997, 35(1): 25-35. DOI:10.1109/36.551931
[12] Santoro M, Askne J, Smith G, et al. Stem volume retrieval in boreal forests from ERS-1/2 interferometry. Remote Sensing of Environment , 2002, 81(1): 19-35. DOI:10.1016/S0034-4257(01)00329-7
[13] Askne J, Santoro M, Smith G, et al. Multitemporal repeat-pass SAR interferometry of boreal forests. IEEE Transactions on Geoscience and Remote Sensing , 2003, 41(7): 1540-1550. DOI:10.1109/TGRS.2003.813397
[14] Santoro M, Askne J I H, Wegmiiller U, et al. Observations, modeling, and applications of ERS-ENVISAT coherence over land surfaces. IEEE Transactions on Geoscience and Remote Sensing , 2007, 45(8): 2600-2611. DOI:10.1109/TGRS.2007.897420
[15] Zebker H A, Weber Hoen E. Penetration depths inferred from interferometric volume decorrelation observed over the Greenland ice sheet. IEEE Transactions on Geoscience and Remote Sensing , 2000, 38(6): 2571-2583. DOI:10.1109/36.885204
[16] Oveisgharan S, Zebker H A. Estimating snow accumulation from InSAR correlation observations. IEEE Transactions on Geoscience and Remote Sensing , 2007, 45(1): 10-20. DOI:10.1109/TGRS.2006.886196
[17] 蒋弥, 李志伟, 丁晓利, 等. InSAR可检测的最大最小变形梯度的函数模型研究. 地球物理学报 , 2009, 52(7): 1715–1724. Jiang M, Li Z W, Ding X L, et al. A study on the maximum and minimum detectable deformation gradients resolved by InSAR. Chinese J. Geophys. (in Chinese) , 2009, 52(7): 1715-1724.
[18] Jiang M, Li Z, Ding X, et al. Modeling minimum and maximum detectable deformation gradients of interferometric SAR measurements. International Journal of Applied Earth Observation and Geoinformation , 2011, 13(5): 766-777. DOI:10.1016/j.jag.2011.05.007
[19] Foster M, Guinzy N. The coefficient of coherence:its estimation and use in geophysical data processing. Geophysics , 1967, 32(4): 602-616. DOI:10.1190/1.1439878
[20] Touzi R, Lopes A, Bruniquel J, et al. Coherence estimation for SAR imagery. IEEE Transactions on Geoscience and Remote Sensing , 1999, 37(1): 135-149. DOI:10.1109/36.739146
[21] Guarnieri A M, Prati C. SAR interferometry:A "quick and dirty" coherence estimator for data browsing. IEEE Transactions on Geoscience and Remote Sensing , 1997, 35(3): 660-669. DOI:10.1109/36.581984
[22] Lee J S, Cloude S R, Papathanassiou K P, et al. Speckle filtering and coherence estimation of polarimetric SAR interferometry data for forest applications. IEEE Transactions on Geoscience and Remote Sensing , 2003, 41(10): 2254-2263. DOI:10.1109/TGRS.2003.817196
[23] Zebker H A, Chen K. Accurate estimation of correlation in InSAR observations. IEEE Geoscience and Remote Sensing Letters , 2005, 2(2): 124-127. DOI:10.1109/LGRS.2004.842375
[24] Hanssen R F. Radar Interferometry:Data Interpretation and Error Analysis. Netherland: Kluwer Academic Pub, 2001 .
[25] Ciuc M, Bolon P, Trouve E, et al. Adaptive-neighborhood speckle removal in multitemporal synthetic aperture radar images. Applied Optics , 2001, 40(32): 5954-5966. DOI:10.1364/AO.40.005954
[26] Vasile G, Trouvé E, Ciuc M, et al. General adaptive-neighborhood technique for improving synthetic aperture radar interferometric coherence estimation. JOSA A , 2004, 21(8): 1455-1464. DOI:10.1364/JOSAA.21.001455
[27] Vasile G, Trouvé E, Lee J S, et al. Intensity-driven adaptive-neighborhood technique for polarimetric and interferometric SAR parameters estimation. IEEE Transactions on Geoscience and Remote Sensing , 2006, 44(6): 1609-1621. DOI:10.1109/TGRS.2005.864142
[28] Vasile G, Trouvé E, Petillot I, et al. High-resolution SAR interferometry:Estimation of local frequencies in the context of Alpine glaciers. IEEE Transactions on Geoscience and Remote Sensing , 2008, 46(4): 1079-1090. DOI:10.1109/TGRS.2007.912713
[29] Ferretti A, Fumagalli A, Novali F, et al. A new algorithm for processing interferometric data-stacks:SqueeSAR. IEEE Transactions on Geoscience and Remote Sensing , 2011, 49(9): 3460-3470. DOI:10.1109/TGRS.2011.2124465
[30] Parizzi A, Brcic R. Adaptive InSAR stack multilooking exploiting amplitude statistics:A comparison between different techniques and practical results. IEEE Geoscience and Remote Sensing Letters , 2011, 8(3): 441-445. DOI:10.1109/LGRS.2010.2083631
[31] Abdelfattah R, Nicolas J M. Interferometric SAR coherence magnitude estimation using second kind statistics. IEEE Transactions on Geoscience and Remote Sensing , 2006, 44(7): 1942-1953. DOI:10.1109/TGRS.2006.870440
[32] Seymour M S, Cumming I G. Maximum likelihood estimation for SAR interferometry.//Proceedings of the International Geoscience and Remote Sensing Symposium IGARSS (1994), 4:2272-2275.
[33] Tough R J A, Blacknell D, Quegan S. A statistical description of polarimetric and interferometric synthetic aperture radar data. Proceedings of the Royal Society of London. Series A:Mathematical and Physical Sciences , 1995, 449(1937): 567-589. DOI:10.1098/rspa.1995.0059
[34] Papoulis A. Probability, Random Variables, and Stochastic Processes. (3rd ed). New York: McGraw-Hill Book Company, 1991 .
[35] 廖明生, 林珲. 雷达干涉测量:原理与信号处理基础. (北京). 测绘出版社, 2003 . Liao M S, Lin H. Synthetic Aperture Radar Intereferometry-Principle and Signal Processing (in Chinese). Beijing: Publishing House of Surveying and Mapping, 2003 .
[36] Ding X, Li Z, Zhu J, et al. Atmospheric effects on InSAR measurements and their mitigation. Sensors , 2008, 8(9): 5426-5448. DOI:10.3390/s8095426
[37] Kvam P H, Vidakovic B. Nonparametric Statistics with Applications to Science and Engineering. New York: John Wiley & Sons, 2007 .
[38] Darling D A. The kolmogorov-smirnov, cramer-von mises tests. The Annals of Mathematical Statistics , 1957, 28(4): 823-838. DOI:10.1214/aoms/1177706788
[39] Anderson T. On the distribution of the two-sample Cramer-von Mises criterion. The Annals of Mathematical Statistics , 1962, 33(3): 1148-1159. DOI:10.1214/aoms/1177704477
[40] Baumgartner W, Weiβ P, Schindler H. A nonparametric test for the general two-sample problem. Biometrics , 1998, 54(3): 1129-1135. DOI:10.2307/2533862
[41] Neuhäuser M. Exact tests based on the Baumgartner-Weiβ-Schindler statistic-A survey. Statistical Papers , 2005, 46(1): 1-29. DOI:10.1007/BF02762032
[42] Spagnolini U. 2-D phase unwrapping and instantaneous frequency estimation. IEEE Transactions on Geoscience and Remote Sensing , 1995, 33(3): 579-589. DOI:10.1109/36.387574
[43] Trouvé E, Caramma M, Maitre H. Fringe detection in noisy complex interferograms. Applied Optics , 1996, 35(20): 3799-3806. DOI:10.1364/AO.35.003799
[44] Wu N, Feng D Z, Li J. A locally adaptive filter of interferometric phase images. IEEE Geoscience and Remote Sensing Letters , 2006, 3(1): 73-77. DOI:10.1109/LGRS.2005.856703
[45] Li Z W, Ding X L, Huang C, et al. Improved filtering parameter determination for the Goldstein radar interferogram filter. ISPRS Journal of Photogrammetry and Remote Sensing , 2008, 63(6): 621-634. DOI:10.1016/j.isprsjprs.2008.03.001
[46] Nicolas J M. Introduction to second kind statistics:application of Log-moments and Log-cumulants to SAR image law analysis. Traitement du Signal , 2002, 19: 139-168.
[47] Kuruoglu E E, Zerubia J. Modeling SAR images with a generalization of the Rayleigh distribution. IEEE Transactions on Image Processing , 2004, 13(4): 527-533. DOI:10.1109/TIP.2003.818017
[48] Greco M S, Gini F. Statistical analysis of high-resolution SAR ground clutter data. IEEE Transactions on Geoscience and Remote Sensing , 2007, 45(3): 566-575. DOI:10.1109/TGRS.2006.888141