测绘地理信息   2019, Vol. 44 Issue (1): 45-47
0
GPS短基线的概率密度函数分析[PDF全文]
叶玲洁1    
1. 广州市城市规划勘测设计研究院,广东 广州,510060
摘要: 通过统计假设检验分析了单历元短基线是否服从正态分布,随后通过极大似然估计的方法对数据组进行p-范分布参数估计,并根据统计假设检验判断数据组是否服从p-范分布。
关键词: 短基线     概率密度函数     正态分布     p-范分布     统计假设检验    
Analysis of Probability Density Function for GPS Short Baseline
YE Lingjie1    
1. Guangzhou Urban Planning & Design Survey Research Institute, Guangzhou 510060, China
Abstract: The paper analyzes whether the single epoch short baseline obeys normal distribution by statistical hypothesis test, then estimates the parameter of p-norm distribution by the method of maximum likelihood estimation, and verifies whether the data obeyed the p-norm distribution according to the statistical hypothesis test.
Key words: short baseline     probability density function     normal distribution     p-vaule distribution     statistical hypothesis test    

GPS测量结果受接收机、传播路径、卫星等多方面因素的影响,其误差源极其复杂,所以我们有理由怀疑GPS测量误差是否服从正态分布。

最小二乘法则在GPS测量数据处理过程中被广泛应用,使用最小二乘法则需建立观测值和待求参数间的函数关系,并知晓观测值的权。虽然观测值的分布情况对参数的求解并无影响,但其直接影响到参数的精度评定[1]。观测数据的分布情况将直接关系到以此为基础的GPS数据处理理论和质量评价准则。

GPS观测数据的分布情况可以通过分析原始观测数据得到,也可以通过分析原始观测值的函数得到[2, 3]。观测值和观测值线性函数的分布是一致的,正态随机变量线性函数仍是服从正态分布的。本文研究的对象是GPS单历元基线。

1 测量常用分布

测量领域除了最常用的正态分布,还有其他可能服从的分布,如拉普拉斯分布、p-范分布等[4-6]。本文分别对实验数据进行正态分布和p-范分布检验。

1.1 正态分布

对于服从正态分布的某随机变量X,概率密度函数可表示为:

$ f(x) = \frac{1}{{\sqrt {2\pi } \sigma }}{{\text{e}}^{ - \frac{1}{{2{\sigma ^2}}}{{(x - \mu )}^2}}}\left( { - \infty < x < \infty, \sigma > 0} \right) $ (1)

式中,μσ2分别为随机变量X的均值和方差。此时X服从正态分布,记X~N(μσ2)。

1.2 p-范分布

如果某一随机变量X是服从p-范分布的,则其概率密度函数的表达式是[4, 7]

$ f(x) = \frac{1}{{2\beta \mathit{\Gamma }(\frac{1}{p})}}\exp \left\{ { - {{\left[{\frac{1}{p}\frac{{|x-\mu |}}{\beta }} \right]}^p}} \right\} $ (2)

式中,μβp-范分布的参数;Γ(α)是伽玛函数,其表达式为:

$ \Gamma (\alpha ) = \int\limits_0^\infty {{x^{\alpha - 1}}{e^{ - x}}{\text{d}}x} $ (3)

p=2时,p-范分布即为正态分布。

2 统计假设检验

假设对于母体X,其分布函数F(x)未知,x1, x2, …, xn是母本Xn个样本值,另假设已知某理论分布函数F0(x)。统计假设检验是通过样本的观测值x1, x2, …, xn,来判断样本的真实分布函数F(x)与理论分布函数F0(x)是否一致。原假设H0表示两者的分布相同,备择假设H1表示两者的分布不同,则有:

${H_0}:F(x) = {F_0}(x);{H_1}:F(x) \ne {F_0}(x) $ (4)

本文采用的检验准则是卡方优度拟合的皮尔逊χ2检验量。皮尔逊χ2检验的步骤可归纳如下:

1) 首先将样本X按等区间进行划分,得到k个互不相交的区间,其中k可取任意整数。经研究论证发现,若观测值的样本标准差为σ,则当划分区间的宽度接近σ/2时,得到的检验结果是较合理的[3],综合考虑本文的样本数据量,所有样本均划分为15个区间。

2) 若分布函数F(x)中含有m个未知参数,则可以利用样本数据来估算未知参数的值,然后将参数估值代入指定的理论分布函数中,本文需要估算两个参数,即样本的均值和方差。

3) 根据划分的区间,样本数据的相应理论频率pi为:

$ {p_i} = {F_0}({a_i}) - {F_0}({a_{i - 1}}) $ (5)

相应的理论频数为npi

4) 根据${\chi ^2} = \sum\limits_{i = 1}^k {\frac{{{{({n_i} - n{p_i})}^2}}}{{n{p_i}}}} $,计算χ2值。若H0成立,则χ2近似服从χ2(k-m-1)分布。ni为样本实际频数。

5) 对于特定的显著水平为α,可以通过查表得到χ1-α2(k-m-1)的值。

6) 比较χ2χ1-α2(k-m-1)值的大小,如果皮尔逊值小于临界值,即χ2χ1-α2(k-m-1)时,接受原假设H0;否则,拒绝原假设H0

3 实例分析

原始观测数据来源于某坝区2011-03-22使用TRIMBLE R7接收机采集的静态数据,采样间隔为15 s,共观测时长均为8 h。本文挑选了其中3条基线,分别记为基线1(0.95 km)、基线2(2.15 km)、基线3(5.29 km),该3条基线向量均已知。考虑到GPS运行周期,为了保证检验数据外界条件的重复可比性,后一天的解算起始历元比前一天提前4 min,从而确保检验数据观测条件(反射物、卫星的几何分布等)的重复性和一致性[8-10]。同一基线不同历元解算使用相同卫星的观测数据。解算过程主要参数如下:GPS双差载波相位观测值、萨斯塔莫宁(Saastamoinen)模型、广播星历、截止高度角为10°。

采用单历元解算,由于基线向量是已知的,所以整周模糊度便可确定。解算得到单历元基线值后,剔除其中大于3倍中误差的基线值,采用皮尔逊卡方统计值按XYZ 3个方向分量进行正态分布和p-范分布检验。在进行p-范分布检验前,需先采用极大似然估计得到p-范分布参数。此外,本文还给出了正态分布和p-范分布的直方图拟合情况,从图形上直观的判断数据的拟合情况(图 1)。

图 1 3个方向分量的正态及p-范分布拟合直方图 Fig.1 Fitting Histogram for Normal and p-value Distribution

表 1给出了基线向量的统计假设检验结果,将正态分布的皮尔逊值与p-范分布的皮尔逊值(表 1中的“最佳p值”表示在计算p-范皮尔逊值时,最小皮尔逊值所对应的p值),均与表 2的临界值进行比对,判断是否接受假设检验,表 1中加粗标出的部分为不接受假设检验的部分。直方图直观地表达了各基线向量的正态分布和p-范分布拟合情况。

表 1 基线向量的统计假设检验结果 Tab.1 Results of Statistical Hypothesis Test for Baseline Vector

表 2 不同显著水平下的χ2(15-2-1)值 Tab.2 Value of χ2(15-2-1) at Different Significance Level

根据上述统计假设检验的结果,发现基线1的Z方向不服从正态分布,但服从p-范分布,其余值均既服从正态分布,亦服从p-范分布,但p-范分布的皮尔逊值更小,且从直方图拟合情况,p-范分布的情况优于正态分布。

4 结束语

采用单历元的数据解算模式,在基线向量已知的情况下,整周模糊度便可确定,此时单历元基线仅是载波相位双差观测值小数部分的函数,可以通过基线向量的残差分析载波相位的分布。根据检验结果,对于短基线,绝大多数是服从正态分布的,这可能是由于采用双差解算可将大部分误差消除或减弱,所以得到的单历元短基线是服从正态分布的,仅有一条基线的一个方向的值不服从正态分布,但其服从p-范分布。对于短基线,可以认为在经过基本的误差改正之后,数据是服从正态分布的,并且发现,对于短基线,p-范分布的拟合性更好。

参考文献
[1]
蓝悦明, 贾媛. GPS观测值误差分布的研究[J]. 测绘通报, 2008(4): 12-13.
[2]
Cai J, Grafarend E W, Hu C. The Statistical Property of the GNSS Carrier Phase Observations and Its Effects on the Hypothesis Testing of the Related Estimators[C].Proceedings of ION GNSS, Fort Worth, TX, 2007
[3]
Luo X, Mayer M, Heck B. On the Issues of Probability Distribution of GPS Carrier Phase Observations[C].EGU General Assembly Conference Abstracts, Vienna, Austria, 2009 http://adsabs.harvard.edu/abs/2009EGUGA..11.4815L
[4]
蓝悦明, 韩柯慧, 叶玲洁, 等. GPS RTK的概率密度函数初探[J]. 测绘地理信息, 2013, 38(5): 6-7.
[5]
蓝悦明, 王楠. GPSRTK观测数据的概率密度函数研究[J]. 测绘通报, 2011(2): 6-7.
[6]
潘雄, 赵启龙, 王俊雷, 等. 一元非对称p-范分布的极大似然平差[J]. 测绘学报, 2011, 40(1): 33-36.
[7]
孙海燕, 潘雄. 一元p-范分布的参数估计[J]. 武汉大学学报·信息科学版, 2003, 28(5): 551-554.
[8]
李一鹤, 沈云中. GPS观测值的时间相关性对基线解算影响[J]. 武汉大学学报·信息科学版, 2011, 36(4): 427-430.
[9]
王爱生, 欧吉坤, 阳仁贵, 等. 快速GPS基线解算结果的统计分析[J]. 大地测量与地球动力学, 2007, 27(4): 51-56.
[10]
刘宁, 熊永良, 王德军, 等. 一种新的GPS整周模糊度单历元求解算法[J]. 武汉大学学报·信息科学版, 2013, 38(3): 291-294.