| GPS短基线的概率密度函数分析 |
GPS测量结果受接收机、传播路径、卫星等多方面因素的影响,其误差源极其复杂,所以我们有理由怀疑GPS测量误差是否服从正态分布。
最小二乘法则在GPS测量数据处理过程中被广泛应用,使用最小二乘法则需建立观测值和待求参数间的函数关系,并知晓观测值的权。虽然观测值的分布情况对参数的求解并无影响,但其直接影响到参数的精度评定[1]。观测数据的分布情况将直接关系到以此为基础的GPS数据处理理论和质量评价准则。
GPS观测数据的分布情况可以通过分析原始观测数据得到,也可以通过分析原始观测值的函数得到[2, 3]。观测值和观测值线性函数的分布是一致的,正态随机变量线性函数仍是服从正态分布的。本文研究的对象是GPS单历元基线。
1 测量常用分布测量领域除了最常用的正态分布,还有其他可能服从的分布,如拉普拉斯分布、p-范分布等[4-6]。本文分别对实验数据进行正态分布和p-范分布检验。
1.1 正态分布对于服从正态分布的某随机变量X,概率密度函数可表示为:
| $ f(x) = \frac{1}{{\sqrt {2\pi } \sigma }}{{\text{e}}^{ - \frac{1}{{2{\sigma ^2}}}{{(x - \mu )}^2}}}\left( { - \infty < x < \infty, \sigma > 0} \right) $ | (1) |
式中,μ和σ2分别为随机变量X的均值和方差。此时X服从正态分布,记X~N(μ,σ2)。
1.2 p-范分布如果某一随机变量X是服从p-范分布的,则其概率密度函数的表达式是[4, 7]:
| $ f(x) = \frac{1}{{2\beta \mathit{\Gamma }(\frac{1}{p})}}\exp \left\{ { - {{\left[{\frac{1}{p}\frac{{|x-\mu |}}{\beta }} \right]}^p}} \right\} $ | (2) |
式中,μ、β是p-范分布的参数;Γ(α)是伽玛函数,其表达式为:
| $ \Gamma (\alpha ) = \int\limits_0^\infty {{x^{\alpha - 1}}{e^{ - x}}{\text{d}}x} $ | (3) |
当p=2时,p-范分布即为正态分布。
2 统计假设检验假设对于母体X,其分布函数F(x)未知,x1, x2, …, xn是母本X的n个样本值,另假设已知某理论分布函数F0(x)。统计假设检验是通过样本的观测值x1, x2, …, xn,来判断样本的真实分布函数F(x)与理论分布函数F0(x)是否一致。原假设H0表示两者的分布相同,备择假设H1表示两者的分布不同,则有:
| ${H_0}:F(x) = {F_0}(x);{H_1}:F(x) \ne {F_0}(x) $ | (4) |
本文采用的检验准则是卡方优度拟合的皮尔逊χ2检验量。皮尔逊χ2检验的步骤可归纳如下:
1) 首先将样本X按等区间进行划分,得到k个互不相交的区间,其中k可取任意整数。经研究论证发现,若观测值的样本标准差为σ,则当划分区间的宽度接近σ/2时,得到的检验结果是较合理的[3],综合考虑本文的样本数据量,所有样本均划分为15个区间。
2) 若分布函数F(x)中含有m个未知参数,则可以利用样本数据来估算未知参数的值,然后将参数估值代入指定的理论分布函数中,本文需要估算两个参数,即样本的均值和方差。
3) 根据划分的区间,样本数据的相应理论频率pi为:
| $ {p_i} = {F_0}({a_i}) - {F_0}({a_{i - 1}}) $ | (5) |
相应的理论频数为npi。
4) 根据
5) 对于特定的显著水平为α,可以通过查表得到χ1-α2(k-m-1)的值。
6) 比较χ2与χ1-α2(k-m-1)值的大小,如果皮尔逊值小于临界值,即χ2<χ1-α2(k-m-1)时,接受原假设H0;否则,拒绝原假设H0。
3 实例分析原始观测数据来源于某坝区2011-03-22使用TRIMBLE R7接收机采集的静态数据,采样间隔为15 s,共观测时长均为8 h。本文挑选了其中3条基线,分别记为基线1(0.95 km)、基线2(2.15 km)、基线3(5.29 km),该3条基线向量均已知。考虑到GPS运行周期,为了保证检验数据外界条件的重复可比性,后一天的解算起始历元比前一天提前4 min,从而确保检验数据观测条件(反射物、卫星的几何分布等)的重复性和一致性[8-10]。同一基线不同历元解算使用相同卫星的观测数据。解算过程主要参数如下:GPS双差载波相位观测值、萨斯塔莫宁(Saastamoinen)模型、广播星历、截止高度角为10°。
采用单历元解算,由于基线向量是已知的,所以整周模糊度便可确定。解算得到单历元基线值后,剔除其中大于3倍中误差的基线值,采用皮尔逊卡方统计值按X、Y、Z 3个方向分量进行正态分布和p-范分布检验。在进行p-范分布检验前,需先采用极大似然估计得到p-范分布参数。此外,本文还给出了正态分布和p-范分布的直方图拟合情况,从图形上直观的判断数据的拟合情况(图 1)。
![]() |
| 图 1 3个方向分量的正态及p-范分布拟合直方图 Fig.1 Fitting Histogram for Normal and p-value Distribution |
表 1给出了基线向量的统计假设检验结果,将正态分布的皮尔逊值与p-范分布的皮尔逊值(表 1中的“最佳p值”表示在计算p-范皮尔逊值时,最小皮尔逊值所对应的p值),均与表 2的临界值进行比对,判断是否接受假设检验,表 1中加粗标出的部分为不接受假设检验的部分。直方图直观地表达了各基线向量的正态分布和p-范分布拟合情况。
| 表 1 基线向量的统计假设检验结果 Tab.1 Results of Statistical Hypothesis Test for Baseline Vector |
![]() |
| 表 2 不同显著水平下的χ2(15-2-1)值 Tab.2 Value of χ2(15-2-1) at Different Significance Level |
![]() |
根据上述统计假设检验的结果,发现基线1的Z方向不服从正态分布,但服从p-范分布,其余值均既服从正态分布,亦服从p-范分布,但p-范分布的皮尔逊值更小,且从直方图拟合情况,p-范分布的情况优于正态分布。
4 结束语采用单历元的数据解算模式,在基线向量已知的情况下,整周模糊度便可确定,此时单历元基线仅是载波相位双差观测值小数部分的函数,可以通过基线向量的残差分析载波相位的分布。根据检验结果,对于短基线,绝大多数是服从正态分布的,这可能是由于采用双差解算可将大部分误差消除或减弱,所以得到的单历元短基线是服从正态分布的,仅有一条基线的一个方向的值不服从正态分布,但其服从p-范分布。对于短基线,可以认为在经过基本的误差改正之后,数据是服从正态分布的,并且发现,对于短基线,p-范分布的拟合性更好。
| [1] |
蓝悦明, 贾媛. GPS观测值误差分布的研究[J]. 测绘通报, 2008(4): 12-13. |
| [2] |
Cai J, Grafarend E W, Hu C. The Statistical Property of the GNSS Carrier Phase Observations and Its Effects on the Hypothesis Testing of the Related Estimators[C].Proceedings of ION GNSS, Fort Worth, TX, 2007
|
| [3] |
Luo X, Mayer M, Heck B. On the Issues of Probability Distribution of GPS Carrier Phase Observations[C].EGU General Assembly Conference Abstracts, Vienna, Austria, 2009 http://adsabs.harvard.edu/abs/2009EGUGA..11.4815L
|
| [4] |
蓝悦明, 韩柯慧, 叶玲洁, 等. GPS RTK的概率密度函数初探[J]. 测绘地理信息, 2013, 38(5): 6-7. |
| [5] |
蓝悦明, 王楠. GPSRTK观测数据的概率密度函数研究[J]. 测绘通报, 2011(2): 6-7. |
| [6] |
潘雄, 赵启龙, 王俊雷, 等. 一元非对称p-范分布的极大似然平差[J]. 测绘学报, 2011, 40(1): 33-36. |
| [7] |
孙海燕, 潘雄. 一元p-范分布的参数估计[J]. 武汉大学学报·信息科学版, 2003, 28(5): 551-554. |
| [8] |
李一鹤, 沈云中. GPS观测值的时间相关性对基线解算影响[J]. 武汉大学学报·信息科学版, 2011, 36(4): 427-430. |
| [9] |
王爱生, 欧吉坤, 阳仁贵, 等. 快速GPS基线解算结果的统计分析[J]. 大地测量与地球动力学, 2007, 27(4): 51-56. |
| [10] |
刘宁, 熊永良, 王德军, 等. 一种新的GPS整周模糊度单历元求解算法[J]. 武汉大学学报·信息科学版, 2013, 38(3): 291-294. |
2019, Vol. 44




