GPS短基线的概率密度函数分析

引用本文

叶玲洁. GPS短基线的概率密度函数分析[J]. 测绘地理信息, 2019, 44(1): 45-47. DOI:10.14188/j.2095-6045.2017098

YE Lingjie. Analysis of Probability Density Function for GPS Short Baseline[J]. Journal of Geomatics 2019, 44(1): 45-47. DOI:10.14188/j.2095-6045.2017098

GPS短基线的概率密度函数分析

[PDF全文]

叶玲洁¹

1. 广州市城市规划勘测设计研究院，广东广州，510060

收稿日期: 2017-09-09

基金项目: 广州市科技计划(201503020022)

第一作者简介: 叶玲洁，硕士生，助理工程师，主要研究方向为GPS数据处理。E-mail:272667480@qq.com

摘要: 通过统计假设检验分析了单历元短基线是否服从正态分布，随后通过极大似然估计的方法对数据组进行p-范分布参数估计，并根据统计假设检验判断数据组是否服从p-范分布。

关键词: 短基线概率密度函数正态分布 p-范分布统计假设检验

Analysis of Probability Density Function for GPS Short Baseline

YE Lingjie¹

1. Guangzhou Urban Planning & Design Survey Research Institute, Guangzhou 510060, China

Abstract: The paper analyzes whether the single epoch short baseline obeys normal distribution by statistical hypothesis test, then estimates the parameter of p-norm distribution by the method of maximum likelihood estimation, and verifies whether the data obeyed the p-norm distribution according to the statistical hypothesis test.

Key words: short baseline probability density function normal distribution p-vaule distribution statistical hypothesis test

GPS测量结果受接收机、传播路径、卫星等多方面因素的影响，其误差源极其复杂，所以我们有理由怀疑GPS测量误差是否服从正态分布。

最小二乘法则在GPS测量数据处理过程中被广泛应用，使用最小二乘法则需建立观测值和待求参数间的函数关系，并知晓观测值的权。虽然观测值的分布情况对参数的求解并无影响，但其直接影响到参数的精度评定^[1]。观测数据的分布情况将直接关系到以此为基础的GPS数据处理理论和质量评价准则。

GPS观测数据的分布情况可以通过分析原始观测数据得到，也可以通过分析原始观测值的函数得到^{[2, 3]}。观测值和观测值线性函数的分布是一致的，正态随机变量线性函数仍是服从正态分布的。本文研究的对象是GPS单历元基线。

1 测量常用分布

测量领域除了最常用的正态分布，还有其他可能服从的分布，如拉普拉斯分布、p-范分布等^[4-6]。本文分别对实验数据进行正态分布和p-范分布检验。

1.1 正态分布

对于服从正态分布的某随机变量X，概率密度函数可表示为：

$ f(x) = \frac{1}{{\sqrt {2\pi } \sigma }}{{\text{e}}^{ - \frac{1}{{2{\sigma ^2}}}{{(x - \mu )}^2}}}\left( { - \infty < x < \infty, \sigma > 0} \right) $

(1)

式中，μ和σ²分别为随机变量X的均值和方差。此时X服从正态分布，记X~N(μ，σ²)。

1.2 p-范分布

如果某一随机变量X是服从p-范分布的，则其概率密度函数的表达式是^{[4, 7]}：

$ f(x) = \frac{1}{{2\beta \mathit{\Gamma }(\frac{1}{p})}}\exp \left\{ { - {{\left[{\frac{1}{p}\frac{{|x-\mu |}}{\beta }} \right]}^p}} \right\} $

(2)

式中，μ、β是p-范分布的参数；Γ(α)是伽玛函数，其表达式为：

$ \Gamma (\alpha ) = \int\limits_0^\infty {{x^{\alpha - 1}}{e^{ - x}}{\text{d}}x} $

(3)

当p=2时，p-范分布即为正态分布。

2 统计假设检验

假设对于母体X，其分布函数F(x)未知，x₁, x₂, …, x_n是母本X的n个样本值，另假设已知某理论分布函数F₀(x)。统计假设检验是通过样本的观测值x₁, x₂, …, x_n，来判断样本的真实分布函数F(x)与理论分布函数F₀(x)是否一致。原假设H₀表示两者的分布相同，备择假设H₁表示两者的分布不同，则有：

${H_0}:F(x) = {F_0}(x);{H_1}:F(x) \ne {F_0}(x) $

(4)

本文采用的检验准则是卡方优度拟合的皮尔逊χ²检验量。皮尔逊χ²检验的步骤可归纳如下：

1) 首先将样本X按等区间进行划分，得到k个互不相交的区间，其中k可取任意整数。经研究论证发现，若观测值的样本标准差为σ，则当划分区间的宽度接近σ/2时，得到的检验结果是较合理的^[3]，综合考虑本文的样本数据量，所有样本均划分为15个区间。

2) 若分布函数F(x)中含有m个未知参数，则可以利用样本数据来估算未知参数的值，然后将参数估值代入指定的理论分布函数中，本文需要估算两个参数，即样本的均值和方差。

3) 根据划分的区间，样本数据的相应理论频率p_i为：

$ {p_i} = {F_0}({a_i}) - {F_0}({a_{i - 1}}) $

(5)

相应的理论频数为np_i。

4) 根据${\chi ^2} = \sum\limits_{i = 1}^k {\frac{{{{({n_i} - n{p_i})}^2}}}{{n{p_i}}}} $，计算χ²值。若H₀成立，则χ²近似服从χ²(k-m-1)分布。n_i为样本实际频数。

5) 对于特定的显著水平为α，可以通过查表得到χ_1-α²(k-m-1)的值。

6) 比较χ²与χ_1-α²(k-m-1)值的大小，如果皮尔逊值小于临界值，即χ²＜χ_1-α²(k-m-1)时，接受原假设H₀；否则，拒绝原假设H₀。

3 实例分析

原始观测数据来源于某坝区2011-03-22使用TRIMBLE R7接收机采集的静态数据，采样间隔为15 s，共观测时长均为8 h。本文挑选了其中3条基线，分别记为基线1(0.95 km)、基线2(2.15 km)、基线3(5.29 km)，该3条基线向量均已知。考虑到GPS运行周期，为了保证检验数据外界条件的重复可比性，后一天的解算起始历元比前一天提前4 min，从而确保检验数据观测条件(反射物、卫星的几何分布等)的重复性和一致性^[8-10]。同一基线不同历元解算使用相同卫星的观测数据。解算过程主要参数如下：GPS双差载波相位观测值、萨斯塔莫宁(Saastamoinen)模型、广播星历、截止高度角为10°。

采用单历元解算，由于基线向量是已知的，所以整周模糊度便可确定。解算得到单历元基线值后，剔除其中大于3倍中误差的基线值，采用皮尔逊卡方统计值按X、Y、Z 3个方向分量进行正态分布和p-范分布检验。在进行p-范分布检验前，需先采用极大似然估计得到p-范分布参数。此外，本文还给出了正态分布和p-范分布的直方图拟合情况，从图形上直观的判断数据的拟合情况(图 1)。

图 1 3个方向分量的正态及p-范分布拟合直方图 Fig.1 Fitting Histogram for Normal and p-value Distribution

表 1给出了基线向量的统计假设检验结果，将正态分布的皮尔逊值与p-范分布的皮尔逊值(表 1中的“最佳p值”表示在计算p-范皮尔逊值时，最小皮尔逊值所对应的p值)，均与表 2的临界值进行比对，判断是否接受假设检验，表 1中加粗标出的部分为不接受假设检验的部分。直方图直观地表达了各基线向量的正态分布和p-范分布拟合情况。

表 1 基线向量的统计假设检验结果 Tab.1 Results of Statistical Hypothesis Test for Baseline Vector

表 2 不同显著水平下的χ²(15-2-1)值 Tab.2 Value of χ²(15-2-1) at Different Significance Level

根据上述统计假设检验的结果，发现基线1的Z方向不服从正态分布，但服从p-范分布，其余值均既服从正态分布，亦服从p-范分布，但p-范分布的皮尔逊值更小，且从直方图拟合情况，p-范分布的情况优于正态分布。

4 结束语

采用单历元的数据解算模式，在基线向量已知的情况下，整周模糊度便可确定，此时单历元基线仅是载波相位双差观测值小数部分的函数，可以通过基线向量的残差分析载波相位的分布。根据检验结果，对于短基线，绝大多数是服从正态分布的，这可能是由于采用双差解算可将大部分误差消除或减弱，所以得到的单历元短基线是服从正态分布的，仅有一条基线的一个方向的值不服从正态分布，但其服从p-范分布。对于短基线，可以认为在经过基本的误差改正之后，数据是服从正态分布的，并且发现，对于短基线，p-范分布的拟合性更好。

参考文献

[1]	蓝悦明, 贾媛. GPS观测值误差分布的研究[J]. 测绘通报, 2008(4): 12-13.
[2]	Cai J, Grafarend E W, Hu C. The Statistical Property of the GNSS Carrier Phase Observations and Its Effects on the Hypothesis Testing of the Related Estimators[C].Proceedings of ION GNSS, Fort Worth, TX, 2007
[3]	Luo X, Mayer M, Heck B. On the Issues of Probability Distribution of GPS Carrier Phase Observations[C].EGU General Assembly Conference Abstracts, Vienna, Austria, 2009 http://adsabs.harvard.edu/abs/2009EGUGA..11.4815L
[4]	蓝悦明, 韩柯慧, 叶玲洁, 等. GPS RTK的概率密度函数初探[J]. 测绘地理信息, 2013, 38(5): 6-7.
[5]	蓝悦明, 王楠. GPSRTK观测数据的概率密度函数研究[J]. 测绘通报, 2011(2): 6-7.
[6]	潘雄, 赵启龙, 王俊雷, 等. 一元非对称p-范分布的极大似然平差[J]. 测绘学报, 2011, 40(1): 33-36.
[7]	孙海燕, 潘雄. 一元p-范分布的参数估计[J]. 武汉大学学报·信息科学版, 2003, 28(5): 551-554.
[8]	李一鹤, 沈云中. GPS观测值的时间相关性对基线解算影响[J]. 武汉大学学报·信息科学版, 2011, 36(4): 427-430.
[9]	王爱生, 欧吉坤, 阳仁贵, 等. 快速GPS基线解算结果的统计分析[J]. 大地测量与地球动力学, 2007, 27(4): 51-56.
[10]	刘宁, 熊永良, 王德军, 等. 一种新的GPS整周模糊度单历元求解算法[J]. 武汉大学学报·信息科学版, 2013, 38(3): 291-294.


测绘地理信息 2019, Vol. 44 Issue (1): 45-47	0