2. 流域生态与地理环境监测国家测绘地理信息局重点实验室, 江西南昌 330013;
3. 江西省数字国土重点实验室, 江西南昌 330013
2. Key Laboratory of Watershed Ecology and Geographical Environment Monitoring, NASG, Nanchang 330013, China;
3. Jiangxi Province Key Lab for Digital Land, Nanchang 330013, ChinaAbstract
总体最小二乘(total least squares,TLS)方法是近30多年来发展起来的一种能同时顾及观测值误差和模型系数矩阵误差的数学方法,其理论及应用研究是目前国内外研究的热点问题[1]。文献[2]首次提出总体最小二乘概念,随着变量误差模型(errors-in-variables,EIV)由单变量模型扩展到多元变量模型[3],总体最小二乘也相应扩展到多元总体最小二乘(multivariate TLS,MTLS)[4, 5]。某些模型的系数矩阵会因未知参数写成向量形式含有重复出现的随机元素和大量的零元素;多元总体最小二乘将参数向量和观测向量改写成矩阵形式,避免了这种现象,进而削弱了系数矩阵中行列之间的相关性,而且使得系数矩阵的构造更加简单。
在国外相关研究中,文献[5, 6, 7]认为观测矩阵和系数矩阵中的随机元素是等精度的,给出了基于奇异值分解法和拉格朗日乘数法的多元总体最小二乘算法;文献[8]讨论了基于拉格朗日乘数法的多元加权总体最小二乘算法,将随机元素的方差阵分解成两个矩阵取直积的形式,但是当观测数据含有两个以上的方差分量或是观测数据含有多类观测值时,随机变量的方差协方差阵就很难写成或是不能写成两个矩阵取直积的形式;文献[9]推导了基于奇异值分解法的多元加权总体最小二乘算法,但是这种算法只使用了行尺度权阵,其权阵不具有一般性。以上文献的所有算法都不适用于系数矩阵与观测矩阵中随机元素具有相关性的情况。文献[10]给出了基于拉格朗日乘数法的多元加权总体最小二乘算法,其权阵具有一般性,但没有具体给出系数矩阵含有常数元素的解法以及没有解决算法的精度评定问题,这种算法的解算效率也还需要验证。在国内相关研究中,文献[11]将基于奇异值分解法的多元总体最小二乘算法应用在三维坐标转换中;文献[12]给出的多元总体最小二乘算法受到正交Procrustes算法制约仅适用于观测值误差对称独立的情况,随机元素相关性问题也没有解决;文献[13]只给出了观测值等精度同方差情况下的多元总体最小二乘算法。对于系数矩阵含有常量的情况,文献[10, 14, 15, 16]将系数矩阵拆分成分别包含随机元素和常数元素的系数矩阵;文献[11, 12, 13]采用消元法,分两步计算随机元素对应的未知参数和常数元素对应的未知参数;文献[8, 17]使常数元素的方差和协方差为零,然后进行加权解算;文献[18]首次将EIV模型改写成更具一般性的PEIV(partial EIV)模型,解决了系数矩阵任意位置含有常数元素的平差问题。但以上方法都没有把系数矩阵和观测向量(或矩阵)中的所有元素纳入到一个协因数阵中进行处理。
基于以上问题,本文推导了顾及系数矩阵含有常数元素情况下的多元总体最小二乘的牛顿解法,并讨论了多元总体最小二乘的牛顿法解和拉格朗日乘数法解之间的关系以及给出了多元总体最小二乘的精度评定公式,最后通过模拟数据和实测数据验证了本文算法的可行性和有效性。
1 多元总体最小二乘解法 1.1 多元变量EIV模型式中,
顾及系数矩阵
式中,
此时,协因数阵
本文在文献[10]推导牛顿法思路的基础上,进一步推导了一般情形下多元总体最小二乘问题的牛顿解法。根据总体最小二乘问题平差准则
式中,
式中,矩阵$\sum $=($\overset{\Lambda }{\mathop \Xi }\,$T$\otimes $In-Im$\otimes $In),这与文献[10]的表达一致,符号“^ ”表示最优估值。
由式(6)和式(7),得到改正数最优估值为[10]
进而得到牛顿法求解无约束问题的目标函数
式中
式(9)对vec(
经推导可得式(10)第1部分
由逆矩阵求导原理,得式(10)第2部分
式中
式中,ei=[0…010…0]T为m维列向量,除了第i个元素为1外,其余的元素全部为0;i=[(j-1)/t]+1;[
由式(11)和式(12)得
式中,并令
式中,i,j=1,2,…,tm;${\bar{Q}}$∈
则
依据牛顿法原理得到未知参数的改正数
以及
式中,vec($\overset{\wedge }{\mathop \Xi }\,$)为未知参数最佳估值;vec(Ξ0)为未知参数近似值。
多元总体最小二乘问题的牛顿解法的迭代步骤为(k为迭代次数):
第1步,根据给定的
第2步,由上一步获得的数值,分别计算
由式(15)和式(18),进一步计算
第3步,根据式(20)更新未知参数估值。
第4步,重复第2和3步,直到当
拉格朗日乘数法的多元总体最小二乘解为[10]
式(21)在近似值处展开,写成式(20)的形式式中,拉格朗日乘数法未知参数改正数为
令
又因为
联合式(23)、式(25)和式(26),得
式中,
由式(27)可知,牛顿法未知参数改正数与拉格朗日乘数法未知参数改正数的区别在于R矩阵。拉格朗日乘数法把平差准则的条件极值转化成式(5)的自由极值,对目标函数式(5)中的变量分别求一阶偏导数,并令其为零来求取目标函数的极小值;牛顿法判断极小值不仅需要目标函数对变量的一阶导数为零,还需要二阶导数大于零,即 Hessian 矩阵正定,这使得牛顿法对全局的判断能力更强,寻找极小值的速度也更快[20];vec($\Delta \overset{\wedge }{\mathop{\Xi }}\,$)L是一阶导数意义下的未知参数改正数,vec($\Delta \overset{\wedge }{\mathop{\Xi }}\,$)N是二阶导数意义下的未知参数改正数,目标函数的二阶导数部分组成
根据文献[6, 7],多元总体最小二乘解法的单位权方差估值公式为
式中,m(n-t)为自由度,mn为观测矩阵Y元素的个数,mt为参数矩阵Ξ元素的个数。 当系数矩阵含有常数元素时, $\mathop {{\rm{ }}V}\limits^ \wedge {\mkern 1mu} = \left[{\matrix{ {vec(\mathop {{E_{As}}}\limits^ \wedge {\mkern 1mu} )} \cr {vec(\mathop {{\rm{ }}E}\limits^ \wedge {{\mkern 1mu} _Y})} \cr } } \right]P = {\left[{\matrix{ {{Q_{{A_S}}}_{{A_S}}} & {{Q_{{A_S}}}_Y} \cr {{Q_{Y{A_S}}}} & {{Q_{YY}}} \cr } } \right]^{ - 1}}$;式(28)也与文献[6]的式(3.7)和文献[7]的式(37)相一致,但本式的表达具有一般性。
2.2 协因数阵计算公式多元总体最小二乘法中,数据多以矩阵形式存在。为计算协因数阵,把矩阵写成向量形式,得到
式(29)将向量$\overset{\wedge }{\mathop V}\,$、$\overset{\wedge }{\mathop L}\,$和$\xi $近似写成
$L$ | $\overset{\wedge }{\mathop{V}}\,$ | $\overset{\wedge }{\mathop{L}}\,$ | $\xi $ | |
$L$ | $Q$ | $-{{\overset{\wedge }{\mathop{X}}\,}_{5}}$ | $Q-{{\overset{\wedge }{\mathop{X}}\,}_{5}}$ | $-Q\overset{\wedge }{\mathop{{{\sum }^{T}}}}\,\overset{\wedge }{\mathop{X_{4}^{T}}}\,$ |
$\overset{\wedge }{\mathop{V}}\,$ | $-{{\overset{\wedge }{\mathop{X}}\,}_{5}}$ | ${{\overset{\wedge }{\mathop{X}}\,}_{5}}$ | $0$ | $Q\overset{\wedge }{\mathop{{{\sum }^{T}}}}\,\overset{\wedge }{\mathop{X_{4}^{T}}}\,$ |
$\overset{\wedge }{\mathop{L}}\,$ | $Q-{{\overset{\wedge }{\mathop{X}}\,}_{5}}$ | $0$ | $Q-{{\overset{\wedge }{\mathop{X}}\,}_{5}}$ | $0$ |
$\xi $ | $-{{\overset{\wedge }{\mathop{X}}\,}_{4}}\overset{\wedge }{\mathop{\sum }}\,Q$ | ${{\overset{\wedge }{\mathop{X}}\,}_{4}}\overset{\wedge }{\mathop{\sum }}\,Q$ | $0$ | ${{\overset{\wedge }{\mathop{X}}\,}_{3}}$ |
根据文献[17]中给出的源坐标系的真值数据,本文通过给定的二维仿射变换参数真值计算得到目标坐标系的真值数据。在得到两组坐标系的真值数据后,依据文献[17],本文在模拟数据中源坐标系所加误差的协因数阵为
模拟数据中目标坐标系所加误差的协因数阵为
共模拟500次,分别使用本文提出的牛顿法(N法)和拉格朗日-牛顿法(L-N法),以及Fang(2011)法[10]、Schaffrin(2009)法[8]和加权最小二乘法(WLS)计算二维仿射变换参数,迭代法的终止条件均为10-12,将获得的二维仿射变换参数的平均值,以及二维仿射变换参数平均值与其真值的差值2范数和平均迭代次数列于表 2中。
名称 | N法 | L-N法 | Fang(2011)法 | Schaffrin(2009)法 | WLS法 | 参数真值 | |
仿射参数 | ${{\xi }_{11}}$ | 0.900 742 | 0.900 742 | 0.900 742 | 0.900 742 | 0.935 548 | 0.9 |
${{\xi }_{21}}$ | -0.800 035 | -0.800 035 | -0.800 035 | -0.800 035 | -0.804 088 | -0.8 | |
${{\xi }_{31}}$ | 0.998 770 | 0.998 770 | 0.998 770 | 0.998 770 | 0.954 356 | 1 | |
${{\xi }_{12}}$ | 0.599 708 | 0.599 708 | 0.599 708 | 0.599 708 | 0.629 577 | 0.6 | |
${{\xi }_{22}}$ | 0.700 151 | 0.700 151 | 0.700 151 | 0.700 151 | 0.680 361 | 0.7 | |
${{\xi }_{32}}$ | 4.999 848 | 4.999 848 | 4.999 848 | 4.999 848 | 4.982 601 | 5 | |
差值范数 | $\left\| \Delta \Xi \right\|$ | 0.001 482 | 0.001 482 | 0.001 482 | 0.001 482 | 0.070 192 | - |
平均迭代次数 | i | 3.02 | 3.01 | 5.372 | 5.974 | - | - |
参数为矩阵时,文献[10]并没有给出在系数矩阵含有常数列时的具体公式算法。依据其提出的在参数为向量时系数矩阵含有常数列的加权总体最小二乘算法,本文编程实现了这种将系数矩阵分成两部分的多元加权总体最小二乘算法,并简称为Fang(2011)法。拉格朗日-牛顿法(L-N法)是指把Fang(2011)法(拉格朗日乘数法)获得的第一次多元加权总体最小二乘参数解作为本文牛顿法迭代的初始值;在选取迭代初始值时,如果使用多元最小二乘参数解作为初始值计算式(20),则为牛顿法(N法),如果使用多元加权总体最小二乘参数解作为初始值计算式(20),则为拉格朗日-牛顿法(L-N法);在能够获得多元加权总体最小二乘参数解的情况下,建议使用收敛速度更快的L-N法。
由表 2可知,N法、L-N法、Fang(2011)法和Schaffrin(2009)法这4种多元加权总体最小二乘法获得的参数结果一致,并且参数估值的差值范数要小于WLS法。从平均迭代次数来看,Schaffrin(2009)法的迭代次数最多,Fang(2011)法次之,L-N法的迭代次数要稍小于N法,为最小。本文提出的多元总体最小二乘牛顿解法的迭代效率要高于Fang(2011)法和Schaffrin(2009)法这两种解法。由文献[20]可知,因为牛顿法是一种用
以上算例没有考虑系数矩阵元素与观测矩阵元素的相关性。为了验证本文的牛顿法能够解决更一般的多元总体最小二乘问题,在文献[19]的基础上,使用Matlab 7.11.0 软件,利用函数randn(100,13*4)T×randn(100,13*4)生成协因数阵
由于模拟数据使得两套坐标系具有了相关性,此时Schaffrin(2009)法不再适用,选用本文提出的牛顿法和拉格朗日-牛顿法,以及Fang(2011)法模拟计算10 000次,计算时取
计算结果表明,牛顿法的平均迭代次数为6.972 6,拉格朗日-牛顿法的平均迭代次数为6.828 7,Fang(2011)法的平均迭代次数为12.188 2。牛顿法和拉格朗日-牛顿法使用的协因数阵
选取文献[19]中二维坐标转换数据作为计算数据,共有5组在源坐标系和目标坐标系下的公共点。 源坐标系和目标坐标系权阵为[19]
使用本文提出的牛顿法和拉格朗日-牛顿法,以及Fang(2011)法计算二维仿射变换参数,迭代法的终止条件均为10-12。3种方法的未知参数估值列于表 3中。利用表 3中的未知参数估值结果和表 1中的公式计算未知参数估值协因数阵,并将其列于表 4中。
参数 | ${{\xi }_{11}}$ | ${{\xi }_{21}}$ | ${{\xi }_{31}}$ | ${{\xi }_{12}}$ | ${{\xi }_{22}}$ | ${{\xi }_{32}}$ |
估值 | 0.999 827 207 612 | -0.000 007 228 476 | 29.761 507 890 910 | -0.000 175 251 547 | 0.999 965 497 834 | 19.683 772 954 162 |
参数$\overset{\wedge }{\mathop{\Xi }}\,$的协因数阵 | |||||
0.000 000 083 211 | -0.000 000 002 016 | 0.000 012 130 226 | -0.000 000 000 008 | 0.000 000 000 001 | -0.000 000 002 403 |
-0.000 000 002 016 | 0.000 000 062 539 | -0.000 000 155 129 | 0.000 000 000 001 | -0.000 000 000 005 | -0.000 000 000 024 |
0.000 012 130 226 | -0.000 000 155 129 | 0.036 683 888 367 | -0.000 000 002 010 | -0.000 000 000 076 | -0.000 003 465 192 |
-0.000 000 000 008 | 0.000 000 000 001 | -0.000 000 002 010 | 0.000 000 086 273 | -0.000 000 005 576 | 0.000 025 548 944 |
0.000 000 000 001 | -0.000 000 000 005 | -0.000 000 000 076 | -0.000 000 005 576 | 0.000 000 102 710 | -0.000 003 426 705 |
-0.000 000 002 403 | -0.000 000 000 024 | -0.000 003 465 192 | 0.000 025 548 944 | -0.000 003 426 705 | 0.050 234 807 436 |
表 3为3种方法的共同结果,其精度一致,且$\overset{\wedge }{\mathop{\sigma _{0}^{2}}}\,$为0.147 294 126 638。结果表明,牛顿法迭代了2次,拉格朗日-牛顿法迭代了1次,Fang(2011)法迭代了3次,这也说明了本文算法的合理性。
4 结 论本文推导了多元总体最小二乘问题的牛顿解法,并比较了基于牛顿法的多元加权总体最小二乘解和基于拉格朗日乘数法的多元加权总体最小二乘解之间的关系,给出了多元总体最小二乘算法精度评定的16种协因数阵的近似计算公式。通过算例验证,并与现有的解法作了比较,得到以下几点结论:
(1) 牛顿法有着更少的迭代次数,更高的解算效率。
(2) 在观测矩阵和系数矩阵元素对应的协因数阵中,本文取常数元素的协因数为0。这虽然导致协因数阵
[1] | 王乐洋.基于总体最小二乘的大地测量反演理论及应用研究[J]. 测绘学报, 2012, 41(4):629. WANG Leyang. Research on Theory and Application of Total Least Squares in Geodetic Inversion[J]. Acta Geodaetica et Cartographica Sinica, 2012, 41(4):629. |
[2] | GOLUB G H, VAN LOAN C F. An Analysis of the Total Least Squares Problem[J]. SIAM Journal on Numerical Analysis, 1980, 17(6):883-893. |
[3] | SPRENT P. Models in Regression and Related Topics[M]. London:Methuen & Co Ltd, 1969. |
[4] | 王乐洋, 许才军. 总体最小二乘研究进展[J]. 武汉大学学报(信息科学版), 2013, 38(7):850-856, 878. WANG Leyang, XU Caijun. Progress in Total Least Squares[J]. Geomatics and Information Science of Wuhan University, 2013, 38(7):850-856, 878. |
[5] | VAN HUFFEL S, VANDEWALLE J. The Total Least Squares Problem:Computational Aspects and Analysis[D]. Philadelphia, Pennsylvania:SIAM, 1991. |
[6] | SCHAFFRIN B, FELUS Y A. Multivariate Total Least-squares Adjustment for Empirical Affine Transformations[C]//VI Hotine-Marussi Symposium on Theoretical and Computational Geodesy:Challenge and Role of Modern Geodesy. Berlin:Springer, 2008, 132:238-242. |
[7] | SCHAFFRIN B, FELUS Y A. On the Multivariate Total Least-squares Approach to Empirical Coordinate Transformations. Three Algorithms[J]. Journal of Geodesy, 2008, 82(6):373-383. |
[8] | SCHAFFRIN B, WIESER A. Empirical Affine Reference Frame Transformations by Weighted Multivariate TLS Adjustment[C]//Geodetic Reference Frames. Berlin:Springer, 2009, 134:213-218. |
[9] | FELUS Y A, BURTCH R C. On Symmetrical Three-dimensional Datum Conversion[J]. GPS Solutions, 2009, 13(1):65-74. |
[10] | FANG X. Weighted Total Least Squares Solutions for Applications in Geodesy[D]. Hanover:Leibniz University of Hanover, 2011. |
[11] | 孙大双, 张友阳, 黄令勇, 等. 多元总体最小二乘在大旋转角三维坐标转换中的应用[J]. 测绘科学技术学报, 2014, 31(5):481-485. SUN Dashuang, ZHANG Youyang, HUANG Lingyong, et al. Application of Multivariate Total Least Squares Method in Three-dimension Coordinate Conversion with Large Rotation Angle[J]. Journal of Geomatics Science and Technology, 2014, 31(5):481-485. |
[12] | 黄令勇, 吕志平, 任雅奇, 等. 多元总体最小二乘在三维坐标转换中的应用[J]. 武汉大学学报(信息科学版), 2014, 39(7):793-798. HUANG Lingyong, LV Zhiping, REN Yaqi, et al. Application of Multivariate Total Least Square in Three-dimensional Coordinate Transformation[J]. Geomatics and Information Science of Wuhan University, 2014, 39(7):793-798. |
[13] | 钱承军, 陈义. 多变量总体最小二乘在点云拼接中的应用[J]. 测绘与空间地理信息, 2015, 38(1):67-69, 76. QIAN Chengjun, CHEN Yi. Application of Multivariable Total Least Squares in the Registration of Point Clouds[J]. Geomatics & Spatial Information Technology, 2015, 38(1):67-69, 76. |
[14] | 王乐洋, 许才军, 鲁铁定. 边长变化反演应变参数的总体最小二乘方法[J]. 武汉大学学报(信息科学版), 2010, 35(2):181-184. WANG Leyang, XU Caijun, LU Tieding. Inversion of Strain Parameter Using Distance Changes Based on Total Least Squares[J]. Geomatics and Information Science of Wuhan University, 2010, 35(2):181-184. |
[15] | XU Caijun, WANG Leyang, WEN Yangmao, et al. Strain Rates in the Sichuan-Yunnan Region Based upon the Total Least Squares Heterogeneous Strain Model from GPS Data[J]. Terrestrial Atmospheric and Oceanic Sciences, 2011, 22(2):133-147. |
[16] | 王乐洋, 于冬冬, 吕开云. 复数域总体最小二乘平差[J]. 测绘学报, 2015, 44(8):866-876. DOI:10.11947/j.AGCS.2015.20130701. WANG Leyang, YU Dongdong, LÜ Kaiyun. Complex Total Least Squares Adjustment[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(8):866-876. DOI:10.11947/j.AGCS.2015.20130701. |
[17] | MAHBOUB V. On Weighted Total Least-squares for Geodetic Transformations[J]. Journal of Geodesy, 2012, 86(5):359-367. |
[18] | XU Peiliang,LIU Jingnan,SHI Chuang.Total Least Squares Adjustment in Partial Errors-in-variables Models:Algorithm and Statistical Analysis[J]. Journal of Geodesy, 2012, 86(8):661-675. |
[19] | JAZAERI S, AMIRI-SIMKOOEI A R, SHARIFI M A. Iterative Algorithm for Weighted Total Least Squares Adjustment[J]. Survey Review, 2014, 46(334):19-27. |
[20] | BOYD S, VANDENBERGHE L. Convex Optimization[M]. Cambridge:Cambridge University Press, 2004. |
[21] | 王乐洋, 鲁铁定. 总体最小二乘平差法的误差传播定律[J]. 大地测量与地球动力学, 2014, 34(2):55-59. WANG Leyang, LU Tieding. Propagation Law of Errors in Total Least Squares Adjustment[J]. Journal of Geodesy and Geodynamics, 2014, 34(2):55-59. |
[22] | ZHOU Yongjun, KOU Xinjian, ZHU Jianjun, et al. A Newton Algorithm for Weighted Total Least-squares Solution to a Specific Errors-in-variables Model with Correlated Measurements[J]. Studia Geophysica et Geodaetica, 2014, 58(3):349-375. |
[23] | 王乐洋, 许才军, 鲁铁定. 病态加权总体最小二乘平差的岭估计解法[J]. 武汉大学学报(信息科学版), 2010, 35(11):1346-1350. WANG Leyang, XU Caijun, LU Tieding. Ridge Estimation Method in Ill-posed Weighted Total Least Squares Adjustment[J]. Geomatics and Information Science of Wuhan University, 2010, 35(11):1346-1350. |