2. 华为技术有限公司 北京研究所, 北京 100085
设计出大规模多入多出(massive MIMO)网络中一种有效、低复杂度的最小均方误差(MMSE)接收机结构.该接收机基于最陡下降和最小均方算法,能够避免大规模矩阵求逆运算.数学推导结果证明,这2种算法应用于MMSE检测时是收敛的.此外,分析了影响收敛速度的因素.仿真结果表明,应用于Massive MIMO网络中时该接收机收敛速度较快,切实可行.
2. Huawei Technologies Co., Ltd, Beijing 100085, China
An efficient low-complexity minimum mean-squared-error (MMSE) receiver structure for massive multiple-input multiple-output (massive MIMO) networks is proposed. It is based on the steepest descent and least mean-square algorithms which can be devoid of the matrix inverse operation.The two algorithms are proved to be convergent when applied in the MMSE detection.Factors that affect the rate of convergence are also analyzed.Analysis and simulation shows that the proposed receiver architecture enjoys a low complexity property and can provide virtually the same performance as the conventional MMSE receiver.
大规模多入多出(massive MIMO, massive multiple-input multiple-output) 网络是指在基站侧配置成百上千根天线,从而实现更大的复用、分集和阵列增益.传统的最小均方误差(MMSE,minimum mean-squared-error)[1]检测广泛应用于无线通信中,然而它会引入矩阵求逆运算,具有3次幂的计算复杂度.对于massive MIMO网络来说,该检测技术复杂度很高.因此,低复杂度的检测技术成为业内学者研究的热点.Hoydis等[2]通过对角矩阵求逆运算简化了MMSE检测算法,但降低了系统性能.Kim等[3]提出了一种新型的接收机结构,它使得每个用户使用一条射频链路就能近似达到传统接收机中每根天线使用一条射频链路时的性能.
笔者将最陡下降(SD,steepest descent) 和最小均方(LMS,least mean-square) 算法应用于MMSE检测中,提出了massive MIMO网络中一种新型的MMSE接收机结构,避免了大规模矩阵求逆运算.
1 系统模型考虑一个上行大规模多用户MIMO系统,配置有Nr根天线的基站在同一时-频资源块上同时服务Nt个单天线用户.在l时刻,用户k的发送符号为xk(l),E{xk(l)}=0,且E{|xk(l)|2}=1,|·|表示求模运算.那么,基站接收到的Nr维信号矢量可以表示为
$ \boldsymbol{y}\left(l \right)=\boldsymbol{H}{\boldsymbol{D}^{\frac{1}{2}}}x\left(l \right)+\boldsymbol{n}\left(l \right) $ | (1) |
其中:x(l)=(x1(l), x2(l), …, xNt(l))T为发送符号矢量;大尺度衰落矩阵是对角矩阵D=diag (β1, β2, …, βNt),βk=zk/rkθ为慢衰系数,zk服从对数正态分布,θ为衰落因子,rk为第k个用户到基站的距离;HNr×Nt为快衰信道矩阵,其中元素hij表示从第j个用户到基站上第i根天线间的快衰系数(考虑在强散射环境下的非相关平坦瑞利衰落信道,此时HNr×Nt中的元素是独立同分布的复高斯随机变量,均值为0,方差为1);n(l) 为归一化的零均值加性高斯白噪声且E(n(l)n(l)+)=1/ρINr,ρ为每个用户的发射信噪比(SNR,signal-to-noise ratio).(·)T和(·)+分别表示矩阵的转置和共轭转置.
2 MMSE接收机结构 2.1 传统MMSE接收机对于用户k,一般线性接收机的检测结果可以表示为
$ \varepsilon(l)={x_k}(l)-{{\hat x}_k}\left(l \right) $ | (2) |
均方误差(MSE,mean squared error) 为
$ J\left(l \right)={E_{{n_k}\left(l \right), {x_k}(l)}}\{ {\varepsilon ^2}\left(l \right)\} $ | (3) |
则MMSE接收机为
$ {\boldsymbol{w}_k}=\mathop {{\rm{argmin}}}\limits_{{\boldsymbol{w}_k}} J\left(l \right) $ | (4) |
假设不同用户的发送符号和噪声之间两两相互独立,又因为实值目标函数J(l) 的曲率方向由共轭梯度矢量给出[4],可以得到
$ {\nabla _{\boldsymbol{w}_k^*}}\left[{J\left(l \right)} \right]=\boldsymbol{R}{\boldsymbol{w}_k} -{\boldsymbol{h}_k}d_{kk}^{\frac{1}{2}}=0 $ | (5) |
其中dkk=βk,当基站侧能够获取完美的信道状态信息(CSI,channel state information) 时,式(5) 的维纳解为
$ {\boldsymbol{w}_k}={\boldsymbol{R}^{-1}}{\boldsymbol{h}_k}d_{kk}^{\frac{1}{2}} $ | (6) |
其中:R=En(l), x(l){y(l)y(l)+}=
另一方面,用户k的接收信干噪比(SINR, signal-to-interference-plus-noise ratio) 可以表示为
$ {\gamma _k}=\frac{{\rho |\boldsymbol{w}_k^+{\boldsymbol{h}_k}{|^2}}}{{\sum\limits_{i=1, i \ne k}^{{N_t}} {\rho |\boldsymbol{w}_k^+{\boldsymbol{h}_i}{|^2}+{{\left\| {\boldsymbol{w}_k^+} \right\|}^2}} }} $ |
式(5) 的解法大致可以分为两类:直接法和迭代法.直接法有QR分解、Gauss-Jordan或者Householder变换等,可以求得准确解.然而,当矩阵维数变得很大时,直接法会导致数值不稳定.迭代法就会被优先考虑,这里考虑相对简单的SD算法,矢量
$ \boldsymbol{\hat w}_k^{l+1}=\boldsymbol{\hat w}_k^l-{k_s}{\nabla ^l} $ | (7) |
其中:
$ {\nabla ^l}=\boldsymbol{R}\boldsymbol{\hat w}_k^l-{\boldsymbol{h}_k}d_{kk}^{\frac{1}{2}} $ | (8) |
假设整个迭代过程中快衰矩阵HNr×Nt保持不变,式(8) 是关于发送符号x(l) 和噪声n(l) 的数学期望值,通过有限的迭代次数后就可以尽可能准确地检测出每个发送符号.
2.3 LMS算法将式(8) 中的数学期望项用瞬时值代替,得到的梯度估计值称为瞬时梯度,用
在时刻l,用权值矢量
$ {{\hat \nabla }^l}=\nabla \boldsymbol{\hat w}_k^{l*}\left[{\varepsilon _{{\rm{ins}}}^2\left(l \right)} \right] -\boldsymbol{y}\left(l \right)\left({x_k^+\left(l \right)-{\boldsymbol{y}^+}\left(l \right)\boldsymbol{\hat w}_k^l} \right) $ | (9) |
对于一个给定的
$ E\left\{ {{{\hat \nabla }^l}} \right\}=\boldsymbol{R\hat w}_k^l-{\boldsymbol{h}_k}d_{kk}^{\frac{1}{2}} $ | (10) |
比较式(8) 和式(10),容易发现瞬时梯度矢量是真实梯度矢量的无偏估计.用
$ \boldsymbol{\hat w}_k^{l+1}=\boldsymbol{\hat w}_k^l-{k_s}\boldsymbol{y}\left(l \right)\boldsymbol{\varepsilon} _{{\rm{ins}}}^+\left(l \right) $ | (11) |
式(11) 可以直接应用于数字通信系统中.
图 1是基于上述方程设计的MMSE接收机结构框图.其中,yi(m) 为第i根天线上接收到的信号分量,wk, il为权值矢量
同样地,在模拟通信系统中,式(11) 可以写成
$ \frac{{\rm{d}}}{{{\rm{d}}t}}{\boldsymbol{w}_k}\left(t \right)={k_s}\boldsymbol{y}\left(t \right)\varepsilon _{{\rm{ins}}}^+\left(t \right) $ | (12) |
对于SD算法,初始权值矢量记为
$ \boldsymbol{\hat w}_k^{l+1}={[\boldsymbol{I}-{k_s}\boldsymbol{R}]^{l+1}}\boldsymbol{\hat w}_k^0+{k_s}{\sum\limits_{i=0}^l {\left[{\boldsymbol{I}-{k_s}\boldsymbol{R}} \right]} ^i}{\boldsymbol{h}_k}d_{kk}^{\frac{1}{2}} $ | (13) |
注意到R是Hermitian矩阵,存在相似变换矩阵Q,使得R=Q-1EQ.其中E=diag (e1, e2, …, eNr) 为由R的特征值组成的对角矩阵.易知R是正定的,则所有的特征值是正的.进一步化简可得
$ \boldsymbol{\hat w}_k^{l+1}={[\boldsymbol{I}-{k_s}\boldsymbol{R}]^{l+1}}\boldsymbol{\hat w}_k^0+{k_s}{\sum\limits_{i=0}^l {\left[{\boldsymbol{I}-{k_s}\boldsymbol{R}} \right]} ^i}{\boldsymbol{h}_k}d_{kk}^{\frac{1}{2}} $ | (14) |
考虑对角矩阵I-ksE,只要每个对角元素的绝对值小于1,那么
$ \mathop {{\rm{lim}}}\limits_{l \to \infty } {[\boldsymbol{I}-{k_s}\boldsymbol{E}]^{l+1}} \to 0 $ | (15) |
依据级数求和法则,有
$ \mathop {{\rm{lim}}}\limits_{l \to \infty } {\sum\limits_{i=0}^l {[\mathit{\boldsymbol{I}}-{k_s}\mathit{\boldsymbol{E}}]} ^i}=\frac{1}{{{k_s}}}{\mathit{\boldsymbol{E}}^{ -1}} $ | (16) |
从而,式(14) 变为
$ \mathop {{\rm{lim}}}\limits_{l \to \infty } \mathit{\boldsymbol{\hat w}}_k^{l+1}={\mathit{\boldsymbol{Q}}^{-1}}\mathit{\boldsymbol{EQ}}{\mathit{\boldsymbol{h}}_k}d_{kk}^{\frac{1}{2}}={\boldsymbol{R}^{-1}}{\mathit{\boldsymbol{h}}_k}d_{kk}^{\frac{1}{2}} $ | (17) |
下面讨论LMS算法.假定y(l) 和y(l+1) 不相关,则LMS算法中权值矢量的期望值可以写成
$ E\left\{ {\boldsymbol{\hat w}_k^{l+1}} \right\}=E\left\{ {\boldsymbol{\hat w}_k^l} \right\}-{k_s}{\nabla ^l} $ | (18) |
从而可以发现,LMS算法中权值矢量的期望值也是收敛的.
最后,讨论SD算法和LMS算法的收敛条件.式(13) 中
$ \begin{array}{l} \mathit{\boldsymbol{\hat w}}_k^{l+1}={\mathit{\boldsymbol{Q}}^{- 1}}{[\mathit{\boldsymbol{I}}-{k_s}\mathit{\boldsymbol{E}}]^{l+1}}\mathit{\boldsymbol{Q}}\left({\mathit{\boldsymbol{\hat w}}_k^0 -{\mathit{\boldsymbol{R}}^{ -1}}{\mathit{\boldsymbol{h}}_k}d_{kk}^{\frac{1}{2}}} \right)+\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\mathit{\boldsymbol{R}}^{ -1}}{\mathit{\boldsymbol{h}}_k}d_{kk}^{\frac{1}{2}} \end{array} $ | (19) |
由式(19) 可看出,权值矢量收敛到维纳解需要的条件为|1-ksemax| < 1.其中emax为R的最大特征值.
用Hi表示hidiihi+(i=1, 2, …, Nt),在massive MIMO网络中,当Nr→∞时,有[5]
$ {\boldsymbol{h}_i}{d_{ii}}\boldsymbol{h}_i^+={\beta _i}\boldsymbol{I} $ | (20) |
应用Weyl定理[5],可以推出
$ {e_{{\rm{max}}}} \ge \frac{1}{\rho }+{\rm{max}}\{ {\lambda _1}, {\lambda _2}, \ldots, {\lambda _{{N_{\rm{t}}}}}\} $ | (21) |
其中λi为Hi的最大特征值,也就是λi=βi,那么
$ 0 <{k_s} <\frac{1}{{\frac{2}{\rho }+\max \{ {\lambda _1}, {\lambda _2}, \ldots, {\lambda _{{N_{\rm{t}}}}}\} }} $ | (22) |
进一步地,考虑到massive MIMO网络中不同信道之间是近似正交的特点[5],可以得到R的近似表达式为
由上述分析可知,收敛速度本质上由CSI,尤其是慢衰系数决定,并受控制因子ks取值影响.事实上,若要保证较快的收敛速度,ks需满足条件:|1-ksemax| < < 1.也就是说,当0 < ks <
下面推导接收信号相关矩阵R对应最大特征值的概率密度分布.首先,
$ {\frac{{{\rm{det}}(\{ {{\rm{e}}^{-{\varphi _j}/{\beta _{{i_n}}}}}\})}}{{{\rm{det}}\mathop \Sigma \limits^{{N_{\rm{r}}}} }}\prod\limits_{l=1}^{{N_{\rm{t}}}} {\frac{{\varphi _l^{{N_{\rm{r}}}-{N_{\rm{t}}}}}}{{({N_{\rm{r}}}-l)!}}} \prod\limits_{k <1}^{{N_{\rm{t}}}} {\frac{{{\varphi _k} - {\varphi _l}}}{{{\beta _{{i_k}}} - {\beta _{{i_l}}}}}{\beta _{{i_k}}}{\beta _{{i_l}}}} } $ |
则R的最大特征值Ω=max (ψ1, …, ψNt)+
$ \begin{array}{*{20}{c}} {{F_\mathit{\Omega }}\left(u \right)={\rm{Prob}}\left({\mathit{\Omega } \le u} \right)=}\\ {{\rm{Prob}}\left({{\psi _1} \le u-\frac{1}{\rho }, \ldots, {\psi _{{N_{\rm{t}}}}} \le u-\frac{1}{\rho }} \right)=}\\ {\int_0^{u-\frac{1}{\rho }} \cdots \int_0^{u - \frac{1}{\rho }} {{f_{{\psi _1}, \ldots, {\psi _{{N_{\rm{t}}}}}}}}({\varphi _1}, \ldots, {\varphi _{{N_{\rm{t}}}}})d{\varphi _1} \ldots d{\varphi _{{N_{\rm{t}}}}}} \end{array} $ |
在仿真中,8个用户均匀分布在距离基站10~100 m的范围内,路损指数设为2,基站天线个数为10.假定基站侧能够获取完美的CSI.
图 2所示为不同条件下线性值(MSE) 随迭代次数增加的进化曲线.其中,ρ=20 dB,ks=αemax-1.可见,在该仿真条件下,经过10次迭代,SD算法的性能基本接近MMSE最优检测性能,且ks的取值影响算法性能和收敛速度,验证了理论分析.实际应用中,可以选取合适的ks以保证尽可能快的收敛速度.另一方面,在传统的MMSE接收机中,矩阵求逆的计算复杂度为O(Nr3).所以,当Nr值很大时,所提检测算法复杂度明显降低.类似地,以距离基站最近的用户为例,给出了该用户的接收SINR随迭代次数(从1开始) 增加的进化曲线(见图 3).
图 4给出了不同SNR条件下emax的期望值大小随基站天线数目变化的关系.由图 4可见,基站天线数目越多,SNR越小,emax的期望值越大.根据不同ks取值可以确定接收端天线数目对迭代算法收敛速度的影响.
进一步地,图 5示出了接收信号相关矩阵R最大特征值的概率密度分布曲线,分别对应接收SNR为5 dB、10 dB,基站天线个数分别为10、20、30.
在Massive MIMO网络中应用传统的MMSE检测技术时,求解均衡矩阵需要大规模矩阵求逆运算,复杂度很高.笔者基于SD和LMS算法,设计出了一种新型的MMSE接收机结构,只需要利用少量的训练序列,经过较少的迭代运算之后就能近似得到最优的均衡矩阵,避免了矩阵求逆运算.换句话说,是以较小的空间复杂度换取了大量的时间复杂度.另外,由于每条射频链路上可以单独执行该算法,并行处理进一步降低了计算复杂度.同时,用数学证明了所提算法的收敛性,并分析了收敛条件以及影响收敛速度的因素.仿真结果表明,该接收机通过较少的迭代次数就可以达到较好的检测性能.
[1] | Peng Zhangjie, Xu Wei, Zhu Jun, et al. On performance and feedback strategy of secure multiuser communications with MMSE channel estimate[J]. IEEE Transactions on Wireless Communications, 2016, 15(2): 1602–1616. doi: 10.1109/TWC.2015.2493145 |
[2] | Hoydis J, Brink S ten, M Debbah. Massive MIMO in the UL/DL of cellular networks:how many antennas do we need?[J]. IEEE Journal on Selected Areas in Communications, 2013, 31(2): 160–171. doi: 10.1109/JSAC.2013.130205 |
[3] | Kim S W, Yoon D H. Realizing multi-user massive MIMO receiver using single radio frequency chain per user[J]. IEEE Wireless Communications Letters, 2014, 3(3): 293–296. doi: 10.1109/WCL.2014.031114.140032 |
[4] | 张贤达. 矩阵分析与应用[M]. 北京: 清华大学出版社, 2012: 470. |
[5] | Wang Bin, Chang Yongyu, Yang Dacheng. On the SINR in massive MIMO networks with MMSE receivers[J]. IEEE Communications Letters, 2014, 18(11): 1979–1982. doi: 10.1109/LCOMM.2014.2360199 |
[6] | Antonia M Tulino, Sergio Verdu. Random Matrix theory and wireless communications[J]. Communications and Information Theory, 2004, 1(1): 1–18. doi: 10.1561/0100000001 |