基于BP神经网络的CSI无源目标分类方法
蒋芳, 张南飞, 胡艳军, 王翊    
安徽大学 计算智能与信号处理教育部重点实验室, 合肥 230601
摘要

针对无源目标分类系统中精度和费用之间不平衡、采用手工提取特征的方法进行特征提取工作量较大的问题,提出了一种基于误差逆传播(BP)神经网络的信道状态信息(CSI)无源目标分类方法.通过提取WiFi信号的CSI作基信号,并结合具有自主学习数据特征能力的神经网络方法,设计了BP神经网络的训练模型,减少了手工提取特征带来的开销.实验结果表明,以身高分类为例,所提方法能够区分4个不同身高段,且平均分类准确度可以达到90%以上.

关键词: 信道状态信息     误差逆传播神经网络     无源目标分类    
中图分类号:TN929.53 文献标志码:A 文章编号:1007-5321(2020)01-0040-06 DOI:10.13190/j.jbupt.2019-035
BP Neural Network Based CSI Device-Free Target Classification Method
JIANG Fang, ZHANG Nan-fei, HU Yan-jun, WANG Yi    
Key Laboratory of Intelligent Computing and Signal Processing(Anhui University), Ministry of Education, Hefei 230601, China
Abstract

Aim at the imbalance between accuracy and expense, the heavy workload of manually extracting features in current device-free target classification systems, a channel state information (CSI) device-free target classification method based on error back propagation (BP) neural network is proposed. By extracting the CSI of the WiFi signal as the base signal and combining the neural network method with the characteristic of autonomous learning data features, the BP neural network training model is designed, which reduces the overhead caused by the manual extraction feature. Taking the height classification as an example, an experiment is carried out, and it is shown that the proposed method can distinguish four different height segments, and the average classification accuracy can reach more than 90%.

Key words: channel state information     error back propagation neural network     device-free target classification    

随着无线网络技术的发展,基于无线局域网(WLAN, wireless local area network)的无源应用受到了广泛关注.无线信号在目标检测[1]、追踪[2]、定位[3]、活动识别[4]、目标分类[5-7]等方面的应用取得了一系列进展.在无源目标分类应用中,AI-Husseiny等[5]提出了一种基于射频(RF, radio frequency)的交通检测和识别系统,该系统基于RF信号强度均值和方差的数学统计实现目标检测并区分人和车,能实现89%的汽车检测. Zhong等[6]通过概率密度函数分析接收到的RF信号的8个典型统计特性,选择其中2个作为特征以区分人类和动物目标,这样手工选取信号特征的方法会带来很大的工作开销.以上分类的目标在外形、材料、速度等方面区别明显. Markus等[7]提出一种用于人类身高识别的WiDisc系统,该系统用接收信号强度指示(RSSI, received signal strength indicator)信号作系统的输入,在离线阶段形成人体不同高度的指纹库,在线上阶段得到待测人体的高度.在WiDisc系统的实验环境中,能对高、中、矮3种类别的身高进行分类识别,但分类准确度只有67%,而矮的类别只有43%.

杨峥[8]和Elnahrawy等[9]分析了基于RSSI方法的物理限制,这些限制只能通过使用更详细和全面的室内环境模型或引入额外的设备来解决,由此导致系统的费用和复杂性都大大增加.综上,无源目标分类系统存在分类精度和费用不平衡以及手工提取特征开销较大这2个问题.为解决这些问题,笔者提出一种结合误差逆传播(BP, error back propagation)神经网络和信道状态信息(CSI,channel state information)的无源目标分类方法,采用CSI替代RSSI作基信号,采用自主学习数据特征的神经网络方法代替手工特征提取,设计神经网络训练模型,同时以身高分类为例进行了实验验证.

1 系统模型

无源目标分类系统模型如图 1所示.数据预处理一般包含去噪处理;特征提取指提取易于进行目标区分的数据特征;将这些特征信号结合合适的分类算法;统计得出分类结果.

图 1 无源目标分类系统模型

在数据收集部分采用CSI信号代替传统的RSSI信号作基信号,在IEEE 802.11n标准[10]中,支持CSI的反馈机制,通过修改无线网卡驱动[11]可以获取正交频分复用(OFDM, orthogonal frequency division multiplexing)子载波中30个子载波的CSI. CSI反映出环境的衰减因子,包括散射、环境衰减、功率衰减等信道信息[12],所以可以通过CSI对通信链路信道特性进行分析,最终来估计信道.

在OFDM系统中,经多径信道之后的接收信号可以表示为

$ \mathit{\boldsymbol{Y}} = \mathit{\boldsymbol{HX}} + \mathit{\boldsymbol{N}} $ (1)

其中:YX分别为接收端和发射端的信号向量,HN分别为信道矩阵和加性高斯白噪声.

各个子载波的CSI可以估计为

$ \mathit{\boldsymbol{\hat H}} = \frac{\mathit{\boldsymbol{Y}}}{\mathit{\boldsymbol{X}}} $ (2)

根据接收端底层硬件设备驱动的不同,CSI可以被分为不同的子载波组,因此CSI矩阵H可以表示为

$ \mathit{\boldsymbol{H}} = [{\mathit{\boldsymbol{H}}_1},{\mathit{\boldsymbol{H}}_2}, \cdots ,{\mathit{\boldsymbol{H}}_i}, \cdots ,{\mathit{\boldsymbol{H}}_P}] $ (3)

其中:P为根据驱动被分成的子载波数,P为30,Hi为单个子载波上的CSI,表示为

$ {H_i} = \left\| {{\mathit{\boldsymbol{H}}_i}} \right\|{{\rm{e}}^{{\rm{jsin}}(\angle {H_i})}} $ (4)

其中:‖Hi‖为第i个子载波的幅度,∠Hi为第i个子载波的相位.

CSI中包含着每条传输路径上的信道衰减信息,而RSSI只是多径信号的叠加.所以,相比RSSI,CSI可以为样本提供更加细粒度的信道信息.

在特征提取和分类算法部分,利用神经网络将两者结合实现端到端的输出,当数据特征不明显时,神经网络能够学习到更好的特征,相较于传统的手工提取特征的方法,减少了训练开销.

2 分类方法

基于BP神经网络的CSI无源目标分类方法的思路是:将采集的CSI信号处理成所需形式后送入神经网络中训练,神经网络在训练的过程中会不断学习数据特征,并对其进行分类.此时的神经网络相当于一个分类器,对于每一个送入其中的数据都会得到一个分类结果,对分类结果进行统计就可以得知正确分类的准确率.

为了提高数据处理效率,采用BP学习算法训练神经网络.该算法基于梯度下降策略,以目标的负梯度方向对参数调整,使得训练集上的累积误差不断减小[13]. BP神经网络包括输入层、隐含层和输出层,输入层和输出层神经单元数目根据输入数据维度和分类要求唯一确定.对于隐含层神经元数目lx的确定,可根据式(5),也可根据经验确定.

$ {l_x} = \sqrt {f + K} + a $ (5)

其中:f为输入层神经元数目,K为输出层神经元数目,a为1~10之间的常数.各个层之间的激活函数为sigmoid函数,其表达式为

$ f(x) = \frac{1}{{1 + {{\rm{e}}^{ - x}}}} $ (6)

确定了神经网络的结构以后,对神经网络进行训练,训练步骤具体如下:

1) 随机初始化权重θ为一个(0, 1)范围的向量,维度由前后神经单元的个数决定;

2) 实现前向传播,即对每个输入样本x(i)逐层计算激活值a(l).

隐含层激活值:

$ {a^{(2)}} = f({({\mathit{\boldsymbol{\theta }}^{(1)}})^{\rm{T}}}{x^{(i)}}) $ (7)

输出层激活值:

$ {a^{(3)}} = f({({\mathit{\boldsymbol{\theta }}^{(2)}})^{\rm{T}}}{a^{(2)}}) = {h_\mathit{\boldsymbol{\theta }}}({x^{(i)}}) $ (8)

其中:θ为向量化之后的表达形式,f(·)表示的函数为sigmoid函数.

3) 编写代码通过式(9)计算代价函数J(θ),

$ \begin{array}{*{20}{c}} {J(\mathit{\boldsymbol{\theta }}) = - \frac{1}{m}{{\left[ {\sum\limits_{i = 1}^m {\sum\limits_{k = 1}^K {y_k^{(i)}} } {\rm{log}}{{({h_\mathit{\boldsymbol{\theta }}}({x^{(i)}}))}_k}} \right]}^2} - }\\ {\frac{1}{m}\left[ {\sum\limits_{i = 1}^m {\sum\limits_{k = 1}^K {(1 - y_k^{(i)})} } {\rm{log}}(1 - {{({h_\mathit{\boldsymbol{\theta }}}({x^{(i)}}))}_k})} \right] + }\\ {\frac{\lambda }{{2m}}\left[ {\sum\limits_{l = 1}^{L - 1} {\sum\limits_{i = 1}^{{S_l}} {\sum\limits_{j = 1}^{{S_{l + 1}}} {{{(\theta _{ji}^{(l)})}^2}} } } } \right]} \end{array} $ (9)

其中:m为训练样本的个数,L为神经网络总的层数,Sl为第l层的单元数,λ为正则化参数.

4) 通过BP算法计算J(θ)的偏导数$\frac{{\partial J(\mathit{\boldsymbol{\theta }})}}{{\partial {\theta _{ij}}^l}}$,以便后面利用梯度下降或其他高级优化算法来最小化J(θ),BP算法流程见算法1.

5) 使用梯度检测比较Dijl和用数值估计计算的偏导数M之间的误差.

$ |D_{ij}^l - M| < \varepsilon $ (10)

其中ε为误差限.若满足式(10),则停用梯度检测.

6) 使用fmincg函数找出使代价函数最小化的θ.

$ \mathit{\boldsymbol{\theta }} = \mathop {{\rm{arg}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{min}}}\limits_\theta J(\mathit{\boldsymbol{\theta }}) $ (11)

至此,整个神经网络的训练结束,神经网络模型也已经确定.接下来就可以将验证数据送入神经网络模型,统计输出的分类结果.

算法1  BP算法

输入:{(x(1), y(1)), (x(2), y(2)), …, (x(m), y(m))}.

输出:Dij.

1  first set Δijl = 0(所有层,所有神经单元,初始误差均为0)

2  for i = 1:m

3   Set a(1) = x(i)

4   逐层计算激活值a(l)

δ(l) = a(l)y(i)计算各个层的误差(输入层除外),并对误差进行不断更新;

${\Delta _{ij}}^l: = {\Delta _{ij}}^l + {a_j}^{(l)}{\delta _i}^{(l + 1)}$

5  end for;

6  ${D_{ij}}^l: = \frac{1}{m}{\Delta _{ij}}^l + \mathit{\boldsymbol{\lambda }}{\mathit{\boldsymbol{\theta }}_{ij}}^l$

3 实验和结果分析 3.1 实验系统设计

为了验证基于BP神经网络的CSI无源目标分类方法,设计了一个人体高度分类系统,系统框图如图 2所示.分类系统共有4个组成部分:数据收集、数据预处理、神经网络训练和分类结果.在数据预处理阶段,将收集到的CSI数据先进行幅值抽取,再进行小波变换去除部分噪声,具体实现过程见3.3节.在神经网络训练阶段,根据不同的分类要求建立不同的神经网络模型.

图 2 无源身高分类系统框图
3.2 实验数据收集

图 3所示的室内环境下进行了实验,实验平台选用路由器作发射端,距地面80 cm;一台配有Inter 5300网卡和开源工具CSI-Tools的笔记本电脑作接收端,距地面50 cm.使用无加密的方式连接到指定的路由器,并使用ping -i 0.001命令每秒约产生1 000个数据包.实验分4个身高段,从每个身高段分别选取了5、8、8、5个测试者共26人进行实验.参与的实验者具体信息如表 1所示.

图 3 实验室内环境的布局

表 1 26个实验者的身高、体重、性别信息

每个测试者均分别站在如图 3所示的4个位置上(即图 3中的六角形所在的位置),并在每个位置停留10 s,收集不同位置不同身高的实验数据.

3.3 实验数据预处理 3.3.1 幅值抽取

对身高为164 cm的实验者在位置2不同时间点采集到的50个CSI数据包原始相位进行分析发现,不同数据包的每个子载波的相位在[-π, +π]之间杂乱无章的分布,不能直接用来当作特征信息,所以选择只保留幅度信息,舍弃相位信息.从每个实验者在每个位置采集到的数据包中选取中间状态稳定的4 000个作为样本,在此之后把这4 000个点中的60%用作训练集,20%作测试集,剩下20%作验证集.

3.3.2 小波变换

对幅值抽取之后的身高164 cm的实验者在位置2的数据,通过绘图观察其单个子载波的CSI随时间变化的情况,结果如图 4所示.由图 4知,原始数据受到噪声的影响.选择用小波变换对幅值抽取之后的数据进行去噪处理,利用db5(Daubechies小波)作为小波函数进行多层分解,通过分解得到近似系数和细节系数,利用近似和细节系数进行重构.假设原始的CSI序列为H(t), H(t)小波分解的表达式为

$ H(t) = {A_n} + {D_n} + {D_{n - 1}} + \cdots + {D_1} $ (12)
图 4 小波变换前单个子载波CSI的变化情况

其中:A为低频近似系数,D为高频细节成分,n为分解层次,在本文中n取3.去噪后的信号如图 5所示.可以看出,小波变换去除了信号噪声时保载波变化的局部特征.

图 5 小波变换后单个子载波的CSI变化情况
3.4 实验结果分析 3.4.1 身高分类结果

将收集的数据预处理之后,分别将不同身高段的实验者的数据打上1~4的标签,送入神经网络训练,经反复训练得到网络结构为30—90—4的神经网络模型.经实验测试,得出如表 2所示的不同身高段的混淆矩阵.表中阴影部分标识的数据为各身高段的分类准确度,对所有身高段的分类准确度取平均,可以计算出平均的分类准确度达到92%. 180~189 cm身高段受环境影响较大,接收数据具有大的波动性.

表 2 不同身高段的混淆矩阵
3.4.2 定位准确度结果

定位准确度的计算,是将预处理后同一身高段实验者在4个位置的数据标记为1~4,送入神经网络中训练得到网络结构为30—60—4的神经网络模型.由此,模型统计出正确的位置分类数与测试总次数的比值. 表 3给出了4个身高段的定位准确度.结果显示,BP神经网络对位置的识别能达到94%以上.

表 3 4个身高段对应的定位准确度
3.4.3 不同基信号分类准确度对比

为了比较RSSI、CSI原始含噪信号、CSI去噪信号3种基信号对于高度分类性能的影响,分别将这3类数据用作神经网络的数据集,结果如图 6所示.对于RSSI信号,反复训练10次,神经网络的平均分类准确度为41.24%.对于CSI含噪声的信号,神经网络的平均分类准确度为83.90%.同理,对于CSI去噪后的信号,平均分类准确度为90.30%.由结果可知,采用CSI作为基信号优于RSSI.

图 6 不同基信号分类准确度结果
3.4.4 与WiDisc系统方法对比

为了与WiDisc系统所采用的方法进行对比,与其做法类似,仅选取高、中、矮3类的代表进行实验.测试者的具体信息如下:

矮:儿童,132 cm,23 kg.

中等:女性,164 cm,45 kg.

高:男子,190 cm,75 kg.

收集3者在图 3视距方向4个位置的CSI数据和RSSI数据,用本文方法与WiDisc系统的方法统计出的分类准确度如表 4所示.

表 4 与WiDisc系统方法的分类结果对比 

表 4可以看出,在图 3所示相同的室内环境下进行实验,本文方法在中等和矮两类的分类准确度都高于WiDisc系统的方法,高的类别两个系统都能达到100%.总体而言,本文方法相较目前已有的身高分类方法提高了分类准确度.

3.4.5 与其他分类方法对比

为进一步评估性能,也采用了其他方法进行对比实验,即Zhong等[6]所采用的支持向量(SVM,support vector machine)和K近邻(KNN,K-nearest neighbor)与本文方法进行身高段分类准确度对比.对比结果如图 7所示.从图 7中可以看出,采用本文方法的分类准确度要高于其他2种方法.

图 7 不同分类方法的准确度对比
4 结束语

笔者提出了一种基于CSI和BP神经网络的无源目标分类方法,以身高分类为例验证了方法性能.实验结果表明,该方法以平均90%以上的准确度区分了4个身高段.相较以往的研究, 笔者在基信号选择上使用CSI代替RSSI,提高了分类精度的同时降低硬件成本,而且将人工神经网络应用到无源目标分类的研究中,减少了手工提取特征带来的开销.

所提方法还有改进空间.首先,为了减少计算量,只提取了传输链路的幅度信息,舍弃了相位信息,相位中也包含可用于分类的特征.其次,只利用了一对收发天线间的单个链路数据,只有频率分集,没有利用到多天线的空间分集.另外,实验仅采集了视距方向上4个位置的数据,后续将会探讨在非视距位置上是否依然以高准确度识别.

参考文献
[1]
Zhu Hai, Xiao Fu, Sun Lijuan, et al. R-TTWD:robust device free through-the-wall detection of moving human with WiFi[J]. IEEE Journal on Selected Areas in Communications, 2017, 35(5): 1090-1103. DOI:10.1109/JSAC.2017.2679578
[2]
Sanaz K, Stefano S, Vittorio R. Tracking of frequency selectivity for device-free detection of multiple targets[C]//2017 IEEE International Conference on Communications Workshops (ICC Workshops). New York: IEEE Press, 2017: 1253-1259.
[3]
Wang Xuyu, Gao Lingjun, Mao Shiwen, et al. CSI-based fingerprinting for indoor localization:a deep learning approach[J]. IEEE Transactions on Vehicular Technology, 2017, 66(1): 763-776.
[4]
肖玲, 潘浩. 基于WiFi信号的人体动作识别系统[J]. 北京邮电大学学报, 2018, 41(3): 119-124.
Xiao Lin, Pan Hao. Human activity recognition system based on WiFi signal[J]. Journal of Beijing University of Posts and Telecommunications, 2018, 41(3): 119-124.
[5]
Al-Husseiny A, Youssef M. RF-based traffic detection and identification[C]//2012 IEEE Vehicular Technology Conference (VTC Fall). New York: IEEE Press, 2012: 1-5.
[6]
Zhong Yi, Dutkiewicz E, Yang Yang, et al. Internet of mission-critical things:human and animal classification-adevice-free sensing approach[J]. IEEE Internet of Things Journal, 2018, 5(5): 3369-3377. DOI:10.1109/JIOT.2017.2760322
[7]
Markus S, Lukas K, Matthias H, et al. Device-free radio-based low overhead identification of subject classes[C]//The 2nd Workshop on Physical Analytics. New York: ACM, 2015: 1-6.
[8]
Yang Zheng, Zhou Zimu, Liu Yyunhao. From RSSI to CSI:indoor localization via channel response[J]. ACM Computing Surveys, 2013, 46(2): 25.
[9]
Elnahrawy E, Li Xiaoyan, Martin R P. The limits of localization using signal strength: a comparative study[C]//2004 First Annual IEEE Communications Society Conference on Sensor and Ad Hoc Communications and Networks(IEEE SECON). New York: IEEE Press, 2004: 406-414.
[10]
Kraemer B, Rosdahl J W, Stephens A, et al. IEEE standard for information technology-local and metropolitan area networks-specific requirements-part 11: wireless LAN medium access control(MAC) and physical layer(PHY) specifications amendment 5: Enhancements for higher throughput: 802.11n-2009[S]. New York: IEEE Working Group, 2009: 303-308.
[11]
Halperin D, Hu Wenjun, Sheth A, et al. Tool release:gathering 802. 11n traces with channel state information[J]. ACM SIGCOMM Computer Communication Review, 2011, 41(1): 53. DOI:10.1145/1925861.1925870
[12]
Shi Shuy, Sigg S, Ji Yusheng. Probabilistic fingerprinting based passive device-free localization from channel state information[C]//IEEE 83rd Vehicular Technology Conference(VTC Spring). New York: IEEE Press, 2016: 1-5.
[13]
周志华. 机器学习[M]. 北京: 清华大学出版社, 2016: 101-103.