在生物神经系统中,存在着一种侧抑制现象,一个神经细胞的兴奋会对周围其他神经细胞产生抑制作用,这种抑制作用会使神经细胞之间出现竞争,从而造成神经细胞的兴奋或抑制。1982年芬兰Helsink大学的T.Kohonen教授[1]基于这种现象提出一种自组织特征图(self-organizing feature map, SOM),并引入赢者通吃(winner take all, WTA)理论,该仿生优化方法通过学习能够自主绘制出拓扑地图,但需通过大量的尝试确定其初始网络结构,无法保证系统的实时性能,研究者们基于该模型的缺陷进行了改进。1993年Martinetz等[2]提出一种神经气(neural gas,NG)模型,提高了网络自组织学习过程的效率。2004年尹峻松等[3]为克服SOM孤立学习与噪声敏感等缺陷, 结合一氧化氮(NO)扩散机理, 在SOM网中引入时间增强机制,提出了一种新型扩散的自组织模型(diffusing self-organizing maps,DSOM)。2009年王春东等[4]将SOM理论运用于信息学,利用灰色关联系数(grey relational coefficient,GRC)调整权重,检测拒绝服务攻击(denial of service, DOS)。2011年于乃功等[5]将可增长特征映射图(growing self-organizing map, GSOM)融入双目立体视觉,通过自组织拓扑结构避免了传统SOM网需大量实验才能确定的初始网络结构。本文以GSOM神经网络模型为基础引入了方向参数和特征参数构成的动态增长自组织特征图(dynamic growing self-organizing feature map,DGSOM),并应用于澳大利亚Milford等[6-9]提出的RatSLAM模型中。
1 RatSLAM模型由于传感器和环境的不确定性,移动机器人利用概率解决同步定位与地图构建问题。其中,卡尔曼滤波、极大期望估计和粒子滤波3种概率算法是当前移动机器人SLAM的核心技术,其通过专用网格或拓扑地图的方式进行环境描述,这些研究成果在仿真和限定条件下能够取得良好效果,但难以兼顾实际环境,且存在计算量大、搜索时间长、易于陷入局部最优解等问题。
鼠类是生物医学研究最多的动物之一[10-11],人们对于其导航、环境探索和真实神经机制的模拟理解得很好,因此鼠类成为科学家们创造生物系统人工模型的原型。
经过不断的研究探索,Milford等提出一种基于鼠类导航细胞的扩展海马模型RatSLAM,该模型包括位姿细胞、视觉细胞以及经验图 3部分, 通过一维头方向细胞和二维位置细胞合并形成的三维位姿细胞表征当前位置,利用一维视觉细胞在环境中学习独特场景,通过位姿细胞和视觉细胞链路编码共同构建拓扑化的经验图,其经验E包含关于视觉细胞V、位姿细胞P和位置间拓扑关系d,定义E=〈V, P, d〉。
创建的兴奋度权重矩阵εabc和由于兴奋性使位姿感知细胞活动产生的变化ΔPx′y′θ′如式(1) 和式(2) 所示:
$ {\mathit{\boldsymbol{\varepsilon }}_{abc}} = \frac{1}{{{k_{x'y'}}\sqrt {2p{k_{q'}}} }}{\mathit{\boldsymbol{\varepsilon }}^{ - \frac{{\left( {{a^2} + {b^2}} \right)}}{{{k_{x'y'}}}}}}{\mathit{\boldsymbol{\varepsilon }}^{ - \frac{{{c^2}}}{{{k_{\theta '}}}}}} $ | (1) |
$ \Delta {P_{x'y'\theta '}} = \sum\limits_{a = 0}^{{N_{x'}}} {\sum\limits_{b = 0}^{{N_{y'}}} {\sum\limits_{c = 0}^{{N_{\theta '}}} {{\mathit{\boldsymbol{\varepsilon }}_{\left( {a - x'} \right)\left( {b - y'} \right)\left( {c - \theta '} \right)}}{P_{abc}} - \varphi } } } $ | (2) |
式中:kx′y′和kθ′分别为位姿感知细胞平面(x′, y′)和θ′维中对应着兴奋性一维分布的方差常数; a、b、c分别为x′、y′、θ′的分布系数; Nx′、Ny′、Nθ′分别为(x′, y′, θ′)空间中的位姿感知细胞三维矩阵元素; 抑制常数φ控制全局抑制水平,使兴奋度被限制在非负范围内。
1.2 视觉细胞的场景学习及位姿关联一维视觉细胞通过视觉关联影响位姿细胞活性状态,其连接强度aix′y′θ′t+1如式(3) 所示:
$ a_{ix'y'\theta '}^{t + 1} = \left\{ {a_i^t,{P_{x'y'\theta '}},{V_i}} \right\} $ | (3) |
视觉细胞关联下的位姿细胞网络活性如式(4) 所示:
$ \Delta {P_{x'y'\theta '}} = \delta \sum\limits_i {{a_{ix'y'\theta '}}{V_i}} $ | (4) |
式中δ为视觉校准加强常数。
1.3 经历图的构建经验E、编码位姿细胞P、视觉细胞V和经历间的拓扑关系d如式(5) 所示:
$ E = \left\{ {P,V,d} \right\} $ | (5) |
拓扑关系d如式(6) 所示:
$ \begin{array}{l} \Delta {d_i} = \alpha \left[ {\sum\limits_{j = 1}^{{N_f}} {\left( {{d_j} - {d_i} - \Delta {P_{ij}}} \right)} + } \right.\\ \;\;\;\;\;\;\left. {\sum\limits_{k = 1}^{{N_t}} {\left( {{d_k} - {d_i} - \Delta {P_{kj}}} \right)} } \right] \end{array} $ | (6) |
式中:α为学习常量; Nf是从经历i到其他经历的转移个数; Nt是从其他经历到经历i的转移个数。实验表明,学习常量α取0.5可使构建的地图收敛到一个稳定的状态,模型如图 1所示。
2 DGSOM算法下的RatSLAM模型神经科学研究表明,视觉皮层与其海马脑区的细胞存在竞争性输入[12-13],而传统的SOM算法[14-19]为确定初始网络结构需进行大量复杂的运算。本文提出一种具有神经元方向和特征的DGSOM神经网络模型,通过引入方向参数减少学习次数从而降低系统的复杂度,通过引入特征参数避免感知混淆,将该模型应用于RatSLAM模型中以改进现有基于鼠类海马体导航机制的细胞导航模型。
方向参数D决定了RatSLAM模型中视觉细胞和位姿细胞的激活特性,激活值mik和mx′y′k取1, 0, -1。特征参数F决定了RatSLAM模型中视觉细胞和位姿细胞的环境特征,其特征可分别表达为nik及nx′y′k,输入参数C可表达为cik=miknik和cx′y′k=mx′y′knx′y′k,其中上标k表示第k个平面。
视觉细胞特征如式(7) 所示:
$ c_i^k = \left\{ \begin{array}{l} n_i^k,\;\;\;\;m_i^k = 1\\ 0,\;\;\;\;\;\;m_i^k = 0\\ - n_i^k,\;\;\;\;\;\;\;m_i^k = - 1 \end{array} \right. $ | (7) |
位姿细胞特征如式(8) 所示:
$ c_{x'y'}^k = \left\{ \begin{array}{l} n_{x'y'}^k,\;\;\;\;m_{x'y'}^k = 1\\ 0,\;\;\;\;\;\;\;m_{x'y'}^k = 0\\ - n_{x'y'}^k,\;\;\;\;\;\;\;m_{x'y'}^k = - 1 \end{array} \right. $ | (8) |
1) 创建DGSOM网络
引入输入神经元C=〈D, F〉,DGSOM模型神经元的创建过程如图 2所示,其中第3个神经元是竞争出的胜者,第m+1个神经元是新产生的神经元。
2) 计算权值向量与输入的距离
在第k个输入vk平面中,到每一个神经元i的距离di可由已知的m个神经元计算得出,可选取的方法包括曼哈顿距离、欧氏距离、径向基等,这里采用输入样本与获胜神经元连接强度的欧氏距离进行判断,计算方法如式(9) 和式(10) 所示:
$ {d_i} = {\left[ {\sum\limits_{i = 1}^m {{{\left( {\mathit{\boldsymbol{c}}_i^k - {\mathit{\boldsymbol{\omega }}_{ij}}} \right)}^2}} } \right]^{\frac{1}{2}}} $ | (9) |
$ {d_{\min }} = \min \left( {{d_i}} \right) $ | (10) |
3) 获取最佳匹配单元
通过引入阈值参数α选择是否需引入新的神经元,获取最佳匹配单元的数学模型,如式(11) 所示:
$ {d_i} = \left\{ \begin{array}{l} 0,\;\;\;\;\;\;i\;为已引入的神经元\\ 1 - \frac{{{d_{\min }}}}{\alpha },\;\;\;\;\;i\;为已引入的神经元,且\;{d_{\min }} < \alpha \\ 1,\;\;\;\;\;\;i\;为新引入的神经元,且\;{d_{\min }} \ge \alpha \end{array} \right. $ | (11) |
4) 调节神经元的权重
新引入的神经元如式(12) 所示:
$ \mathit{\boldsymbol{\omega }}_{ij}^{t + 1} = \mathit{\boldsymbol{c}}_{ij}^k $ | (12) |
已引入的神经元如式(13) 所示:
$ \mathit{\boldsymbol{\omega }}_{ij}^{t + 1} = \left\{ \begin{array}{l} \mathit{\boldsymbol{\omega }}_{ij}^t + {\beta ^t}\left( {\mathit{\boldsymbol{c}}_{ij}^k - \mathit{\boldsymbol{\omega }}_{ij}^t} \right),\;\;\;\;\;j = \arg \min {d_j}\\ \mathit{\boldsymbol{\omega }}_{ij}^t,\;\;\;其他 \end{array} \right. $ | (13) |
式中:
5) 构建一个新的神经元
通过移动机器人在环境中探索,重复过程1)~4), 构建一个新的神经元。
6) 将DGSOM模型应用于RatSLAM
DGSOM下的RatSLAM模型如图 3所示。通过摄像头获取局部场景,利用视觉里程计信息整合至位姿细胞从而影响经历图的构建; 融合DGSOM神经网络模型的视觉细胞,一方面对位姿细胞进行视觉关联,另一方面直接影响经历图的构建。
3 实验与结果分析 3.1 实验设计本实验通过如图 4所示的“旅行家Ⅱ号”轮式机器人摄像头模块进行局部场景的采集,将采集的图像传至上位机并通过M ATLAB进行算法分析验证。实验选取的室内场景如图 5所示。
1) 改进前后RatSLAM模型中位姿细胞的活性转移过程及DGSOM-RatSLAM模型的实时性验证实验
位姿细胞的位姿转移过程如图 6所示,每组3幅图分别表示摄像头实际读取的图像信息、RatSLAM模型中位姿感知细胞活性状态信息以及DGSOM-RatSLAM模型位姿感知细胞活性状态信息; 图 6(a)~(i)所示的过程表示移动机器人在18~23 s时位姿细胞的活性转移过程。从图 6所示的组图中可以看出,随时间推移,RatSLAM模型和DGSOM-RatSLAM模型的位姿细胞左侧活性强度逐渐降低,中间及右侧活性强度逐渐增加; 文献[6]证明了RatSLAM模型在一天中的不同时段都能对同一场景实现闭环检测,但如图 6(j)~(l)所示,该模型无法在场景重现的第一时间(67 s时刻)进行闭环检测,而改进后的DGSOM-RatSLAM模型能够在这一时刻及时地辨识出先前出现的场景,实现闭环检测,其改进模型的实时性得到了验证。
2) RatSLAM模型与DGSOM-RatSLAM模型的定性分析
RatSLAM模型与融入DGSOM神经网络的RatSLAM模型的性能对比如图 7所示,相比于现有的RatSLAM模型,DGSOM-RatSLAM模型采集相同场景时所需视觉细胞的个数更少,能够更快地进行场景重定位且匹配效果更佳。
3) 高斯噪声干扰下的RatSLAM模型与DGSOM-RatSLAM模型的定性分析
为进一步验证DGSOM-RatSLAM模型的有效性,给所需处理的图像添加随机高斯噪声,其中正态分布的均值μ取0,标准差σ取随机值[0.02, 0.08]。高斯噪声干扰下的RatSLAM模型与DGSOM-RatSLAM模型性能对比如图 8所示,相比于RatSLAM模型,DGSOM-RatSLAM模型采集相同场景时所需视觉细胞的个数更少,能够更快地实现闭环且匹配效果更佳。
4) 准确率与召回率对闭环检测的定量分析
引入准确率P、召回率R及F值对两种系统进行评估,数学模型如式(14)~(16) 所示:
$ P = \frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FP}}}} $ | (14) |
$ R = \frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FN}}}} $ | (15) |
$ {F_a} = \frac{{{a^2} + 1}}{{{a^2}}}\frac{{PR}}{{P + R}} $ | (16) |
式中:正阳性(true positive,TP)指正确识别的闭环经验节点单元,假阳性(false positive,FP)指错误检测出的闭环经验节点单元,假阴性(false negative,FN)指未检测到的真实闭环经验节点单元,这里取a=1, 有
$ {F_1} = \frac{{2PR}}{{P + R}} $ | (17) |
经计算,RatSLAM算法和DGSOM-RatSLAM算法的准确率P分别为93.26%和94.74%,差异性不显著; 但相比于RatSLAM模型,DGSOM-RatSLAM模型的召回率R有显著的提升,其中,RatSLAM算法的召回率R仅为75.28%,即该算法在场景重定位中会导致较多的假阴性判断,DGSOM-RatSLAM算法的召回率R改进至86.88%,两种模型的F1值分别为83.31%与90.64%,可以看出,DGSOM-RatSLAM算法性能得到了一定的改进,数据对比如表 1所示。
在每一帧图像中加入高斯噪声,得出其改进前后的Gauss-RatSLAM模型及Gauss-DGSOM-RatSLAM,其准确率P分别为91.42%和86.70%,召回率R分别为71.33%和80.25%,计算得F1值分别为80.14%和83.35%,数据如表 2所示。
对比两模型的准确率、召回率及F1值可以看出,融入DGSOM的鼠类导航细胞模型整体性能得到了一定的改进。
5) 实验场景匹配效果对比
RatSLAM模型与融入DGSOM神经网络的RatSLAM模型的实验场景匹配效果对比如图 9所示,DGSOM-RatSLAM模型在闭环匹配中具有更好的鲁棒性和快速性。
与现有的RatSLAM模型相比,本文提出的DGSOM-RatSLAM模型将DGSOM神经网络融入视觉细胞,通过减少所需细胞的数量降低了系统的复杂度,并且通过位姿细胞活性状态实验与视觉细胞实验分别验证了DGSOM-RatSLAM模型能够更早地匹配到闭环,使系统具有更好的快速性能,优化了匹配效果,其准确率、召回率及F1值与传统RatSLAM模型相比有一定的改进,分别达94.74%、86.88%和90.64%,进一步进行鲁棒性测试可知融入高斯噪声干扰下的改进模型的准确率、召回率及F1值分别达86.70%、80.25%、83.35%。
[1] | KOHONEN T. Self-organized formation of topologically correct feature maps[J]. Biological cybernetics, 1982, 43(1): 59-69. DOI:10.1007/BF00337288 (0) |
[2] | MARTINETZ T M, BERKOVICH S G, SCHULTEN K J. Neural-gas network for vector quantization and its application to time-series prediction[J]. IEEE transactions on neural networks, 1993, 4(4): 558-569. DOI:10.1109/72.238311 (0) |
[3] |
尹峻松, 胡德文, 陈爽, 等. DSOM:一种基于NO时空动态扩散机理的新型自组织模型[J]. 中国科学E辑:信息科学, 2004, 34(10): 1094-1109. YIN Junsong, HU Dewen, CHEN Shuang, et al. DSOM: a new self-organization model based on NO space-time dynamic diffusion mechanism[J]. Science in China ser. E information sciences, 2004, 34(10): 1094-1109. (0) |
[4] | 王春东, 虞鹤峰, 王怀彬. Grey self-organizing map based intrusion detection[J]. Optoelectronics letters, 2009, 5(1): 64-68. (0) |
[5] |
于乃功, 王丽. 双目立体视觉和GSOM相结合的机器人自主地图构建方法[J]. 计算机测量与控制, 2011, 19(11): 2810-2813. YU Naigong, WANG Li. Autonomous mapping for robot using a combination of binocular stereo vision and GSOM[J]. Computer measurement and control, 2011, 19(11): 2810-2813. (0) |
[6] | MILFORD M, GEORGE A. Featureless visual processing for SLAM in changing outdoor environments[J]. Springer tracts in advanced robotics, 2014: 569-583. (0) |
[7] | MILFORD M J, PRASSER D P, WYETH G F. Effect of representation size and visual ambiguity on RatSLAM system performance[C]//Australasian Conference on Robotics and Automation. Australian Robotics and Automation Society (ARAA), 2006: 1-8. (0) |
[8] | MILFORD M, SCHULZ R, PRASSER D, et al. learning spatial concepts from RatSLAM representations[J]. Robotics and autonomous systems, 2007, 55(5): 403-410. DOI:10.1016/j.robot.2006.12.006 (0) |
[9] | MILFORD M, WYETH G, PRASSER D. RatSLAM on the edge: revealing a coherent representation from an overloaded rat brain[C]// Ieee/rsj International Conference on Intelligent Robots and Systems, IROS 2006, October 9-15, 2006, Beijing, China. 2006:4060-4065. (0) |
[10] |
王丽娟, 陶璨, 张光伟, 等. 小鼠初级听皮层SOM中间神经元突触输入的时空特性研究[J]. 第三军医大学学报, 2017, 39(5): 417-422. WANG Lijuan, TAO Can, ZHANG Guangwei, et al. Spatial-temporal characteristics of synaptic inputs received by SOM+ interneurons in mouse primary auditory cortex[J]. Journal of third military medical university, 2017, 39(5): 417-422. (0) |
[11] |
于乃功, 方略, 罗子维, 等. 大鼠脑海马结构认知机理及其在机器人导航中的应用[J]. 北京工业大学学报, 2017, 43(3): 434-442. YU Naigong, FANG Lue, LUO Ziwei, et al. Cognitive mechanism of rat hippocampal formation and its application in robot navigation[J]. Journal of Beijing university of technology, 2017, 43(3): 434-442. DOI:10.11936/bjutxb2016060082 (0) |
[12] |
刘帅师, 程曦, 郭文燕, 等. 深度学习方法研究新进展[J]. 智能系统学报, 2016, 11(5): 567-577. LIU Shuaishi, CHENG Xi, GUO Wenyan, et al. Progress report on new research in deep learning[J]. CAAI transactions on intelligent systems, 2016, 11(5): 567-577. (0) |
[13] |
丁永生. 计算智能的新框架:生物网络结构[J]. 智能系统学报, 2007, 2(2): 26-30. DING Yongsheng. A new scheme for computational intelligence: bio-network architecture[J]. CAAI transactions on intelligent systems, 2007, 2(2): 26-30. (0) |
[14] |
芮小平, 张立强. 基于SOM的多维信息可视化研究[J]. 应用基础与工程科学学报, 2011, 19(3): 379-388. RUI Xiaoping, ZHANG Liqiang. Multi-dimensional information visualization based on SOM[J]. Journal of basic science and engineering, 2011, 19(3): 379-388. (0) |
[15] |
尹柏强, 何怡刚, 朱彦卿. 一种广义S变换及模糊SOM网络的电能质量多扰动检测和识别方法[J]. 中国电机工程学报, 2015, 35(4): 866-872. YIN baiqiang, HE Yigang, ZHU Yanqing. Detection and classification of power quality multi-disturbances based on generalized S-transform and fuzzy SOM neural network[J]. Proceedings of the CSEE, 2015, 35(4): 866-872. (0) |
[16] |
於东军, 吴小俊, HANCOCKEdwin R, 等. 广义SOM及其在人脸性别识别中的应用[J]. 计算机学报, 2011, 34(9): 1719-1725. YU Dongjun, WU Xiaojun, HANCOCK Edwin R, et al. Generalized SOM with application to facial gender identification[J]. Chinese journal of computers, 2011, 34(9): 1719-1725. (0) |
[17] |
刘艳, 陈丽安. 基于SOM的真空断路器机械故障诊断[J]. 电工技术学报, 2017, 32(5): 49-54. LIU Yan, CHEN Li'an. Mechanical fault diagnosis of vacuum circuit breaker based on SOM[J]. Transactions of China electrotechnical society, 2017, 32(5): 49-54. (0) |
[18] |
邱天宇, 申富饶, 赵金熙. 自组织增量学习神经网络综述[J]. 软件学报, 2016, 27(9): 2230-2247. QIU Tianyu, SHEN Furao, ZHAO Jinxi. Review of self-organizing incremental neural network[J]. Journal of software, 2016, 27(9): 2230-2247. (0) |
[19] |
赵建华, 李伟华. 有监督SOM神经网络在入侵检测中的应用[J]. 计算机工程, 2012, 38(12): 110-111. ZHAO Jianhua, LI Weihua. Application of supervised SOM neural network in intrusion detection[J]. Computer engineer, 2012, 38(12): 110-111. DOI:10.3969/j.issn.1007-130X.2012.12.018 (0) |