盲人触觉辅助设备是现代盲人识别和感知外界信息的重要途经之一,能够把其探测设备中摄像头采集到的外部信息转化为触觉信号,反馈给盲人身上,为盲人感知外界信息提供了一条最有效的解决途经。但是由于采集到的图像数据量太大,除了在信息转化和传递过程中采用特定的方法之外,能够在采集阶段锁定目标位置并提取其信息,从而略去了庞大复杂的背景干扰,使调焦系统快速精准地定位到目标物体,这对目标的跟踪和特征的提取都起着至关重要的作用[1]。而目前广泛应用的对焦深度法在聚焦时[2],通常都需要采集几十甚至上百帧的图像并对其进行多次评价之后才能确定正焦位置,所以,一种高效的对焦方法对提高图像输入设备的性能具有重要意义。
在摄像头探测设备调焦的过程中,经常发生轻度或是深度离焦的视频图像被捕获到,图像通常都存在一定程度自然背景的干扰。因此,从数字图像处理的角度很难提取出有突破性的方法。文中受生物视觉感知系统成像过程的启发,提出了一种结合视觉感知的调节焦距构建方法,具有较强的稳健性。 1 生物视觉感知机制
与基于像素的图像分割、边缘检测、模版匹配等这些传统方法不一样,人类视觉完成目标关注是通过感知信息的检测、提取、整合等步骤,它与计算机方法有着本质不同[3]。在这种高效的生物机制中,比较典型的是众多学者提出的Serre模型和Itti模型。Serre模型从视觉机制的生物层面出发,为信号在细胞间的传递过程建立了详尽的模型结构。相比之下,Itti将显著特性引入生物视觉,使建立的模型更加简单明。文中先对采集到的图像进行特征保留的二值化处理,再建立图像信号与功能视皮层神经元的对应关系,通过对神经元间增强抑制作用方式及作用强度的调制,实现对识别目标轮廓的增强。最后在Itti模型和显著特性的基础上来建立焦距调节要求的视觉感知模型[4]。在对轮廓进行识别的过程中,设定了参数阈值滤除干扰,极大程度上减少了那些类似人体形态轮廓的背景图像的干扰。 2 实现的过程 2.1 轮廓特征保留并增强的二值化
在对图像信息进行处理的过程中,首先对图像进行特征保留的二值化处理,图像二值化是图像处理的一项基本技术,也是很多图像处理过程中都会进行的预处理技术,但是对于二值化过程中能否最大限度地保留原图的主要特征,这对下一步对目标物体边界轮廓特征的配准和识别起到至关重要的作用。所以,在此采用文献[5]中所提到的一种基于Gabor滤波器的轮廓特征保留并增强的二值化算法来对图像进行预处理,它是一种自适应调整阈值的方法,能使二值化后的图像极大地保持原图像的边界特征。 Gabor在1946年将短时傅里叶变换的窗函数取成高斯函数,提出了Gabor变换。已有研究证明,Gabor滤波器已经可以有效地模拟在轮廓化过程中,结合神经元风车状的排列结构[6],建立图像结构信息与神经元的对应关系。A、B分别为同一幅图像中设定的两个神经元,图 1所示A′、B′为图 2所对应神经元的排列结构图。
如图 2所示,以A为风车的中心,则弱化A的方向偏好,则神经元B在该风车结构中的位置是由信号AB的方向φAB与B的方位φB的角度差值θAB来确定,B′的位置决定了其对A′的作用方式及强度。为确保θ的取值(0,π/2),取:
文中通过神经元结构功能关系,展现出了良好的平行抑制和共线增强性能,也表现出了神经元对信号的处理功能。对所有人体轮廓信息的识别过程中,使得增强和抑制这两个效果的区分度变得更为鲜明[7]。 2.2 模拟人眼视觉感知功能识别目标特征
为实现视觉感知机制的特征识别和提取过程,在Itti模型和显著特性的基础上[8],文中利用Gabor滤波器[9, 10]能够模仿人类的视皮层细胞具有方向敏感性的特性,将图像中的方向、频率特性还有控件位置同时提取出,其数学模型如式(2)~(4):
式中:σx和σy分别为x和y方向上的标准差,也是滤波器的尺度参数;θ是方向,取0°、45°、90°和135°;f是中心频率。把图像序列作为多尺度的Gabor滤波器的输入,为充分提取图像的特征信息,采用最近邻差值法按单个神经元的分辨率进行规范,再沿方向θ的4个不同的值进行融合,得到4个不同方向上的特征图[11]。在步骤2.1的处理中,对人体轮廓图像特征的方向偏好进行了强化,强化后的图像作为多尺度的Gabor滤波器的输入,从根本上提高了其生成的特征图对人体轮廓信息的保留,也大大增加了2.3中采用边界扩展法来建立的调焦窗口的准确性和可靠性。 2.3 边界扩展法启动调焦机制
因为捕捉到的边界特征图有不规则边界的角度特性,所以选择采用“十”字模版对边界进行扩展并建立调焦窗口[12]。
该过程主要受以下2个方面因素影响:
1)当无效像素的“十”字范围存在的有效像素多于1个时,该无效像素应有效化成为扩展点,实现边界扩展;
2)相邻的无效像素的形式可能会被扩展点改变;
在用“十”字模版对图像进行卷积时,根据因素1)来进行扩展的判断和操作。为了获得规则的矩形调焦窗口,就需要充分地考虑因素2)的可能性,来进行多次迭代处理。每次进行扩展时记录扩展点“十”字范围内的无效像素点Pn,并生成预处理系列L={P1,P2,…,Pn,…},对该序列进行因素1)的再判断和扩展,该过程应迭代直至L为空,得到规则的矩形窗口。 2.4 设定阈值滤除干扰
为了提高对人体目标识别的正确率,通过对人体目标特征样本的采集,并对所有样本的同一方向的特征图运用有效像素权重法,即目标区域内有效像素与非0像素的比值得到1个有效像素权重值。经过多次的采集和分析后,最终确定了1个人体目标形态的临界特征权重阈值。如果特征图的有效像素权重达不到这个范围的均视为干扰信号,这样就滤掉了那些类似人体形态轮廓的干扰背景,极大地提高了对人体目标成功对焦的识别率,特征权重WI及其阈值Wmin、Wmax为
式中:F为目标区域I内的有效像素;NI为目标区域I内非0像素个数。图 3为对200个不同的人体目标图像有效像素权重值进行的分析,通过分析可得Wmin=0.48,Wmax=0.72。 3 实验结果与分析为验证本方法的有效性和可靠性,进行了实验验证,处理的数据源为720 pixel×576 pixel具有日常生活环境特点的图像,在图 4、7中,捕捉到的是一张复杂背景中的人体图像;在图 5、8中,是经过了轮廓特征保留并增强的二值化处理。在图 6、9中,模拟人眼视觉感知功能识别目标特征,并利用边界扩展法来启动调焦机制,经阈值去噪和边界扩展滤除干扰,得到了规则的矩形调焦窗口[13]。在对200个图像样本进行测试的过程中,与文献[14]基于模糊的轮廓模型进行对比,由表 1可看出文中处理算法相对于原始基于图像分割的Itti模型,在对焦成功率上有了进一步的提高,并大大缩短了响应时间。
针对日常环境下对人体目标捕捉的自动对焦,文中引入了视觉感知机制,以Itti模型为基础,通过轮廓特征保留并增强的二值化处理,多尺度Gabor滤波器模拟人眼视觉感知感受视野的过程,对图像进行特征提取,最后用边界扩展法获得规则的矩形调焦窗口。并且720 pixel×576 pixel图像的处理时间稳定在220 ms以内,满足了实时性要求,具有重要的工程应用价值。
[1] | 谢剑斌. 视觉感知与智能视频监控[M]. 长沙:国防科技大学出版社,2012:77-124. |
[2] | 尤玉虎, 刘通, 刘佳文. 基于图像处理的自动对焦技术综述[J]. 激光与红外, 2013, 43(2):132-136. |
[3] | 潘林, 郑炳锟, 魏丽芳, 等. 置信度边缘检测在眼底相机自动对焦中的应用[J]. 计算机仿真, 2011, 28(5):271-274. |
[4] | MARGOLIST, CORNISH T. Designing an augmented environment for remote collaboration in digital cinema production[C]//Proceedings of SPIE 8649, The Engineering Reality of Virtual Reality.Burlingame, USA:SPIE,2013, 8649:67-72. |
[5] | 蔡超, 王梦. 基于视觉感知机制的轮廓检测方法[J]. 华中科技大学学报:自然科学版, 2011, 39(7):22-25. |
[6] | 张雨浓, 曾庆淡, 肖秀春, 等. 复指数Fourier神经元网络隐神经元衍生算法[J]. 计算机应用, 2008, 28(10):2503-2506. |
[7] | 黄凯奇, 任伟强, 谭铁牛. 图像物体分类与检测算法综述[J]. 计算机学报, 2014, 36(12):1225-1240. |
[8] | KHAMESEEM B, ALLY J, AMIRFAZLI A. Automatic focusing for objects with large displacement at high magnification[J]. Measurement and control, 2006, 39(4):118-121. |
[9] | THARWATA, GABER T, HASSANIEN A E. Cattle identification based on muzzle images using Gabor features and SVM classifier[M]//HASSANIEN A E, TOLBA M F, AZAR A T. Advanced machine learning technologies and applications.:Springer International Publishing,2014:236-247. |
[10] | 孙玉宝, 肖亮, 韦志辉, 等. 图像稀疏表示的结构自适应子空间匹配追踪算法研究[J]. 计算机学报, 2012, 35(8):1751-1758. |
[11] | 刘雪超, 吴志勇, 黄德天, 等. 结合视觉感知的调焦窗口的构建[J]. 中国激光, 2014, 41(1):0109001. |
[12] | DOGANH, EKINCIM. Automatic panorama with auto-focusing based on image fusion for microscopic imaging system[J]. Signal, image and video processing, 2014, 8(S1):5-20. |
[13] | 侯志强, 韩崇昭. 视觉跟踪技术综述[J]. 自动化学报, 2006, 32(4):603-617. |
[14] | 刘驰. 基于活动轮廓的图像分割算法研究[D]. 南京:南京理工大学, 2014:3-67. |