基于神经网络和图像分割的林火图像识别研究<sup>*</sup>

Download PDF 打印本文

文章快速检索

高级检索

引用本文

丁虎, 姚磊, 刘少刚, 等 . 基于神经网络和图像分割的林火图像识别研究[J]. 应用科技,2016, 43(3): 82-86. 复制到剪切板

DING Hu , YAO Lei , LIU Shaogang , et al . The forest fire image recognition based on neural network and image segmentation[J]. Applied Science and Technology, 2016, 43(3): 82-86.
DOI: 10.11991/yykj.201510011 复制到剪切板

基于神经网络和图像分割的林火图像识别研究

丁虎¹ , 姚磊² , 刘少刚² , 吴伟峰² , 高春晓²

1. 中船重工集团第七〇四研究所, 上海 200031;
2. 哈尔滨工程大学机电工程学院, 黑龙江哈尔滨 150001

收稿日期: 2015-10-19; 网络出版日期: 2016-06-25

基金项目: 哈尔滨市应用技术研究与开发项目(2013RFXXJ002);高等学校博士学科点专项科研基金项目(20102304110007)

作者简介: 丁虎(1978-),男,博士,高级工程师.

通讯作者: 刘少刚(1962-),男,教授,博导,E-mail:liushaogang@hrbeu.edu.cn .

摘要: 为了提高森林灭火航弹投放的准确性,提高航弹的利用率,对森林火灾图像识别方法进行了优化设计,将阈值分割和神经网络算法相结合,实现了火灾图像的智能识别,提高了图像识别的精确性。本研究利用高清摄像机获取森林火灾图像,采用阈值分割技术对图像进行提取,通过MATLAB计算得到有无火灾的信息,控制系统获取火灾信息后对灭火航弹的投放进行决策,提高了灭火过程的自动化水平。对图像识别算法进行了测试,通过测试发现,该算法可以有效地提高火灾的识别效率和识别精度,为森林灭火的自动化提供了参考。

关键词: 森林灭火神经网络灭火航弹阈值分割图像识别

The forest fire image recognition based on neural network and image segmentation

DING Hu¹ , YAO Lei² , LIU Shaogang² , WU Weifeng² , GAO Chunxiao²

1. China Shipbuilding Industry Corporation 704^th Research Institute, Shanghai 200031, China ;
2. College of Mechanical and Electrical Engineering, Harbin Engineering University, Harbin 150001, China

Abstract: In order to improve the release accuracy and utilization efficiency of fire extinguishing bomb, a forest fire image recognition technique was designed. Threshold segmentation was combined with the neural network algorithm to realize the intelligent image recognition of forest fire, which improves the accuracy of image recognition. The image of forest fire was acquired from HD video cameras and extracted by the technology of threshold segmentation in this study. The fire information can be obtained by MATLAB, and decisions on the release of fire extinguishing bombs were made by the control system after the fire information was analyzed. Therefore, the automatic level of firefighting was greatly improved. In addition, tests were made on the image recognition algorithm, and the results prove that the recognition efficiency and accuracy of forest fires can be effectively improved by using the proposed algorithm, which provides a reference for the automatic forest firefighting.

Key words: forest firefighting neural network fire extinguishing bomb threshold segmentation image recognition

人类社会已经进入了科技迅猛发展的21世纪，但是森林火灾的控制问题至今没有得到很好的解决^[1]。森林火灾具有发生面广、突发性强、扑救困难等特点^[2]。传统的森林灭火方式效率低，缺乏对火情的实时监测，灭火缺乏针对性，往往消耗大量的人力物力，效果却并不乐观。林场火灾监控一般直接采用摄像头拍摄监控的方式，而肉眼进行火灾图像识别缺乏精确性，无法有效地对林场火情进行针对性的监控分析。应用森林灭火航弹进行森林灭火是一种全新的森林灭火方法^[3-4]，能够有效解决森林消防灭火过程中人工灭火占主导地位的现状，改变目前基层森林消防官兵只能手持风力灭火机在火场内部冒着生命危险与林火搏斗的状况，对于难以接近的森林火灾可以实现远程高效灭火。由于火场上空环境复杂多变，如何根据林场上方采集的图像确定灭火航弹投放方案，使其更有效率地将森林灭火航弹准确地投放到森林火场上空，成为森林灭火的关键因素之一。

1 森林火灾图像识别系统总体设计

森林火灾图像的识别对于灭火航弹投放系统的设计具有重要的意义，投放系统可以根据森林火灾的图像来判断灭火航弹需要进行投弹的位置，提高航弹的利用率，其中森林火灾图像的识别流程如图 1所示。

图 1 森林火灾图像识别流程

图选项

森林火灾图像识别过程中，首先利用高清摄像机获取森林现场图像^[5-6]，然后对图像进行灰度处理以及阈值分割处理，得到林场图片的灰度图像，之后利用主元分析法对二值化图像处理，剔除掉一部分对火灾识别贡献率低的因子，并作为BP神经网络的输入变量，根据输出层的结果判断有无火灾，最后实施投弹。

2 森林火灾图像识别过程和控制算法设计 2.1 图像识别过程

本文提出的森林火灾图像识别过程主要按照下面的操作步骤进行：

1) 收集监控视频采集的森林现场照片，将图片分为有火灾和无火灾两大类，并对图片进行预处理；

2) 利用MATLAB对图像进行灰度处理和阈值分割，将处理后的图像以“0”、“1”的矩阵的形式作为BP神经网络的输入变量；

3) 将100张火灾图像和100张非火灾图像作为BP神经网络的输入层输入向量后，定义有火灾时输出层的输出向量为1，无火灾时输出向量为2；经过反复试凑，构建出火灾图像识别的神经网络；

4) 把步骤3)取得的数据看成训练集，然后对上述步骤得到的预处理图片进行保存；

5) 当选择新的一张待识别的火灾图片a时，首先对图片进行预处理，提取其灰度阈值分割后的图片矩阵信息；

6) 利用主元分析方法对得到的矩阵信息进行处理，剔除一部分对输出结果贡献率小的信息，然后再进行BP神经网络识别，得到待识别图片a的输出层结果；

7) 对于网络的输出值需要进行取整操作，比如一个图像的输出值为0.8，那么看作是有火灾的类别，并且认为分类识别正确。如果一个图像的输出值是0.2。那么认为输出值与实际期望结果差距太大，认为是输出错误，判别和识别的过程是错误的。

2.2 样本的预处理

良好的样本选择能够大大提高网络学习的效率，所以在样本选取中一定要做到有的放矢。在样本选取时，相似类别的样本选取的数量应该大致接近，这样可以避免因某一类样本选取过多，权值过大，造成实验结果对于该样本过于敏感。

计算机对数字量“0”、“1”的识别速度要远远高于颜色形状等复杂的信息，所以样本训练前首先要对选取的样本进行图像分割处理，让图片信息变成“0”、“1”的矩阵信息，方便计算机进行处理。灰度阈值分割法是一种最常用的并行区域技术，它是图像分割中应用数量最多的一类^[7]。阈值分割方法实际上是输入图像f到输出图像g的如下变换：

(1)

点击浏览

式中：T为阈值，f(i,j)为图像处理前的图像元素，g(i,j)为处理后图像元素。

最大类间方差法是一种自适应的阈值确定的方法。它是按图像的灰度特性，将图像分成背景和目标两部分。背景和目标之间的类间方差越大说明构成图像的两部分的差别越大，当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。本文使用最大类间方差法对图像进行分割，这也意味着错分概率最小。

选取样本图片200张，其中火灾图片100张，无火灾图片100张，将图片进行编号，分别为1.1，1.2，…，1.100和2.1，2.2，…，2.100。不同摄像头获取的图片像素往往大小不一致，首先将图片尺寸统一为64 pix×64 pix，再利用最大类间方差法对图像进行二值化处理。利用MATLAB软件对火灾图像进行预处理的效果如图 2所示。

图 2 森林火灾图像预处理

图选项

2.3 控制算法的设计

在利用神经网络算法对图像进行识别计算前，首先利用主元分析法对输入层矩阵进行处理，主元分析法主要用来降低维数，提高识别效率。例如在神经网络中，对于输入层的某个特定元素，无论这个特定元素为何值，输出结果均为1或者与1的差距不大，那么可以判定这个元素本身不具备区分性，用这个元素特征来做区分，贡献性将会非常小。本文采用的主元分析法就是用来找到那些对案例贡献性不大的元素，将其剔除，从而使留下的元素都是对最后结果有较高贡献率的元素，这样就可以极大地简化计算。

高绪伟^[8]对应用主元分析法与不应用主元分析的方法的识别效果进行了对比。应用主元分析法与不应用主元分析的方法的识别率和算法平均计算时间见表 1。

表 1 主元分析法与无特征提取方法的识别效率对比

识别方法	识别率/%	平均运行时间/ms
应用主元分析法	84.5	1 555.5
不应用主元分析的方法	88	18.9

表选项

表 1表明，相比于不应用主元分析的方法，主元分析法能够极大缩减计算时间，与此同时也能够显著提高识别率，由此可知，主元分析法具有优良的降维效果。利用主元分析法将图像信息进行处理后，即可利用BP神经网络算法对图像进行训练。

一个完整的神经网络主要包括输入层、隐含层和输出层。输入层、隐含层和输出层之间相互连接，但是每一层的节点之间没有任何连接^[9-10]。所谓的“输入向量维数”即输入层的节点个数，“输出向量维数”即输出层的节点个数，输入层和输出层之间的隐含层节点个数是经过反复试凑得到的，没有直接确定的标准。神经网络可以学习并且存储非常多的输入模式与输出模式之间的映射关系，却无需在学习和存储前事先揭晓并描述输入输出间的映射关系。通过对输出误差的反向传播，获得不断调整网络连接权系数和阈值的信息，最终使神经网络的平方误差最小，达到期望要求。搭建的BP神经网络的结构如图 3所示。

图 3 BP神经网络的结构

图选项

为了形象地展示文中BP神经网络算法的实现过程，可以用流程图的形式来表示神经网络的执行步骤，如图 4所示。

图 4 BP神经网络的执行步骤

图选项

1) 隐含层个数的设置

利用神经网络设置网络映射需要对神经网络的隐含层个数进行设置。一般来说，包含一个隐含层的3层神经网络即可实现输入层到输出层的映射。较少的网络层数会降低网络学习的精度，但是较多的网络层数虽然能够提高网络学习的精度，也会使网络结构更加复杂，增加网络学习的时间。综合考虑，文中设计的神经网络使用3层网络层。

2) 各层节点个数的选择

隐含层神经元的个数直接影响到神经网络的学习能力，当隐含层的神经元个数较少时，虽然会降低网络的规模和学习时间，但是网络学习的精度会明显下降。当隐含层神经元数目过多时，网络的学习能力增强，但是网络的规模变大，每次的网络学习时间会增加。目前对于神经元个数的选取并没有明确的理论指导，一般由实际经验来确定。

实际应用中可参考以下经验公式：

(2)

点击浏览

式中：M表示输入层神经元的个数，N表示输出层之间的个数，a取1~10的常数。经过反复试凑，设计的网络中各层节点个数分别设置为18、13、5个。基于设计需求，神经网络判断的结果为图像判定有火灾和无火灾2种情况，所以输出层的神经元个数为1。

3 火灾图像识别MATLAB测试

利用MATLAB编制了用于检测图像有无火灾的GUI界面，如图 5所示。

图 5 火灾图像识别GUI界面

图选项

GUI界面操作步骤如下：

1) 打开森林火灾识别系统GUI界面，点击读入照片，将一张待识别的图片载入界面中。

2) 点击“图片预处理”，得到图片大小经处理后的灰度图片，用于匹配后续的PCA和BP神经网络识别，如图 6所示。

图 6 图像经处理后的火灾图像识别界面

图选项

3) 点击PCA，可以进行主元成分分析，剔除掉那些影响因子较小、贡献率低的元素。

4) 点击BP神经网络，得到BP识别的结果。对于当前图像，提示是否需要投弹。弹出的有火灾和无火灾提示界面如图 7所示。

图 7 提示界面

图选项

4 结论

本文分别选取100张有火灾和100张无火灾的图像进行了火灾图像识别试验，试验中识别正确的样本个数为195个，识别正确率为97.5%。根据试验结果可以看出，本文设计的图像识别方法在选取了200个训练样本的情况下即达到了较高的识别率，说明运用图像分割和神经网络算法对于火灾识别具有积极的意义。

但是最后的试验还存在一些不理想的识别结果，造成试验结果不理想的原因主要有以下两点：

1) 由于实验资源的限制，本次训练的样本数量较少，用于训练和测试的样本图片只有200张，样本中包含的图像信息量不够全面。

2) 由于计算机计算能力有限，本文将样本图像统一处理为64 pix×64 pix，低像素的图片有可能导致图像信息不全面，导致误识别。

在实际灭火工作中，可以利用摄像头采集更多的林场图像，扩大训练样本。并且随着计算机水平的提升，可以构建更加复杂的BP神经网络处理高像素的图像，从而更加有效地识别森林火灾。

参考文献

[1]	PETRUCCI B, CAPITONI B, BORELLI R, et al. The "Forest Fire Project", national cartographic portal of the Italian Environmental Department:an example of management of cartographic data to support forest fires fighting plans in national parks[J]. Forest,2010, 7 : 13 –21.
[2]	魏茂洲, 王克印. 森林灭火装备的现状与展望[J]. 林业机械与木工设备,2006, 34 (7) : 11 –14.
[3]	刘少刚, 周钊, 张书宇, 等. 森林灭火航弹智能观瞄投放控制系统设计[J]. 应用科技,2014, 41 (1) : 69 –74.
[4]	邓波. 智能森林灭火航弹研究[D]. 哈尔滨:哈尔滨工程大学, 2011:1-2.
[5]	黄儒乐, 吴江, 韩宁. 林火烟雾图像自动识别中的模式分类器选择[J]. 北京林业大学学报,2012, 34 (1) : 92 –95.
[6]	饶裕平, 柴红玲. 林火视频监控中烟识别方法概述[J]. 林业调查规划,2009, 34 (1) : 59 –62.
[7]	MAGESWARI S U, SRIDEVI M, MALA C. An experimental study and analysis of different image segmentation techniques[J]. Procedia engineering,2013, 64 : 35 –45.
[8]	高绪伟. 核PCA特征提取方法及其应用研究[D]. 南京:南京航空航天大学, 2009:42.
[9]	YU Feng, XU Xiaozhong. A short-term load forecasting model of natural gas based on optimized genetic algorithm and improved BP neural network[J]. Applied energy,2014, 134 : 102 –113.
[10]	SANKAR A B, SELVI J A V, KUMAR D, et al. Effective enhancement of classification of respiratory states using feed forward back propagation neural networks[J]. Sadhana,2013, 38 (3) : 377 –395.

DOI: 10.11991/yykj.201510011

文章信息

丁虎, 姚磊, 刘少刚, 吴伟峰, 高春晓

DING Hu, YAO Lei, LIU Shaogang, WU Weifeng, GAO Chunxiao

基于神经网络和图像分割的林火图像识别研究

The forest fire image recognition based on neural network and image segmentation

应用科技, 2016, 43(3): 82-86

Applied Science and Technology, 2016, 43(3): 82-86

DOI: 10.11991/yykj.201510011

文章历史

收稿日期: 2015-10-19

网络出版日期: 2016-06-25

文章信息

文章历史

相关文章

工作空间