文章信息
- 刘素青, 周畅, 杜盛珍.
- Liu Suqing, Zhou Chang, Du Shengzhen.
- 基于遗传算法的神经网络木材消耗量预测模型研究
- THE STUDY ON THE WOOD CONSUMING PREDICTION MODEL OF NEURAL NETWORK BASING ON GENETIC ALGORITHM
- 林业科学, 2001, 37(3): 122-125.
- Scientia Silvae Sinicae, 2001, 37(3): 122-125.
-
文章历史
- 收稿日期:1999-06-07
-
作者相关文章
遗传算法是由Holland受博物学家达尔文的“生物进化”和“自然选择”学说的启发, 于1975年提出的, 经过20多年的研究和实践, 遗传算法已经发展成为非线性控制和系统识别的有力工具, 被广泛应用于人工智能、机器人系统、神经网络学习过程、模式识别、图像处理、系统控制、工业优化控制、自适应控制以及包括遗传学在内的生物学的诸多领域和社会学科的各个方面等。
Holland遗传算法的中心思想:首先在所收索的分布空间上随机地选择n个基因种群(染色体群体)或n个初始点(种子), 即产生祖先; 然后计算这n个染色体群体的适应度, 并加以比较, 评选出这n个染色体群体适应环境的优劣; 再从这n个点中随机选择2点(自然选择), 并给较优者更高的机会(优胜劣汰); 最后利用自然选择得到的2点, 按照某种随机方式, 必要时增加噪声, 生成一个新点, 重复这一过程, 直至产生n个新的点。由此, 所产生的n个新基因种群, 一定比其父代性能更优良, 新的点更接近于最优解。人工神经网络是一种模拟人脑信息处理算法的非线性系统, 具有知识和分布式存储和并行处理的特点, 并且具有记忆和联想的功能, 理论研究表明, 它能以任意精度逼近任意的非线性函数, 因此, 它比较适合于一些复杂问题建模。木材消耗量的预测就是利用神经网络的记忆能力对历史数据进行学习记忆, 建立木材消耗量的神经网络模型, 然后利用神经网络的联想能力对未来木材消耗量进行预测。
2 神经网络的进化学习神经网络的结构形式有多种, 其中前向神经模型是常见的一种模型之一。前向型神经网络最常用的学习算法为BP算法, 但这种算法极易陷入局部极小点, 因此, 建议采用近年流行的进化算法对神经网络进行学习。进化算法是一种基于群体优化方法, 它的基本思路是模拟自然界中生物群体之间相互竞争, 按适者生存的原则进行选择, 适应环境的个体被保留, 而不适应环境的个体被淘汰, 个体继承父辈的特性, 同时又发生变异而具有不同于父辈的特性, 这样为自然界的选择提供了更多不同的个体, 群体就是这样经过一代代的演变最后由不适应环境进化到适应环境。一般进化算法有3种不同的类型:遗传算法、进化规划和进化策略。由于神经网络学习的特点, 进化策略学习具有一定的优越性。
神经网络进化策略学习方法为:Stage1 确定神经网络的表示方式; Stage2 随机产生一定数量的神经网络作为初始群体; Stage3 计算每个神经网络所对应的性能指标, 并按其大小进行排序; Stage4 选择性能指标排在前50%的个体作为下代的个体, 不作改变复制到下一代, 丢弃其余的个体; Stage5 将性能指标排在前50%的个体作为下一代新个体的父辈, 分别对他们进行变异产生新个体; Stage6 由Stage4 和Stage5 形成新一代群体, 回到Stage2, 直到所得到的神经网络满足给定的要求(图 2)。
前向神经网络可以用一个字符串来表示, 字符串由权值组成
其中:Wijk中k为前向神经网络的层号; i、j为神经网络第k层中神经元节点的序号。
2.2 适应性能指标的确定一般理论认为, 预测值与实际值的误差越小越好, 因此, 适应性能指标和预测值与实际值的离差平方和有关, 由此可见适应性越好, 其离差平方和∑(ŷi-yi)2越小, 为了统一起见, 把适应性指标转化成一个极大值。即
式中:f为适应性指标; Fmax适应指标最大值; yi实际值; ŷi预测值。
2.3 变异算子进化策略不完全同于遗传算法, 它仅采用了变异算子, 没采用交叉算子。同时可对神经网络的拓朴结构和权值进行变异。为了简单起见, 把神经网络的拓朴结构固定, 因此仅对权值进行变异, 对群体中第n个神经网络的权值Wijk, 其变异增量:
式中:λ为系数, N (0, Pm)为均值为0, 方差为Pm的高斯函数, Pm和第n个神经网络在群体的性能有关, 若第n个神经网络的性能越差, 则Pm越大, 从而ΔWijk偏差均值0的可能性越大, 进化策略采用的是群体学习方法, 因此它可以避免陷入局部极点。
3 神经网络的木材消耗量预测模型根据牛继荃资料(牛继荃, 1994), 以我国山东省1981~1988年木材消耗量为例, 采用图 3的神经网络实现木材消耗量和固定资产投资、工农业总产值之间的映射关系。网络的输入为固定资产投资和工农业总产值, 因此共有2个输入节点, 网络输出为木材消耗量1个节点, 隐层节点数没有固定的选择公式(Forgel, 1994), 一般应满足2n > m, 其中n为隐层节点数, m为样本数。输入层和隐层中各有一个偏置节点, 其输入固定为1。网络中所有节点的节点函数均为Sigmoid型函数。
为了使输入/输出数据都在[0, 1]区间内, 需将表 1的数据进行归一化处理, 归一化的数据即为神经网络学习样本数据。
以1981~1986年6年间数据为样本作为学习建模的基础, 对1987和1988年进行预测, 以检验模型的预测效果。以C++语言在PII机运行, 取λ=0.2。λ大, 施加的扰动大, 权值变异大; λ小, 施加的扰动小, 权值变异小。学习结束后的网络很好地实现了木材消耗量和固定资产投资、工农业总产值之间的函数映射关系。神经网络具有良好的联想能力, 因此它对未来的数据应有很好的预测能力。神经网络的预测效果见表 2。从表 2中可以看出, 神经网络方法预测效果优良, 可以作为木材消耗量的理想预测模型。
由于神经网络可以以任意精度逼近一个非线性函数, 具有良好的适应性, 对木材消耗量表现出良好的预测效果, 比牛继荃先生的方法精度更高。
用神经网络方法进行预测时, 具有良好的向外扩展性, 在这次试验中表现出不会因为向外扩展而精度降低。
Angeline P J, et al. 1994. An evolutionary algorithm that construct recurrent neural networks. IEEE Trans Neural Network., 5(1). |
Forgel D B. 1994. An introduction to simulated evolutionary optimization. IEEE Trans Neural Neworks, 5(1). |
Goldberg D E. 1989. Genetic Algorithms in search.Optimization and machine learning Readding. MA: Addison-Wesley, 27-93.
|