林业科学  2012, Vol. 48 Issue (11): 87-91   PDF    
0

文章信息

吴舒辞, 刘帅, 李建军, 沈学杰, 王传立
Wu Shuci, Liu Shuai, Li Jianjun, Shen Xuejie, Wang Chuanli
毛竹导热系数非线性拟合的PSO-BP模型
A PSO-BP Model for Nonlinear Fitting of Phyllostachys edulis' Thermal Conductivity
林业科学, 2012, 48(11): 87-91.
Scientia Silvae Sinicae, 2012, 48(11): 87-91.

文章历史

收稿日期:2012-01-09
修回日期:2012-06-02

作者相关文章

吴舒辞
刘帅
李建军
沈学杰
王传立

毛竹导热系数非线性拟合的PSO-BP模型
吴舒辞, 刘帅, 李建军, 沈学杰, 王传立    
中南林业科技大学 长沙 410004
摘要: 应用粒子群优化算法(particle swarm optimization,PSO)训练多层前馈(back propagation,BP)神经网络,提出毛竹导热系数的PSO-BP模型,将神经网络的学习过程映射为粒子群体的迭代寻优过程,达到优化神经网络权值及阈值的目的。结果表明:毛竹导热系数PSO-BP模型在泛化性能、拟合精度、训练及验证误差等方面均优于标准BP网络模型。
关键词:毛竹导热系数    神经网络    粒子群优化算法    非线性拟合    
A PSO-BP Model for Nonlinear Fitting of Phyllostachys edulis' Thermal Conductivity
Wu Shuci, Liu Shuai, Li Jianjun, Shen Xuejie, Wang Chuanli    
Central South University of Forestry and Technology Changsha 410004
Abstract: By applying PSO(particle swarm optimization)algorithm to train BP(back propagation)neural network, this article puts forward a PSO-BP model of Phyllostachys edulis' thermal conductivity and regards the process of neural network learning as that of iterative optimization for particle swarm, with the purpose of optimizing neural network weights and thresholds. The research results show that the PSO-BP model of Phyllostachys edulis' thermal conductivity is superior to the standard BP network model in several aspects, such as generalization performance, fitting precision, training, error validation, etc., which provides a new method for the application of intelligent information processing technology in bamboo material analyses.
Key words: Phyllostachys edulis' thermal conductivity    neural network    particle swarm optimization(PSO)    nonlinear fitting    

在竹材加工过程中,干燥、热压胶合等热处理对加工效率、能源消耗、产品质量有着重要影响。导热系数表征物体以纯热传导方式传递能量的能力,是非常重要的热物性参数。对竹材导热系数的研究,是竹材热处理的重要理论基础之一(于文吉,2002张齐生,2003)。近年来,有学者采用试验测量和理论模型研究竹材的导热系数:隋仲义等(2006)检测了竹木复合材料的横向导热系数,分析了导热系数与材料内部结构的关系;夏经国(1990)测定了7种竹材的导热系数,采用最小二乘法拟合出竹材导热系数的理论计算公式;董丽君(2009)对竹材软化过程中的热学参数进行了系统研究,提出基于傅里叶导热定律的竹材径向导热系数表达式;吴舒辞等(2004)指出毛竹(Phyllostachys edulis)导热系数在70 ℃附近会出现峰值,该研究结果对于竹材加工生产有一定指导意义。然而,由于竹材由天然高分子有机物聚合而成,具有各向异性,其导热系数与竹材物理化学特性呈非线性变化关系。现有研究成果大多采用多元线性回归分析方法,该方法适用于线性关系好的研究对象,但定量分析竹材导热系数会有一定局限性。同时,由于涉及较多影响因子,传统分析方法拟合出的数学关系式非常复杂,计算量较大。而根据热运动规律建立理论模型涉及竹材的微观结构。据此,刘帅等(2011)提出毛竹导热系数标准BP神经网络模型,弥补了线性分析方法的不足,并为解决不确定的非线性问题提供了新的思路。

粒子群算法(particle swarm optimization, PSO)由电气工程师Russell Eberhart和社会心理学家James Kennedy于1995年提出,其思想来源于动物群体和进化计算理论。作为一种群体智能优化方法,PSO适用于求解大量非线性、不可微和多峰值的复杂优化问题(Kennedy et al., 1995Eberhart et al., 2001)。BP(back propagation)神经网络的训练可转化成一种函数优化问题,即寻找最优的连接权值,使所训练神经网络的输出值与目标值之差达到最小。本研究采用BP神经网络拟合毛竹导热系数与密度、温度的复杂非线性关系,在此基础上,引入PSO算法优化BP神经网络的结构、权值及阈值,利用其高度的收敛性提高单一BP网络模型的拟合精度,并将结果与文献(刘帅等,2011)做比较。

1 材料与方法 1.1 试验材料及试验测量

试材采集于湖南省株洲市龙头铺镇新龙山村的毛竹林,为3~4年生毛竹材。在样竹地上部分距离地面0.1 m处向上锯取若干个完整竹节的竹段,将竹青和竹黄刨去,制成一组直径为1 cm、厚度为0.2 cm的圆形纽扣状试样。

借助JR-2激光热导测试仪,采用激光闪光法(刘雄飞等,2000)测试出不同温度下的毛竹热扩散率,并使用日本理学株式会社(Rigaku Corporation)生产的Themoflex热分析仪测量毛竹比热和毛竹标准气干密度。利用换算公式将热扩散率α、比热Cp和密度ρ换算成导热系数λ,换算公式为:

(1)
1.2 试验数据预处理

按照上述试验方法,测得本文所需的试验数据范围:温度T=30~100 ℃,密度ρ=0.631~0.838 g·cm-3,导热系数λ=0.197~0.434 W·m-1K-1。考虑到某些热处理工艺中热流沿垂直竹纤维方向,此处毛竹导热系数测量值均为垂直竹纤维方向。将毛竹导热系数实际测量值划分为训练样本集与测试样本集,分别用于神经网络的训练和验证。为保证神经网络的收敛性和高效性,在训练前必须先对样本集数据进行严格筛选,剔除严重畸变的数据,并将数值归一化到[0, 1]之间。本研究采用如下计算公式:

(2)

式中:T为原始数据;TminTmax分别为原始数据的最小值和最大值;为归一化值。

2 毛竹导热系数的PSO-BP神经网络模型 2.1 粒子群优化算法原理

在PSO算法中,每个优化问题的解都由搜索空间中“粒子”的位置来表示,优化问题求解过程实为粒子群体在搜索空间中迭代寻优过程(刘希玉等,2008Lin et al., 2008)。设N维搜索空间中,有一个由m个粒子所组成的群体,其中第i个粒子的位置向量表示为xi=(xi1, xi2, …, xiN), i=1, 2, …, m,每个粒子另有一速度向量vi=(vi1, vi2, …, viN)用来描述粒子在搜索空间中的“飞行”状态。粒子不断调整自己的位置来搜索新解,通过适应值函数计算其适应值,并记录下搜索到的最优解pi及整个粒子群经历的最优位置pg。在每一次迭代过程中,粒子跟踪上一代的状态、自身最优位置及群体最优位置来调整当前状态,其第d维(1≤dN)速度vid及位置xid的迭代公式如下:

(3)
(4)

式中:t为迭代代数;i=1, ···, m; d=1, ···, Nw称为惯性因子,用于调节PSO算法的全局与局部寻优能力;c1c2称为加速因子,它使粒子向个体最优位置pi和群体最优位置pg加速运动;r1r2是[0, 1]区间内服从均匀分布的随机数;vid∈(-vmax, vmax), vmax是粒子最大飞行速度。迭代终止条件一般为迭代代数达到最大值和粒子群搜索到设定的最优位置。

2.2 粒子群优化BP神经网络(PSO-BP)

采用PSO算法训练BP神经网络,首先必须按照BP神经网络结构产生初始粒子种群,粒子的位置向量对应待优化的神经元连接权值和阈值;然后确定粒子的适应值,进而确定粒子的最优位置及群体的最优位置。PSO-BP中的适应值函数可选用神经网络的均方根误差RMSE:

(5)

式中:n1为训练样本数; 是第j个导热系数样本值; λj是第j个导热系数的网络输出值。神经网络的学习过程实质是粒子在搜索空间中寻找使得适应值最小的位置。PSO-BP训练过程的伪代码如下:

Algorithm 1:PSO-BP

  Procedure PSO-BP

  Begin

    根据PSO-BP的网络结构计算粒子的维数N=4×s+1,s为隐层神经元个数;

    设置合理的εtmaxε为最大训练误差,tmax为最大迭代代数;

    随机产生初始粒子群体,其中第i个粒子的位置向量xi, 速度向量vi, i=1, …, m

    训练神经网络,并计算每个粒子的初始适应值RMSEi, i=1, …, m

    迭代代数t=1;

    while(RMSEi > εt < tmax)

  Begin

    根据适应值确定粒子的最优位置pi和群体的最优位置pg

    更新粒子的速度和位置,产生新的种群:

    vid(t)=wvid(t)+c1r1[pi-xid(t)]+c2r2[pg-xid(t)],

    xid(t)=xid(t)+vid(t);

    计算新粒子群的适应值RMSEi, i=1, ..., m

    t=t+1;

  End

    输出适应值最优的粒子,作为神经网络连接权值和阈值的优化值;

End

2.3 模型建立及网络训练

毛竹导热系数作为影响竹材干燥、胶合和改性的重要热物理参数,其本身也受诸多因素的影响,包括密度、含水率、温度、孔隙率、物质成分、纹理方向、热流方向等。毛竹内部多孔,且各向异性,密度(孔隙)和含水率是影响毛竹导热能力的主要因素;外部介质温度使竹材内部各处存在含水率梯度和温度梯度,是影响毛竹热传导的重要因素;同时,受热流方向的影响,顺纹与横纹的毛竹导热系数也各不相同。可见,毛竹导热系数是一个随各影响因子动态变化的非线性函数,以竹材微观结构和导热机制为出发点的传统建模方法必然会有一定局限性。受系统论的启发,可视毛竹导热系数模型为一复杂系统,主要影响因子作为系统的输入,毛竹导热系数作为系统的输出,直接通过样本数据实现输入到输出的非线性映射,避免了系统内部复杂关系的分析过程。

人工神经网络由大量神经元相互连接而成,通过模仿人脑的信息处理方式实现高效的并行计算和逻辑操作。它无须任何先验公式,经过有限次迭代计算即可获得试验数据的内在规律,适用于非线性系统建模问题。具有“输入层-中间层-输出层”3层结构的前馈神经网络可以以任意精度逼近给定的任一非线性函数(王旭,2000),因此,本研究采用BP神经网络拟合毛竹导热系数,并通过PSO算法优化BP神经网络的参数和结构,使其能在一定范围内准确预测毛竹导热系数。

根据本研究情况,网络模型输入层神经元数设置为2,分别代表毛竹导热系数的主导影响因子密度和温度;输出层神经元数设置为1,代表毛竹导热系数;中间层即隐层的神经元数具有不确定性,但其取值对整个网络的训练效果及收敛性都会产生影响。笔者拟采用李祚泳等(2008)提出的试凑方法,选用不同数目的隐层神经元来构造网络,对每一种网络皆使用PSO-BP算法进行优化,选取训练误差最小的网络结构,以期同时完成神经网络的权值优化和结构优化。综上,本研究构建具有不同隐层神经元数s的“2-s-1”3层PSO-BP网络模型。网络模型的训练参数为:粒子种群数目m=15;加速因子c1=c2=1.2;惯性因子w=0.5;最大迭代代数tmax=500;训练误差设定值ε=10-2。根据PSO-BP模型的网络结构,粒子群搜索空间维数N的计算公式如下:

(6)

式中:s取[3, 10]中的整数;训练样本集样本数n1=20,检验样本集样本数n2=10,将其分别用于训练及验证本研究PSO-BP模型。

3 结果与分析 3.1 最优网络结构

对隐层神经元数为3~10的8种网络结构分别进行训练,输出适应值,如表 1所示。从表 1可知,当神经网络隐层具有6个神经元时,网络训练误差(适应值)最小;当隐层神经元数目过少或较多时,网络拟合不足或拟合过度,都将使得网络的误差增大。

表 1 不同网络结构的适应值 Tab.1 The fitness value of different network structures

本研究使用PSO算法优化神经网络的权值及阈值,并结合试凑法确定具有最小适应值的隐层神经元数目,以优化神经网络的结构。

3.2 模型泛化能力

经过优化的神经网络模型可以用来拟合毛竹导热系数,拟合效果用网络模型预测值与同等条件下检验样本集实测值的相关系数来衡量。图 1a为PSO-BP模型预测值与实测值的相关性,相关系数R2为0.981;作为对比,图 1b为文献(刘帅等,2011)中标准BP网络模型预测值与实测值的相关性,相关系数R2为0.928。图中良好的相关性均表明了BP神经网络在毛竹导热系数拟合计算中的可靠性,但PSO-BP网络模型较标准BP网络模型的泛化能力更强,拟合精度更高。

图 1 模型拟合值与实测值的相关性 Fig.1 The correlation of fitted and measured values

图 2所示为毛竹导热系数、密度、温度的三维散点经MATLAB插值拟合后形成的曲面图。其中,图 2a的毛竹导热系数为实测值,图 2b的毛竹导热系数为拟合值,图中曲面变化情况若要通过数学公式精确的表达出来恐怕并不容易。由图 2可知,毛竹导热系数随密度增大而增大,随温度的增加先迅速增大而后保持稳定并略微有所减小。竹材多孔,孔隙内含空气,而空气的导热系数相比竹材物质导热系数更小,因而密度越大材质越致密的竹材导热能力越强。温度由低到高增加时,竹材物质分子热运动加剧,孔隙及导管内水和空气传热增强,使得毛竹导热系数呈快速增长。但随着温度的增加,孔隙逐渐增大并伴随部分水分排出,孔隙内空气分子活动区域增大,空气导热逐渐居主导地位。因此,当温度达到70 ℃以上时,导热系数稳中有降。

图 2 毛竹导热系数三维曲面 Fig.2 The 3D surface chart of Phyllostachys edulis' thermal conductivity
3.3 模型误差分析

参照文献(蔡从中等,2009)中的方法,采用平均绝对误差、平均相对误差、全部样本平均绝对误差等指标进一步对模型的性能进行评价,分别由式(7),(8),(9)定义:

平均绝对误差:

(7)

平均相对误差:

(8)

全部样本平均绝对误差:

(9)

式中:n1为训练样本数;n2为检验样本数;是第j个样本值;λj是第j个样本的神经网络预测值。

表 2可以看出,PSO-BP模型的误差指标MAE,MRE,ASMRE均小于BP模型的误差指标,更进一步验证了PSO-BP网络模型的优越性。

表 2 误差分析 Tab.2 Error analysis
4 结论与讨论

本研究采用系统建模思想,考虑主导影响因子温度及密度,建立毛竹导热系数的PSO-BP网络模型,用以估测一定条件范围内的毛竹导热系数。该模型虽未明确给出毛竹导热系数随影响因子动态变化的具体数学公式,但却通过神经网络的训练过程将上述变化关系隐含在神经网络各个神经元的权值和阈值中。图 1图 2表 2的结果表明:在使用同样的训练样本及检验样本的情况下,PSO-BP模型相比标准BP网络具有更好的泛化性能、更高的拟合精度。

神经网络模型拟合毛竹导热系数作为一种“软测量”手段,不仅具有较高的可靠性,还能节省因大量重复的试验测量所花费的开销。后续研究工作将考虑如下几个方面:

1) 对竹材加工而言,导温系数同样是非常重要的热学参数,后续研究考虑对其进行拟合计算。

2) 本研究的测温范围限于30~100 ℃之间,超出该范围的拟合结果会出现较大的误差,因而有必要获取更大温度范围的试验测量数据用于网络模型的训练。

3) 竹材通常含有一定水分,标准气干材的含水率为12%。水的导热性能优于竹材物质及空气,试材水分含量的高低对毛竹导热系数有着至关重要的影响。本研究限于试验条件未实时跟踪试材含水率变化,因此建模时未将含水率作为系统输入,但模型的输出结果体现了水分含量变化对毛竹导热系数的影响。

4) 需要指出的是,神经网络是“暗箱”模型,虽能定量表征毛竹导热系数与影响因子的非线性关系,但要全面认识其中的规律,阐释其机制,还需在竹材微观结构、热质耦合等方面开展深入研究。

参考文献(References)
[] 蔡从中, 温玉锋, 朱星键, 等. 2009. 木材导热系数的支持向量回归预测. 重庆大学学报, 32(8): 960–964. DOI:10.11835/j.issn.1000-582X.2009.08.019
[] 董丽君. 2009. 弧状竹片展平中相关的热学及力学特性的研究. 南京林业大学硕士学位论文, 9-13. http://d.wanfangdata.com.cn/Thesis/Y1645590
[] 李祚泳, 汪嘉杨, 郭淳. 2008. PSO算法优化BP网络的新方法及仿真实验. 电子学报, 36(11): 2224–2228. DOI:10.3321/j.issn:0372-2112.2008.11.026
[] 刘帅, 吴舒辞, 沈学杰. 2011. 毛竹导热系数的神经网络预测建模. 中国农学通报, 27(31): 53–57.
[] 刘希玉, 刘弘. 2008. 人工神经网络与微粒群优化. 北京, 北京邮电大学出版社.
[] 刘雄飞, 薛健, 傅友君. 2000. 闪光法测定半透光物质热扩散率. 中南大学学报, 25(6): 510–513.
[] 隋仲义, 唐伟, 王春明, 等. 2006. 竹木复合材导热性能的研究. 林业科技, 31(1): 50–52.
[] 王旭. 2000. 人工神经元网络原理与应用. 沈阳, 东北大学出版社.
[] 吴舒辞, 喻寿益, 韩健, 等. 2004. 毛竹竹材几个热力学特性参数的测试与分析. 中南林学院学报, 25(5): 70–75.
[] 夏经国. 1990. 竹材的电阻率、导热系数的研究. 竹类研究, 2(1): 18–26.
[] 于文吉. 2002. 竹材特性研究及其进展. 世界林业研究, 15(2): 50–55.
[] 张齐生. 2003. 我国竹材加工利用要重视科学和创新. 浙江林学院学报, 20(1): 1–4.
[] Eberhart R C, Shi Y. 2001. Particle swarm optimization:developments, applications and resourses. Proc IEEE Int'l Conf on Evolutionary Computation, Seoul, Korea, 81-86. http://ieeexplore.ieee.org/document/934374/
[] Kennedy J, Eberhart R C. 1995. Particle swarm optimization. Proc IEEE Int'l Conf on Neural Networks, Perth, Australia, 1942-1948.
[] Lin Y L, Chang W D, Hsieh J G. 2008. A particle swarm optimization approach to nonlinear rational filter modeling. Expert Systems with Application, 34(2): 1194–1199. DOI:10.1016/j.eswa.2006.12.004