浙江大学学报 (农业与生命科学版)  2017, Vol. 43 Issue (1): 128-136
文章快速检索     高级检索
模糊方法改进的反向传输神经网络预测南美白对虾养殖的水质[PDF全文]
丁金婷 , 臧泽林, 黄敏    
浙江大学城市学院信息与电气工程学院, 杭州 310015
摘要: 在南美白对虾高密度、规模化围塘养殖生产中, 水质参数的监测、评价及预警是至关重要的。以杭州市某南美白对虾基地日常养殖水质为研究对象, 选取温度、pH值、溶解氧、氧化还原电位等4项指标作为预测参数, 建立拓扑结构为40-14-4的3层前馈反向传输 (back propagation, BP) 神经网络模型, 即以连续10个时间单位的预测变量为输入层, 隐含层节点数为14个, 输出层变量为温度、pH值、溶解氧和氧化还原电位。为克服传统BP神经网络存在的收敛速度慢、易陷入震荡和泛化能力不强等缺点, 采用模糊方法优化了自适应变步长BP神经网络算法, 缩短了BP神经网络的训练时间, 提高了网络收敛效率与稳定度。结果表明, 以模糊方法改进的BP神经网络 (FABPM) 方法具有收敛速度快、预测精度高、稳定度好等特点, 对选取的4项水质指标都给出了较好的训练与预测结果, 预测的平均相对误差小于2.5%,从而为水产养殖水质预测与评价提供了一种新方法。
关键词: 南美白对虾    水质预    反向传输神经网络    模糊自适应变步长算法    
Penaeus vannamei aquaculture water quality prediction based on the improved back propagation neural network
DING Jinting , ZANG Zelin, HUANG Min    
School of Information & Electrical Engineering, Zhejiang University City College, Hangzhou 310015, China
Summary: Penaeus vannamei is one of the important commercial species in the shrimp farming industry in China in virtue of its wide range of feeding, rapid growth, strong environmental tolerance and disease resistance, etc. In recent years, deteriorating water quality has caused massive financial losses to farmers, which has become one of the major bottlenecks to production output and the minimization of disruptions to production processes. In addition, with the development of aquaculture, the culture environment and water quality have been degraded greatly because of the waste-water drainage. The monitoring, evaluation and early warning of the water quality parameters in intensive and large-scale P. vannamei tanks are key areas to be considered in aquaculture development.
    According to the water quality monitoring data from one of the P. vannamei breeding base in Hangzhou, a mathematical model of multi-layer feed forward neural network was established to predict and evaluate the quality of aquaculture water. The topology of the model was 40-14-4, that was, the temperature, pH value, dissolved oxygen, and oxidation-reduction potential were the input variables in m=10 consecutive time units, the number of hidden layer nodes was 14, and the output layer was 4. In order to overcome the disadvantages of traditional back propagation (BP) neural network including slow convergence speed, easy to fall into the shock, poor generalization ability and so on, the adaptive variable step size BP-neural network learning algorithm based on the fuzzy method had been developed, which can reduce the learning time of BP-neural network, improve the convergence efficiency and network stability.
    The computed results for water quality showed good agreement with the measured values. The correlation coefficients for the temperature, pH value and the oxidation-reduction potential during the training and testing processes were better than 0.975. The comparison between the original measured and predicted values of the BP-neural network showed that the relative errors, with a few exceptions, were lower than 2.5%.
    In conclusion, the BP-neural network model can well reveal the complicated non-linear relationship between the input and output water quality variables in intensive P. vannamei tanks, and the improved BP-neural network (FABPM) method based on fuzzy method has the characteristics of fast convergence, high accuracy and good stability. It provides a new method for the prediction and evaluation of water quality in aquaculture.
Key words: Penaeus vannamei    water quality prediction    artificial neural network    adaptive variable step size algorithm    

南美白对虾 (Penaeus vannamei) 具有个体大、生长快、肉质好、适应性强等特点, 已成为我国水产养殖业主要虾类品种。浙江省杭州湾地区南美白对虾养殖面积常年稳定在105×667 m2万左右, 也已成为杭州市水产业中最重要的主导产业。近年来, 气候异常多变, 而南美白对虾养殖又要经历梅雨和台风2个发病高峰期。另外, 虾塘经过数年养殖, 逐渐呈老化状态, 各种有害细菌增加, 微量元素缺乏, 养殖环境日趋恶化, 病菌的交叉感染与内源污染进一步加剧, 使南美白对虾发病率和病死率逐年上升, 给养殖户带来巨大的经济损失, 以致制约了南美白对虾养殖业的发展。随着水产养殖技术的发展及养殖规模和养殖密度的加大, 如何减小养殖风险成了重要的课题。建立传感器组监测和调控养殖水体的水质参数成了越来越普遍的选择[1-3], 然而养殖水体具有体量大, 变化非线性等特点, 在发现水质超出报警边界时采取补救措施往往并不能及时的挽回损失, 所以为了更有效地减小养殖风险, 有必要对水质变化情况进行预测报警。

为了解决水质的预测报警问题, 很多学者做了相关的研究。刘双印等[4]通过主要成分分析, 采用最小二乘支持向量机的方法, 给出了养殖水质pH值预测模型, 可以对养殖水质的pH值进行有效的预测与报警, 但pH的单值输出显然不能满足水产养殖的需要; 胡海清等[5]采用基于LM-BP神经网络对河流水体的pH值和浊度进行了建模与预测, 模型注重使用某一时刻的参数值来推测下一时刻的参数值, 没有考虑提取参数的变化趋势, 造成预测精确度并不理想。袁琦等[6]采用自适应BP神经网络算法对养殖水质的pH进行预测, 期望通过自适应的参数调整加快网络的收敛速度, 但自适应的BP神经网络的参数难以确定, 容易陷入步长极大或极小的状态, 尚有再改进的必要。

反向传输 (back propagation, BP) 神经网络是一种非线性能力强, 预测精度高, 可实现参数自动修正、且对于全局最优解, 有良好逼近能力的算法, 已被广泛应用于各类水质预测与报警系统中。BP神经网络是一种前馈形的神经网络, 常见的3层BP神经网络包括输入层、隐含层和输出层。每一层由若干个可以完成加法和乘法运算的神经元组成, 神经元与下一层的神经元进行连接。BP神经网络可以通过模拟动物神经的兴奋、抑制信息传递的方式进行训练, 并且利用训练好的神经网络完成有效的预测。为了克服传统BP神经网络不足, 利用模糊控制理论, 采用自适应变步长算法来训练前馈人工神经网络, 以降低BP神经网络的训练时间, 提高收敛效率与网络稳定度。

本文以杭州市某南美白对虾基地日常养殖水质为研究对象, 建立了一个对养殖水质进行预测与评价的多层前馈网络输出。在训练时, 以连续多个时间点的多项水质数据同时输入神经网络, 以多项水质数据为输出进行训练。利用神经网络寻找其中水质参数在时间上变化的一般规律, 从而达到同时输出多项水质参数的目标。结果表明, 以模糊方法改进的自适应变步长BP神经网络 (FABPM-BP) 具有收敛速度快、预测精度高、稳定度好等特点, 从而为水产养殖水质预测与评价提供了一种新方法。

1 材料与方法 1.1 试验材料

本试验于浙江省杭州市北极品水产科技公司养殖基地进行, 试验使用的仪器为日本产多参数水质检测仪 (型号:U-52), 测量的数据为2014年9月12日至25日在杭州市南美白对虾养殖基地测得的12 d水质参数的数据。在众多参数中选取温度, pH值, 溶解氧 (dissolved oxygen, DO), 氧化还原电位 (oxidation-reduction potential, ORP)4项指标作为试验数据。

温度是影响水产养殖的重要物理因子之一。水温不仅影响水体水质状况, 还影响对虾的生长发育。在适合温度范围, 水温越高, 南美白对虾摄食量越大, 生长速度越快。南美白对虾生长的适宜水温为22~32 ℃。

南美白对虾养育期水质pH值应控制在7.6~8.6之间, pH值过低, 酸性水体容易致使对虾感染寄生虫病, 水体中磷酸盐溶解度受到影响, 有机物分解率减慢, 对饵料的利用率大大降低, 影响虾的正常生长。pH值过高会增大氨氮的毒性, 使对虾鳃组织遭受破坏, 呼吸功能发生阻碍, 导致窒息死亡。

溶解氧不仅是保证对虾正常生理功能和健康生长的必需物质, 也是改良水质和底质的必需物质。水体溶解氧高, 可抑制氨氮、亚硝酸盐、硫化氢等有害物质的产生, 同时可减轻它们对对虾的毒害作用, 增强对虾食欲, 提高饵料利用率, 降低虾病发生率, 促进对虾生长发育; 反之, 对虾摄食、生长、病害发生率和饵料利用率就会受到不同程度的影响。在南美白对虾养殖的全过程中水体均应保持有充足的溶解氧, 最好能保持5 mg/L以上, 一般也不能低于4 mg/L。

氧化还原电位是非常重要的水质指标之一, 它虽然不能独立反应水质的好坏, 但是能够综合其他水质指标来反应养殖系统的生态环境, 是水质变化的先行指标, 能起到一定预警功能。氧化还原电位降低, 说明水质在恶化, 提醒我们要增氧和改底了, 以提高电位, 抑制氨氮和亚硝酸盐的生成。

为了提高运算的效率, 对12 d的14 400组数据 (采样周期1 min) 进行等间隔的采样, 并且排除错误数据后, 得到219组有效数据 (采样周期1 h)。使用前面的135组数据作为训练数据, 后面的84组作为检验数据。

1.2 养殖水质BP神经网络建立

温度 (T)、pH值、溶解氧 (DO)、氧化还原电位 (ORP), 是表征养殖水质的重要参数。图 1中以同一时间的T, pH, DO, ORP为一个数据单元, 记为Dn。在实际生产中, 各个水质参数是逐渐变化的, 某一时刻参数的量都与其历史数据有着很大的关联。为了让神经网络能够根据水质参数的历史数据做出预测, 取m=9, 以连续的10组历史数据作为输入, 以下一个时刻的数据作为输出, 神经网络进行预测的函数表达式为:

${{D}_{n+1}}=F\left( {{D}_{n}}, {{D}_{n-1}}, {{D}_{n-2}}, {{D}_{n-3}}, \cdots, {{D}_{n-m}} \right)。$ (1)

式 (1) 中:F(D) 为神经网络产生的n时刻水质数据到n+1时刻水质数据的预测映射, Dn为在n时刻水质参数组的值。

图1 养殖水质BP神经网络拓扑结构 Fig. 1 Topological structure of the BP-neural network for aquaculture water quality prediction
1.2.1 隐含层节点数的确定

隐含层的节点数决定了神经网络的拟合能力, 一般来讲隐含层的节点数越多, 神经网络的拟合能力越强, 但同时训练也就越困难。隐含层节点数目前还没有成熟统一的确定方法, 但对于一般问题的隐含层节点数可以参考经验公式确定[6]

$L=\sqrt{b+c}+a。$ (2)

式 (2) 中:L为隐含层节点数, b为输入层节点数, c为输出层节点数, a为经验常数。

通过试验与比较, 选取b为40, c为4, 由此得到隐含层节点数为14。

1.2.2 数据的归一化处理

为了保证神经网络对样本具有足够的输入敏感性和良好的拟合性, 减小因数字数量级大小不同而带来的不良影响, 做如下归一化处理, 将所有数据统一映射到[0, 1]之间:

${x}'=\frac{x-{{x}_{\min }}}{{{x}_{\max }}-{{x}_{\min }}}。$ (3)

式 (3) 中:xx′分别表示变量归一化处理前、后的数值, xmax为数据中最大的数据值, xmin为数据中最小的数据值。

1.2.3 神经网络的训练过程

因为养殖水质数据的变化是一个渐变的过程, 所以神经网络可以通过过去的数据来寻找水质时间上的对应关系。为了缩短神经网络快速的训练时间, 采用图 2所示的时间串行输入模式, 即神经网络先以连续n单元的数据为输入数据, 以紧随其后的第n+1个数据为输出进行第1次训练。训练结束后, 神经网络的窗口向右移动1格, 以第n+2个数据为输出进行第2次的训练。每当窗口掠过所有的数据成为一次训练, 根据经验, 要完成一次成功的尝试, 需要上万遍的有效训练。

图2 神经网络训练过程 Fig. 2 Training process of the neural network
1.3 利用模糊方法改进的自适应变步长BP神经网络

传统的BP神经网络有着训练时间过长的不足, 训练一个相对复杂的网络可能需要十几个小时或者几天的时间, 这无疑是巨大的时间成本。为了解决这一问题, 很多学者对BP神经网络进行了改进, 其中将神经网络固定的步长改为可变化的训练步长是一种行之有效的方法。

文献[6]中, 将动量法与学习速率可变方法文献[7]结合, 利用每次训练产生的误差变化率对训练的步长进行调整, 是一种有效的方法, 但是在解决水质问题时采用串行输入的方式, 每次计算的误差是一个局部的收敛, 这就造成了严重的误差值的波动。误差的波动很可能会造成步长的不正常变化, 从而影响整个训练的稳定性。

模糊方法文献[8]是以模糊数学为基础, 把思维过程绝对化, 从而达到精确而严格的目的。本模型利用模糊算法在执行决策时的稳定性和科学性特性, 使用模糊算法调整BP神经网络中进行训练时的步长η, 达到稳定优化η值的目的, 使BP神经网络的收敛更加快速。

模糊算法以每一次神经网络训练所产生的误差信号为根据, 使用设定好的模糊算法对神经网络所处的收敛状态进行判定, 从而为神经网络的权值、偏置的修改及恶性训练 (不利于权值收敛) 的取消提供控制信号。模糊控制器的具体工作流程见图 3

图3 模糊控制器的工作流程 Fig. 3 Working process of the fuzzy controller
1.3.1 数据差分处理

判断误差收敛的位置, 一种比较常见的方法是通过误差变化的趋势来判断, 误差变化率的计算公式如下:

$\Delta =\frac{E\left( n \right)-E\left( n-1 \right)}{E\left( n \right)}。$ (4)

式 (4) 中:Δ为计算得到的误差变化率;E(n) 与E(n-1) 表示n时刻与n-1时刻神经网络训练过程中得到的误差。

为了方便进行模糊化处理, 使误差变化率映射到0-1区间:

$X\left( n \right)=\frac{\Delta }{2}+0.5=\frac{E\left( n \right)-E\left( n-1 \right)}{2E\left( n \right)}+0.5。$ (5)

式 (5) 中X(n) 为经过映射运算后得到的误差变化。

1.3.2 模糊处理

为了有效地调整步长, 必需对收敛时的状态做出判断, 故采用模糊方法, 使用图 4矩形三角形组合隶属函数对误差变化率的信号进行模糊处理。处理成为{-3, -2, -1, 0, 1, 2, 3}的“七值”信号, 分别代表了误差高速上升、误差中速上升、误差低速上升、误差稳定、误差值低速下降、误差中速下降和误差高速下降7种情况。

图4 隶属函数 Fig. 4 Membership function
1.3.3 规则库与模糊决策

与一般的模糊算法不同, 由于模型采用串行输入的训练方式, 输入的训练数据良莠不齐, 可能产生误差值的较大抖动, 于是为了消除抖动带来的不良影响, 采用概率累计的方式产生模糊控制的结果, 对于更高累计量的状态采取更激进的收敛方式。需要累积的变量见表 1, 分别对应了误差变化的7种状态。

表1 累计变量的名称以及含义 Table 1 Accumulative total variable names and meanings
点击放大

在收敛过程中, 状态的转换往往对应着累计量的重新计算, 特别是误差上升和下降采取的权值控制策略完全相反, 所以模型设计了累积的累计清零规则。变量的累计规则见表 2, 它表示信号的输入对于累计变量N(-3), N(-2), N(-1), N(0), N(+1), N(+2), N(+3) 的影响。

表2 累计变量的规则 Table 2 Total variable rules
点击放大

为了提高BP神经网络的适应能力, 模型使用概率策略进行输出, 累计的数量越大, 产生该模式的输出概率也就越大, 控制模式M(i) 的概率满足公式:

$P\left( M\left( i \right) \right)=\frac{N\left( i \right)}{\sum\limits_{k=-3}^{k=3}{N\left( k \right)}}。$ (6)

式 (6) 中:PM(i) 为模式的输出概率;N(i) 为相应累计变量的累计值;$\sum\limits_{k=-3}^{k=3}{N\left( k \right)}$为所有累计变量之和。

1.3.4 控制信号输出

网络对不同的控制模式产生不同的控制信号具体步骤见图 5, 其中a1、a2、a3是固定的模型参数, 一般有a1 < a2 < a3

图5 信号输出 Fig. 5 Signal output
2 结果与讨论 2.1 BP算法改进的效果

分别使用传统BP神经网络算法, 文献[6]中利用动量法改进的自适应变步长神经网络算法, 以及本文提出的利用模糊方法改进的自适应变步长BP神经网络算法, 采用同一组水质数据 (数据来源于2014年9月12至20日, 杭州市萧山区北极品水产科技公司南美白对虾养殖基地) 来对BP神经网络进行训练, 具体结果见表 3

表3 几种算法训练情况比较 Table 3 Training rate comparison of several algorithms
点击放大

综上分析可以得到:经过改进的神经网络能够更加有效地适应串行的输入模式, 可以减少串行输入随机性带来的不稳定性, 根据误差的变化情况调整BP网络的收敛权值, 使其值一直处于较优化的程度上。这样的好处在于模型不必通过大量的试验确定合适的收敛步长, 并且收敛速率普遍快于相对较优恒定步长的BP神经网络。

2.2 水质预测模型的结果与分析

神经网络训练的效果可以用2种指标来衡量, 一种是训练效果, 体现了神经网络对于已知的训练数据的再现情况;另一种是预测效果, 表示神经网络对于未知数据的预测情况。在不出现过度拟合的情况下, 一般而言拟合越好其神经网络的预测情况越好。但是如果权值或训练次数设置得不合理造成了过度拟合的现象, 反而会降低预测的精确度。

图 6是BP神经网络对于135个数据拟合情况。图中实线表示相应时间点选取的温度、pH值、溶解氧和氧化还原电位4个水质指标的实测数据;虚线表示相应时间点神经网络的相应输出结果;图中r为预测值与实际值的拟合优度指数;Ea为实测值与预测值的误差平均值。如果2点重合就表示BP神经网络可以提前1个时间周期 (60 min) 对水质变化进行预测。从图 6可以看到, 神经网络对4个水质参数都可以实现很好的训练, 特别是对于温度、pH值和氧化还原电位这3个指标, 不仅相关系数优于0.975, 且平均相对误差的绝对值小于12%。溶解氧 (DO) 在第70个数据时出现了明显的下降, 经过查证是因为雷雨天气导致实测值出现畸点。即使如此, 神经网络也实现了很好的训练, 这也从另一个方面说明了神经网络有着优秀的学习能力。

图6 拟合结果 Fig. 6 Outcomes of the model fitting

图 7是将余下的85个检测数据带入训练好的神经网络预测得到的数据, 其中实线表示水质的实测数据, 虚线表示水质的预测数据。如果2点重合就表示BP神经网络可以提前1个时间周期 (60 min) 对水质变化进行预测。

图7 预测效果 Fig. 7 Outcomes of the model forecast

可以看到在养殖过程中溶解氧 (DO)、pH的波动相对较小, 温度和ORP的波动比较明显, 神经网络都可以对其进行有效的预测。温度, DO, pH值的平均相对误差均在2%以内, ORP由于变化比较剧烈, 平均相对误差小于10%, 且4个水质指标预测时的平均相对误差均小于训练精度, 从一个侧面说明本文采用的基于模糊方法改进的自适应变步长BP神经网络算法具有良好的训练和预测能力。

对于养殖有重要意义的溶解氧 (DO) 是一个变化比较快速的参数, 溶解氧的含量过低会导致水产品浮头或者窒息死亡, 从图 6图 7可以看出, 溶解氧的预测值与相应的实际值基本重合, 假设当溶解氧的含量低于3.45时, 需要进行报警。根据BP神经网络水质预测模型的计算, 溶解氧在第52个采样周期时达到报警值, 比实际的情况提早报警60 min, 养殖企业就可以利用这60 min, 采取相应的手段, 减少相应的经济损失。

3 结语

以杭州市某南美白对虾基地的养殖水质为研究对象, 选取温度、pH值、溶解氧和氧化还原电位等4项指标作为预测参数, 建立了一个拓扑结构为40-14-4的3层前馈BP神经网络数学模型, 对养殖水质进行评价和预测。采用模糊方法优化了自适应变步长BP神经网络算法, 降低了传统BP神经网络训练时间, 提高收敛效率与网络稳定度, 温度、pH值和溶解氧的预测平均相对误差均小于2%, 可为水产养殖水质预警及调控提供数据技术支持。

参考文献
[1] 马从国, 赵德安, 王建国, 等.基于无线传感器网络的水产养殖池塘溶解氧智能监控系统. 农业工程学报,2015 (7):193–200.
MA C G, ZHAO D A, WANG J G, et al. Intelligent monitoring system for aquaculture dissolved oxygen in pond based on wireless sensor network. Transactions of the Chinese Society of Agricultural Engineering, 2015 (7):193–200. (in Chinese with English abstract)
[2] 张淋江, 刘志龙, 唐国盘.基于无线传感器网络的水产养殖水质监测研究. 电脑知识与技术,2015 (5):263–265.
ZHANG L J, LIU Z L, TANG G P, et al. Monitoring of water quality in aquaculture based wireless sensor networks. Computer Knowledge and Technology, 2015 (5):263–265. (in Chinese with English abstract)
[3] 潘贺, 关久念, 李太浩.基于无线传感器网络的水产养殖水环境监测系统设计与试验. 中国农机化学报,2014 (5):246–250.
PAN H, GUAN J N, LI T H, et al. Design and test of aquaculture water environment monitoring system based on wireless sensor network. Journal of Chinese Agricultural Mechanization, 2014 (5):246–250. (in Chinese with English abstract)
[4] 刘双印, 徐龙琴, 李振波, 等.基于PCA-MCAFA-LSSVM的养殖水质pH值预测模型. 农业机械学报,2014 (5):239–246.
LIU S Y, XU L Q, LI Z B, et al. Forecasting model for pH value of aquaculture water quality based on PCA-MCAFA-LSSVM. Transactions of the Chinese Society for Agricultural Machinery, 2014 (5):239–246. (in Chinese with English abstract) DOI: 10.6041/j.issn.1000-1298.2014.05.037.
[5] 胡海清, 周小丽, 宋毅.LM-BP神经网络在水质预测的应用. 微型电脑应用,2011 (9):44–46.
HU H Q, ZHOU X L, SONG Y, et al. LM-BP neural network application in water quality forecast. Microcomputer Applications, 2011 (9):44–46. (in Chinese with English abstract)
[6] 袁琦, 黄建清, 符新, 等.基于神经网络的水产养殖水质预测模型研究. 湖北农业科学,2013 (1):143–146.
YUAN Q, HUANG J Q, FU X, et al. Study on prediction model of aquaculture water quality based on artificial neural network. Hubei Agricultural Sciences, 2013 (1):143–146. (in Chinese with English abstract)
[7] 刘晋钢, 韩燮, 李华玲.BP神经网络改进算法的应用. 华北工学院学报,2002 (6):449–451.
LIU J G, HAN K, LI H L. Application of an improved arithmetic on BP-neural networks. Journal of North China Institute of Technology, 2002 (6):449–451. (in Chinese with English abstract)
[8] 林丽莉, 冯天瑾, 周文晖, 等.基于神经-模糊方法的单料烟感官质量评价专家系统. 青岛海洋大学学报 (自然科学版),2001 (6):931–936.
LIN L L, FENG T J, ZHOU W H, et al. Expert system based on neuro-fuzzy approach for sensory quality assessment of tobaccos. Journal of Ocean University of China (Natural Science), 2001 (6):931–936. (in Chinese with English abstract)