基于自组织递归模糊神经网络的PM2.5浓度预测

引用本文

周杉杉, 李文静, 乔俊飞. 基于自组织递归模糊神经网络的PM2.5浓度预测[J]. 智能系统学报, 2018, 13(4): 509-516. DOI: 10.11992/tis.201710007.

ZHOU Shanshan, LI Wenjing, QIAO Junfei. Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network[J]. CAAI Transactions on Intelligent Systems, 2018, 13(4): 509-516. DOI: 10.11992/tis.201710007.

基金项目

国家自然科学基金项目(61533002，61603009)；北京工业大学“日新人才”计划项目(2017-RX(1)-04)；北京市自然科学基金项目(4182007).

通信作者

周杉杉. E-mail：18810337855@163.com

作者简介

周杉杉，女，1992年生，硕士研究生，主要研究方向为智能信息处理与神经网络非线性系统建模。获得软件著作权1项。发表学术论文1篇;
李文静，女，1985年生，副教授，博士，主要研究方向为神经计算、人工神经网络、模式识别。主持国家自然科学基金青年项目、中国博士后第57批面上资助项目、北京市博士后科研活动经费资助项目各1项。申请美国发明专利1项。近5年来发表学术论文10余篇，其中SCI收录8篇;
乔俊飞,男,1968年生,教授,博士生导师,中国人工智能学会科普工作委员会主任,主要研究方向为智能信息处理、智能控制理论与应用。获教育部科技进步奖一等奖和北京市科学技术奖三等奖各1项。获得发明专利20余项。发表学术论文100余篇,其中被SCI收录20余篇,EI收录60余篇

文章历史

收稿日期：2017-10-17
网络出版日期：2018-03-28

Contents Abstract Full text Figures/Tables PDF

基于自组织递归模糊神经网络的PM2.5浓度预测

周杉杉^1,2, 李文静^1,2, 乔俊飞^1,2

1. 北京工业大学信息学部，北京 100124;
2. 计算智能与智能系统北京市重点实验室，北京 100124

收稿日期：2017-10-17；网络出版日期：2018-03-28

基金项目：国家自然科学基金项目(61533002，61603009)；北京工业大学“日新人才”计划项目(2017-RX(1)-04)；北京市自然科学基金项目(4182007).

作者简介：周杉杉，女，1992年生，硕士研究生，主要研究方向为智能信息处理与神经网络非线性系统建模。获得软件著作权1项。发表学术论文1篇;
李文静，女，1985年生，副教授，博士，主要研究方向为神经计算、人工神经网络、模式识别。主持国家自然科学基金青年项目、中国博士后第57批面上资助项目、北京市博士后科研活动经费资助项目各1项。申请美国发明专利1项。近5年来发表学术论文10余篇，其中SCI收录8篇;
乔俊飞,男,1968年生,教授,博士生导师,中国人工智能学会科普工作委员会主任,主要研究方向为智能信息处理、智能控制理论与应用。获教育部科技进步奖一等奖和北京市科学技术奖三等奖各1项。获得发明专利20余项。发表学术论文100余篇,其中被SCI收录20余篇,EI收录60余篇。

通信作者：周杉杉. E-mail：18810337855@163.com.

摘要：针对PM2.5浓度非线性动态变化的特点，提出了一种自组织递归模糊神经网络(self-organizing recurrent fuzzy neural network，SORFNN)方法预测PM2.5小时浓度。首先，通过分析影响PM2.5浓度的多种因素，利用主成分分析法(principal component analysis，PCA)筛选出与PM2.5浓度相关性较强的特征变量作为神经网络的输入变量。然后，根据ε准则和偏最小二乘算法(partial least squares，PLS)进行规则化层神经元的增删，实现递归模糊神经网络结构的自动调整，并采用学习率自适应的梯度下降算法调整模型中心、宽度和权值等参数，建立PM2.5预测模型。最后，利用典型非线性系统辨识和实际PM2.5浓度预测实验进行验证。实验结果表明，所设计的自组织递归模糊神经网络结构精简且预测精度高，较好地满足了PM2.5实时预测的要求。

关键词：PM2.5 预测 PCA 递归模糊神经网络自组织自适应梯度下降

Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network

ZHOU Shanshan^1,2, LI Wenjing^1,2, QIAO Junfei^1,2

1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China;
2. Beijing Key Laboratory of Computational Intelligent System, Beijing 100124, China

Abstract: To address the nonlinear dynamic variation in the concentration of fine particulate matter (PM2.5), in this paper, we propose a novel self-organizing recurrent fuzzy neural network (SORFNN) for predicting the hourly PM2.5 concentration. First, we analyzed the factors affecting PM2.5 concentration by principal component analysis to identify the characteristic variables and used them as input variables in the neural network. Next, we added or deleted a nerve cell to the regularized layer, based on the ε criterion and partial least squares algorithm, to automatically adjust the recurrent fuzzy neural network. In addition, we applied the adaptive gradient descent algorithm to adjust parameters such as the centers, widths and weights to establish a PM2.5 model. Lastly, to verify the results, we conducted experiments in typical nonlinear system identification and actual PM2.5 concentration prediction. The experimental results show that the proposed SORFNN is compact in structure, has high prediction accuracy, and can satisfy the real-time prediction requirements of PM2.5 concentration.

Key words: PM2.5 prediction PCA recurrent fuzzy neural network self-organizing adaptive gradient descent algorithm

近年来伴随我国多个城市空气重污染事件的发生，以细颗粒物(PM2.5)为特征污染物的区域性大气环境问题逐渐引起了人们的广泛关注^[1]。2012年环保部发布了新修订的《环境空气质量标准》(GB3095—2012)，将PM2.5纳入空气质量监测范围。2013年国务院发布了《大气污染防治行动计划》，制定了明确的大气污染防治目标。但截至2016年中国环境状况公报发布的数据，全国338个地级及以上城市只有84个城市空气质量达标，以PM2.5为首要污染物的天数达到80.3%。我国城市空气污染是长期形成的复合型大气污染，治理工作还需要我们长期不懈的努力。

据研究PM2.5可以渗透到人的肺部和支气管，因此长期暴露于PM2.5环境中会增加呼吸系统和心血管疾病的发病率和死亡率^[2]。通过对太阳辐射的吸收和散射，PM2.5也会对全球气候变化产生影响，同时会影响能见度，进而影响我们的日常生活^[3]。因此，对PM2.5进行有效的预测，及时采取防控措施有重要意义。但是PM2.5的浓度既和污染源有关，又受气象条件的影响，使得预测难度较大。

目前空气质量预测方法主要有机理分析和统计模型两种。机理分析法通过研究PM2.5的形成机理，复杂的物理、化学变化来模拟其扩散过程，进而预测PM2.5的浓度。比如，Saide等^[4]利用化学传输模型，根据示踪物CO浓度与PM10/PM2.5的线性关系得到PM10/PM2.5的预测浓度，其中模型所需的排放源清单的准确性对预测结果有显著影响；Riccio等^[5]利用欧拉模型和拉格朗日模型对意大利南部某站点的PM2.5浓度变化情况进行了模拟，得出了当地PM2.5的浓度不但受本地排放源的影响，同时与周边区域的输送有关的结论。但是，大气环境是动态变化的非线性过程，理论分析复杂，机理分析建模所需的气象边界条件、排放源清单等参数难以取得，模型的适用性较难满足，不适合日常PM2.5浓度的预测。

相比于机理分析方法，统计模型更容易通过数据拟合方法建立预测模型。Chen等^[6]使用小波分解和逐步回归结合的方法来预测PM10的浓度，取得了不错的预测效果；Elbayoumi等^[7]以室外PM10、PM2.5、CO、CO₂浓度、风速、气压和相对湿度作为输入，建立多元线性回归模型(multiple linear regression，MLR)预测室内PM10和PM2.5的浓度。而PM2.5浓度变化是非线性过程，对其建立线性模型效果并不理想。

人工神经网络(artificial neural network，ANN)因其强大的非线性映射能力、自组织自学习能力，被广泛用于非线性系统的建模。Ordieres等^[8]利用多层感知器和径向基函数(radial basis function，RBF)神经网络预测PM2.5浓度，发现RBF神经网络预测结果更精确；Xu等^[9]利用回声状态网络预测上海市区PM2.5日均浓度，以更少的输入取得了比RBF更好的预测效果，但是预测精度仍需进一步提高。由于神经网络是“黑箱模型”，可解释性差，模糊系统则可以利用模糊语言处理信息，表达能力较强，因此结合两种方法的优势对PM2.5浓度进行预测成为提高预测精度的有效方法；Mishra等^[10]以CO、NO₂、O₃、SO₂、上一时刻的PM2.5浓度、温度、风速、相对湿度和露点温度作为输入，利用Takagi Sugeno型模糊神经网络预测当前时刻的PM2.5浓度，取得了比MLR和ANN更好的效果；Qiao等^[11]利用模糊神经网络建立PM2.5小时预测模型，并采用二阶梯度下降算法训练网络，预测效果比ESN和化学传输模型都要好。另外，PM2.5的浓度扩散是一个非线性动态变化的过程，受到时滞的影响。相对于前馈神经网络，递归神经网络具有动态元素，内部的反馈连接可用于记忆历史信息，更适合处理非线性动态过程。因此，本文提出采用递归模糊神经网络(recurrent fuzzy neural network，RFNN)预测PM2.5浓度。

对于神经网络而言，网络结构的大小是影响其性能的重要因素，结构优化方法主要有增长型、修剪型和增长修剪相结合等方法。而很多方法在判断是否增删神经元时需要预先设定阈值，这些阈值的设定通常凭借经验多次试凑，不能保证找到最优值^[12-14]。针对以上问题，本文提出一种神经网络结构自组织方法，采用ε准则和偏最小二乘法(partial least squares，PLS)定义增长和删减指标，使用尽量少的阈值，实现规则化层神经元的自动增删，同时采用学习率自适应的梯度下降算法对网络参数进行优化，并将该自组织递归模糊神经网络用于PM2.5浓度预测实验。

1 递归模糊神经网络

RFNN结合了神经网络与模糊系统的优点，引入的递归环节可以增加网络的动态记忆性能。文中RFNN的结构如图1所示。

	Download: JPG larger image
图 1 递归模糊神经网络结构 Fig. 1 Structure of recurrent fuzzy neural network

网络隶属函数层采用高斯函数对输入变量进行模糊化处理，如式(1)所示。在规则层引入反馈环节，通过sigmoid函数将上一时刻规则层的输出作为当前规则层的一个输入，计算过程如式(2)～(4)所示。去模糊化层和输出层如式(5)～(6)所示。

${u_{ij}}(t) = \exp [ - \frac{{{{({a_i}(t) - {c_{ij}}(t))}^2}}}{{2\sigma _{ij}^2(t)}}],\;\;\;\;j = 1,2,\cdots,m$

(1)

式中：u_ij(t)为t时刻第i个输入对应的第j个隶属函数的输出，c_ij(t)和σ_ij(t)分别为对应隶属函数的中心和宽度。

${\phi _j}(t) = {f_j}\prod\nolimits_{i = 1}^n {{u_{ij}}(t)},\;\;\;\; j=1,2,\cdots,m$

(2)

${f_j} = \frac{1}{{1 + \exp ( - {h_j})}}$

(3)

${h_j} = {\phi _j}(t - 1){\lambda _j}(t)$

(4)

式中：ϕ_j(t)是t时刻第j个规则层神经元的输出，ϕ_j(t-1)表示前一时刻规则层的输出，f_j是对应的sigmoid函数，h_j是内部变量，λ_j(t)是t时刻递归环节的反馈权值。

${\bar \phi _j}(t) = {{{\phi _j}(t)} / {\sum\limits_{j = 1}^m {{\phi _j}(t)} }}$

(5)

$y(t) = \sum\limits_{j = 1}^m {{w_j}(t){{\bar \phi }_j}(t)} $

(6)

式中：y(t)是t时刻神经网络的输出，w_j(t)是t时刻输出层与前一层的连接权值， ${\bar \phi _j}(t)$ 是去模糊化层的输出。

为了提高网络的收敛性，本文采用学习率自适应的梯度下降算法调整递归模糊神经网络的参数。

$\eta = {\eta _{\max }} - d({\eta _{\max }} - {\eta _{\min }})/D$

(7)

式中： ${\eta _{\max }}$ 和 ${\eta _{\min }}$ 分别是最大和最小学习率，d是当前迭代步数，D是总的迭代步数。在初始阶段参数调整幅度较大，利于快速寻优节省时间，随着迭代步数的增加，学习率逐渐减小，以保证网络的稳定性。

2 自组织递归模糊神经网络

神经网络的结构是影响其性能的关键因素之一，本文根据模糊规则的ε完整性准则和偏最小二乘法实现网络规则层的自组织，结构如图2所示。

	Download: JPG larger image
图 2 自组织递归模糊网络结构 Fig. 2 Structure of self-organizing RFNN

2.1 结构增长

规则层神经元的增长有两个判断标准：误差和 $\varepsilon $ 准则。

1)定义判断误差e。为了减小异常数据的影响，文中采用滑窗方法：

$e = \frac{{\displaystyle\sum\limits_{i = r - M + 1}^r {{e_i}} }}{M}$

${e_i} = \left| {y_{}^d(i) - y(i)} \right|$

式中：M是滑窗宽度。若误差e变大，则说明网络泛化性能变差，需要增加模糊规则或者修正参数。

2)根据 $\varepsilon $ 完整性准则^[15]，对于一个正常的数据分布，当输入位于[c_ij-2σ_ij，c_ij+2σ_ij]范围内时，95%的数据属于该成员函数。因此通过式(1)计算可以得到隶属函数的输出阈值为0.135 4。这个条件保证了每个输入的模糊隶属度不小于0.135 4，满足了模糊规则的 $\varepsilon $ 完整性准则。

因此，如果满足条件：

$\left\{ {\begin{array}{l} {\left| {e(t + 1)} \right| > \left| {e(t)} \right|} \\ {u(n) = \arg \max ({u_{ \bullet j}}) < 0.135\;4} \end{array}} \right.$

则说明当前网络误差变大，现有规则不能有效覆盖输入数据，需要增加规则层神经元(将规则层第n个神经元分裂为两个)。新增神经元的初始参数设置为

${{{c}}_{\rm{new}}}(t) = \frac{1}{2}({{{c}}_n}(t) + {{x}}(t))$

${{\mathbf{{{\sigma}} }}_{\rm{new}}}(t) = {{\mathbf{{\sigma}}}_n}(t)$

${{{w}}_{\rm{new}}}(t) = \frac{{e(t)}}{{{\phi _{\rm{new}}}(t)}}$

式中：c_new(t)、σ_new(t)和w_new(t)分别是新增神经元的中心、宽度和连接权值，c_n(t)和σ_n(t)是第n个神经元的中心和宽度，x(t)是当前输入样本，ϕ_new(t)是新增神经元的输出。

2.2 结构修剪

模糊神经网络规则层的删减一般根据规则层神经元对于输出层神经元的影响大小来判断。这种删减也可以理解为一种数据的降维。因此，基于数据降维的思想，本文采用偏最小二乘算法实现规则层神经元的修剪。偏最小二乘算法的一个显著特点就是允许在样本点个数少于变量个数的情况下进行回归分析。由于滑窗宽度有限，可能出现滑窗内样本个数少于规则层神经元个数(即变量个数)的情况，所以采用PLS算法正好解决这一问题。以下是删减过程的主要步骤：

首先判断误差e，如果|e(t+1)|<|e(t)|，说明当前网络性能较好。接下来通过PLS计算规则层神经元的回归系数，删除对输出影响较小的神经元以避免网络结构冗余。PLS主要计算步骤如下：

1)以滑窗内规则层神经元输出作为自变量X，网络输出层神经元作为单因变量y。X和y经标准化后的矩阵分别记为E₀和F₀。

2)从E₀和F₀分别提取第1个成分t₁和u₁。提取成分时，t₁与u₁要尽可能多地携带原数据的信息且相关性最大，从而保证自变量成分t₁对因变量成分u₁的解释性最强。如果第1个成分不能满足精度要求，则用残差矩阵E₁和F₁继续提取第2个成分，直至提取的成分个数满足算法的停止要求。

${{X}} = {{T}}{{{P}}^{\rm{T}}} + {{E}} = \sum\limits_{i = 1}^\alpha {{{{t}}_i}} {{p}}_i^{\rm{T}} + {{E}}$

$y = {{U}}{{{Q}}^{\rm{T}}} + {{F}} = \sum\limits_{i = 1}^\alpha {{{{u}}_i}} {{q}}_i^{\rm{T}} + {{F}}$

式中：T、P、E分别是自变量X的得分矩阵、负荷矩阵与残差矩阵；U、Q、F分别是因变量y的得分矩阵、负荷矩阵与残差矩阵；α是提取的成分个数。

3)通过检验交叉有效性确定最终提取的成分个数。首先从所有n个样本点中除去第i个样本点(i=1,2, $ \cdots$ ,n)，用h个成分拟合一个回归方程。将被除去的样本点i代入该回归方程，得到y在样本点i上的拟合值 ${\hat y_{h( - i)}}$ 。对i=1,2, $ \cdots$ ,n重复上述计算，则因变量y的拟合误差平方和为

${{\rm{PRESS}}_h} = \sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_{h( - i)}})}^2}}$

其次，将所有n个样本点用于拟合含h个成分的回归方程，记第i个样本点的拟合值为 ${\hat y_{hi}}$ ，得到y的误差平方和为

${{\rm{SS}}_h} = \sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_{hi}})}^2}}$

定义交叉有效性

$Q_h^2 = 1 - \frac{{{{\rm{PRESS}}_h}}}{{{{\rm{SS}}_{h - 1}}}}$

当 $Q_h^2 < 0.097\;5$ 时，增加新的成分对减少回归方程的拟合误差无明显改善，停止提取成分。

通过计算回归系数R_j，当规则层神经元的最小系数R小于阈值R_th时，则删除该神经元。

$\left\{ {\begin{array}{l} {\left| {e(t + 1)} \right| < \left| {e(t)} \right|} \\ {R = \arg \min ({R_j}) < {R_{\rm{th}}}} \end{array}} \right.$

若第j个神经元被删除，则与第j个规则层神经元欧氏距离最近的神经元参数调整为

${{{c'}}_{j'}}(t) = {{{c}}_{j'}}(t)$

${{\mathbf{{{\sigma}} '}}_{j'}}(t) = {{\mathbf{{{\sigma}}}}_{j'}}(t)$

${w'_{j'}}(t) = {w_{j'}}(t) + {{{w_j}(t){\phi _j}(t)} /{{\phi _{j'}}(t)}}$

式中：j′是与神经元j欧氏距离最近的神经元，c′_j_′、σ′_j_′、和w′_j_′分别是结构调整后神经元j′的中心、宽度和权值；c_j_′、σ_j_′、和w_j_′分别是结构调整前神经元j′的中心、宽度和权值；ϕ_j_′是神经元j′的输出。

3 实验研究 3.1 非线性系统辨识

为验证SORFNN模型的有效性，采用典型的非线性系统：

$y(t + 1) = \frac{{y(t)y(t - 1)[y(t) + 2.5]}}{{1 + {y^2}(t) + {y^2}(t - 1)}} + u(t)$

进行实验验证。其中，y(0)=0，y(1)=0，u(t)=sin(2πt/25)。非线性系统的模型为

$\hat y(t + 1) = \hat f(y(t),y(t - 1),u(t))$

(8)

因此SORFNN模型为3输入1输出，根据式(8)产生500个样本，训练数据采用前400组，后100组用于测试，为了验证神经网络的自组织结构变化，初始规则数选取较小值2。

图3给出了训练过程中规则层神经元个数的变化情况，最终神经元稳定在6个左右，表明网络结构能够动态优化，提高网络性能。图4和图5分别给出了网络训练效果和测试效果。从图中可以看出，网络在训练和测试阶段与期望输出都拟合较好。

	Download: JPG larger image
图 3 规则层神经元变化 Fig. 3 Number variation of neurons in rule layer

	Download: JPG larger image
图 4 训练效果 Fig. 4 Training results

	Download: JPG larger image
图 5 测试效果 Fig. 5 Test results

图6是样本的测试误差图，图7是测试输出与期望输出拟合的散点图。从图中可以看出网络测试误差较小，测试输出与期望输出基本拟合在一条直线上。表1给出了SORFNN与动态模糊神经网络(dynamic fuzzy neural network，DFNN)^[16]、广义动态模糊神经网络(generalized dynamic fuzzy neural network，GDFNN)^[17]和基于本文自组织方法的自组织模糊神经网络(self-organizing fuzzy neural network，SOFNN)的性能比较。

	Download: JPG larger image
图 6 测试误差 Fig. 6 Error of test

	Download: JPG larger image
图 7 测试散点图 Fig. 7 Scatter plot of test

从表1可以看出，SORFNN的测试RMSE为0.009 1，明显小于其他算法。规则层神经元个数为6，结构较为紧凑。同时，该自组织算法计算时间明显小于其他算法。对比结果表明SORFNN不仅能够获得较为精简的网络结构，而且性能同样可以满足要求。

表 1 不同算法网络性能对比 Tab.1 Performance comparison of different algorithms

其中，均方根误差RMSE和平均百分比误差APE计算公式如下：

${\rm{RMSE}} = \sqrt {\frac{{\displaystyle\sum\limits_{t = 1}^N {{{({y_d}(t) - y(t))}^2}} }}{{2N}}} $

${\rm{APE}} = \frac{1}{N}\sum\limits_{t = 1}^N {\frac{{\left| {{y_d}(t) - y(t)} \right|}}{{|{y_d}(t)|}}} \times 100\% $

3.2 PM2.5浓度预测

通过非线性系统辨识实验，验证了所设计的SORFNN模型的有效性，接下来将该模型用于同样是非线性过程的实际PM2.5浓度的小时预测。

3.2.1 数据来源

PM2.5浓度预测和分析使用的数据一般有3种：地面监测站观测数据、同期同地区的气象观测数据、高空遥感图像。目前北京市已经建立了完善的空气污染监测站，因此本次实验选用易获得的地面监测站数据和同期气象数据，以北京市朝阳区某国控空气质量监测站为研究对象，采集该站点的小时监测数据。具体数据集来源于微软的城市计算项目^[34]，该数据集采样时间为2014年5月1日—2015年4月30日，包含了4个季节的监测数据，样本内容丰富具有代表性，采样变量包括《环境空气质量标准》(GB3095—2012)中规定的6项常规监测项目CO、NO₂、SO₂、O₃、PM2.5、PM10和气象变量温度(T)、湿度(RH)、风向(WD)、风速(WS)、气压(P)、天气(W)，删除异常数据和缺失数据后获得4 000组完整数据。实验中先将样本数据随机化归一化处理，然后选择前3 000组用于网络训练并进行十折交叉验证，轮流将其中9份用作训练，1份作为测试，求其误差均值。后1 000组用于网络测试，并进行多次独立实验。这样训练样本和测试样本都包含了空气质量较好和较差时的观测数据，保证了样本的多样性。

3.2.2 特征提取

PM2.5的小时浓度与其他污染物和气象条件密切相关，陈冠益等^[18]的研究表明PM2.5浓度受温度、相对湿度、风速风向、降雨的影响显著。Zheng等^[19]的研究表明不同时刻的天气条件和SO₂、NO₂等污染物对PM2.5浓度影响较大。本文中选择当前时刻的污染物变量(CO、NO₂、SO₂、O₃、PM2.5和PM10)、当前时刻的气象因子(温度、湿度、风向、风速、气压和天气)、下一时刻的预报气象因子(温度、湿度、风向、风速、气压和天气)作为特征变量。考虑到特征变量比较多，且各个变量之间有一定相关性，若直接引入神经网络预测模型会有信息冗余，造成模型复杂度变高，影响模型预测性能。所以，采用主成分分析方法进行特征变量提取，达到数据降维的目的。本文中取累计贡献率大于0.85的变量，最终提取出8个主成分作为神经网络预测模型的输入。

3.2.3 实验结果

实验中神经网络为8输入1输出，规则层初始神经元个数为4。预测模型的评价指标采用常用的均方根误差RMSE、平均绝对误差MAE、决定系数R²、一致性指数IA^[7-8,28-29]。

${\rm{MAE}} = \frac{1}{N}\sum\limits_{i = 1}^N {\left| {{o_{i - }}{p_i}} \right|} $

${R^2} = \frac{{(\displaystyle\sum\limits_{i = 1}^N {({p_i} - \bar p)({o_i} - \bar o){)^2}} }}{{\displaystyle\sum\limits_{i = 1}^N {{{({p_i} - \bar p)}^2}\displaystyle\sum\limits_{i = 1}^N {{{({o_i} - \bar o)}^2}} } }}$

${\rm{IA}} = 1 - \frac{{\displaystyle\sum\limits_{i = 1}^N {{{({p_i} - {o_i})}^2}} }}{{\displaystyle\sum\limits_{i = 1}^N {{{(\left| {{p_i} - \bar o} \right| + \left| {{o_i} - \bar o} \right|)}^2}} }}$

式中：o_i和 $\bar o$ 分别是期望值和期望值的均值，p_i和 $\bar p$ 是预测值和预测值的均值。

图8给出了网络训练过程中规则层神经元个数的变化情况，从图中可以看出在训练过程中神经网络的结构是动态变化的，根据一段时间内样本的分布情况，神经元实现了增删调整，最终神经元个数为7个。图9给出了网络的测试效果，测试输出与期望输出拟合较好。图10是SORFNN与DFNN、GDFNN、SOFNN、SORBF方法的预测误差对比图，DFNN的误差在(–250,250)范围内，GDFNN和SORBF的误差都在(–150,250)之间，SOFNN的误差范围是(–100,250)，SORFNN的误差则在(–150,150)范围。相比其他方法，SORFNN的预测误差范围较小，分布也比较均匀集中。具体性能指标对比如表2所示。从表中可以看出，文中自组织方法有效地减小了预测模型的误差，在拟合度等方面也有所提高，是一种有效的自组织方法。

	Download: JPG larger image
图 8 规则层神经元变化 Fig. 8 Number variation of neurons in rule layer

	Download: JPG larger image
图 9 测试效果 Fig. 9 Test results

	Download: JPG larger image
图 10 测试误差 Fig. 10 Test error

表 2 不同网络性能对比 Tab.2 Performance comparison of different networks

4 结束语

通过分析PM2.5浓度变化的特点，本文提出采用自组织递归模糊神经网络来预测PM2.5浓度。经过PCA提取特征变量，实现数据降维和信息去冗余，有利于提高模型预测性能。为了解决神经网络结构优化问题，提出基于ε准则和偏最小二乘法的自组织方法，构建了自组织递归模糊神经网络模型，同时采用学习率自适应的梯度下降算法对神经网络的中心、宽度等参数进行训练，建立了PM2.5浓度预测模型。通过非线性系统辨识实验证明了该预测模型的有效性，最后将该模型用于实际问题PM2.5浓度的预测。实验结果表明该模型不仅能够获得较为精简的网络结构，而且预测精度有所提高，为PM2.5浓度预测提供了一种有效的方法。

参考文献

[1]	TAO Minghui, CHEN Liangfu, WANG Zifeng, et al. A study of urban pollution and haze clouds over northern China during the dusty season based on satellite and surface observations[J]. Atmospheric environment, 2014, 82: 183-192. DOI:10.1016/j.atmosenv.2013.10.010 (0)
[2]	QIAO Liping, CAI Jing, WANG Hongqi, et al. PM2.5 constituents and hospital emergency-room visits in Shanghai, China[J]. Environmental science and technology, 2014, 48(17): 10406-10414. DOI:10.1021/es501305k (0)
[3]	XIAO S, WANG Q Y, CAO J J, et al. Long-term trends in visibility and impacts of aerosol composition on visibility impairment in Baoji, China[J]. Atmospheric research, 2014, 149: 88-95. DOI:10.1016/j.atmosres.2014.06.006 (0)
[4]	SAIDE P E, CARMICHAEL G R, SPAK S N, et al. Forecasting urban PM10 and PM2.5 pollution episodes in very stable nocturnal conditions and complex terrain using WRF–Chem CO tracer model[J]. Atmospheric environment, 2011, 45(16): 2769-2780. DOI:10.1016/j.atmosenv.2011.02.001 (0)
[5]	RICCIO A, CHIANESE E, AGRILLO G, et al. Source apportion of atmospheric particulate matter: a joint Eulerian/Lagrangian approach[J]. Environmental science and pollution research, 2014, 21(23): 13160-13168. DOI:10.1007/s11356-013-2367-5 (0)
[6]	CHEN Yuanyuan, SHI Runhe, SHU Shijie, et al. Ensemble and enhanced PM10 concentration forecast model based on stepwise regression and wavelet analysis[J]. Atmospheric environment, 2013, 74: 346-359. DOI:10.1016/j.atmosenv.2013.04.002 (0)
[7]	ELBAYOUMI M, RAMLI N A, MD YUSOF N F F, et al. Multivariate methods for indoor PM10 and PM2.5 modelling in naturally ventilated schools buildings[J]. Atmospheric environment, 2014, 94: 11-21. DOI:10.1016/j.atmosenv.2014.05.007 (0)
[8]	ORDIERES J B, VERGARA E P, CAPUZ R S, et al. Neural network prediction model for fine particulate matter (PM2.5) on the US–Mexico border in El Paso (Texas) and Ciudad Juárez (Chihuahua)[J]. Environmental modelling and software, 2005, 20(5): 547-559. DOI:10.1016/j.envsoft.2004.03.010 (0)
[9]	XU Zhao, XIA Xiaopeng, LIU Xiangnan, et al. Combining DMSP/OLS nighttime light with echo state network for prediction of daily PM2.5 average concentrations in Shanghai, China[J]. Atmosphere, 2015, 6(10): 1507-1520. DOI:10.3390/atmos6101507 (0)
[10]	MISHRA D, GOYAL P, UPADHYAY A. Artificial intelligence based approach to forecast PM2.5 during haze episodes: a case study of Delhi, India[J]. Atmospheric environment, 2015, 102: 239-248. DOI:10.1016/j.atmosenv.2014.11.050 (0)
[11]	QIAO Junfei, CAI Jie, HAN Honggui, et al. Predicting PM_2.5 concentrations at a regional background station using second order self-organizing fuzzy neural network [J]. Atmosphere, 2017, 8(1): 10. (0)
[12]	HAN Honggui, LI Ying, GUO Yanan, et al. A soft computing method to predict sludge volume index based on a recurrent self-organizing neural network[J]. Applied soft computing, 2016, 38: 477-486. DOI:10.1016/j.asoc.2015.09.051 (0)
[13]	HAN Honggui, WANG Lidan, QIAO Junfei, et al. A spiking-based mechanism for self-organizing RBF neural networks[C]//2014 International Joint Conference on Neural Networks (IJCNN). Beijing, China, 2014: 3775–3782. (0)
[14]	HAN Honggui, WU Xiaolong, QIAO Junfei. Nonlinear systems modeling based on self-organizing fuzzy-neural-network with adaptive computation algorithm[J]. IEEE transactions on cybernetics, 2014, 44(4): 554-564. DOI:10.1109/TCYB.2013.2260537 (0)
[15]	LENG Gang, MCGINNITY T M, PRASAD G. An approach for on-line extraction of fuzzy rules using a self-organising fuzzy neural network[J]. Fuzzy sets and systems, 2005, 150(2): 211-243. DOI:10.1016/j.fss.2004.03.001 (0)
[16]	WU Shiqian, ER M J. Dynamic fuzzy neural networks-a novel approach to function approximation[J]. IEEE transactions on systems, man, and cybernetics, part B (cybernetics), 2000, 30(2): 358-364. DOI:10.1109/3477.836384 (0)
[17]	WU Shiqian, ER M J, GAO Yang. A fast approach for automatic generation of fuzzy rules by generalized dynamic fuzzy neural networks[J]. IEEE transactions on fuzzy systems, 2001, 9(4): 578-594. DOI:10.1109/91.940970 (0)
[18]	陈冠益, 张雯, 侯立安, 等. 天津蓟县夏季PM2.5污染特征及影响因素[J]. 天津大学学报: 自然科学与工程技术版, 2015, 48(2): 95-102. CHEN Guanyi, ZHANG Wen, HOU Lian, et al. Pollution characteristics and influence factors of PM2.5 in summer in Jixian county of Tianjin[J]. Journal of Tianjin university: science and technology, 2015, 48(2): 95-102. (0)
[19]	ZHENG Yu, YI Xiuwen, LI Ming, et al. Forecasting fine-grained air quality based on big data[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, NY, USA, 2015: 2267–2276. (0)
[20]	AZID A, JUAHIR H, TORIMAN M E, et al. Prediction of the level of air pollution using principal component analysis and artificial neural network techniques: A case study in Malaysia[J]. Water, air, and soil pollution, 2014, 225: 2063. DOI:10.1007/s11270-014-2063-1 (0)
[21]	VOUKANTSIS D, KARATZAS K, KUKKONEN J, et al. Intercomparison of air quality data using principal component analysis, and forecasting of PM₁₀ and PM2.5 concentrations using artificial neural networks, in Thessaloniki and Helsinki [J]. Science of the total environment, 2011, 409(7): 1266-1276. DOI:10.1016/j.scitotenv.2010.12.039 (0)
[22]	HAN Honggui, GUO Yanan, QIAO Junfei. Self-organization of a recurrent RBF neural network using an information-oriented algorithm[J]. Neurocomputing, 2017, 225: 80-91. DOI:10.1016/j.neucom.2016.11.010 (0)
[23]	QIAO Junfei, ZHANG Wei, HAN Honggui. Self-organizing fuzzy control for dissolved oxygen concentration using fuzzy neural network1[J]. Journal of intelligent and fuzzy systems, 2016, 30(6): 3411-3422. DOI:10.3233/IFS-152088 (0)
[24]	WANG Ning, ER M J, MENG Xianyao. A fast and accurate online self-organizing scheme for parsimonious fuzzy neural networks[J]. Neurocomputing, 2009, 72(16/17/18): 3818-3829. (0)
[25]	余辉, 袁晶, 于旭耀, 等. 基于ARMAX的 PM2.5 小时浓度跟踪预测模型[J]. 天津大学学报: 自然科学与工程技术版, 2017, 50(1): 105-111. YU Hui, YUAN Jing, YU Xuyao, et al. Tracking prediction model for PM2.5 hourly concentration based on ARMAX[J]. Journal of Tianjin university: science and technology, 2017, 50(1): 105-111. (0)
[26]	ZOU Bin, WANG Min, WAN Neng, et al. Spatial modeling of PM2.5 concentrations with a multifactoral radial basis function neural network[J]. Environmental science and pollution research, 2015, 22(14): 10395-10404. DOI:10.1007/s11356-015-4380-3 (0)
[27]	MISHRA D, GOYAL P. Neuro-fuzzy approach to forecast NO₂ pollutants addressed to air quality dispersion model over Delhi, India [J]. Aerosol and air quality research, 2016, 16(1): 166-174. (0)
[28]	FU Minglei, WANG Weiwen, LE Zichun, et al. Prediction of particular matter concentrations by developed feed-forward neural network with rolling mechanism and gray model[J]. Neural computing and applications, 2015, 26(8): 1789-1797. DOI:10.1007/s00521-015-1853-8 (0)
[29]	ELANGASINGHE M A, SINGHAL N, DIRKS K N, et al. Complex time series analysis of PM10 and PM2.5 for a coastal site using artificial neural network modelling and k-means clustering[J]. Atmospheric environment, 2014, 94: 106-116. DOI:10.1016/j.atmosenv.2014.04.051 (0)
[30]	PEREZ P, GRAMSCH E. Forecasting hourly PM2.5 in Santiago de Chile with emphasis on night episodes[J]. Atmospheric environment, 2016, 124: 22-27. DOI:10.1016/j.atmosenv.2015.11.016 (0)
[31]	WU G D, HUANG P H. A maximizing-discriminability-based self-organizing fuzzy network for classification problems[J]. IEEE transactions on fuzzy systems, 2010, 18(2): 362-373. (0)
[32]	许少鹏, 韩红桂, 乔俊飞. 基于模糊递归神经网络的污泥容积指数预测模型[J]. 化工学报, 2013, 64(12): 4550-4556. XU Shaopeng, HAN Honggui, QIAO Junfei. Prediction of activated sludge bulking based on recurrent fuzzy neural network[J]. CIESC journal, 2013, 64(12): 4550-4556. (0)
[33]	MADRIGANO J, KLOOG I, GOLDBERG R, et al. Long-term exposure to PM2.5 and incidence of acute myocardial infarction[J]. Environmental health perspectives, 2013, 121(2): 192-196. (0)
[34]	城市计算[EB/OL]. (2008–03–18). https://www.microsoft.com/en-us/research/project/城市计算. (0)