环境科学学报  2014, Vol. 34 Issue (8): 2121-2125
基于复杂网络的城市湖库藻类水华形成识别研究    [PDF全文]
邵飞, 施彦 , 王小艺, 许继平, 王立, 盛璐, 唐丽娜    
北京工商大学 计算机与信息工程学院, 北京 100048
摘要:在对城市湖库藻类水华形成机理深入研究的基础上,将提取的影响水华暴发的关键因子总磷(TP)、总氮(TN)、温度(T)、pH值、溶解氧(DO)、光照(I)、叶绿素a浓度(chl_a)作为网络节点,将影响因素间的关系抽象成网络的边,构建了藻类水华形成的有向网络模型.同时,计算了复杂网络的统计特征参数,构建了节点的关键度模型,并进行修正,进而构建了水华形成的复杂网络统计特征参数模型G,对其进行半定量分级,从而实现对水华暴发的有效识别,最后采用北京城市河湖水质的实验数据对模型进行了验证.结果表明,复杂网络统计特征参数G与叶绿素a浓度有显著的相关性,能够较好地表征水华形成过程.
关键词复杂网络    藻类水华    形成机理    水华识别    
Recognition of lake algal bloom based on complex network
SHAO Fei, SHI Yan , WANG Xiaoyi, XU Jiping, WANG Li, SHENG Lu, TANG Lina    
Beijing Technology and Business University, College of Computer and Information Engineering, Beijing 100048
Abstract: Based on the deep analysis of the formation mechanism of algal bloom in urban lakes, a directed graph model is built. In this complex network, several key factors including total phosphorus (TP), total nitrogen (TN), temperature (T), pH, dissolved oxygen (DO), illumination (I) and chl_a are extracted to be the nodes of the network, and the affective relationship between the key factors are abstracted to be the side of the network. Furthermore, the statistic characteristic parameters of this complex network are calculated and a critical model of the node is developed and corrected. Then a numerical model is built for the statistical characteristic parameter G of algal bloom. Through semi-quantitative grading of G, the valid recognition of algal bloom is achieved. Finally, this method is used and validated for water quality monitoring data of urban lake in Beijing. The result suggests that numerical model G for complex network is strongly associated with the density of chl_a, which can better present the process of bloom formation.
Key words: complex network    algal bloom    formation mechanism    bloom recognition    
1 引言(Introduction)

随着现代工业进程的快速发展,湖库水体富营养化现象日趋严重,由此而导致的藻类水华暴发给水环境的生态结构及经济社会带来了严重的影响(Cui et al., 2009).因此,对湖库藻类水华形成机理深入分析,进而对藻类水华暴发这一突发情况进行有效识别,可为相关部门采取及时有效的水华防治措施提供可靠的依据.

近年来,湖库水体富营养化机理研究在理论和实践方面都有较大的发展,研究人员已建立了大量复杂程度不同的水体富营养化机理模型(Pettersson et al., 2001).贾海峰等(2009)在参考水质WASP模型和生态CAEDYM模型的基础上,构建了藻类生态动力学模型,描述了浮游植物、氮、磷和溶解氧4个子系统的动力学关系,较好地模拟了城市水系的藻类生长状况.Chau(2005)通过不同的研究周期,基于多次输入的水动力学参数与水质参数,将PSO优化用于训练感知器模型,并实时预测了Tolo海港的赤潮现象.董硕琦等(2012)提出用Agent智能仿真技术来构建湖库藻类水华形成的机理模型,对湖库藻类生消机理进行深入研究,并对藻类生长趋势和湖库水系的能量流动和物质流动状态进行了有效分析.刘载文等(2008)从Δt时段内叶绿素的质量平衡关系入手,构建了藻类生长模型,并通过有约束非线性极小值问题的求解方法获得模型的最优参数估计值,模型很好地反映了水华暴发前的藻类生长情况,而在水华暴发阶段和衰亡阶段出现了较大偏差.王小艺等(2012a)通过设计正交试验,结合粗糙集理论确定模型输入的关键因子,构建了城市湖库蓝藻水华形成的数学机理模型,并运用改进的粒子群算法对模型参数进行非线性优化率定,发现该模型较好地模拟了蓝藻的生长变化趋势,提高了模型的适用性及有效性.

由于湖库水体是一个开放性的复杂系统,现有的藻类水华形成机理建模方法无法准确、量化地描述水华暴发期间水体营养盐之间、营养盐与外环境等之间的关系(Lee et al., 2003).复杂网络是将复杂系统中相互作用的实体抽象成节点,通过节点间的相互作用反映出复杂系统中各实体的相互作用.因此,复杂网络能把现实中的模型描述成可见的模型,并可通过数学运算得到可见的结果,从而更加系统地描述藻类水华形成过程.基于此,本文在确定影响城市湖库藻类水华形成的主要影响因子基础上,建立水华形成识别的有向复杂网络模型,通过复杂网络统计特性分析,构筑水华暴发统计特征函数G,并进行半定量的分级,进而判断藻类水华的污染程度.

2 湖库藻类水华形成识别的复杂网络建模(Complex network modeling for the lake algal bloom formation) 2.1 藻类水华形成识别模型

将复杂的湖库水体系统抽象成一个复杂网络,将影响藻类水华形成的主要影响因素抽象成网络节点,构成网络点集 V(V ={v1,v2,...,vn}),节点数为n;将各主要影响因素间的关系抽象成网络的边,构成边集 E(E ={e1,e2,...,em}),边数为m,并且 E中所有的边都有V 中两个节点与之相对应.这种由 V和E 组成的网络拓扑图G=(V,E)表示湖库水体藻类水华形成特性.根据城市湖库水华形成机理特征,将总磷(TP)、总氮(TN)、温度(T)、pH 值、溶解氧(DO)、光照(I)、藻密度(chl_a)等7个关键影响因素构成点集 V,影响因素之间的相互关系构成边集 E,其中节点数n=7,边数m=14.构建的复杂网络的藻类水华形成有向网络模型如图 1所示.

图 1 湖库藻类水华形成识别的复杂网络结构 Fig. 1 The complex network structure for the recognition the lake algal bloom formation
2.2 复杂网络统计特征参数计算

复杂系统的数据特征往往通过其对应的复杂网络模型的统计特征表现出来,因此,复杂网络的统计特性成为很多学者的关注点(Newman,2003),在此重点研究平均路径长度、聚类系数、节点介数和度分布等统计特性.其中,平均路径长度是对整个复杂网络是否会发生的相互之间关系的概率统计,聚类系数用来描述网络的耦合程度,节点介数的大小与节点在网络中的影响和作用相对应,节点的度能够反映节点的重要程度.

相关性分析是对各藻类水华形成影响因子之间的相关密切程度进行分析,以便获得各个影响因素与藻类水华形成的作用关系.为得出各影响因子之间的相关程度,对实际湖库水体数据进行实验分析,得出影响因子间的相关系数.其中,温度与叶绿素a的相关系数是0.867,说明与光照等影响因子相比,水体中叶绿素a含量受温度的影响较大;溶解氧和pH值与藻密度的相关系数也较大,说明溶解氧和pH值对水体中叶绿素a含量的影响较大;同时N、P和光照对叶绿素a的含量也有一定影响,但光照对叶绿素的直接影响相对较弱,这与实际情况完全符合.

定义各影响因子之间的相关系数为rij,各节点之间边与边的距离为Dij(i,j=1,2.....7,n=7),采用Floyd算法计算有向复杂网络边的最短距离(Tsai et al., 2004),即:

模型采用的数据为2007年阳光房模拟自然条件下的水华暴发监测数据,水样采自北京市玉渊潭公园,它是北京市二环水系的重要组成部分,具有很好的代表性.有向复杂网络边的最短距离及节点间最短距离计算结果见表 12>所示.

表 1 水华暴发识别有向复杂网络边的最短距离 Table 1 The shortest distance of the sides in the complex network for algal bloom recognition

表 2 水华暴发识别有向复杂网络节点间的最短路径 Table 2 The shortest distance of the nodes in complex network for algal bloom recognition

计算结果表明,网络中的T到pH、chl_a、DO,以及TN、DO到pH等节点上计算的边距离比其余影响因子之间的边距离小,表示此复杂网络中比较容易通过上述的转移方式来达到最短距离,即T与pH、chl_a、DO,以及pH与TN、DO等这些元素之间的相互作用容易使水体发生富营养化变化.复杂网络边的距离中“∞”和“0”代表复杂网络中不存在这两个节点的相互作用,即相互之间的边也不存在.

湖库水体在一定条件下,T、TP、pH、DO、I、TN均不需要通过其他因子而直接到达节点7(叶绿素a),即直接影响藻类水华形成.由表 2的结果得出节点之间的最短路径,根据节点vi到节点vj的平均路径长度L的公式(2)计算各节点的平均路径长度.

式中,dij为网络中节点vivj的距离,等于节点vivj之间相互连接的最短路径上的边数,节点到自身的距离为0,N为网络的节点数.

聚类系数Ci为任一节点vi与其他相连节点之间实际存在的边数EiKi个节点之间最多可能有Ki(Ki-1)/2条边的比值,可表示为:

式中, Ki是节点vi与其它节点连接的边数.整个网络的聚类系数C就是所有节点vi的聚类系数Ci的平均值.很显然,聚类系数C的范围为0≤C≤10.

2.3 水华暴发统计特征参数模型构建

为更好地体现每个节点在复杂网络中的作用,构建节点的关键度模型为:

式中,dmin即节点vi到叶绿素a计算的最短距离;λ+i和λi分别表示相应节点vi的入度和出度,节点度即节点的出度和入度的和,节点度越大就意味着该节点在整个网络中的作用越重要;Bi表示节点vi的节点介数,反应整个网络中相应节点的影响和作用(Lin,1995),节点介数越大,表明该节点在计算最短距离时被经过的次数越多,受各影响因子的综合协同作用越大,反应其在水华暴发中的作用越大.

考虑到平均路径长度和聚类系数对网络的影响,对节点的关键度模型进行二次修正,修正模型为:

式中,Ci为节点的聚类系数,表示节点vi与网络中其他节点的耦合程度,L为网络的平均路径长度.结合实际数据对复杂网络中各个参数进行分析,计算结果见表 3.

表 3 水华形成识别复杂网络的各参数值 Table 3 Various parameters of complex network for algal bloom recognition

根据表 3可以看出,各影响因子对藻类水华形成的作用程度不尽相同.考虑CiBiσi等是水华形成复杂网络特性的关键参数,构建藻类水华形成的统计特征参数模型G

式中,G是水华形成的统计特征值;σ′i为节点vi的关键度σi与节点vi的具体参数值的乘积,即σ′i=ci×σici表示节点vi的具体参数值,n为节点数,n=6.

为验证藻类水华形成的统计特征参数G值的有效性,选取2组北京城市湖库水质监测数据进行计算,8月份数据用于对模型有效性进行验证,6月份数据用于对模型稳定性进行验证,结果如图 2所示.

图 2 复杂网络统计特征参数G与叶绿素a的对比 Fig. 2 Comparison between the statistical characteristic parameters G and chl_a

图 2可知,藻类水华形成的统计特征参数G与表征水华形成的叶绿素a具有显著相关性.表明统计特征计算能够很好地反映藻类水华形成过程,同时相比叶绿素a还提供了更丰富的信息,在藻类生长的适应时期,G值变化比较平缓.在藻类生长的萌芽阶段,水体内部发生着显著的变化,能量流动呈现不稳定态势,G值在此萌芽阶段也同样出现震荡的不稳定现象.在水华暴发阶段,叶绿素a的数量发生突变,呈指数增长,此时G值也发生突变,以同样的方式增长.同时,由图 2b可知,G值的变化超前于叶绿素的变化,分析可知,所构建的水华形成复杂网络的统计特征参数G的数值模型能够较好地反应水华形成情况,能够较快地识别水华现象和水华暴发趋势.此外,对第2组数据的验证结果显示,该模型具有较好的稳定性.根据北京城市湖库水体特点及大量实验数据分析得出,叶绿素浓度超过40 μg · L-1可认为水华暴发(王小艺等,2012b).根据G值与叶绿素的对应关系及实验结果可得出表 4所示的结论.

表 4 水华形成识别复杂网络的统计特征参数G与结果验证 Table 4 Statistical characteristic parameters G and the result about identification of algal-blooms outbreak

因此,复杂网络的统计特征参数G的数值模型能够直观地反映水体中叶绿素a的变化情况.当水体中影响水华暴发的关键因子的含量发生变化或有变化趋势时,由于叶绿素a的变化存在一定的滞后性,不能够快速地反映水华暴发的情况,然而通过对参数G的计算,能够快速识别水体中叶绿素a的变化情况和变化趋势,从而为有关部门及时采取预防和治理措施提供可靠的保障.

3 结论(Conclusions)

通过对水华形成的复杂网络识别模型进行验证,结果表明,复杂网络的统计特征参数G与叶绿素a浓度有显著的相关性.在藻类生长的适应期,G值变化平缓,在萌芽阶段,G值出现波动和振荡,在水华暴发阶段,G值发生突变呈指数增长,较好地表征了水华形成过程.同时,G值变化的超前性说明G值可以更快地对水华现象进行识别,萌芽阶段G值的波动性也充分显示该参数能够对系统的微小变化做出灵敏反应.两组不同数据的模型验证结果显示,该模型具有较好的稳定性.

参考文献
[1] Chau K W. 2005. Algal bloom prediction with particle swarm optimization algorithm[J]. Lecture Notes in Computer Science, 3801: 645-650
[2] Cui G B, Liu L, Yao Q. 2009. Eutrophication Control Mechanism Research in Taihu Lake[M]. Beijing: China Water Power Press
[3] 董硕琦, 刘载文, 王小艺. 2012. 基于多Agent的湖库水华形成机理建模[J]. 复杂系统与复杂性科学,9(1): 59-63
[4] 贾海峰, 张岩松, 何苗. 2009. 北京水系多藻类生态动力学模型[J]. 清华大学学报(自然科学版), 49(12): 1992-1996
[5] Lee J H W, Huang Y, Dickman M D, et al. 2003. Neural network modelling of coastal algal blooms[J]. Ecological Modelling, 159(2/3): 179-201
[6] Lin S. 1995. Computer solutions of the traveling salesman problem [J]. Bell System Technical Journal, 44(10): 2245-2269
[7] Liu Z W, Wu Q M, Wang X Y. 2008. Algae growth model based on optimized theories and its application in water bloom prediction [J]. Journal of Chemical Industry and Engineering (China), 59(7): 1869-1873
[8] Newman M E J. 2003. The structure and function of complex networks[J]. SIAM Review, 45(2): 167-256
[9] Pettersson L H, Durand D, Johannessen O M, et al. 2001. Monitoring and model predictions of harmful algae blooms in Norwegian waters//IEEE 2001 International Geoscience and Remote Sensing Symposium. Sydney, NSW: IEEE. 3: 1146-1148
[10] Tsai C F, Tsai C W, Tseng C C. 2004. A new hybrid heuristic approach for solving large traveling salesman problem[J]. Information Sciences, 166(1/4): 67-81
[11] 王小艺, 唐丽娜, 刘载文, 等. 2012a. 城市湖库蓝藻水华形成机理[J]. 化工学报, 63(5): 1492-1497
[12] 王小艺, 赵晓平, 刘载文,等. 2012b. 城市湖库蓝藻水华形成机理综合建模研究[J]. 环境科学学报, 32(7): 1677-1683