中国海洋大学学报自然科学版  2019, Vol. 49 Issue (1): 69-76  DOI: 10.16441/j.cnki.hdxb.20170428

引用本文  

李修竹, 苏荣国, 张传松, 等. 基于支持向量机的长江口及其邻近海域叶绿素a浓度预测模型[J]. 中国海洋大学学报(自然科学版), 2019, 49(1): 69-76.
LI Xiu-Zhu, SU Rong-Guo, ZHANG Chuan-Song, et al. A Chl-a Prediction Model Based on Support Vector Machine in Yangtze River Estuaries and Its Adjacent Sea Areas[J]. Periodical of Ocean University of China, 2019, 49(1): 69-76.

基金项目

国家重点研究发展计划项目(2016YFC1402101;2016YFC1400602)资助
Supported by the National Key Research and Development Program(2016YFC1402101;2016YFC1400602)

通讯作者

苏荣国, E-mail:surongguo@ouc.edu.cn

作者简介

李修竹(1993-),女,硕士生,主要研究方向海洋污染生态研究。E-mail:1143877751@qq.com

文章历史

收稿日期:2017-12-15
修订日期:2018-02-01
基于支持向量机的长江口及其邻近海域叶绿素a浓度预测模型
李修竹1 , 苏荣国1 , 张传松1 , 石晓勇1,2     
1. 中国海洋大学化学化工学院,山东 青岛 266100;
2. 国家海洋局海洋减灾中心, 北京 100194
摘要:本文基于长江口及其邻近海域2015年3月和7月的现场调查数据,选取水温、盐度、总氮(TN)、总磷(TP)、溶解氧和有色溶解有机物(CDOM)特征吸收系数aCDOM(355)、aCDOM(455)作为输入变量,叶绿素a浓度作为输出变量,应用支持向量机回归(SVR)算法建立模型并预测长江口邻近海域叶绿素a的浓度。结果表明,SVR构建的叶绿素a预测模型得到的预测值和实测值有很好的一致性,在0.01的显著性水平下,训练集和验证集的Pearson相关性系数分别达到0.886和0.840,均方误差MSE分别为0.024 0和0.041 8,能够较为准确预测叶绿素a浓度,研究结果可为我国近海生态环境监测提供技术支持。
关键词支持向量机    长江口    叶绿素a    预测    

随着沿海地区经济的飞速发展,大量工业废水和污染物排放入海,导致近岸海域富营养化严重,赤潮频发。赤潮对生态环境和人类健康造成巨大破坏,打破了海域生态系统平衡,并给水产养殖造成了巨大损失,引起了国内外的广泛关注[1-2]。因此,对水体富营养化进行早期预测很有必要。众所周知,海洋生态系统十分复杂,各因素之间的相互作用及其动态变化过程未被完全知晓,制约了传统的生态水动力模型的发展[3]

近年来,数据智能技术在预测模型中兴起,主要包括遗传算法[4]、人工神经网络[5]、多项式回归[6]、灰色理论[7]等方法。许多学者运用这些方法对能反映近岸海域富营养化状况的叶绿素a进行预测,并取得了一定成果。其中,BP神经网络(BP-ANN)在叶绿素a浓度预测中运用最广,实例最多。但是神经网络的经验风险最小化是基于样本够多的情况,在处理小样本和多变量数据时,并不能很好的保证模型的泛化能力,存在过拟合现象,即样本数较少时,预测结果不能保证。

支持向量机(SVM)是根据Vapnik[8]建立的统计学理论为基础,遵循结构风险最小化原理建立的一种处理数据方法。该方法通过引用核函数,实现了在小样本、非线性的条件下提高模型预测的准确性,避免了BP-ANN局部最优和收敛时长等问题,弥补了神经网络的不足。

长江口海域生态环境复杂多样[9],随着人类活动的增加,长江口邻近海域富营养化严重,赤潮频发,渔业环境质量下降,严重影响了江苏沿岸经济的发展,因此对该海域进行环境预测技术研究很有必要。叶绿素a是反映海水中藻类生物量的重要指标,也是表征水体富营养化程度的重要指示之一[10]。预测叶绿素a浓度可以为长江口及邻近海域富营养化的监测和管理提供支持。

1 材料与方法 1.1 样品采集与预处理

本文以长江口邻近海域作为研究对象,2015年春季(3月)和夏季(7月)在长江口邻近海域(29°77′N~32°25′N,122°00′E~124°00′E),分别设置了9个断面,60个站位进行现场调查,共采集了172个表层和次表层的海水样品,具体站位分布图见图 1。具体采样方法:现场用Niskin采水器根据站位水深进行采水,采水后立即用0.7 μm的GF/F膜过滤,并用马弗炉烧过的锡纸包好冷冻保存,带回实验室测定叶绿素a浓度;过滤后的水样部分装在灼烧后的棕色玻璃瓶(已预先在400 ℃的马弗炉中灼烧4 h)中冷冻保存,用于测定有色溶解有机物(CDOM)的特征吸收系数;另一部分水样冷冻保存于100 mL的聚乙烯瓶中,用于总氮、总磷的测定。

图 1 2015年3和7月采样站位示意图 Fig. 1 Map of sampling station in March and July 2015
1.2 样品的测定

温度(T)、盐度(S)和溶解氧(DO):利用多参数水质仪CTD获得。

TN和TP:采用磷钼蓝法和Cr-Cu还原法获得,即先用含硼酸的碱性过硫酸钾氧化消解海水样品,再用Cr-Cu还原法把氧化后的硝酸盐转化为亚硝酸盐,用重氮-偶氮反应显色测定,无机磷酸盐则采用磷钼蓝法测定。

CDOM的特征吸收系数:采用紫外可见分光光度法测定,测样仪器为岛津UV-2550紫外可见分光光度计,并用5 cm石英比色皿,以Mill-Q水为参比测定过滤水样。

叶绿素a:采用分光光度法获得,先将冷冻的GF/F滤膜放入离心管,并用10 mL 90%的丙酮溶液振荡萃取得到上清液,将上清液置于1 cm比色皿中,用岛津UV-2550紫外可见分光光度计,以丙酮作参比, 测定630、647、664、750 nm的其吸光度,再利用Jeffrey-Humphrey的方程计算Chl-a的浓度[11]

$ \begin{array}{l} \;\;\;\;{\rm{Chl}} - a({\rm{mg}}\cdot{{\rm{m}}^{ - 3}}) = [11.85 \times ({A_{664}}-{A_{750}})-\\ 1.54 \times ({A_{647}}-{A_{750}}) - 0.08 \times ({A_{630}} - {A_{750}})] \times \\ {V_{\rm{e}}}/(L \times {V_{\rm{f}}})。\end{array} $

其中:L为比色皿长度;Ve为萃取液的体积;Vf为过滤水样的体积;A为吸光度。

1.3 研究方法

支持向量机(SVM)的基本思想就是利用核函数将低维输入空间中线性不可分的点映射成高维特征空间中线性可分的点,并通过划分超平面使同类样本之间相似性尽可能的大,即所有的点到分类超平面的距离最大化,达到最大泛化能力[12-13]

近海海域富营养化是一个多因素耦合、多维度协同作用的结果,关系复杂且具有多维的非线性特征[14-15],此外,叶绿素a浓度与各影响因素之间也存在典型的非线性关系,而支持向量机回归(SVR)就是将实际问题通过非线性映射到高维特征空间,并在高维特征空间构建线性回归,从而得到低维空间的非线性回归效果[16]。支持向量机回归(SVR)模型的样本只有一类,所寻求的最优平面是使所有样本点离超平面的“总偏差”最小,样本点都在两条边界之间,相当于求最大间隔的问题[17]

支持向量机回归模型与人工神经网络类似,主要包括三个部分:输入层、中间层和输出层,具体模型见图 2

图 2 支持向量机模型的输入与输出 Fig. 2 The inputs and outputs of support vector machine

其中:x1~xn为低维输入向量,即xi=(x1, x2, …, xn);K(xi, x) =〈φ(xi) ·φ(x)〉为核函数,xi为支持向量,φ向高维空间映射的函数[13],通过对应支持向量的拉格朗日系数(β1, β2, …, βn)连接输入向量和核函数就能得到线性组合函数f(x)。

$ f\left( x \right) = {\rm{sgn}}[\sum\nolimits_{i = 1}^n {\beta iK({x_i}, x) + b}]。$ (1)

两个低维空间中的输入向量经过某种变化后计算出其在高维空间中的向量内积值即为核函数,巧妙的避免了向量由低维向高维空间映射时计算复杂的问题。目前支持向量机回归模型常用的核函数有线性核函数、多项式核函数、Sigmoid核函数和径向基核函数(RBF核函数)[18]。与多项式和Sigmoid核函数相比,径向基核函数参数少,更适合非线性映射,且具有较宽的收敛域,计算更为简单,因此,径向基核函数应用更广[18-19]。本文使用径向基核函数,公式如下:

$ K\left( {{x_i}, x} \right) = {\rm{exp}}\left( { - \frac{{{{\left\| {{x_i} - x} \right\|}^2}}}{{2{g^2}}}} \right), g > 0。$ (2)

其中g为核参数。

核函数选定后,需要确定相应的最优惩罚参数c和核参数g,其中c主要表示惩罚系数,即对误差的容忍度,g表示主要影响样本数据子空间分布的复杂程度。最优惩罚参数c和核参数g通常通过K-折交叉验证法(K-fold Cross Validation)得到[20]。具体操作是将数据集平均分为K组,轮流将其中的K-1组做训练,剩余的1组做验证,在给定参数情况下,K次的结果的均值作为对模型的评价指标,对支持向量机回归模型表示为预测值和实际值的均方误差(MSE)。

2 模型的建立 2.1 参数选择及预处理

有色溶解有机物(CDOM)是水体中溶解有机物(DOM)的基本组分,能够影响控制C、N、P等元素的生物地球化学循环和浮游植物进行光合作用[21]。CDOM的特征吸收系数与水体DOM含量及性质、水体浊度等密切相关,是近海海域生态环境监测主要指标的组成部分[22]。水温(T)、盐度(S)、总氮(TN)、总磷(TP)、溶解氧(DO)这些参数是评价海水水质的基本指标,对海洋中藻类产生直接或间接影响,进而影响水体中叶绿素a浓度[23]。因此,本文确定的监测参数包括水温(T)、盐度(S)、总氮(TN)、总磷(TP)、溶解氧(DO)等基本参数和有色溶解有机物(CDOM)特征吸收系数aCDOM(355)和aCDOM(455)。

对获得的172个样品的溶解氧、盐度、温度、TN、TP、aCDOM(355)、aCDOM(455)参数及测得的Chl-a浓度进行统计分析,由表 1可知,Chl-a的平均值为1.754 9 μg·L-1,变化范围在0.013 1~18.954 4 μg·L-1之间。其中,长江口附近海域表层和近岸站位所采集的水样中Chl-a浓度较高。长江口近岸海域受陆源输入影响较大,营养物质浓度较高,浮游植物生长旺盛[24]

表 1 各参数数值特征 Table 1 The numerical characteristic of each parameter

此外,考虑到数据中各变量存在量纲和数量级的差异,对数据进行了归一化处理以减小数值差异带来的影响[25]。具体处理方法如下:

$ \mathit{x' = }\frac{{x - {x_{\min }}}}{{{x_{\max }} - {x_{\min }}}}。$

其中:x′为变量x归一化后的值;xmaxxmin分别是数据的最大值和最小值。

2.2 相关性分析

对支持向量机回归模型的输入变量进行相关性分析,去除不相关或重复变量,对于保证模型的合理性以及提高模型的准确度具有重要意义。本文以叶绿素a浓度作为输出变量,以水温、盐度、总氮(TN)、总磷(TP)、溶解氧和有色溶解有机物(CDOM)特征吸收系数aCDOM(355)、aCDOM(455)作为候选输入变量,分别计算了各输入变量与叶绿素a浓度的Pearson相关系数,结果如表 2

表 2 输入变量和叶绿素a浓度的Pearson相关系数 Table 2 The Pearson correlation coefficient between the input variables and Chl-a

表 2可知,在0.01的显著性水平下,溶解氧(DO)、温度和吸收系数aCDOM(355)、aCDOM(455)与Chl-a都具有显著相关关系,相关系数在-0.204~0.479之间,而盐度和TN与Chl-a在0.05的显著性水平下也呈显著相关关系,其相关系性系数分别为-0.192和0.165,这表明本研究所选取的大多参数与Chl-a之间具有相关性,考虑到TP与其余参数在0.01的显著性水平下有显著相关关系,且TP是海水富营养化监测的基本要素,故最终的输入变量确定为温度、盐度、总氮(TN)、总磷(TP)、溶解氧(DO)以及CDOM的紫外特征吸收系数aCDOM(355)和aCDOM(455)。

2.3 支持向量机回归模型的建立

从172个样品中随机抽取112个样品作为训练集,剩余的60个样品作验证集。以CDOM特征吸收系数aCDOM(355)和aCDOM(455)以及温度、盐度、溶解氧等7个参数作为输入变量,以叶绿素a浓度为因变量。

支持向量机回归采用台湾大学林智仁开发设计的LIBSVM-3.1工具包实现,在MATLAB平台下进行建模[26],设置核函数为径向基核函数,相应参数为最优惩罚参数c和核参数g。为确定cg最佳参数值,将cg分别取以2为底的指数离散值,代入K-CV交叉验证的算法中,选取这K个模型中平均验证准确度最大,即平均验证均方根误差(MSE)最小的那组cg值作为该模型的参数,该方法被称为“网格寻优法”(GS)。为减少计算量,把cg的间隔设置大一点,再通过最佳参数位置范围逐渐减小其范围和间隔,进行精细的网格寻优,以此确定最终的参数值。

设置模型参数c∈ {2-10, 2-9.5, …, 210},g∈ {2-10, 2-9.5, …, 210},V=10,进行网格寻优搜索,结果如图 3所示。

图 3 网格寻优搜索结果 Fig. 3 The optimization results of Grid Search

利用网格寻优搜索方法得到的最佳参数值为:c=11.313 4、g=0.5, 得到最佳参数后,核函数为,按该参数进行设置后,输入训练集数据,就能得到最终的叶绿素a浓度预测模型,该支持向量机回归模型的函数可表达为:

$\mathit{f}\left( x \right) = \sum\nolimits_{i = 1}^{52} {\beta \exp \left( { - 0.15{{\left\| {x - {x_i}} \right\|}^2}} \right)} - 0.153\;6。$

模型的性能由可决系数(R2)和均方误差(MSE)决定,R2表示测量值与预测值之间的相关性,R2越接近于1,表示样本的预测值对实测样本的拟合度越好,模型的拟合效果越好[27]。而MSE主要用来表征样本数据之间的变化程度,MSE的数值越小,表明预测模型对实验数据的分析具有越好的精确度[28],该模型的MSE=0.048 7。

2.4 训练和验证结果

将训练集和验证集数据输入上述预测模型中,对输出值进行反归一化,得到模拟的叶绿素a浓度,并将实测叶绿素a浓度值和预测值进行对比,对比结果具体见图 4所示。

图 4 实际值与预测值对比 Fig. 4 Comparison of measured values and predicted values

图 4可知,以7个变量构建的GS-SVR模型所输出的叶绿素a浓度预测值和实测值在变化趋势上大致相同。在训练集中,模拟值和实测值在0.01的显著性水平下,Pearson相关系数为0.886(p<0.01),均方误差MSE为0.024 0;而验证集中,模拟值和实测值在0.01的显著性水平下,Pearson相关系数为0.840(p<0.01),均方误差MSE为0.041 8。Zhang等[29]利用基于主成分分析(PCA)方法的模糊BP神经网络模型预测中国东海近岸海域叶绿素a浓度,预测结果与实测值具有良好一致性,MSE为0.109;Rocha等[30]通过多元线性回归方法预测了巴西帕尔杜河叶绿素a浓度,其预测结果与实测值的Pearson相关系数为0.520;Zheng等[31]利用元胞自动机与支持向量机结合(CA-SVM)建立了渤海湾叶绿素a浓度预测模型,其预测结果与实测值的R2为0.861,均方差MSE为0.190。相较而言,本研究所建立的模型得到的预测值和实测值具有更好的一致性。

2.5 输入变量相对重要性评价

根据7个输入变量建立的支持向量机回归预测模型,由w=∑s.v.βiφ(xi)求出各变量权重系数,并得到各输入变量对输出变量的重要性,将权重系数最大的温度赋值100,可以得到各输入参数的相对重要性,具体情况见表 3

表 3 输入变量的权重系数和相对重要性 Table 3 Input variables in importance according to their weights and standardized weights

由上述表 3中的权重系数可知,支持向量机回归预测模型中对叶绿素a浓度预测影响显著的输入变量是温度和CDOM特征吸收系数aCDOM(355)。海水中的浮游植物通过光合作用进行初级生产,而叶绿素a是浮游植物进行光合作用的重要色素。有研究表明,温度是一切酶促反应的控制因子,水温与浮游植物的初级生产密切相关[32],浮游植物代谢率和光合作用暗反应都取决于水温,当光照充足时, 光合作用的速度与温度呈正相关[33]

CDOM的紫外吸收系数(aCDOM(355)和aCDOM(455))对模型影响也较大,二者相对重要性为84.03。有色溶解有机物(CDOM)是水体中溶解有机物(DOM)中活跃部分,是DOM储库中主要的光吸收部分,不仅是营养物质迁移转化的重要环节,而且与水体生物活动密切相关[34-35]。CDOM的降解会形成CO2,NH4-和PO3-等无机物[36],对C、N和P元素的生物地球化学循环起着重要影响。CDOM也是异养生物的重要食物来源。同时,浮游植物光合作用和其他生物活动是水体CDOM的一个重要来源[37]。研究表明CDOM的紫外可见吸收系数与COD、叶绿素a、营养盐、DOC等水质参数有显著相关性[38-40]

除此以外,盐度和溶氧对长江口邻近海域叶绿素a浓度预测模型影响也较大。盐度是反应近岸海域特别是海域陆源输入的常用指标[41],在这些区域盐度与营养盐之间都有较为明显的负相关关系,水系混合影响着营养盐的消长[42]。溶解氧是海洋浮游植物光合作用的产物,也是海洋中影响异养生物活动的主要因素[43],是衡量海水水质的基本参数之一。

3 结语

基于CDOM特征吸收系数aCDOM(355)和aCDOM(455)以及温度、盐度、溶解氧、TP、TN等5个基本水质参数作为输入变量,利用支持向量机回归(SVR)建立了长江口邻近海域叶绿素a浓度预测模型,预测值与实测值具有较好的一致性,且温度和CDOM特征吸收系数影响显著,表明该模型能较好的预测长江口邻近海域叶绿素a浓度,可为长江口及邻近海域富营养化监测提供技术支持。

参考文献
[1]
Zhu Z Y, Wu Y, Zhang J, et al. Reconstruction of anthropogenic eutrophication in the region off the Changjiang Estuary and central Yellow Sea: From decades to centuries[J]. Continental Shelf Research, 2014, 72(1): 152-162. (0)
[2]
Pretty J N, Mason C F, Nedwell D B, et al. Environmental costs of freshwater eutrophication in England and Wales[J]. Environmental Science & Technology, 2003, 37(2): 201-208. (0)
[3]
Lee J H W, Huang Y, Dickman M, et al. Neural network modelling of coastal algal blooms[J]. Ecological Modelling, 2001, 159(2): 179-201. (0)
[4]
Sivapragasam C, Muttil N, Muthukumar S, et al. Prediction of algal blooms using genetic programming[J]. Marine Pollution Bulletin, 2010, 60(10): 1849-55. DOI:10.1016/j.marpolbul.2010.05.020 (0)
[5]
裴洪平, 罗妮娜, 蒋勇. 利用BP神经网络方法预测西湖叶绿素a的浓度[J]. 生态学报, 2004, 24(2): 246-251.
PEI Hongping, LUO Nina, JIANG Yong. Applications of back propagation neural network for predicting the concentration of chlorophyll-a in West Lake[J]. Acta Ecologica Sinica, 2004, 24(2): 246-251. (0)
[6]
徐子和. 多项式回归预测法——论正交设计原理在时序预测中的应用[J]. 预测, 1985(s1): 104-108.
XU Zihe. Multi-term regression pre-test method-Application of orthogonal Design principle in time Series Prediction[J]. Prediction, 1985(s1): 104-108. (0)
[7]
朱世平, 刘载文, 王小艺, 等. 灰色理论与神经网络在水华预测中的应用[J]. 计算机工程与应用, 2011, 47(13): 231-233.
ZHU Shiping, LIU Zaiwen, WANG Xiaoyi, et al. Gray theory and neural network prediction for water bloom[J]. Computer Engineering and Applications, 2011, 47(13): 231-233. DOI:10.3778/j.issn.1002-8331.2011.13.065 (0)
[8]
Vapnik V N. The nature of statistical learning theory[J]. IEEE Transactions on Neural Networks, 1997, 8(6): 1564-1564. DOI:10.1109/TNN.1997.641482 (0)
[9]
陆赛英, 葛人峰, 刘丽慧. 东海陆架水域营养盐的季节变化和物理输运的规律[J]. 海洋学报, 1996, 18(5): 41-51.
LU Saiying, GE Renfeng, LIU Lihui. Seasonal variation and physical transport of nutrients in the waters of the East China Sea shelf[J]. Acta Oceanologica Sinica, 1996, 18(5): 41-51. (0)
[10]
向先全, 陶建华. 基于模糊识别和遗传神经网络的渤海湾叶绿素a预测研究[J]. 海洋环境科学, 2011, 30(2): 239-242.
XIANG Xianquan, TAO Jianhua. Prediction of Chl-a in Bohai Bay by genetic neural network and fuzzy recognition[J]. Marine Environmental Sciences, 2011, 30(2): 239-242. DOI:10.3969/j.issn.1007-6336.2011.02.020 (0)
[11]
Jeffrey S W, Humphrey G F. New spectrophotometric equations for determining chlorophylls a, b, c1 and c2 in higher plants, algae and natural phytoplankton[J]. Biochem Physiol Pflanz BPP, 1975. (0)
[12]
王洪礼, 王长江, 李胜朋. 基于支持向量机理论的海水水质富营养化评价研究[J]. 海洋技术学报, 2005, 24(1): 48-51.
WANG Hongli, WANG Changjiang, LI Shengpeng. Eutro phication Evaluation of Seawarter Based on Support Vector Machine[J]. Marine Technology, 2005, 24(1): 48-51. (0)
[13]
张成成, 陈求稳, 徐强, 等. 基于支持向量基的太湖梁梅湾叶绿素a浓度预测[J]. 环境科学学报, 2013, 33(10): 2856-2861.
Zhang C C, Chen Q W, Xu Q, et al. A chlorophyll-a prediction model for Meiliang bay of Taihu based on Support Vector Machine[J]. Acta Scientiae Circumstantiae, 2013, 33(10): 2856-2861. (0)
[14]
Zeng Q, Qin L, Bao L, et al. Critical nutrient thresholds needed to control eutrophication and synergistic interactions between phosphorus and different nitrogen sources[J]. Environmental Science & Pollution Research International, 2016, 23(20): 1-12. (0)
[15]
姚云, 郑世清, 沈志良. 利用人工神经网络模型评价胶州湾水域富营养化水平[J]. 海洋环境科学, 2008, 27(1): 10-12.
YAO Yun, ZHENG Shiqing, SHEN Zhiliang. Assessment on eutrphication in Jiaozhou Bay using artificial neural networks(ANN) model[J]. Marine Environmental Sciences, 2008, 27(1): 10-12. DOI:10.3969/j.issn.1007-6336.2008.01.003 (0)
[16]
Yang S, Lu W, Chen N, et al. Support vector regression based QSPR for the prediction of some physicochemical properties of alkyl benzenes[J]. Journal of Molecular Structure Theochem, 2005, 719(1): 119-127. (0)
[17]
王炜, 林命週, 马钦忠, 等. 支持向量机及其在地震预报中的应用前景[J]. 西北地震学报, 2006, 28(1): 78-84.
WANG Wei, LIN Mingzhou, MA Qinzhong, et al. Support vector machines and its application future in earthquake predication[J]. Northwestern Seismological Journal, 2006, 28(1): 78-84. DOI:10.3969/j.issn.1000-0844.2006.01.017 (0)
[18]
Chen Y W, Lin C J. Combining SVMs with various feature selection strategies[J]. Studies in Fuzziness & Soft Computing, 2006, 207: 315-324. (0)
[19]
Keerthi S S, Lin C J. Asymptotic behaviors of support vector machines with Gaussian kernel[J]. Neural Computation, 2003, 15(7): 1667. DOI:10.1162/089976603321891855 (0)
[20]
万鹏, 王红军, 徐小力. 局部切空间排列和支持向量机的故障诊断模型[J]. 仪器仪表学报, 2012, 33(12): 2789-2795.
Wan Peng, Wang Hongjun, Xu Xiaoli. Fault diagnosis model based on local tangent space alignment and support vector machine[J]. Chinese Journal of Scientific Instrumen, 2012, 33(12): 2789-2795. DOI:10.3969/j.issn.0254-3087.2012.12.023 (0)
[21]
Whitehead R F, Mora S D, Demers S. Interactions of ultraviolet-B radiation, mixing, and biological activity on photobleaching of natural chromophoric dissolved organic matter: A mesocosm study[J]. Limnology & Oceanography, 2000, 45(2): 278-291. (0)
[22]
Stedmon C A, Markager S, Tranvik L, et al. Photochemical production of ammonium and transformation of dissolved organic matter in the Baltic Sea[J]. Marine Chemistry, 2007, 104(3): 227-240. (0)
[23]
侯延鹏.营养元素及光照、温度对铜绿微囊藻生长、越冬及复苏的影响研究[D].南昌: 南昌大学, 2008.
HOU Yanpeng. Study on the Impact of Main Nutrients and Strength of Illumination、Temperature on Growth、Over-winter and Recovery of Microcystis Aeruginosa[D]. Nanchang: Nanchang University, 2008. http://cdmd.cnki.com.cn/Article/CDMD-11902-2008142049.htm (0)
[24]
许云峰, 马春子, 霍守亮, 等. 以程海为例用支持向量机回归算法预测叶绿素a浓度[J]. 环境工程技术学报, 2012, 2(3): 207-211.
XU Yunfeng, MA Chunzi, HUO Shouliang, et al. Using support vector regression algorithm to predict chlorophyll-a concentrations with chenghai lake for example[J]. Journal of Environmental Engineering Technology, 2012, 2(3): 207-211. DOI:10.3969/j.issn.1674-991X.2012.03.031 (0)
[25]
柳小桐. BP神经网络输入层数据归一化研究[J]. 机械工程与自动化, 2010(3): 122-123.
LIU Xiaotong. Study on data normalization in BP neural network[J]. Mechanical Engineering and Automation, 2010(3): 122-123. DOI:10.3969/j.issn.1672-6413.2010.03.046 (0)
[26]
张博.混沌支持向量机风速短期预测及其在pcDuino平台实现[D].太原: 中北大学, 2014.
ZHANG Bo. Study on Short-term Wind Forecasting with Chaotic-Support Vector Machine in PcDuino Platform[D]. Taiyuan: North University of China, 2014. http://cdmd.cnki.com.cn/Article/CDMD-10110-1014218133.htm (0)
[27]
孙甜甜.冲击压路机的厚铺层压实质量检测方法研究[D].太原: 太原科技大学, 2010.
SUN Tiantian. Research on Testing Method of Compaction Quality of Thick Layer of Impact Roller[D]. Taiyuan: Taiyuan University of Science and Technology, 2010. http://cdmd.cnki.com.cn/Article/CDMD-10109-2010243660.htm (0)
[28]
安葳鹏, 孙贝. 基于分态的煤矿瓦斯浓度预测模型的研究[J]. 计算机工程与应用, 2014, 20: 233-238.
AN Weipeng, SUN Bei. Research of coalmine gas concentration prediction model based on sub-state[J]. Computer Engineering and Applications, 2014, 20: 233-238. (0)
[29]
Zhang Y, Li C, Hu X. Content prediction of Chlorophyll-a in seawater based on Fuzzy BP method[C]. //IEEE: Eighth International Conference on Fuzzy Systems and Knowledge Discovery, 2011: 611-615. http://ieeexplore.ieee.org/document/6019495/ (0)
[30]
Rocha R R A, Thomaz S M, Carvalho P, et al. Modeling chlorophyll-α and dissolved oxygen concentration in tropical floodplain lakes (Paraná River, Brazil)[J]. Brazilian Journal of Biology, 2009, 69(2): 491-500. (0)
[31]
Zheng D, Sun J, Wang A, et al. The Simulation of the chlorophyll-A by using the CA-SVM method and its application in Bohai Bay[C]. //IEEE: International Conference on Remote Sensing, Environment and Transportation Engineering, 2012: 1-5. http://ieeexplore.ieee.org/xpls/icp.jsp?arnumber=6260787 (0)
[32]
Fogg G E. Algal cultures and phytoplankton ecology[J]. Quarterly Review of Biology, 1976, 15(3-4): 453-453. (0)
[33]
Ryther J H. Photosynthesis and Fish Production in the Sea[J]. Science, 1969, 166(3901): 72-76. DOI:10.1126/science.166.3901.72 (0)
[34]
Rochelle-Newall E J, Fisher T R. Chromophoric dissolved organic matter and dissolved organic carbon in Chesapeake Bay[J]. Marine Chemistry, 2002, 77(1): 23-41. DOI:10.1016/S0304-4203(01)00073-1 (0)
[35]
Massicotte P, Markager S. Using a Gaussian decomposition approach to model absorption spectra of chromophoric dissolved organic matter[J]. Marine Chemistry, 2016, 180: 24-32. DOI:10.1016/j.marchem.2016.01.008 (0)
[36]
Jørgensen L, Stedmon C A, Kragh T, et al. Global trends in the fluorescence characteristics and distribution of marine dissolved organic matter[J]. Marine Chemistry, 2011, 126(1-4): 139-148. DOI:10.1016/j.marchem.2011.05.002 (0)
[37]
Bai Y, Su R, Shi X. Assessing the dynamics of chromophoric dissolved organic matter in the southern Yellow Sea by excitation-emission matrix fluorescence and parallel factor analysis (EEM-PARAFAC)[J]. Continental Shelf Research, 2014, 88: 103-116. DOI:10.1016/j.csr.2014.07.011 (0)
[38]
Kowalczuk P, Zablocka M, Sagan S, et al. Fluorescence measured in situ as a proxy of CDOM absorption and DOC concentration in the Baltic Sea[J]. Oceanologia, 2010, 52(3): 431-471. DOI:10.5697/oc.52-3.431 (0)
[39]
Slonecker E T, Jones D K, Pellerin B A. The new Landsat 8 potential for remote sensing of colored dissolved organic matter (CDOM)[J]. Marine Pollution Bulletin, 2016, 107(2): 518-527. DOI:10.1016/j.marpolbul.2016.02.076 (0)
[40]
刘明亮, 张运林, 秦伯强. 太湖入湖河口和开敞区CDOM吸收和三维荧光特征[J]. 湖泊科学, 2009, 21(2): 234-241.
LIU Mingliang, ZHANG Yunlin, QIN Boqiang. Characterization of absorption and three-dimensional excitation-emission matrix spectra of chromophoric dissolved organic matter at the river inflow and the open area in Lake Taihu[J]. Journal of Lake Sciences, 2009, 21(2): 234-241. DOI:10.3321/j.issn:1003-5427.2009.02.012 (0)
[41]
王磊, 林丽贞, 谢聿原, 等. 冬季东海及南海北部海域初级生产力和新生产力的初步研究[J]. 海洋学研究, 2012, 30(1): 59-66.
WANG Lei, LIN Lizhen, XIE Yuyuan, et al. A preliminary study on the new productivity and primary of East China Sea and northern South China Sea in winter[J]. Journal of Marine Sciences, 2012, 30(1): 59-66. DOI:10.3969/j.issn.1001-909X.2012.01.008 (0)
[42]
暨卫东, 黄尚高. 福建海岸带海水营养盐消长与温、盐、浮游植物的关系[J]. 热带海洋学报, 1989(2): 55-64.
JI Weidong, HUANG Shanggao. Relationship between nutrients, salinity and phytoplankton in FUJIAN Coastal Water[J]. Journal of Tropical Oceanography, 1989(2): 55-64. (0)
[43]
崔毅, 宋云利, 杨琴芳, 等. 渤海溶解氧的时空变化与环境因子和浮游植物的关系初探[J]. 渔业科学进展, 1993(14): 113-118.
CUI Yi, SONG Yunli, YANG Qinfang, et al. the temporal and spatial variation of dissolved oxygen and the relationship between phytoplankton and environment factors in BOHAI Sea[J]. Progress In Fishery Sciences, 1993(14): 113-118. (0)
A Chl-a Prediction Model Based on Support Vector Machine in Yangtze River Estuaries and Its Adjacent Sea Areas
LI Xiu-Zhu1, SU Rong-Guo1, ZHANG Chuan-Song1, SHI Xiao-Yong1,2     
1. Laboratory of Marine Chemistry Theory and Technology, Ministry of Education, Ocean University of China, Qingdao 261000, China;
2. National Marine Hazard Mitigation Service, Beijing 100194, China
Abstract: A Chl-a prediction model for Yangtze River Estuaries and its adjacent sea areas is established by using Support Vector Regression (SVR), based on the field investigation data of Yangtze River Estuaries and its adjacent sea areas in March and July 2015.The water temperature, salinity, total nitrogen(TN), total phosphorus(TP), dissolved oxygen, aCDOM(355) and aCDOM(455) were selected as input variables, and the Chl-a was selected as the output variable.The results show that the predicted values using Chl-a prediction model by SVR and measured values are in good agreement. At the significance level of 0.01, the Pearson correlation coefficients of the training set and the validation set could reach 0.886 and 0.840, and the MSE was 0.024 0 and 0.041 8, respectively. At the same time, the prediction model provides technical support for further research on coastal ecological environment.
Key words: support vector machine    Yangtze River Estuary    Chl-a    prediction