中国海洋大学学报自然科学版  2021, Vol. 51 Issue (8): 20-29  DOI: 10.16441/j.cnki.hdxb.20200243

引用本文  

刘俊超, 贾明秀, 冯卫东, 等. 基于RF和GAM模型的南极磷虾资源分布与环境因子关系研究[J]. 中国海洋大学学报(自然科学版), 2021, 51(8): 20-29.
Liu Junchao, Jia Mingxiu, Feng Weidong, et al. Spatial-Temporal Distribution of Antarctic Krill (Euphausia superba) Resource and Its Association with Environment Factors Revealed with RF and GAM Models[J]. Periodical of Ocean University of China, 2021, 51(8): 20-29.

基金项目

国家重点研究发展计划项目(YS2020YFD090016);南极磷虾高效捕捞技术研发项目(20150256)资助
Supported by the National key Research and Development Program(YS2020YFD090016);the Efficient Fishing Technology Development Program of Antarctic Krill(20150256)

通讯作者

刘长东, E-mail: changdong@ouc.edu.cn

作者简介

刘俊超(1995-),男,硕士生。E-mail: liujunchao9523@stu.ouc.edu.cn

文章历史

收稿日期:2020-08-26
修订日期:2020-11-17
基于RF和GAM模型的南极磷虾资源分布与环境因子关系研究
刘俊超1 , 贾明秀2 , 冯卫东2 , 刘长东1 , 黄六一1     
1. 中国海洋大学水产学院,山东 青岛 266003;
2. 中国水产有限公司,北京 100160
摘要:为实现南极磷虾(Euphausia superba)渔场的有效预测和高效开发。本研究基于“龙腾”号拖网渔船在南设得兰群岛和象岛周围海域2015—2019年渔捞日志的数据,应用随机森林模型(Random forest, RF)和广义可加模型(Genera-lized additive model, GAM)分析了南极磷虾单位捕捞努力量渔获量(Catch per unit effort, CPUE)与环境因子(经纬度、表层水温、水深、离岸距离)之间的关系。RF模型分析显示:经度和纬度与南极磷虾CPUE整体上呈负相关关系;随着表层水温的升高南极磷虾的CPUE呈逐渐下降趋势;当水深小于1 000 m时,南极磷虾CPUE较高,当水深大于1 000 m时,南极磷虾CPUE与水深呈负相关关系,这表明水深对南极磷虾的分布影响显著。GAM模型分析显示:南极磷虾CPUE与经度在整体上呈极显著非线性负相关关系(P < 0.01);与表层水温呈极显著线性负相关关系(P < 0.01);与纬度、水深和离岸距离呈极显著非线性相关关系(P < 0.01)。综合这两种模型结果表明,南极磷虾适宜栖息于较浅海域且在不同海域对水温的适宜性不同,CPUE高值相对集中于62.5°S—63.5°S、58°W—60°W范围。相较于GAM模型,RF模型拟合效果更优(R2 = 0.331 4±0.000 7,RMSE = 0.248 1±0.000 2)。RF模型通过计算变量重要性并排序,选择对南极磷虾的CPUE产生影响的主导因子,在研究海洋生物资源分布中有广阔的应用前景。
关键词南极磷虾    单位捕捞努力量    环境因子    随机森林模型    广义可加模型    

南极磷虾通常指南极大磷虾(Euphausia superba),是生活在南大洋中的一种甲壳类浮游生物,分布于南大洋水域,围绕南极分布,聚集区主要位于陆架边缘、冰架边缘以及岛屿周围海域[1-3]。南极磷虾作为世界上资源量最大的生物资源,也是一种潜在的巨大蛋白资源,使其成为渔业发达国家关注的焦点[4]。据估计,南极磷虾年生物量约为(6.5~10)×108 t,为实现南极磷虾资源可持续发展,南极海洋生物资源养护委员会(Convention for the Conservation of Antarctic Marine Living Resources, CCAMLR)认为,在不影响南极生态系统条件下的最大捕捞量应为(4~6)×106 t[5]。南极磷虾的商业捕捞开始于20世纪60年代,前苏联率先对南极磷虾进行资源调查与试捕。此后,日本、德国、波兰等国家相继开展了南极磷虾资源的调查研究与捕捞。中国于20世纪80年代对南极磷虾项目进行考察,2010年由“开利轮”和“安兴海轮”两艘远洋捕捞船首次进行南极磷虾的捕捞生产活动,当年累计捕捞1 956 t。2011年派出5艘远洋捕捞船捕捞南极磷虾16 014 t,之后捕捞产量逐年上升。

由于南大洋复杂的海域环境及多种环境和生物因子对南极磷虾时空分布的影响,导致其单位捕捞努力量渔获量(Catch per unit effort, CPUE)年际间波动较大,渔场变动规律不易把握。王荣等[6]研究发现南极磷虾分布具有集群性的特点,其聚集区通常由大片的集群构成,且各磷虾集群的大小不同,呈斑块状分布。环境因素对南极磷虾丰度及空间分布影响显著,如Gareth等[7]研究发现,在秋季南极Marguerite海湾南极磷虾垂直分布于整个海域。南极磷虾栖息地的水温变化通常较小。朱国平等[8]对南极磷虾渔场的大尺度分析发现,南奥克尼群岛水域南极磷虾适宜的海表温度范围为0.1~1.8 ℃,最适范围为0.5~1.5 ℃。国内外一些学者对局部海域研究时发现南极磷虾的分布具有明显的季节和年际变化,Siegel[9]认为,获取食物和躲避捕食者是导致南极磷虾季节性分布变化的主要原因,这两个因素也被认为是引起南极磷虾集群分布的主要原因[10-11]。南极海域在冬季分布着大片的海冰,有研究表明南极磷虾CPUE年际变动随海冰面积的增加而减少[12]。贾明秀等[13]在分析南极磷虾空间分布与环境因子的关系时发现,水温和水深对南极磷虾CPUE有显著影响。

广义可加模型(Generalized additive model, GAM)通过对预测变量进行独立的平滑处理,并以加性方式来计算预测变量对响应变量的影响程度,广泛应用于南极磷虾资源分布与环境因子关系的研究中[8, 14-16]。南大洋复杂的海域生态系统及多种环境和生物因子对南极磷虾分布的交互影响,GAM模型不易发现影响南极磷虾分布的主导因子。随机森林模型(Random forest, RF)通过构建一定数量的决策树并且按照相应准则对生成的决策树进行组合生成随机森林,由于生成决策树具有随机性的特点,因此可用于模拟多重非线性关系[17]。应用随机森林模型分析南极磷虾CPUE与环境因子之间的关系,能够计算各环境因子对南极磷虾CPUE的影响大小,便于发现影响南极磷虾空间分布的主导因子。

南设得兰群岛和象岛位于南极半岛北部,岛屿周边海域是南极磷虾的主要捕捞作业渔场。本研究基于中国水产有限公司“龙腾”号大型拖网加工船2015—2019年在南设得兰群岛周边海域作业的渔捞日志数据,应用RF和GAM模型分析南极磷虾CPUE与环境因子之间的关系,为南极磷虾渔场预测和高效开发提供参考。

1 材料与方法 1.1 研究区域与数据来源

本研究基于“龙腾”船2015—2019年在南极半岛北部的南设得兰群岛和象岛附近海域的渔捞日志数据。“龙腾”船为大型拖网加工船,全长107.61 m,宽19.0 m,总吨位7 765.0。渔捞日志数据包括单网次渔获量(t)、起放网经纬度、表层水温(℃)、作业水深(m)、拖速(kn)和拖曳时长(min),作业时间主要为1—7月。计算起放网位置的中点作为各网次的作业位置,捕捞作业位置如图 1所示。剔除记录错误的网次,剩余3 394个有效网次用于本研究分析。

图 1 “龙腾”渔船作业位置和对数转换的南极磷虾CPUE Fig. 1 Fishing sites of "Long-teng" boat and catch per unit effort(CPUE) by log-transformation

渔捞日志记录了可能影响南极磷虾分布的表层水温和作业位置因子,本研究还分析水深(m)、离岸距离(km)对南极磷虾分布的影响。水深数据来源于美国NOAA网站(https://www.ngdc.noaa.gov/)公布的ETOPO1数据;离岸距离通过Arcgis10.5软件的临近点分析工具获得。本研究中,CPUE定义为1 h的捕捞量(见公式1),经对数转换的CPUE基本符合正态分布(见图 2),作为模型分析的反应变量,CPUE计算公式如下:

$ {\rm{CPUE}} = \frac{C}{E}。$ (1)
图 2 经对数转换的南极磷虾CPUE直方图与正态分布曲线 Fig. 2 Histograms and normal distribution curves of catch per unit effort(CPUE) by log-transformation

式中:C为单网次总捕捞量(t);E为单网次总作业时间(h);CPUE单位为t/h。

1.2 研究方法

经度、纬度、表层水温、水深和离岸距离为模型分析的解释变量。首先采用方差膨胀因子(Variance inflation factor,VIF)对5个解释变量进行多重共线性分析,剔除显著共线的解释变量。5个变量的VIF值均小于5,多重共线性不显著(P>0.05)。

RF是由Breiman[18]开发的一种机器学习模型,对于具有多维度变量的大数据处理较快,并具有较强的适应性。由于随机森林是有许多随机构建的决策树组合在一起所得到的,因此RF模型适用于量化复杂的非线性关系,其预测结果不受异常值和冗余数据的影响,并且不会产生明显的过拟合现象。RF模型建模时由参数Ntree和mtry来定义决策树与随机特征的数量,其中,Ntree的值通过与误差的关系图来确定;本研究中,mtry不进行赋值,使用默认的输入变量数的1/3,当变量小于3时取1[19]。RF模型通过计算对输入数据集中变量的重要性进行排序,计算公式如下:

$ {V_i} = \frac{1}{{{N_{{\rm{tree}}}}}}\sum\nolimits_{v \in {S_{{X_i}}}} {G\left( {{X_i}, v} \right)}。$ (2)

式中:Vi表示解释变量Xi对随机森林模型的解释率;SXi表示Ntree棵树的随机森林中,被Xi分裂的节点集合;G(Xiv)表示Xi在分裂节点v的基尼信息增益,用以选择最大信息增益的解释变量。

GAM模型是广义线性模型(Generalized linear model, GLM)非参数扩展,通常用于构建解释变量与响应变量之间的非线性关系[20],当所构建的函数自由度为1时,表示反应变量与预测变量为线性关系;自由度大于1,表示反应变量与预测变量为非线性关系,自由度值越大则非线性关系越显著。本研究中GAM模型可表示为:

$ {\rm{log}}\left( {{\rm{CPU}}{{\rm{E}}_i}} \right) = \\{s_1}\left( {{\rm{lon}}} \right) + {s_2}\left( {{\rm{lat}}} \right) + {s_3}\left( {{\rm{temp}}} \right) + {s_4}\left( {{\rm{depth}}} \right) + {s_5}\left( {{\rm{dshore}}} \right) + {\varepsilon _i}。$ (3)

式中:s为样条函数;lon表示经度;lat表示纬度;temp表示表层水温;depth表示水深;dshore表示离岸距离;εi表示残差项。

本研究把数据按75%∶25%分为拟合数据集和测试数据集,基于模型对测试数据的拟合精度(R2)和均方根误差(RMSE)两个指标评估两个模型的拟合性能。RF和GAM模型分别使用R软件的“randomForest”和“mgcv”包计算。

2 结果 2.1 渔捞日志数据

“龙腾”渔船2015—2019年在48.1亚区的作业位置主要位于布兰斯菲尔德海峡以及象岛与南设得兰群岛之间海域,总捕捞产量为64 082 t。南极磷虾CPUE空间分布显示,布兰斯菲尔德海峡南极磷虾CPUE资源密度高于象岛与南设得兰群岛之间海域(见图 1)。象岛与南设得兰群岛之间海域捕捞次数为554次,CPUE变动范围在1.04~46.45 t/h,平均为(11.93±0.31) t/h。布兰斯菲尔德海峡捕捞次数为2 840次,CPUE变动范围在1.16~114.00 t/h,平均为(17.95±0.23) t/h。从CPUE年际均值变化来看,2015—2019年南极磷虾年平均CPUE大致呈逐渐上升趋势,其中2018和2019年CPUE值较高,分别为(21.30±0.54)和(21.42±0.46) t/h(见图 3)。南极磷虾平均CPUE随表层水温的升高近似呈逐渐降低趋势,当表层水温在-2.5~-2.0 ℃和-2.0~-1.5 ℃范围内时,南极磷虾平均CPUE值较高,分别为(19.59±0.73)和(19.12±0.41) t/h(见图 4)。当水深小于1 000 m时,南极磷虾平均CPUE值较高,表明此深度范围内南极磷虾资源密度较大(见图 5)。从南极磷虾平均CPUE与离岸距离关系来看,在离岸距离为4~14 km和44~54 km和74~94 km范围内,南极磷虾平均CPUE较高,分别为(18.21±1.06)、(19.26±0.53)和(18.26±1.63) t/h(见图 6)。

图 3 “龙腾”渔船作业海域南极磷虾年平均CPUE和作业次数比例的年间变化(均值±标准差) Fig. 3 The annual average CPUE and operation frequency ratio of krill in the Antarctic where "Long-teng" fishing boat operates(Mean±SE)
图 4 “龙腾”渔船作业海域南极磷虾平均CPUE随表层水温变化和作业次数比例变化(均值±标准差) Fig. 4 The annual average CPUE with the change of sea surface temperature and operation frequency ratio of krill in the Antarctic where "Long-teng" fishing boat operates(Mean±SE)
图 5 “龙腾”渔船作业海域南极磷虾平均CPUE随水深变化和作业次数比例变化(均值±标准差) Fig. 5 The annual average CPUE with the change of water depth and operation frequency ratio of krill in the antarctic where "Long-teng" fishing boat operates(Mean±SE)
图 6 “龙腾”渔船作业海域南极磷虾平均CPUE随离岸距离变化和作业次数比例变化(均值±标准差) Fig. 6 The annual average CPUE with the change of offshore distance and operation frequency ratio of krill in the Antarctic where "Long-teng" fishing boat operates(Mean±SE)
2.2 RF与GAM模型结果

1 000次重复交叉验证结果显示RF模型的拟合精度(R2=0.331 4±0.000 7,RMSE=0.248 1±0.000 2)优于GAM模型(R2=0.170 2±0.000 7,RMSE=0.276 1±0.000 2)(见图 7)。

( 虚线为1∶1参考线,实线为拟合的模型趋势线。The dotted line is the 1∶1 reference line, and the solid line is the fitted model trend line. ) 图 7 RF和GAM模型散点拟合图 Fig. 7 Scatterplots of RF and GAM models fitting results

RF模型通过优化Ntree值来提高模型的拟合精度和减少模型拟合时间,结果显示,当Ntree值在600之后模型误差趋于稳定(见图 8),因此在拟合模型时设置Ntree=600。RF模型利用自变量重要性评价指标和偏相关图来提高模型的可解释性。本研究中各环境因子对南极磷虾CPUE影响程度结果表明,水深、经度与纬度的变量重要性要高于表层水温和离岸距离(见图 9)。

图 8 决策树数目与误差关系图 Fig. 8 Relationship diagram of Ntree and error
( lon:经度longitude;lat:纬度latitude;temp:表层水温sea surface temperature;depth:水深water depth;dshore:离岸距离offshore distance. ) 图 9 RF模型环境因子重要性评价 Fig. 9 The importance of environment factors by RF model

RF模型的偏依赖图显示南极磷虾CPUE和各环境因子之间的相关性。结果表明:南极磷虾CPUE在研究区域随经度变大而逐渐减小(见图 10a);纬度与南极磷虾CPUE分布的关系呈波动分布,当纬度在63.0°S—63.5°S之间时,南极磷虾CPUE随纬度降低而升高,且大部分作业位置的纬度都位于该范围内,当纬度大于63.0°S时,南极磷虾CPUE随纬度降低而逐渐减小(见图 10b);表层水温与南极磷虾CPUE整体上呈负相关关系,当表层水温在-2~-1 ℃时,南极磷虾CPUE随表层水温升高而逐渐降低,当表层水温在-1~0 ℃时,南极磷虾CPUE变化不大(见图 10c);水深范围在0~1 000 m时,南极磷虾CPUE随水深增加呈逐渐增加趋势,当水深在1 000~1 500 m范围内时,南极磷虾CPUE迅速下降,当水深大于1 500 m时,水深对南极磷虾CPUE的影响程度达到最小,并基本保持不变(见图 10d);离岸距离对南极磷虾CPUE影响呈现多峰非线性关系(见图 10e)。

图 10 环境因子对CPUE影响的RF模型偏相关图 Fig. 10 The partial correlation of environment variable on RF model influenced by CPUE

GAM模型结果显示,南极磷虾CPUE与经度呈极显著负相关关系(P < 0.01,见图 11a);纬度与南极磷虾CPUE呈极显著非线性相关关系(P < 0.01,见图 11b);南极磷虾CPUE与表层水温呈极显著线性相关关系(P < 0.01,见图 11c);水深与南极磷虾CPUE呈极显著相关关系,且80%以上的作业位置水深都小于1 000 m(P < 0.01,见图 11d);当作业位置的离岸距离在5~30 km范围内时,南极磷虾CPUE与离岸距离呈极显著正相关关系,有70%以上的作业位置的离岸距离在30~60 km之间,在此范围内CPUE与离岸距离呈极显著负相关关系(P < 0.01,见图 11e)。

图 11 环境因子对CPUE影响的GAM分析结果图 Fig. 11 Plot of environment variable on GAM model influenced by CPUE
3 讨论 3.1 南极磷虾CPUE与环境因子关系

南极磷虾是一种生活于冷水环境的浮游动物,对海水温度变化极为敏感。1~2 ℃的水温变化往往会影响南极磷虾的分布[21],当水温升高后,海冰逐渐消融,南极磷虾随海冰消退而向大陆架移动;当水温下降后,南极磷虾可能仍停留在夏季的高丰度区,也可能分散到海冰下或潜伏至海底[22]。朱国平等[23]利用GAM模型分析南乔治亚岛南极磷虾渔获率与海水表温的关系,发现当海水表温在0.5~2.0 ℃范围内时,南极磷虾渔获率随表温增加而成上升趋势。Trathan等[2]认为南乔治亚岛周围南极磷虾数量与水温存在近线性关系,即当水温小于2.25 ℃时,南极磷虾高丰度出现在低水温区域。本研究RF模型结果显示南极磷虾CPUE与表层水温呈负相关关系,南极磷虾CPUE高值出现在-2~-1 ℃之间,结合南极磷虾CPUE与表层水温数据进行空间匹配发现,该水温范围内有超过95%的作业位置位于布兰斯菲尔德海峡,而在象岛与南设得兰群岛之间的作业水温大多介于-0.4~1.2 ℃之间,其原因可能是由于南极绕极流带动底层水涌升,涌升区中心水温略高于涌升区外水温,并且水温随纬度升高而降低[24]。本研究作业海区主要位于布兰斯菲尔德海峡及象岛与南设得兰群岛之间海域,在空间上具有不连续性,表明不同海域的南极磷虾对水温的适宜性不同。南极日照时间随季节变动具有很大差异,并且光照的强弱往往会影响南极磷虾的进食和新陈代谢速率。Teschke等[25]在实验室条件下对南极磷虾进行了光照模拟实验,结果表明光照对于南极磷虾生理生长会产生周期性的影响;Seear[26]从分子学角度分析发现不同光照周期对南极磷虾控制蜕壳、摄食以及游动的基因表达具有显著影响。朱国平等[23]研究发现,南极磷虾平均作业水深在500~1 000 m时,CPUE较高。在本研究中南极磷虾的作业位置主要分布在水深小于1 000 m的海域,RF和GAM模型结果都显示,当水深小于1 000 m时,南极磷虾CPUE与水深呈极显著正相关关系,水深影响光照强度,故表明水深和光照的交互作用对南极磷虾分布有显著影响。阮超等[27]研究发现南极磷虾渔场在南设得兰群岛的东北部海域较为集中(61°S—64°S、58°W—60°W)。本研究RF和GAM结果都表明,在62.5°S—63.5°S、58°W—60°W范围内,南极磷虾CPUE值相对较高,其原因可能是南设得兰群岛与南极半岛之间的洋流使得该海域浮游植物丰度增加,丰富的饵料资源促使南极磷虾密度增高。同时,南极磷虾为游泳能力较弱的浮游动物,适宜栖息于大陆架及岛屿边缘,这与之前研究结果吻合[1-3, 24]。Klevjer等[28]分析南极磷虾在斯科舍海的分布和群集特征与离岸距离的关系,将离岸距离分为四类(0~50 km、50~100 km、100~200 km、大于200 km),发现在整个调查区域内,南极磷虾生物量丰富的海域会聚集形成大而密集的群体,并且这种聚集趋势随离岸距离的减小而增大。陈吕凤等[29]在分析南设得兰群岛水域CPUE与离岸距离关系时发现,在不同水域环境下,离岸距离对南极磷虾CPUE的影响具有差异性。本研究中GAM模型结果显示南极磷虾CPUE与离岸距离在整体上呈极显著正相关关系,与之前研究结果的差异可能是由于本研究主要集中在近岸海域,研究尺度较小,无法探究离岸距离对南极磷虾分布的大尺度影响。

南极磷虾数据通常来源于科学调查数据和渔业生产数据。前者所获得的南极磷虾数据具有准确度高、调查全面及调查站位具有随机性等优点,可较准确的分析南极磷虾空间分布与环境因子之间的关系。然而,由于南极特殊的地理位置,科学调查数据一般有空间尺度较小,站位数量少及时间不连续等不足之处[16, 30]。中国自2010年开始,每年都在南极海域进行南极磷虾生产作业,同时捕捞范围不断扩大,故渔业生产数据具有时间连续性、空间尺度大、调查站位多等优点。但是,渔业生产数据测量的环境因子少、数据准确度底、调查站位密集且不具有随机性。渔业生产数据是科学调查数据的有效补充,渔业生产数据可验证基于科学调查数据模型的准确性,渔业生产数据与科学调查数据的有机结合,可更有效的分析南极磷虾分布与环境因子的关系,为南极磷虾渔场渔情预报提供更准确的科学参考。

3.2 模型分析

RF模型在环境评价和陆地生物资源研究中应用较多[16, 31-33],目前在渔业资源分布研究中应用较少。RF模型进行回归分析受离群值影响较小,在随机干扰较多的情况下表现稳健[18]。相较于传统回归方法,GAM模型被认为是一种信息更为丰富的工具[34],但GAM模型通过加性方式来计算预测变量对响应变量的影响程度,即将多个环境变量综合进行分析,在模型拟合时可能会忽略环境变量之间的交互作用,而RF模型通过构建随机决策树,在训练时能够检测环境变量之间的相互影响。本研究中GAM与RF模型预测结果的差异性可能是由于两种模型计算方法不同及环境变量之间的交互作用引起的。由于数据获取的原因,本研究只分析了经度、纬度、表层水温、水深和离岸距离对南极磷虾分布的影响。南极磷虾捕食者(如鲸)和饵料生物分布、洋流等因子都是影响南极磷虾分布的重要因子,如朱国平等[35]研究发现南极磷虾较小集群与海况呈负相关,原因可能是南极磷虾通过形成小规模集群来躲避捕食者;Atkinson等[36]发现夏季南极磷虾资源分布与浮游植物丰度呈正相关关系,因此,食物来源可能是影响南极磷虾空间分布的重要因素。随着南极磷虾数据获取的不断完善,科学数据和渔业生产数据的有机结合,影响南极磷虾分布的重要环境和生物因子不断引入到模型中,会不断提升模型的预测精度。

4 结语

本研究基于龙腾船2015—2019年的渔捞日志数据,应用RF和GAM模型分析了南设德兰群岛和象岛周围海域南极磷虾CPUE与环境因子之间的关系。GAM模型分析结果表明,南极磷虾CPUE与表层水温呈极显著线性负相关关系,与经度、纬度、水深以及离岸距离呈极显著非线性关系。RF模型结果显示,南极磷虾CPUE受水深、经度以及纬度影响较大,且RF模型拟合度优于GAM模型。综合两种模型结果表明,不同海域的南极磷虾对水温的适宜性不同,南极磷虾CPUE高值相对集中于62.5°S—63.5°S、58°W—60°W范围内,在水深小于1 000 m时,南极磷虾CPUE随水深增加而逐渐升高,表明在南设得兰群岛和象岛周围海域的南极磷虾适宜栖息于较浅海域。RF模型在量化环境因子和南极磷虾CPUE关系时,将数据分为若干组,这种典型的局部优化行为在处理多变量和变量间具有交互作用时表现优异,未来在分析海洋生物资源分布与环境因子关系研究中具有广阔应用前景。

参考文献
[1]
Ashjian C J, Davis C S, Gallager S M, et al. Distribution of larval krill and zooplankton in association with hydrography in Marguerite Bay, Antarctic Peninsula, in austral fall and winter 2001 described using the video plankton recorder[J]. Deep Sea Research Part Ⅱ Topical Studies in Oceanography, 2008, 55(3-4): 455-471. DOI:10.1016/j.dsr2.2007.11.016 (0)
[2]
Trathan P N, Brierley A S, Brandon M A, et al. Oceanographic variability and changes in Antarctic krill (Euphausia superba) abundance at South Georgia[J]. Fisheries Oceanography Euphausia superta, 2003, 12(6): 569-583. DOI:10.1046/j.1365-2419.2003.00268.x (0)
[3]
Atkinson A, Siegel V, Pakhomov A, et al. Oceanic circumpolar habitats of Antarctic krill[J]. Marine Ecology Progress, 2008, 362(1): 1-23. (0)
[4]
Nicol S, Foster J, Kawaguchi S. The fishery for Antarctic krill-recent developments[J]. Fish & Fisheries, 2012, 13(1): 30-40. (0)
[5]
CCAMLR. Commission for the Conservation of Antarctic Marine Living Resources[R]. Hobart, Australia: CCAMLR, 2012. (0)
[6]
王荣, 孙松. 南极磷虾渔业现状与展望[J]. 海洋科学, 1995(4): 28-32.
Wang Rong, Sun Song. Krill fishery in the south ocean-its present and future[J]. Marine Sciences, 1995(4): 28-32. (0)
[7]
Gareth L, Peterhw L, Timothyks, et al. Euphausiid distribution along the western Antarctic Peninsula-part B: Distribution of euphausiid aggregations and biomass, andassociations with environmental features[J]. Deep Sea Research Part Ⅱ Topical Studies in Oceanography, 2008, 55(3-4): 432-454. DOI:10.1016/j.dsr2.2007.11.014 (0)
[8]
朱国平, 朱小艳, 徐怡瑛, 等. 基于GAM模型分析夏秋季南奥克尼群岛南极磷虾渔场时空分布及与环境因子之间的关系[J]. 极地研究, 2012, 24(3): 266-273.
Zhu Guoping, Zhu Xiaoyan, Xu Yiying, et al. The spatiotemporal distribution of fishing groups for Antarctic krill(Euphausia superba) around the South Orkney Islands in austral summer-autumn and its relation to environmental factors based on a generalized additive model[J]. Chinese Journal of Polar Research, 2012, 24(3): 266-273. (0)
[9]
Siegel V. Distribution and population dynamics of Euphausia superba: Summary of recent findings[J]. Polar Biology, 2005, 29(1): 1-22. DOI:10.1007/s00300-005-0058-5 (0)
[10]
Zhou M, Dorland R D. Aggregation and vertical migration behavior of Euphausia superba[J]. Deep Sea Research Part Ⅱ Topical Studies in Oceanography, 2004, 51(17-19): 2119-2137. DOI:10.1016/j.dsr2.2004.07.009 (0)
[11]
李显森, 张吉昌, 赵宪勇, 等. 2012/2013渔季CCAMLR 48区南极磷虾(Euphausia superba)资源时空分布[J]. 渔业科学进展, 2015, 36(4): 1-9.
Li X S, Zhang J C, Zhao X Y, et al. Spatiotemporal distribution of Euphausia superba in CCAMLR area 48 during 2012/2013 fishing season[J]. Progressin Fishery Sciences, 2015, 36(4): 1-9. (0)
[12]
戴立峰, 张胜茂, 樊伟. 南极磷虾资源丰度变化与海冰和表温的关系[J]. 极地研究, 2012, 24(4): 352-360.
Dai L F, Zhang S M, Fan W. The abundance index of Antarctic krill and its relationship to sea ice and sea surface temperature[J]. Chinese Journal of Polar Research, 2012, 24(4): 352-360. (0)
[13]
贾明秀, 黄六一, 褚建伟, 等. 基于GAM和GWR模型分析环境因子对南极磷虾资源分布的非线性和非静态性影响[J]. 中国海洋大学学报(自然科学版), 2019, 49(8): 19-26.
Jia M X, Huang L Y, Chu J W, et al. Studies on the nonlinearand spatial nonstationary effects of environmental factors onthe distribution of Antarctic krill (Euphausia superba)[J]. Periodical of Ocean University of China, 2019, 49(8): 19-26. (0)
[14]
孙珊, 李显森, 赵文武, 等. 基于广义可加模型分析时空和环境因子对2013年南极磷虾资源分布的影响[J]. 水产科学, 2015, 34(10): 609-615.
Sun S, Li X S, Zhao W W, et al. Effects of temporal, spatial and environmental factors on distribution of Antarctic krill(Euphausia superba) in 2013 based on generalized additive model[J]. Fisheries Science, 2015, 34(10): 609-615. (0)
[15]
朱国平. 基于广义可加模型研究时间和环境因子对南极半岛北部南极磷虾渔场的影响[J]. 水产学报, 2012, 36(12): 1863-1871.
Zhu G P. Effects of temporal and environmental factors on the fishing ground of Antarctic krill (Euphausia superba) in the northern Antarctic Peninsula based on generalized additive model[J]. Journal of Fisheries of China, 2012, 36(12): 1863-1871. (0)
[16]
朱国平, 刘子俊, 徐国栋, 等. 基于精细尺度的冬季南乔治亚岛南极磷虾渔获率时空与环境效应[J]. 应用生态学报, 2014, 25(8): 2397-2404.
Zhu G P, Liu Z J, Xu G D, et al. Spatial-temporal and environmental effects of catch rate on Antarctic krill fishery in the South Georgia Island in the austral winter season based on the fine scale data[J]. Chinese Journal of Applied Ecology, 2014, 25(8): 2397-2404. (0)
[17]
游介文, 邹滨, 赵秀阁, 等. 基于随机森林模型的中国近地面NO2浓度估算[J]. 中国环境科学, 2019, 39(3): 969-979.
You J W, Zhou B, Zhao X G, et al. Estimating ground-level NO2 concentrations across mainland China using random forests regression modeling[J]. China Environmental Science, 2019, 39(3): 969-979. DOI:10.3969/j.issn.1000-6923.2019.03.009 (0)
[18]
Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. DOI:10.1023/A:1010933404324 (0)
[19]
李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报, 2013, 50(4): 1190-1197.
Li X H. Using "random forest" for classification and regression[J]. Chinese Journal of Applied Entomology, 2013, 50(4): 1190-1197. (0)
[20]
Guisan A, Edwards T C, Hastie T. Generalized linear and generalized additive models in studies of species distributions: Setting the scene[J]. Ecological Modelling, 2002, 157(2-3): 89-100. DOI:10.1016/S0304-3800(02)00204-1 (0)
[21]
朱国平, 朱小艳, 孟涛, 等. 2012年秋冬季利文斯顿岛南极磷虾渔业CPUE指标变动及其影响因素[J]. 大连海洋大学学报, 2013, 28(4): 399-405.
Zhu G P, Zhu X Y, Meng T, et al. The variation and impacting factorsin CPUE index of Antarctic krill fishery around Livingston Island during fall-winter of 2012[J]. Journal of Dalian Ocean University, 2013, 28(4): 399-405. DOI:10.3969/j.issn.2095-1388.2013.04.016 (0)
[22]
樊伟, 伍玉梅, 陈雪忠, 等. 南极磷虾的时空分布及遥感环境监测研究进展[J]. 海洋渔业, 2010, 32(1): 95-101.
Fan W, Wu Y M, Chen X Z, et al. Progress in spatiotemporal distribution of Antarctic krill and environment survey of remote sensing[J]. Marine Fisheries, 2010, 32(1): 95-101. DOI:10.3969/j.issn.1004-2490.2010.01.014 (0)
[23]
朱国平, 冯春雷, 吴强, 等. 南极磷虾调查CPUE指数变动的影响因素初步分析[J]. 海洋渔业, 2010, 32(4): 368-373.
Zhu Guoping, Feng Chunlei, Wu Qiang, et al. Preliminary analysis on factors impacting CPUE index variations in Antarctic krill survey[J]. Chinese Journal of Marine Fisheries, 2010, 32(4): 368-373. DOI:10.3969/j.issn.1004-2490.2010.04.004 (0)
[24]
许苏清, 陈立奇. 利用卫星数据分析南大洋夏季表层水叶绿素和温盐年际分布特征[J]. 自然科学进展, 2009, 19(7): 760-767.
Xu S Q, Chen L Q. Study on the interannual distribution of chlorophyll and temperature and salt inthe surface water of the Southern Ocean in summer by using satellite data[J]. Progress in Natural Science, 2009, 19(7): 760-767. DOI:10.3321/j.issn:1002-008X.2009.07.009 (0)
[25]
Teschke M, Kawaguchi S, Meyer B. Effects of simulated light regimes on maturity and body composition of Antarctic krill, Euphausia superba[J]. Marine Biology, 2008, 154(2): 315-324. DOI:10.1007/s00227-008-0925-z (0)
[26]
Seear P, Tarling G A, Teschke M, et al. Effects of simulated light regimes on gene expression in Antarctic krill (Euphausia superba Dana)[J]. Journal of Experimental Marine Biology & Ecology, 2009, 381(1): 57-64. (0)
[27]
阮超, 张衡, 崔雪森, 等. 南设德兰群岛附近海域南极磷虾渔场时空分布及其与表温的关系[J]. 生态学杂志, 2016, 35(9): 2435-2441.
Ruan C, Zhang H, Cui X S, et al. Spatial-temporal distribution of Antarctic krill fishing ground and their relationship with sea surface temperature in waters around the South Shetland Islands[J]. Chinese Journal of Ecology, 2016, 35(9): 2435-2441. (0)
[28]
Klevjer T A, Tarling G A, Fielding S. Swarm characteristics of Antarctic krill Euphausia superba relative to the proximity of land during summer in the Scotia Sea[J]. Marine Ecology Progress Series, 2010, 409: 157-170. DOI:10.3354/meps08602 (0)
[29]
陈吕凤, 朱国平. 基于地理加权模型的南设德兰群岛北部南极磷虾渔场空间分布影响分析[J]. 应用生态学报, 2018, 29(3): 938-944.
Chen L F, Zhu G P. Analysis of spatial distribution of Antarctic krill fishery in northern Shetland Islands based on geographically weighted model[J]. Chinese Journal of Applied Ecology, 2018, 29(3): 938-944. (0)
[30]
Murphy E J, Trathan P N, Everson I, et al. Krill fishing in the Scotia Sea in relation to bathymetry, including the detailed distribution around South Georgia[J]. CCAMLR Science, 1997, 4: 1-17. (0)
[31]
夏晓圣, 陈菁菁, 王佳佳, 等. 基于随机森林模型的中国PM2.5浓度影响因素分析[J]. 环境科学, 2020, 41(5): 2057-2065.
Xia Xiaosheng, CHEN Jingjing, WANG Jiajia, et al. PM2.5 concentration influencing factors in China based on the randomforest model[J]. Environmental Science, 2020, 41(5): 2057-2065. (0)
[32]
Huang Keyong, Xiao Qingyang, Meng Xia, et al. Predicting monthly high-resolution PM2.5 concentrations with random forest model in the North China Plain[J]. Environmental Pollution, 2018, 242: 675. DOI:10.1016/j.envpol.2018.07.016 (0)
[33]
金宇, 周可新, 高吉喜, 等. 基于随机森林模型的国家重点保护陆生脊椎动物物种优先保护区的识别[J]. 生态学报, 2016, 36(23): 7702-7712.
Jin Y, Zhou K X, Gao J X, et al. Identifying the priority conservation areas for key national protected terrestrial vertebrate species based on arandom forest model in China[J]. Acta Ecologica Sinica, 2016, 36(23): 7702-7712. (0)
[34]
Bellido J M, Pierce G J, Wang J. Modelling intra-annual variation in abundance of squid Loligo forbesi in Scottish waters using generalised additive models[J]. Fisheries Research, 2001, 52(1-2): 23-39. DOI:10.1016/S0165-7836(01)00228-4 (0)
[35]
朱国平, 李慧婷, 李烨, 等. 2018年夏秋季南设得兰群岛周边水域南极磷虾集群类型及其影响因素[J]. 生态学杂志, 2020, 39(4): 1265-1272.
ZHU Guoping, LI Huiting, LI Ye, et al. Antarctic krill (Euphausia superba) aggregation types and affecting factors around the South Shetland Islands, Antarctic during austral summer-autumn 2018[J]. Chinese Journal of Ecology, 2020, 39(4): 1265-1272. (0)
[36]
Atkinson A, Siegel V, Pakhomov E, et al. Long-term decline in krill stock and increase in salps within the Southern Ocean[J]. Nature, 2004, 432(7013): 100-103. DOI:10.1038/nature02996 (0)
Spatial-Temporal Distribution of Antarctic Krill (Euphausia superba) Resource and Its Association with Environment Factors Revealed with RF and GAM Models
Liu Junchao1 , Jia Mingxiu2 , Feng Weidong2 , Liu Changdong1 , Huang Liuyi1     
1. College of Fisheries, Ocean University of China, Qingdao 266003, China;
2. China National Fisheries Corp, Beijing 100160, China
Abstract: In order to provide fundamental knowledge for fishing ground prediction and fishery resource efficient exploitation, we analyzed the relationship between Antarctic krill (Euphausia superba) catch per unit effort (CPUE) and environmental factors (latitude and longitude, water temperature, water depth, offshore distance) in the marine areas around the South Shetlands and Elephant Island based on the fishing log data collected with "Long-teng" boat from 2015 to 2019 using the random forest(RF) and generalized additive model(GAM). Results from the RF indicated that longitude and latitude negatively correlate with CPUE on the whole, CPUE of Antarctic krill decreases with the increase of water tempera-ture sharply, implying its significant influence on the distribution of Antarctic krill, and CPUE is relative high and steady when water depth below 1 000 m and decreases with the increase of water depth when its value greater than 1 000 m.GAM results indicated significant nonlinear relationships between CPUE and longitude latitude, water depth and offshore distance(P < 0.01) and a significant linear negative relationship between CPUE and water temperature(P < 0.01).Result from the two models indicated that the Antarctic krill was suitable to inhabit in shallow sea and had different suitability to water temperature in different sea areas. The higher CPUE were relatively concentrated in the range of 62.5°S—63.5°S and 58°W—60°W. Compared with GAM, RF model has better fitting effect; R2 and RMSE were higher. RF sorted the importance of variables in the input data set and then chose the dominant factors that affect the CPUE. RF can better deal with multivariate cases and intera-ctive effects among the variables. Therefore, RF has a broad application prospect in the fishery data analysis.
Key words: Antarctic krill    catch per unit effort    environment factor    random forest model    genera-lized additive model