上海海洋大学学报  2018, Vol. 27 Issue (2): 265-273    PDF    
淀山湖鱼类调查样本量优化设计
王家启1,2, 田思泉1,2,3,4, 高春霞1,2,3,4, 戴小杰1,2,3,4     
1. 上海海洋大学 海洋科学学院, 上海 201306;
2. 中国远洋渔业数据中心, 上海 201306;
3. 国家远洋渔业工程技术研究中心, 上海 201306;
4. 大洋渔业资源可持续开发教育部重点实验室, 上海 201306
摘要:渔业资源的独立调查是获得高质量数据的重要手段,可以为渔业资源评估与管理提供科学依据,而样本量(站位数量)直接影响调查数据的质量。以淀山湖鱼类资源调查为例,利用重采样方法,研究样本量对调查结果精确度和准确性的影响。结果表明:在减少样本量的情况下同样可获得较高精确度和准确性的结果。不同指数的相对估计误差(REE)随着样本量的增加而降低,当样本量大于等于8时大部分指数的REE均趋于稳定;REE与指数的空间变异性呈正相关关系,REE存在指数间差异和季节差异。为保持相同精确度,不同指数在同一季节所需样本量不同,分析鱼类多样性指数所需样本量最少,其次是鱼类群体资源量指数,分析单个物种资源量指数所需样本量最多;同一指数不同季节所需样本量也不相同,分析资源量丰度指数冬季所需样本量最多,分析鱼类多样性指数夏季所需样本量最多。适当调整样本量可以在保证调查结果精确度和准确性的情况下降低调查对资源量较小的鱼类的负面影响。
关键词渔业资源    调查设计    样本量    物种多样性指数    优化    

目标种群在一定时空尺度下的物种丰富度、资源量、个体生物学特征等信息是对该种群进行评估与管理的基本需求,而这些信息主要通过独立的渔业资源调查获得[1]。针对不同调查水域设计的渔业资源调查方法是获得高质量的物种和群落水平上的生物学和生态学数据的重要手段[2-3]。在渔业独立调查中,样本量影响鱼类群落特征的解析精度[4-5],样本量越多则所得数据质量越高,分析结果与鱼类种群或群落的真实状况越接近,但同样会增加独立调查的经济成本和时间成本,过多的样本量可能还会导致资源和调查水域生态环境的进一步破坏。有效的采样设计应保证在有限的样本量下获得相对较高质量和数量的数据[6-9],但由于自然水域鱼类生态类型多样、栖息环境复杂,加之群体自身时空动态的影响[6, 10-11],优化采样设计,确定有效的样本量显得颇为困难。

实际渔业资源调查中,使用不同的采样设计对调查水域进行多次重复的采样调查是不现实的。近些年,国内外学者利用计算机模拟,从统计学角度在采样设计与站点和样本数量优化方面取得一定的进展,如SIMMONDS[12]以大西洋北海鲱鱼的资源丰度空间分布声学调查为例,采用计算机模拟采样的方式分析在不同种群模式下不同采样设计之间的差异,也有学者[9, 13]采用计算机模拟手段研究在渔业资源独立调查中使用传统的调查方法和使用最优化采样设计方法之间的差异,以及传统的采样设计和自适应采样设计的优劣势[14]。众多研究结果表明,最佳的采样设计应该综合考虑调查成本、调查目的、种群动态变化模式、采样精度等因素。本研究以湖泊渔业资源调查为例,使用重采样方法进行模拟调查,分析站点数量对调查结果的影响,以期实现站点优化的目的,为今后更加高效的资源调查评估提供依据。

1 材料与方法 1.1 数据来源

依据历史调查数据和淀山湖的水文条件,共设置24个站点(图 1),于2010年7月—2011年6月逐月进行野外采样,采样网具为刺网和拖网(表 1表 2)。调查船租用当地渔船(长6 m,宽2 m,功率为8.82 kW)。不同网目的网片按网目大小依次组合放置,拖网采用多网囊电脉冲虾拖网,每个站点拖曳时间为30 min。渔获样本冷冻保存,在实验室内根据《上海鱼类志》[15]鉴定渔获种类,记录渔获数量。

图 1 调查站点空间分布 Fig. 1 Spatial distribution of sampling sites
表 1 淀山湖刺网调查网具规格 Tab.1 Gillnet standard of Dianshan Lake
表 2 淀山湖拖网调查网具规格 Tab.2 Trawl net standard of Dianshan Lake
1.2 研究方法

本文根据现有的调查数据,评估当前调查设计是否可依据不同的调查目的进行站点优化。为了研究在调查湖泊鱼类单一物种或多个物种丰度以及群落特征时,降低采样强度,是否可获得相似质量(精确度和准确度)的数据,前提是假设原始调查数据能够准确地反映淀山湖鱼类物种组成、单一物种或多个物种的丰度指数以及物种多样性指数的实际状况。

在渔业资源调查中,不同的采样方式对调查结果尤其是对资源丰度的分析有很大影响,本研究中,根据数据统计结果显示,拖网渔获的种类能够覆盖淀山湖所有种类,因此在进行资源丰度和物种多样性分析时仅使用拖网渔获数据。

1.2.1 资源丰度指数

资源丰度指数根据实际采样方式,采用每网次每小时的渔获量为参考指标,单位为g/h:

式中: C为单次调查渔获总量;n为单次调查的拖网次数;t为单次调查单次拖网的时间。

1.2.2 物种多样性指数

根据淀山湖水域鱼类群落多样性研究选用Shannon多样性指数(H′)[16]、Margalef丰富度指数(D)[17],Pielou均匀度指数(J′)[18]

式中:S为所有站点的鱼种类数;N为所有站点所有物种的总尾数;Ni为第i个物种的尾数。

1.2.3 站点优化设计方法

利用各月份调查的拖网渔获数据,选取各月份的鱼类多样性指数(多样性指数H′、丰富度指数D,均匀度指数J′)、优势种中每月都有捕获记录的物种(刀鲚Coilia ectenes,光泽黄颡鱼Pelteobaggrus nitidus,子陵吻虾虎鱼Rhinogobius giurinus)和淀山湖主要鱼类(鲤科鱼类)以及总鱼类的资源量指数,使用重采样方法,评估调查站点数量对淀山湖鱼类多样性和鱼类资源量调查的影响,并分析其季度差异。

采用变异系数(coefficient of variation, CV)分析采样估计值的离散程度,本研究中用变异系数分析单次调查各指数值的空间变异程度:

式中:n为站点数量;yi为第i个站点调查得出的指数值;yn个站点调查得出的指数的平均值;SS是离差平方和(Sum of Squares of deviations, SS); s2是样本方差。

采用相对估计误差(relative estimated error, REE)比较采样估算值的估测准确性[8]:

采用相对偏差(relative bias, RB)比较估计量的偏差[19]

式中:Ytrue为个体物种丰度指数、物种多样性指数真实值;Yiestimate为第i次重抽样估计的指数值;R为模拟次数(本研究模拟次数1000)。

各月份的重采样分析单独进行。分析过程中首先确定样本量大小(本研究中样本量大小范围为1~23个站点),然后从原始数据中随机(replacement)选取给定样本量大小的数据,计算鱼类多样性指数以及单个物种(刀鲚,光泽黄颡鱼,子陵吻虾虎鱼)、鲤科鱼类和淀山湖总鱼类资源的资源量丰度指数,每个给定样本量大小的数据选择都随机进行1 000次。计算每组数据的相对误差和相对偏差。所有数据的统计分析全部在Excel 2013和R-3.1.3软件中完成。

2 结果

根据公式计算各月份的物种多样性指数和资源丰度指数,并估算其月间均值和每种指数的空间变异系数(CV)(表 3)。

表 3 丰度指数和多样性指数汇总 Tab.3 Summary of abundance index and species diversity index

单个物种的资源量丰度月间均值比较低,传统的经济物种刀鲚的月平均资源丰度低于200 g/h;光泽黄颡鱼则更小,低于100 g/h。由于淀山湖鱼类中以鲤科鱼类为主,月平均资源丰度相对较高,约占整个淀山湖鱼类资源的60%。单个物种的资源量丰度指数月平均变异系数较大,其次是鲤科鱼类和总鱼类资源,物种多样性指数的月平均变异系数普遍较小。

2.1 相对估计误差(REE)比较

不同季度各指数的REE为该季度各月份REE的均值。结果显示,各季度所有指数的REE随着样本量的减少而增加;当样本量从8增加到23,大部分指数的REE趋于稳定或有较小的降低,而当样本量从2增加到8时REE降低较快,REE的季度和指数间差异较为显著(图 2)。相同样本量情况下,同一季节不同指数类型的REE以单个物种资源量丰度指数REE最大,其次是鱼类群体资源量丰度指数REE,物种多样性指数REE最小。同一指数不同季节,单物种资源量丰度指数REE最高的季节为冬季,其次是秋季、夏季,最低是春季;而鱼群资源量丰度指数REE最高的是冬季,其次是夏季、秋季,最低的是春季;物种多样性指数REE夏季最高,春季最低(图 3)。样本量从23减小到8,单个物种资源量丰度指数REE范围从3.33%~11.39%增加到22.80%~77.34%,鱼群资源量丰度指数REE范围从3.18%~4.46%增加到21.97%~31.19%,物种多样性指数REE范围从0.87%~1.66%增加到6.02%~11.09%(图 3)。

图 2 各季节不同指数对应样本量的相对估计误差(REE) Fig. 2 The relative estimation error (REE) for different indices with different sample sizes in the four sampling seasons
图 3 不同指数对应样本量的平均相对误差 Fig. 3 The averaged relative estimation error (REE) for different indices with different sample sizes in the four sampling seasons

进一步分析结果显示,所有指数(单物种资源量丰度指数、群体资源量丰度指数和物种多样性指数)的REE和指数的空间变异系数密切相关。相同样本量的情况下,指数的空间变异系数越高,REE就越高(图 4)。例如,单物种资源量丰度的空间变异系数冬季>秋季>夏季>春季,其REE也有相同的大小关系。

图 4 相对估计偏差与原始指数变异系数关系变化 Fig. 4 Relative estimated error (REE) with the coefficient of variation (CV) of original indices
2.2 相对偏差(RB)比较

当样本量大于或等于8时,所有指数的RB均在-2%~2%之间,各季节的RB和样本量之间均不存在相关关系,表明对所有指数的估计是无偏差的。在该样本量范围内,夏季所有指数的RB绝对值均小于1%,秋季和春季分别只有一种指数的RB绝对值超过了1%,冬季则是大部分指数的RB绝对值小于1%(图 5)。

图 5 各季节不同指数对应样本量的相对偏差(RB)绝对值 Fig. 5 Absolute value of relative bias (RB) with sample sizes for different indices in the four sampling seasons
2.3 样本量对目标种群和采样精度的影响比较

本研究以调查站点数12为例,分析减少样本量对采样精度(相对估计误差REE的增加)和目标物种(渔获量的减少)的影响。结果显示,调查站点数减少到12,各季节不同指数REE(%)的增加和采样渔获量降低的比例见表 4。在一定情况下,调查站点数减少对采样精度的影响较小,但却会很大程度上减少采样渔获量,降低采样调查对目标鱼类种群的影响。样本量减少到12,采样努力量降低了50%,REE(%)的增加和渔获量(%)的减少程度存在季节和目标指数之间的差异。其中,REE(%)的平均增加量为26.06%,渔获量的平均减小比例为49.81%。对于总调查渔获量来说,夏季调查中,样本量减小到12,其REE(%)仅增加了15.61%,而采样渔获量却降低了50.23%,其降低程度远大于REE的增加程度,可以有效地降低采样调查对淀山湖鱼类资源的影响。

表 4 样本量减少(24~12)对应的相对误差和产量变化 Tab.4 The changes in the REE and in the catch (in weight) of trawl survey when sample size decreased from 24 to 12 for individual species/fish groups
3 讨论

物种丰富度是描述区域性物种多样性最简单直接的方法,但却是一个很难准确测定的量[20-22]。因为物种的数量会随着采样区域的增加而增加[23],只有在样本量适当且相似的情况下物种丰富度才能够进行比较分析。研究发现,物种和区域之间的关系是两种现象的结果[23-25]:(1)即使在一个环境比较单一的区域,随着区域面积的增加,个体数量也会增加,那么捕获更多物种的可能性就会更大;(2)区域面积越大,环境多样性就越高。因此,环境变化会导致物种的非均匀分布,在这种情况下调查面积增加渔获数量就会增加。生物监测中比较恰当的样本量应该是在该样本量基础之上再增加样本量,不会使物种丰富度发生大幅度的增加,也不会改变物种资源量相对丰度[26];低于该样本量,无论是物种丰富度还是资源量相对丰度,波动较大,不能够做到准确监测。

本研究中,使用REE表示样本量和调查目的之间的关系,分析多少样本量能够使REE在一个理想的范围内,以达到调查目的。总体来看,大部分指数的REE都有一个相似的趋势,开始随着样本量的增加,REE逐渐降低,随后随着样本量的增加REE趋于稳定(图 23),这和一般抽样理论是一致的[1, 27]。在以多个物种资源量以及群落组成为目的湖泊渔业调查中,不同物种的资源量指数和群落特征指数的空间分布是有差异的。本研究中样本量大于等于8时,所有指数的估计值是无明显偏差的(图 5),因此我们假设当前采样设计能够获得目标群体的真实时空分布。研究结果中,与单物种资源量丰度指数和鱼类群体资源量丰度指数的REE相比,物种多样性指数的REE较小,说明减少相同样本量,估算物种多样性指数的准确性和精确度都相对较高。本研究结果显示物种多样性指数的空间差异性相比于资源量丰度指数的空间差异性较小,由于鱼类个体的栖息地偏好和环境的异质性导致其在空间分布上差异较大。然而,多样性指数是反映调查区域内鱼类种类和个体数量多少及其种间个体数量分布均匀性的量化指标[28]。通常,鱼类个体的栖息地选择和竞争等生态过程决定了一个区域的物种组成[29],同时也限制了一个采样点的物种数量。虽然不同调查站点之间的物种组成可能不同,但只要个体数量相似,其物种多样性指数差异就会很小。本文采用的覆盖多个物种的三个综合多样性指数的空间变化相对较小,因此,在淀山湖渔业资源调查中如果以估算物种多样性为调查目的,需要的样本量相对较小,而以调查鱼类种类数为目的,考虑到鱼类不同物种的空间分布,为使结果的精确度更高则需要更多的样本量[30]

模拟研究结果表明,湖泊渔业资源调查中,有效的采样设计应该考虑目标指数的时空分布模式(例如,单个物种或鱼群的资源量丰度指数、物种多样性指数),同时也要考虑时间和经济成本需求。对一个生态敏感区域的调查应该在保证数据质量的情况下尽可能减少样本量,尽量使调查产生的死亡降到最低。然而,在国内大部分湖泊生态系统中,大多数鱼类资源丰度都有不同程度的下降甚至消耗殆尽。因此,应尽可能减少湖泊资源调查对资源丰度较低的物种的负面影响,在某些情况下,尽管样本量只是轻微减少,但却大幅度降低了调查对目标种群的负面影响;在产卵季节,对湖泊河流等水域衰退种群的调查更应该注重调查对种群的影响。

从科学或管理的角度来看,不同鱼类的重要性是有差异的。一些经济鱼类如刀鲚、光泽黄颡鱼相比于其他鱼类具有更高的管理优先级。如果是以这些物种为调查目标,在采样设计中则应该着重考虑该物种的样本量需求。本研究中分析的三个多样性指数、单物种资源量丰度指数以及鱼群资源量丰度指数重要性是不等的。因此,渔业资源调查中,应针对不同的目标有侧重点进行采样设计优化。

4 展望

渔业资源调查中,渔具的选择性导致不同大小个体的鱼被捕获的可能性是不同的,因此,渔业调查数据反映的结果更接近于真实情况,而并非真实情况。然而,在模拟采样中更大程度上表示的是采样方法的相对偏差和可重复性。通过模拟采样推断出的有效样本量优化的是采样精度,提高采样的准确性则需要适当的渔具和采样站点。

淀山湖渔业资源调查中采取的是定点采样的方式。在湖泊渔业资源调查和监测中是一种比较常用的方法,这种方法更利于资源年度变化的比较分析,但是定点采样的站点设置,往往受到主观因素影响较大,资源估计结果的准确性较差。定点采样站点是固定的,而鱼类群落变动是随机的,那么采样结果与实际群落分布变动规律可能不一致,所以容易产生偏差。

参考文献
[1]
COCHRAN W G. Sampling techniques[M]. 3rd ed. New York: John Wiley & Sons, 1977.
[2]
ENSIGN W E. Surveys of fisheries resources[J]. Transactions of the American Fisheries Society, 1994, 123(4): 679-680. DOI:10.1577/1548-8659-123.4.679
[3]
JENNINGS S, KAISER M, REYNOLDS J D. Marine fisheries ecology[M]. New York: John Wiley & Sons, 2009.
[4]
ANGERMEIER P L, SMOGOR R A. Estimating number of species and relative abundances in stream-fish communities:effects of sampling effort and discontinuous spatial distributions[J]. Canadian Journal of Fisheries and Aquatic Sciences, 1995, 52(5): 936-949. DOI:10.1139/f95-093
[5]
REILLY H. Nutritional assessment[J]. British Journal of Nursing, 1996, 5(1): 18-24. DOI:10.12968/bjon.1996.5.1.18
[6]
陈新军, 俞存根, 卢伙胜. 渔业资源与渔场学[M]. 北京: 海洋出版社, 2004.
CHEN X J, YU C G, LU H S. Fishery resource biology and fishing[M]. Beijing: Ocean Press, 2004.
[7]
HORPPILA J, PELTONEN H. Optimizing sampling from trawl catches:contemporaneaus multistage sampling for age and length structures[J]. Canadian Journal of Fisheries and Aquatic Sciences, 1992, 49(8): 1555-1559. DOI:10.1139/f92-172
[8]
CHEN Y. A Monte Carlo study on impacts of the size of subsample catch on estimation of fish stock parameters[J]. Fisheries Research, 1996, 26(3/4): 207-223.
[9]
LIU Y, CHEN Y, CHENG J H. A comparative study of optimization methods and conventional methods for sampling design in fishery-independent surveys[J]. ICES Journal of Marine Science, 2009, 66(9): 1873-1882. DOI:10.1093/icesjms/fsp157
[10]
BAYLEY P B, LARIMORE R W, DOWLING D C. Electric seine as a fish-sampling gear in streams[J]. Transactions of the American Fisheries Society, 1989, 118(4): 447-453. DOI:10.1577/1548-8659(1989)118<0447:ESAAFG>2.3.CO;2
[11]
LYONS J. The length of stream to sample with a towed electrofishing unit when fish species richness is estimated[J]. North American Journal of Fisheries Management, 1992, 12(1): 198-203. DOI:10.1577/1548-8675(1992)012<0198:TLOSTS>2.3.CO;2
[12]
SIMMONDS E J, FRYER R J. Which are better, random or systematic acoustic surveys? A simulation using North Sea herring as an example[J]. ICES Journal of Marine Science, 1996, 53(1): 39-50. DOI:10.1006/jmsc.1996.0004
[13]
赵静, 章守宇, 林军, 等. 不同采样设计评估鱼类群落效果比较[J]. 应用生态学报, 2014, 25(4): 1181-1187.
ZHAO J, ZHANG S Y, LIN J, et al. A comparative study of different sampling designs in fish community estimation[J]. Chinese Journal of Applied Ecology, 2014, 25(4): 1181-1187.
[14]
YU H, JIAO Y, SU Z M, et al. Performance comparison of traditional sampling designs and adaptive sampling designs for fishery-independent surveys:a simulation study[J]. Fisheries Research, 2012, 113(1): 173-181. DOI:10.1016/j.fishres.2011.10.009
[15]
倪勇, 张列士. 上海鱼类志[M]. 上海: 上海科学技术出版社, 1990.
NI Y, ZHANG L S. Fish fauna of Shanghai[M]. Shanghai: Shanghai Scientific and Technical Publishers, 1990.
[16]
SHANNON C E, Weaver W. The mathematical theory of communication[M]. Urbana: University of Illinois Press, 1949: 29.
[17]
ULANOWICA R E. Information theory in ecology[J]. Computers & Chemistry, 2001, 25(4): 393-399.
[18]
PIELOU E C. Species-diversity and pattern-diversity in the study of ecological succession[J]. Journal of Theoretical Biology, 1966, 10(2): 370-383. DOI:10.1016/0022-5193(66)90133-0
[19]
TAYLOR J R. An introduction to error analysis:the study of uncertainties in physical measurements[M]. California: University Science Books, 1982.
[20]
MAGURRAN A E. Ecological diversity and its measurement[M]. New Jersey: Princeton University Press, 1988.
[21]
COLWELL R K, CODDINGTON J A. Estimating terrestrial biodiversity through extrapolation[J]. Philosophical Transactions of the Royal Society B:Biological Sciences, 1994, 345(1311): 101-118. DOI:10.1098/rstb.1994.0091
[22]
GOTELLI N J, COLWELL R K. Quantifying biodiversity:procedures and pitfalls in the measurement and comparison of species richness[J]. Ecology Letters, 2001, 4(4): 379-391. DOI:10.1046/j.1461-0248.2001.00230.x
[23]
HE F L, LEGENDRE P. Species diversity patterns derived from species-area models[J]. Ecology, 2002, 83(5): 1185-1198.
[24]
SCHEINER S M, COX S B, WILLIG M, et al. Species richness, species-area curves and Simpson's paradox[J]. Evolutionary Ecology Research, 2000, 2(6): 791-802.
[25]
CAM E, NICHOLS J D, HINES J E, et al. Disentangling sampling and ecological explanations underlying species-area relationships[J]. Ecology, 2002, 83(4): 1118-1130.
[26]
JENNINGS M J, FORE L S, KARR J R. Biological monitoring of fish assemblages in Tennessee Valley reservoirs[J]. River Research and Applications, 1995, 11(3/4): 263-274.
[27]
ZIEGEL E R. Sampling:design and analysis[J]. Technometrics, 2000, 42(2): 223-224.
[28]
LUDWIG J A, REYNOLDS J F. Statistical ecology:a primer on methods and computing[M]. New York: John Wiley and Sons, 1988.
[29]
TILMAN D. Niche tradeoffs, neutrality, and community structure:a stochastic theory of resource competition, invasion, and community assembly[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(30): 10854-10861. DOI:10.1073/pnas.0403458101
[30]
王家启, 戴小杰, 王坤, 等. 淀山湖鱼类生物多样性调查样本量的优化设计[J]. 应用生态学报, 2017, 28(1): 291-298.
WANG J Q, DAI X J, WANG K, et al. Optimal design of sample size for estimating species richness of fishes in Dianshan Lake, China[J]. Chinese Journal of Applied Ecology, 2017, 28(1): 291-298.
Optimization of sample size for lake fish resources survey
WANG Jiaqi1,2, TIAN Siquan1,2,3,4, GAO Chunxia1,2,3,4, DAI Xiaojie1,2,3,4     
1. College of Marine Science, Shanghai Ocean University, Shanghai 201306, China;
2. National Data Centre for Distant-Water Fisheries of China, Shanghai 201306, China;
3. National Distant-water Fisheries Engineering Research Center, Shanghai Ocean University, Shanghai 201306, China;
4. The Key Laboratory of Sustainable Exploitation of Oceanic Fisheries Resources, Ministry of Education, Shanghai Ocean University, Shanghai 201306, China
Abstract: Fishery-independent surveys are essential for collecting high quality data to support fisheries stock assessment and management. Sample size (number of sites) plays a significant role in determining the quality of survey data. A fishery survey in Dianshan Lake was conducted as a case study to analyze the effect of sample size on accuracy and precision for estimates of fish abundance or fish species diversity using resampling techniques. Results showed sample size can be reduced while still achieving relatively high precision and accuracy for most indices measuring abundance and biodiversity. The relative estimated error(REE) for all the indices increased when the sample size decreased in four sampling seasons. For most indices in the four sampling seasons, the REE was stable or slightly increased when the sample size decreased from 24 to 8. The REE had a significant and positive relationship with the CVs of the corresponding indices for the four sampling seasons and had different levels of values for each index in the four seasons.For the sake of the same precision for different indices in one season, the sample size needed for analyzing fish diversity indices was smaller than the one required while analyzing species abundances indices.To maintain the same precision for one index in different seasons, the sample size needed for analyzing abundance indices and fish diversity indices were the largest in winter and summer respectively.The study suggests that the optimal sample size identified in a lake fishery survey design may be different with respect to different goals. Sample size could be reduced to some extent in the subsequent surveys to reduce the negative effect of the survey on fish species with low abundance in the study area.
Key words: fishery resources     survey design     sample size     species diversity index     optimization