基于月季微卫星标记的7个遗传相似系数比较

DOI: 10.11707/j.1001-7488.20130111

文章信息

黄平, 崔娇鹏, 郑勇奇, 张川红

Huang Ping, Cui Jiaopeng, Zheng Yongqi, Zhang Chuanhong

Comparison of 7 Genetic Similarity Coefficients Based on Microsatellite Markers in Rose Variety

林业科学, 2013, 49(1): 68-76

Scientia Silvae Sinicae, 2013, 49(1): 68-76.

DOI: 10.11707/j.1001-7488.20130111

文章历史

收稿日期：2012-03-02

修回日期：2012-07-18

作者相关文章

黄平

崔娇鹏

郑勇奇

张川红

引用本文

黄平, 崔娇鹏, 郑勇奇, 张川红. 2013. 基于月季微卫星标记的7个遗传相似系数比较[J]. 林业科学, 49(1): 68-76. 复制到剪切板

Huang Ping, Cui Jiaopeng, Zheng Yongqi, Zhang Chuanhong. 2013. Comparison of 7 Genetic Similarity Coefficients Based on Microsatellite Markers in Rose Variety. Scientia Silvae Sinicae, 49(1): 68-76. DOI: 10.11707/j.1001-7488.20130111 复制到剪切板

基于月季微卫星标记的7个遗传相似系数比较

黄平¹, 崔娇鹏², 郑勇奇¹, 张川红¹

1. 国家林业局植物新品种分子测定实验室国家林业局林木培育重点实验室中国林业科学研究院林业研究所北京 100091；
2. 北京植物园北京 100093

收稿日期：2012-03-02；修回日期：2012-07-18

基金项目：国家林业局科技发展中心项目(2007011) ；北京市科委计划项目公益应用类(D08050603770804) 。

通讯作者：郑勇奇

摘要：以月季品种的微卫星标记数据为基础，选择7个遗传相似系数对月季品种间遗传相似度进行计算，并采用非加权组平均法（UPGMA）建立相应的系统树。通过遗传相似系数相关性、聚类结果一致性以及拟合优度等分析方法，探讨不同的遗传相似系数在微卫星遗传分析中的适用性。分析数据显示7个系数之间相关系数介于0.726～1.000。共表型相关系数r_c介于0.85～0.93，表明品种间遗传差异在基于UPGMA方法的聚类树状图中有良好体现。系统树之间的CI_c指数范围为0.468～1.000，表明采用不同相似系数进行聚类分析时，结果存在较大差异。7个遗传相似系数的S统计值介于16.24%～29.90%，Russel and Rao系数最低，Simple Matching等3个系数S值均大于20%。综合考虑分子标记特点、物种杂合度、Kruskal拟合优度等因素，并结合聚类分析与品种谱系比较结果，研究认为Dice系数和Jaccard系数适用于月季的微卫星遗传分析，其次是Simple Matching系数。

关键词：月季品种多倍体微卫星标记遗传相似系数聚类分析

Comparison of 7 Genetic Similarity Coefficients Based on Microsatellite Markers in Rose Variety

Huang Ping¹, Cui Jiaopeng², Zheng Yongqi¹, Zhang Chuanhong¹

1. Laboratory of Molecular Testing for Plant Variety of State Forestry Administration Key Laboratory of Tree Breeding and Cultivation of State Forestry Administration Institute of Forestry, Chinese Academy of Forestry Beijing 100091;
2. Beijing Botanical Garden Beijing 100093

Abstract: Seven genetic similarity coefficients were selected to calculate pairwise genetic similarity of rose (Rosa) varieties based on microsatellite data, and the 7 corresponding dendrograms were constructed by Unweighted Pair Group Method with Arithmetic Mean. The applicability of different genetic similarity coefficients in analyzing genetic relationships based on the microsatellite in rose varieties was investigated by means of correlation analysis between genetic similar matrixes, consistency analysis between cluster trees, and test of the goodness of fit. The result showed that correlation coefficients between different similar matrixes ranged from 0.726 to 1.000. Cophenetic correlation coefficients ranged from 0.85 to 0.95, indicating that there was a good representation of similarity matrixes in the form of dendrograms. Index of CI_c between pairwise dendrograms ranged from 0.468 to 1.000, which indicated that dendrograms were dependent on selection of different genetic similarity coefficients. STRESS values among the 7 genetic similarity coefficients ranged from 16.24% to 29.90%. The STRESS values of Simple Matching, Roger and Tanimoto, and Hamann coefficients were all more than 20%. Comprehensive consideration of molecular marker characteristics, species heterozygosis, STRESS value, and combined with clustering result and variety lineage, Dice coefficient and Jaccard coefficient were found to be the most appropriate for rose variety genetic analysis, followed by Simple Matching coefficient.

Key words: Rosa variety polyploidy microsatellite genetic similarity coefficient cluster analysis

DNA分子标记是指生物个体间或者群体间基因组上的DNA差异片段。随着现代生物技术发展，开发出许多DNA水平差异检测技术。目前，分子标记广泛应用于分子辅助育种、群体遗传多样性评价、物种系统发育、亲缘关系分析、品种鉴定以及依赖性派生品种(essentially derived variety)认定等方面的研究(van Eeuwijk et al.，2004;Heckenberger et al.，2005)。在这些研究中，数据分析都是基于个体间遗传相似度或遗传距离，选择不同遗传相似系数导致分析结果存在很大差异(Kosman et al.，2005)。因此，选择合适的遗传相似系数对于准确估计个体间遗传相似度、评价群体间遗传多样性尤为重要。

遗传相似性分析往往基于分子标记数据。RAPD，AFLP等获得的是显性标记，该类型数据直接转换成为“0-1”二元矩阵;RFLP，SSR，SNP等标记产生共显性数据，二倍体生物中共显性标记可转成每个位点的基因型进行后续分析，而一些研究也直接将共显性数据转换为“0-1”二元矩阵进行遗传相似性分析。Rodrigues等(2008)利用微卫星标记研究大豆(Glycine max)依赖性派生品种鉴定，数据分析中使用相同等位基因数量与总等位基因数量比值计算品种相似度;Vosman等(2004)应用AFLP标记鉴定切花月季(Rosa hybrida)依赖性派生品种，数据分析中选择了Jaccard系数，研究结果表明原始品种与突变品种间Jaccard相似系数均大于0.96;Borchert等(2008)选择Dice系数进行了欧石楠(Calluna vulgaris)依赖性派生品种认定的研究。Kosman等(2005)认为先前的研究对选择合适的遗传相似系数缺乏理论指导，并提出选择遗传相似系数需要考虑分子标记特性、物种倍性、自交程度(杂合度)等诸多因素的影响。

月季是世界上最为重要的木本观赏花卉之一，大约包含200种，主要分布于北半球温带地区。月季通常指的是蔷薇科(Rosaceae)蔷薇属(Rosa)一类植物的总称，包括月季花、蔷薇、玫瑰等。根据美国月季协会(American Rose Society)分类方法，月季分为野生种(Wild Species)、古老月季(Old Garden Rose)和现代月季(Modern Rose)。现代月季多为四倍体(4x=28)，也有少数三倍体(3x=21)，染色体数目变异也给月季遗传分析带来一定难度。本研究以多倍体月季微卫星标记数据为基础，选择7个遗传相似系数计算月季品种间遗传相似度，采用UPGMA法进行聚类分析，并建立相应的系统树。通过遗传相似系数的相关性分析、系统树一致性分析、拟合优度分析以及聚类结果与品种谱系比较分析，探讨不同遗传相似系数在月季遗传分析中的适用性问题。

1 材料与方法 1.1 试验材料

49个月季栽培品种均采集于北京植物园苗圃，主要包括中国月季(China rose)、杂交茶香月季(Hybrid Tea rose)、丰花月季(Floribunda rose)、藤本月季(Climbing rose)、灌木月季(Shrub rose)、多花月季(Polyantha rose)、杂交玫瑰(Hybrid rugosa)以及法国蔷薇(Galica)等品种群(表 1)。

表 1 供试月季品种 Tab.1 Information of rose varieties

表 1 供试月季品种

Tab.1 Information of rose varieties

编号 No.	品种 Variety	品种群 Group	编号 No.	品种 Variety	品种群 Group
1	Rosa ' Yinrihehua'	中国月季China	26	Rosa ‘Sweet Dreams’	杂交茶香月季Hybrid Tea
2	Rosa 'Viridiflora/	中国月季China	27	Rosa ‘Ruby Wedding’	杂交茶香月季Hybrid Tea
3	Rosa ‘Old No. 1^J	中国月季China	28	Rosa ‘Paul Shirville’	杂交茶香月季 Hybrid Tea
4	Rosa ‘Old No. 6 ^J	中国月季China	29	Rosa ‘Royal William’	杂交茶香月季 Hybrid Tea
5	Rosa ‘Zixianghong⁵	中国月季China	30	Rosa ‘Warm Wishes’	杂交茶香月季 Hybrid Tea
6	Rosa ‘Simianjing⁵	中国月季China	31	Rosa ‘Pride of England’	杂交茶香月季 Hybrid Tea
7	Rosa 'Yushizhuang’	中国月季China	32	Rosa ‘Congratulations’	杂交茶香月季 Hybrid Tea
8	Rosa ‘Hermosa’	中国月季China	33	Rosa ‘Deep Secret’	杂交茶香月季 Hybrid Tea
9	Rosa ‘Irene Watts’	中国月季China	34	Rosa ‘Elina’	杂交茶香月季 Hybrid Tea
10	Rosa ‘Queen Mab	中国月季China	35	Rosa ‘Royal Smile’	杂交茶香月季 Hybrid Tea
11	Rosa ‘Sophies Perpetual5	中国月季China	36	Rosa ‘Summer Fragrance’	杂交茶香月季 Hybrid Tea
12	Rosa ‘Bloomfield Abundance^J	中国月季China	37	Rosa ‘Regensberg’	多花月季Polyantha
13	Rosa ‘Old Blush^	中国月季China	38	Rosa ‘Summer Sunset’	多花月季Polyantha
14	Rosa ‘Comtesse du cayla^J	中国月季China	39	Rosa ‘Snowdon’	杂交玫瑰Hybrid rugosa
15	Rosa ‘Columbian Climber’	藤本月季Climbing	40	Rosa ‘Hazel le Rougete’	杂交玫瑰Hybrid rugosa
16	Rosa ‘Breath of Life5	藤本月季Climbing	41	Rosa ‘Pearl Drift’	灌木月季Shrub
17	Rosa ‘Open Arms’	藤本月季Climbing	42	Rosa ‘Sussex’	灌木月季Shrub
18	Rosa ‘Eden Rose 88 ^J	藤本月季Climbing	43	Rosa ‘Many Happy Return’	灌木月季 Shrub
19	Rosa ‘Spice of Life’	丰花月季Floribunda	44	Rosa ‘Rose Ball’	灌木月季 Shrub
20	Rosa ‘Twenty Fifth’	丰花月季Floribunda	45	Rosa ‘Peter Beales’	灌木月季 Shrub
21	Rosa ‘Woman’ s Hour’	丰花月季Floribunda	46	Rosa ‘Perle d’ Or’	灌木月季 Shrub
22	Rosa ‘Glad Tidings’	丰花月季Floribunda	47	Rosa ‘Cardinal Hume’	灌木月季 Shrub
23	Rosa ‘Rememberance ’	丰花月季Floribunda	48	Rosa ‘Sadler’s Wells’	灌木月季 Shrub
24	Rosa ‘Oranges and Lemons’	丰花月季Floribunda	49	Rosa ‘Rhapsody in blue’	灌木月季 Shrub
25	Rosa ‘James Mason’	法国蔷薇Gallica

1.2 研究方法 1.2.1 数据来源

分析数据源于月季品种的微卫星标记分析。先前的研究利用荧光毛细管电泳技术分析了49个月季品种在27个微卫星位点上的DNA指纹，具体微卫星标记试验步骤、微卫星引物来源均参考前人研究(Kimura et al.，2006;Hibrand- Saint Oyant et al.，2008;Zhang et al.，2006;Park et al．，2010;冯锦霞等，2011)，部分月季的微卫星毛细管电泳检测结果如图 1所示。

	图 1 月季品种在位点Rw18N19 的等位基因变异 Fig. 1 Allelic variants of rose varieties at Rw18N19 locus rfu: 相对荧光单位Relative fluorescence units．

1.2.2 分析方法

研究选择了7个常用的遗传相似系数(表 2)，它们分别是Dice系数、Jaccard系数、 Simple Matching系数(SM)、Roger and Tanimoto系数(RT)、Russell and Rao系数(RR)、Hamann系数和Phi系数。其中，Dice系数、Jaccard系数、Simple Matching系数和Roger and Tanimoto系数是一种相似性配对系数，即相似匹配数与总匹配数的比值;Russell and Rao系数是一种二分点乘积配对系数;Hamann系数又称为Hamann概率，该系数原理是相似概率与相异概率之差;Phi系数是一个统计关联的系数，该系数与卡方检验相关。

表 2 遗传相似系数计算方法^① Tab.2 Calculation methods of different genetic similarity coefficients

品种间遗传相似度使用NYSYS-pc 2.1e软件(Rohlf，2000)计算，然后根据品种间遗传相似矩阵，采用SHAN模块UPGMA法进行聚类分析。遗传相似矩阵间相关性分析使用Mantel检验(Mantel，1967)。r_c共表型相关系数使用Cophenetic模块计算，该系数是用于检验原始遗传相似矩阵与聚类方法之间拟合优度的参数。聚类树状图CI_c指数采用CONSENSUS-consensus tree模块计算，该指数是用于估计不同系统树间相对一致性的参数(Sokal et al．，1981)。S统计值(STRESS)使用MDSCALE模块进行分析，该值是用于估计不同遗传相似系数的拟合优度的参数(Kruskal，1964)，拟合优度分级参考表 3。

表 3 S 值拟合优度分级 Tab.3 Classification for goodness of fit of the graphic projection according to value of STRESS

2 结果与分析 2.1 遗传相似系数相关性

研究结果(图 1)显示，不同月季品种在相同的微卫星位点上等位基因表型存在明显差异。基于上述数据，利用7个遗传相似系数计算成对品种的遗传相似度矩阵，矩阵的相关性分析结果(表 4)显示7个遗传相似系数之间成对的相关系数介于0.726～1.000。Hamann系数与RR系数相关性最好，相关系数到达1.000;其次是SM系数与RT系数，相关系数为0.997;Jaccard系数与Dice系数之间的相关系数为0.991;RR系数与SM系数、RR系数与Hamann系数，相关系数均为0.738;RR与RT系数之间相关性最低，相关系数为0.726。

表 4 基于不同相似系数间相关系数^① Tab.4 Correlation coefficients between different genetic similarity matrixes based on different similarity coefficients

2.2 系统树一致性分析

不同的系统树一致性分析结果(表 5)显示，CI_c指数范围在0.468～1.000之间。Dice系数与Jaccard系数，SM系数与RT系数，RT系数与Hamann系数，SM系数与Hamann系数间建树的一致性最高，CI_c指数均为1.000。当CI_c指数为1时，2个系统树完全一致。建树一致性最低的是RT系数与RR系数，SM系数与RR系数，CI_c指数均为0.468。SM系数与Jaccard系数、SM系数与Dice系数之间的CI_c指数均为0.702，表明SM系数与Dice系数以及SM系数与Jaccard系数的聚类分析结果相似，但也存在差异。RR系数与其他系数之间的CI_c指数都低于0.6，表明RR系数建树结果与其他系数均存在较大差异。系统树一致性分析表明选择不同遗传相似系数进行聚类分析，结果存在较大差异。

表 5 基于不同遗传相似系数的UPGMA 系统树的CI_c指数 Tab.5 Consensus fork index between dendrograms(UPGMA) produced by similarity coefficients

2.3 拟合优度分析

根据不同的遗传相似系数建立UPGMA系统树，7个遗传相似系数的r^c范围在0.85～0.93之间(表 6)，RR系数的r^c最大，其次是Dice系数和Jaccard系数，r^c值为0.88，结果表明品种间遗传相似度在UPGMA聚类分析中有良好的体现。7个遗传相似系数的S统计值介于16.24%～29.90%(表 6)，RR系数的S值最低(16.24%)，Dice，Jaccard，Phi系数与RR系数处于同一优度，SM，Hamann系数以及RT系数的S统计值均超过20%，拟合优度相对较低。

表 6 相似系数拟合优度分级 Tab.6 Classifications of good-of-fit in different genetic similarity coefficients

2.4 聚类分析

系统树一致性分析表明Jaccard系数与Dice系数二者间建树结果一致，Hamann系数、RT系数、SM系数三者间建树结果一致。因此，选择对Dice系数、SM系数、Phi系数以及RR系数的聚类结果进行详细比较与分析。

基于Dice系数的聚类分析(图 2a)，月季品种分为2大类群(第Ⅰ类和第Ⅱ类)。其中，第Ⅰ类又分为I-A类和I-B类2个聚类群。I-A类包括品种1，2，3，6，7，8，13，44(44为灌木月季，其余为中国月季)。Ⅰ-B类又细分为Ⅰ-B1，Ⅰ-B2，Ⅰ-B3: Ⅰ-B1包括月季品种26，30，34等杂交茶香月季;Ⅰ-B2包括19，21，22，23，24等丰花月季以及多花月季;Ⅰ-B3包括月季品种11，3 8，4 7，4 9(该组品种间遗传差异较大)。第Ⅱ类群中包括品种4，9，12，14等中国月季品种。

	图 2 基于Dice 系数(a) 和Simple Matching 系数(b) 的聚类分析 Fig. 2 Clustering analysis based on Dice coefficient( a) and Simple matching coefficient( b)

基于SM系数的聚类分析(图 2b)，月季品种分为2大类群(第I类和第II类)。第Ⅰ类由中国月季组成，它分为Ⅰ-A和Ⅰ-B 2个亚类。Ⅰ-A包括品种1，2，3，6，7，8，13，49;I-B包括品种4，9，10，12，14，4 6。第Ⅱ类分为Ⅱ-A和Ⅱ-B 2类。Ⅱ-A再细分为2类，Ⅱ-A1包括了所有的杂交茶香月季，Ⅱ-A2由丰花月季品种组成;Ⅱ-B由品种15，20，41，4 5构成。

基于Phi系数的聚类分析(图 3a)，样本分为2大类群(第Ⅰ类和第Ⅱ类)。其中，第Ⅰ类分为Ⅰ-A和I-B 2个亚类。Ⅰ-A包括品种1，2，6，7，8，13，44，4 7，4 9。I-B又细分为4组: Ⅰ-B1由杂交茶香月季组成;Ⅰ-B2由丰花月季品种组成;Ⅰ-B3包括品种15，20，28，31，41，43，45;Ⅰ-B4包括品种11，17，3 8。第II类群由品种4，9，10，12，46等中国月季组成。

	图 3 基于Phi 系数(a) 和Russell and Rao 系数(b) 的聚类分析 Fig. 3 Clustering analysis based on Phi coefficient(a) and Russell and Rao coefficient(b)

RR系数聚类分析将月季分为4类(Ⅰ，Ⅱ，Ⅲ，Ⅳ)(图 3b)。第I类包括3个亚类: Ⅰ-A包括品种1，7，4 4，47;Ⅰ-B再细分为3类;Ⅰ-C由品种11，38组成。第Ⅱ类包括品种2，3，6，8，13。第Ⅲ类包括品种4，10，14。第Ⅳ类包括品种12，4 6。

通过对聚类树状图进行比较，结果显示基于不同遗传相似系数的聚类系统树存在差异。基于Dice系数的聚类分析，中国月季被分为2类，其中一类与其他类型月季组成一个大聚类群(Ⅰ)，而另一类独立组成一个聚类群(Ⅱ)，品种44与中国月季聚为一类，品种47和49单独聚为一类;基于SM系数的聚类分析将月季分为中国月季(Ⅰ)和其他类型月季(Ⅱ)2个类群，品种49与中国月季聚为一类，品种44，4 7单独聚类;基于Phi系数聚类分析，品种44，4 7，4 9与中国月季聚为一类;基于RR系数的聚类分析将中国月季分为4类，只有少量品种与杂交茶香月季、丰花月季等多个类型组成一个最大的聚类群(Ⅰ)，其余中国月季单独聚类。

3 讨论与结论 3.1 遗传相似系数相关分析

相关性分析结果表明遗传相似系数分为3类:第1类包括Jaccard系数与Dice系数，二者的计算式均不含d值(共同缺失条带)，只是在a值(共有条带)权重有所差别(表 1);第2类是Hamann系数、SM系数、RT系数以及Phi系数，这类相似系数均含有d值，Hamann系数是基于概率的系数，Phi是基于统计关联的相似系数;第3类则是RR系数，该系数计算式分母包含d值，被认为是一种“杂合”系数。Dice系数与Jaccard系数相关系数r为1，Hamann系数、SM系数、RT系数三者间相关系数r也为1，表明了这些系数表达式上虽然存在差异，但表达式之间存在某种函数关系。Miguel等(2003)利用假定矩阵和试验数据分析不同遗传相似系数对聚类结果的影响，结果显示无论矩阵结构还是分类拓扑结构，Jaccard系数与Dice系数产生结果一致，本次分析结果也印证之。这可能是由于二者计算原理相同，只是a值权重存在差异。已有研究提出Jaccard系数和Dice系数适用于RAPD数据分析，认为以RAPD标记数据为基础的个体间遗传相似度计算不应考虑d值(共同缺失的条带)，这是由于在共同缺失的情况下，DNA之间也可能存在差异(Duarte et al.，1999;Meyer et al.，2004)。每个微卫星位点上存在许多等位基因，个体所携带的等位基因数量有限，因此我们认为计算2个杂合基因型遗传相似度时，只需比较观测的等位基因之间的差异，不考虑d值。

3.2 系统树一致性

系统树一致性分析中的CI_c指数是用于比较2个聚类结果之间的差异程度的参数。Dalirsefat等(2009)研究中SM系数与Jaccard系数，SM系数和Dice系数的CI_c指数分别为0.75和0.76，相比于本文的分析结果略大;而Balestre等(2008)利用微卫星标记分析玉米(Zea mays)自交系的研究中，Hamann系数与RT系数的CI_c指数为0.22，这可能与试验材料自交程度、基因组复杂程度、分子标记类型等因素有关。已报道的研究中RR系数与其他系数间的CI_c指数均较低，本研究结果也证实了该系数与其他系数存在较大差异，RR系数在生物学研究中鲜有应用(Beer et al.，1993)。

3.3 不同遗传相似系数的拟合优度比较

根据Kruskal拟合优度判断标准(表 3)，RR系数最优，Jaccard系数和Dice系数与其处于同一水平，SM等系数拟合优度水平较低。但我们认为RR系数不适用于微卫星标记数据分析。首先，微卫星标记具有单位点特异性，每个位点存在较大等位基因变异，而个体中等位基因保有量是有限的;其次，月季栽培品种涉及到多个原生种杂交、回交，这也进一步增加了等位变异数量。等位变异数量大势必增加d 值，而在RR的计算式只在分母中包含d值，d值比例过高会导致样本间遗传相似度显著降低(图 3b)。SM系数也是前人研究中常用的遗传相似系数，SM系数计算式在分子和分母中均包含d值，在一定程度上可减少d值偏差产生的影响。

3.4 聚类分析比较

不同遗传系数的聚类树状图之间存在差异，主要差异是中国月季分类。SM系数将所有中国月季聚为一大类，然后再进行细分;而Dice系数和Phi系数则先将部分中国月季单独聚为一类，另一部分则与其他类型月季形成一个较大的聚类群;RR系数则先将中国月季分为3个独立的聚类群，每个聚类群包含2～3个品种，只有少数几个品种与其他类型月季组成一个较大的聚类群。基于Dice系数、Phi系数和SM系数的聚类结果，中国月季与其他类型的月季存在较大遗传差异，这与Scariot等(2006)结果一致，符合试验材料的真实遗传背景。

基于SM系数聚类分析中，灌木月季品种Rosa ‘Rhapsody in blue’与中国月季聚为一类，该品种的育种亲本涉及2个北美原生种———加州蔷薇(Rosa californica)和草原玫瑰(Rosa setigera)，因此，认为该品种与中国月季聚为一类是不合适的。基于Dice系数的聚类分析，灌木月季品种Rosa‘Roseball’与中国月季聚为一类，育种亲本涉及密刺蔷薇(Rosa spinosissima)，该种在中国有分布;品种Rosa ‘Cardinal Hume’和Rosa‘Rhapsody in blue’的育种均涉及到加州蔷薇，但二者育种亲本不同，因此聚类分析中2个品种聚为一类，而遗传相似度较低(图 2a)。基于Phi系数的聚类将Rosa ‘Rhapsody in blue’，Rosa ‘Roseball’和Rosa ‘Cardinal Hume’3个品种与中国月季聚为一类。通过聚类结果与品种谱系比较，研究认为Dice系数适用于月季品种遗传分析，其次是SM系数，数据分析最好避免使用Phi系数和RR系数。

3.5 多倍体遗传分析存在的问题

前人研究认为利用微卫星标记准确获得多倍体基因型比较困难，多倍体的微卫星指纹可能不是该位点等位基因型，而是一种“表现型”(Becher et al.，2000;Esselink et al.，2003)，并提出等位基因定量分析方法，如MAC-PR(Esselink et al.，2004)，但是定量分析的影响因素较多。许多研究中采用“0-1”矩阵方法对微卫星标记数据进行赋值，这种赋值方法的主要问题是观察的个体间遗传差异低于实际差异，还会降低品种鉴定中微卫星标记的分辨率。例如，四倍体植物中基因型1为AAAB，基因型2为AABB，基因型3为ABBB，利用“0-1”赋值方式分析该位点，统计结果均为“AB”。总之，应用微卫星标记分析多倍体遗传关系时，分析结果与实际情况之间存在一定的差异，而且多倍体遗传分析缺少合适的数学模型(Kosman et al.，2005)。

3.6 结论

遗传分析研究的基础是利用分子标记数据计算个体间遗传相似度或遗传距离，遗传相似系数的选择势必影响遗传相似度或者遗传距离的计算。综合考虑分子标记特点、遗传相似系数原理、物种杂合度、Kruskal拟合优度分级等因素，结合聚类结果与品种谱系比较，研究认为Dice系数和Jaccard系数适用于月季微卫星遗传分析，其次是Simple Matching系数。

参考文献(References)

[1]	冯锦霞,郑勇奇,张川红,等.2011.利用荧光SSR标记鉴别杨树品种.林业科学,47(6):167-174.(1)
[2]	Balestre M,Von Pinho R,Souza J,et al.2008.Comparison of maize similarity and dissimilarity genetic coefficients based on microsatellite markers.Genetic Molecular Research,7(3):695 -705.(1)
[3]	Becher S A,Steinmetz K,Weising K,et al.2000.Microsatellites for cultivar identification in Pelargonium.Theoretical and Applied Genetics,101(4):643-651.(1)
[4]	Beer S,Murphy J,Phillips T,et al.1993.Assessment of genetic variation in Avena sterilis using morphological traits,isozymes,and RFLPs.Crop Science,33(6):1386-1393.(1)
[5]	Borchert T,Krueger J,Hohe A.2008.Implementation of a model for identifying Essentially Derived Varieties in vegetatively propagated Calluna vulgaris varieties.BMC Genetics,9(1):56.(1)
[6]	Dalirsefat S,Meyer A,Mirhoseini S.2009.Comparison of similarity coefficients used for cluster analysis with amplified fragment length polymorphism markers in the silkworm,Bombyx mori.Journal of Insect Science,9:1-8.(1)
[7]	Dice L R.1945.Measures of the amount of ecologic association between species.Ecology,26(3):297-302.(1)
[8]	Duarte MJ,Santos J B,Melo L C.1999.Comparison of similarity coefficients based on RAPD markers in the common bean.Genetics and Molecular Biology,22(3):427-432.(2)
[9]	Esselink G,Nybom H,Vosman B.2004.Assignment of allelic configuration in polyploids using the MAC-PR (microsatellite DNA allele counting-peak ratios) method.Theoretical and Applied Genetics,109(2):402-408.(1)
[10]	Esselink G,Smulders M,Vosman B,et al.2003.Identification of cut rose (Rosa hybrida) and rootstock varieties using robust sequence tagged microsatellite site markers.Theoretical and Applied Genetics,106(2):277-286.(1)
[11]	Hamann U.1961.Merkmalbestand und Verwandtschaftsbeziehungen der Farinosae.Ein Beitragzum System der Monokotyledonen.Willdenowia,2:639-768.(1)
[12]	Heckenberger M,Bohn M,Frisch M,et al.2005.Identification of essentially derived varieties with molecular markers:an approach based on statistical test theory and computer simulations.Theoretical and Applied Genetics,111(3):598-608.(1)
[13]	Hibrand-Saint Oyant L,Crespel L,Rajapakse S,et al.2008.Genetic linkage maps of rose constructed with new microsatellite markers and locating QTL controlling flowering traits.Tree Genetics and Genomes,4(1):11-23.(1)
[14]	Kimura T,Nishitani C,Iketani H,et al.2006.Development of microsatellite markers in rose.Molecular Ecology Notes,6(3):810 -812.(1)
[15]	Kosman E,Leonard K J.2005.Similarity coefficients for molecular markers in studies of genetic relationships between individuals for haploid,diploid,and polyploid species.Molecular Ecology,14 (2):415-424.(3)
[16]	Kruskal J B.1964.Multidimensional scaling by optimizing goodness of fit to anom-metric hypothesis.Psychometrika,29(1):1-27.(1)
[17]	Mantel N A.1967.The detection of disease clustering and a generalized regression approach.Cancer Research,27(2):209-220.(1)
[18]	Meyer A,Garcia A F,Souza A P,et al.2004.Comparison of similarity coefficients used for cluster analysis with dominant markers in maize (Zea mays L).Genetics and Molecular Biology,27(1):83-91.(1)
[19]	Murguia M,Villasenor J L.2003.Estimating the effect of the similarity coefficient and the cluster algorithm on biogeographic classifications.Annales Botanici Fennici,40(6):415-421.
[20]	Park Y H,Ahn S G,Choi Y M,et al.2010.Rose (Rosa hybrida L.) EST-derived microsatellite markers and their transferability to strawberry (Fragaria spp.).Scientia Horticulturae,125(4):733 -739.(1)
[21]	Rodrigues D H,de Alcântara Neto F,Schuster I.2008.Identification of essentially derived soybean cultivars using microsatellite markers.Crop Breeding and Applied Technology,8(1):74-78.(1)
[22]	Rogers D J,Tanimoto T T.1960.A computer program for classifying plants.Science,132:1115-1118.(1)
[23]	Rohlf F J.2000.NTSYS-PC:numerical taxonomy and multivariate analysis system:Version 2.1.Exeter Software,Setauket,New York.(1)
[24]	Russel P F,Rao T R.1940.On habitat and association of species of anopheline larvae in south-eastern Mdras.Journal Malaria Institute of India,3(1):153-178.(1)
[25]	Scariot V,Akkak A,Botta R.2006.Characterization and genetic relationships of wild species and old garden roses based on microsatellite analysis.Journal of the American Society for Horticultural Science,131(1):66-73.(1)
[26]	Sneath P H A,Sokal R R.1973.Numerical Taxonomy.Freeman,San Francisco,USA,573.(1)
[27]	Sokal R R,Rohlf F J.1981.Taxonomic congruence in the Leptopodomorphare-examined.Systematic Zool,30(3):309-325.(1)
[28]	van Eeuwijk F A,Law J R.2004.Statistical aspects of essential derivation,with illustrations based on lettuce and barley.Euphytica,137(1):129-137.(1)
[29]	Vosman B,Visser D,van der Voort J R,et al.2004.The establishment of'essential derivation'among rose varieties,using AFLP.Theoretical and Applied Genetics,109(8):1718-1725.(1)
[30]	Yule G U.1912.On the methods of measuring association between two attributes.Journal of the Royal Statistical Society,75(6):579 -652.(1)
[31]	Zhang L,Byrne D,Ballard R,et al.2006.Microsatellite marker development in rose and its application in tetraploid mapping.Journal of the American Society for Horticultural Science,131(3): 380-387.(1)

本文献在全文中的定位：

... Park et al．，2010;冯锦霞等，2011)，部分月季的微卫星毛细管电泳检测结果如 ...

本文献在全文中的定位：

... 和Dice系数的CI_c指数分别为0.75和0.76，相比于本文的分析结果略大;而Balestre等(2008)利用微卫星标记分析玉米(Zea mays)自交系的研究中，Hamann系数与RT系数的 ...

本文献在全文中的定位：

... 难，多倍体的微卫星指纹可能不是该位点等位基因型，而是一种“表现型”(Becher et al.，2000;Esselink et al.，2003)，并提出 ...

本文献在全文中的定位：

... 也证实了该系数与其他系数存在较大差异，RR系数在生物学研究中鲜有应用(Beer et al.，1993)。 ...

本文献在全文中的定位：

... 了Jaccard系数，研究结果表明原始品种与突变品种间Jaccard相似系数均大于0.96;Borchert等(2008)选择Dice系数进行了欧石楠(Calluna vulgaris)依赖性派生品种认定的研究。 ...

本文献在全文中的定位：

... 性分析中的CI_c指数是用于比较2个聚类结果之间的差异程度的参数。Dalirsefat等(2009)研究中SM系数与Jaccard系数，SM系数和Dice系数的CI_c指数分别为0.75和0.76 ...

本文献在全文中的定位：

... Dice，1945 ...

本文献在全文中的定位：

... Duarte et al.，1999 ...

... (共同缺失的条带)，这是由于在共同缺失的情况下，DNA之间也可能存在差异(Duarte et al.，1999;Meyer et al.，2004)。每个微卫星 ...

本文献在全文中的定位：

... ，并提出等位基因定量分析方法，如MAC-PR(Esselink et al.，2004)，但是定量分析的影响因素较多。许多研究中采用“0-1”矩阵方法对微卫星 ...

本文献在全文中的定位：

... 种“表现型”(Becher et al.，2000;Esselink et al.，2003)，并提出等位基因定量分析方法，如MAC-PR ...

本文献在全文中的定位：

... Hamann，1961 ...

本文献在全文中的定位：

... 方面的研究(van Eeuwijk et al.，2004;Heckenberger et al.，2005)。在这些研究中，数据分析都是基于个体间遗传相似度或遗传距离，选择不 ...

本文献在全文中的定位：

... 参考前人研究(Kimura et al.，2006;Hibrand- Saint Oyant et al.，2008;Zhang et al.，2006 ...

本文献在全文中的定位：

... 点上的DNA指纹，具体微卫星标记试验步骤、微卫星引物来源均参考前人研究(Kimura et al.，2006 ...

本文献在全文中的定位：

... 遗传相似度或遗传距离，选择不同遗传相似系数导致分析结果存在很大差异(Kosman et al.，2005)。因此，选择合适的遗传相似系数对于准确估计个体间遗传相似度、评价群 ...

... n>选择Dice系数进行了欧石楠(Calluna vulgaris)依赖性派生品种认定的研究。Kosman等(2005)认为先前的研究对选择合适的遗传相似系数缺乏理论指导，并提出选择遗传 ...

... 与实际情况之间存在一定的差异，而且多倍体遗传分析缺少合适的数学模型(Kosman et al.，2005)。 ...

本文献在全文中的定位：

... MDSCALE模块进行分析，该值是用于估计不同遗传相似系数的拟合优度的参数(Kruskal，1964)，拟合优度分级参考表 3。 ...

本文献在全文中的定位：

... 采用SHAN模块UPGMA法进行聚类分析。遗传相似矩阵间相关性分析使用Mantel检验(Mantel，1967)。共表型相关系数使用Cophenetic模块计算，该系数是用于检验 ...

本文献在全文中的定位：

... 可能存在差异(Duarte et al.，1999;Meyer et al.，2004)。每个微卫星位点上存在许多等位基因，个体所携带的等位基因数量有限， ...

本文献在全文中的定位：

... Zhang et al.，2006;Park et al．，2010;冯锦霞等，2011)，部分月季的微 ...

本文献在全文中的定位：

... 一些研究也直接将共显性数据转换为“0-1”二元矩阵进行遗传相似性分析。Rodrigues等(2008)利用微卫星标记研究大豆(Glycine max)依赖性派生品种鉴定，数据分析中 ...

本文献在全文中的定位：

... Rogers and Tanimoto，1960 ...

本文献在全文中的定位：

... 品种间遗传相似度使用NYSYS-pc 2.1e软件(Rohlf，2000)计算，然后根据品种间遗传相似矩阵，采用SHAN模块UPGMA法进行聚类分析。遗 ...

本文献在全文中的定位：

... Russel and Rao，1940 ...

本文献在全文中的定位：

... 和SM系数的聚类结果，中国月季与其他类型的月季存在较大遗传差异，这与Scariot等(2006)结果一致，符合试验材料的真实遗传背景。 ...

本文献在全文中的定位：

... Sneath and Sokal，1973 ...

本文献在全文中的定位：

... SUS-consensus tree模块计算，该指数是用于估计不同系统树间相对一致性的参数(Sokal et al．，1981)。S统计值(STRESS)使用MDSCALE模块进行分析，该值是用于估计不同遗传相 ...

本文献在全文中的定位：

... 析、品种鉴定以及依赖性派生品种(essentially derived variety)认定等方面的研究(van Eeuwijk et al.，2004;Heckenberger et al.，2005)。在 ...

本文献在全文中的定位：

... ，数据分析中使用相同等位基因数量与总等位基因数量比值计算品种相似度;Vosman等(2004)应用AFLP标记鉴定切花月季(Rosa hybrida)依赖性派生品种，数据分析中选择了Jacc ...

本文献在全文中的定位：

... Yule，1912 ...

本文献在全文中的定位：

... Zhang et al.，2006;Park et al．，2010 ...