林业科学  2003, Vol. 39 Issue (1): 75-79   PDF    
0

文章信息

马浩, 张冬梅, 李荣幸, 邓华平, 陈新房.
Ma Hao, Zhang Dongmei, Li Rongxing, Deng Huaping, Chen Xinfang.
泡桐属植物育种值预测方法的研究
STUDY ON PREDICTING METHOD OF BREEDING VALUES IN PAULOWNIA
林业科学, 2003, 39(1): 75-79.
Scientia Silvae Sinicae, 2003, 39(1): 75-79.

文章历史

收稿日期:1999-09-29

作者相关文章

马浩
张冬梅
李荣幸
邓华平
陈新房

泡桐属植物育种值预测方法的研究
马浩1, 张冬梅2, 李荣幸2, 邓华平1, 陈新房3     
1. 中国林业科学研究院林业研究所 北京 100091;
2. 河南农业大学园林学院 郑州 450002;
3. 河南省开封县林业局 开封 475100
摘要: 分别用最佳线性无偏预测和最佳线性预测方法预测了泡桐属植物的育种值。结果表明,根据亲缘相关距阵对育种值的最佳线性无偏预测结果没有显著影响:数据量较大时,可用小区平均值取代单株值,同时也可用最佳线性预测代替最佳线性无偏预测方法预测育种值;预测育种值与真正育种值之间的相关系数与预测育种值之间的方法或误差方差存在极显著的相关关系,可用前者作预测育种值的精度指标。通过比较毛泡桐种源所预测育种值之间的方差和误差方差可以得出:在对研究材料评选时,最佳线性预测比最小平方估算法具有优越性,但当重复数大于5次,每个小区内的植株多于6时,这两种预测方法的精度非常接近。
关键词: 泡桐    育种值    最佳线性无偏预测    最佳线性预测    
STUDY ON PREDICTING METHOD OF BREEDING VALUES IN PAULOWNIA
Ma Hao1, Zhang Dongmei2, Li Rongxing2, Deng Huaping1, Chen Xinfang3     
1. The Research Institute of Forestry, CAF Beijing 100091;
2. Henan Agricultural University Zhengzhou 450002;
3. Forest Bureau of Kaifeng County, Henan Province Kaifeng 475100
Abstract: The breeding values of eight Paulownia species were predicted by Best Linear Unbiased Prediction (BLUP) and Best Linear Prediction (BLP),Results showed that there were no significant effects on predicted results of breeding values based on BLUP whether with numerator relationship matrix (NRM) constructed by RFLP of cpDNA or not.If too much data available,breeding values could be predicted utilizing plot means values instead of individual datum or by the BLP instead of BLUP.Correction between the predicted values and the true genetic values was closely related to the variance among the predictions or the error variance of predictions,so the former could be used to indicate the precision of breeding values instead of later two coefficients.By compared variance and error variance among predicted breeding values based on provenance trails of P.tomentosa,BLP was a more reliable method to rank candidates than that of the least squares estimates.However,if repetitions were more than five,and individuals in every plots were over six,the precision of these two methods for breeding values prediction had little difference.
Key words: Paulownia    Breeding value    Best linear unbiased prediction    Best linear prediction    

研究材料的评价和选择贯穿于各种育种途径和环节,是林木遗传改良的关键。选择育种通常是以表型值为基础,因含有环境效应,所以效率和准确性都较差(Cotteriall et al., 1990;吴仲贤,1977),加之林木育种试验占地面积大、周期长、受人为干扰和外界条件的影响大,这必然会增大评价试验材料的难度,更不容易准确地选择出遗传品质真正优良的改良材料(White et al., 1989)。为了克服以上缺点,国外自20世纪80年代中期以来开始大量地应用育种值的线性预测结果来评价育种材料,目前已有湿地松、小干松、班克松、亮果桉等树种的研究报道(Souza et al., 1992; Surles et al., 1993;1995;Ericsson et al., 1995; Klein, 1995;Tibbits et al., 1998)。根据育种值作出的选择反映了加性遗传效应,排除了环境对评选育种材料造成的偏差,从而可以提高选择的准确性,增大育种效果。

国外在应用育种值对树木进行评价时,往往假设研究材料之间不存在亲缘关系,当信息量大时,用最佳线性无偏方法预测育种值常常难于实现。实际上,育种材料之间不同程度的亲缘关系客观存在,有必要研究切实可行的林木育种值预测方法。本文以泡桐为材料,对育种值的预测方法进行研究。

1 材料与方法 1.1 试验材料 1.1.1 泡桐种类及亲缘关系

1995年将白花泡桐(Paulownia fortunei)、山明泡桐(P.lamprophylla)、海岛泡桐(P.taiwaniana)、南方泡桐(P.australis)、毛泡桐(P.tomentosa)、楸叶泡桐(P.catalpifolia)、成都泡桐(P.albiphloea var.)、川泡桐(P.fargesii)1 a生苗木按随机区组设计,4次重复,5株行状小区定植于南阳试验基地,1996年秋季观测树高和胸径。此外还采集新鲜叶片,用Sal Ⅰ、Ecor Ⅰ、HindⅢ、BamHⅠ4种限制性内切酶作cpDNA的RFLP分析。根据所统计片段带的有无,以NTSYS-PC程序中Simqua l软件估算分析材料之间的遗传相关性系数(见表 1)。

表 1 8种泡桐种的相关系数 Tab.1 The Correlation coefficiencies of eight Paulownia species based on RFLP
1.1.2 毛泡桐种源

参加分析的毛泡桐种源共26个,本文仅利用9 a生胸径性状作最佳线性预测和群体平均值法的比较(马浩等,1998)。

1.2 育种值预测方法 1.2.1 用单株观测数据预测育种值

利用单株数据和最佳线性无偏预测公式预测育种值时,需要构造较大维数的矩阵。为避开计算机运行时内存不足,利用混合模型方程组求解。

单株树木观测值Y用矩阵表示为:

式中,β为区组固定效应;u为泡桐种的随机效应;p为泡桐种与区组的随机互作效应;e是随机误差效应;XZW分别是相应项的结构矩阵。

根据方差分析结果求出upe的方差分量,依次用δu2、δp2、δe2表示。于是混合模型方程组为:

式中,K1e2u2; K2e2p2; I是单位矩阵;A是分子血缘相关矩阵(张源等,1993Henderson, 1975)。为使系数矩阵满秩,加入4次重复效应估算值等于零的约束条件。泡桐种的育种值向量是2û

1.2.2 用小区平均值预测育种值

泡桐种单地点试验的线性模型是:Yijk=U+Fi+Rj+FRij+Wijk, 式中Yijk为第i个种在第j个区组第k个单株的表型值;U为试验地固定的总平均表型值;Fi为第i个种的随机效应值,E(Fi)=0, Var(Fi)=δF2; Rj为第j个区组的固定效应值;FRij为第i个种与第j个区组的随机互作值,E(FRij)=0, Var(FRij)=δFR2; Wijk为随机误差,E(Wijk)=0, Var(Wijk)=δW2。因为重复数Ȳij·和小区株数不同,在求方差组分以前,先计算调和平均值。

i种泡桐的小区平均值Ȳij·为:Ȳij·=U+Fi+FRij+Wij·/mi, 式中,mi为第i个种所对应的小区内株数。若种间不存在亲缘关系时,小区平均值的方差是Var(Ȳij·)=δFi2Frij2Wij·2/mi;小区平均值与育种值之间的协方差是Cov(Ȳij·, gi)=2δF2; 育种值的方差Var(gii)=4δF2; 协方差 Cov(gi, gi′)=0。若两个种间的亲缘系数为Aii'时,小区平均值的方差与协方差分别为Var(Ȳij·)=δFi2FRij2Wij·2/mi,Cov(Ȳij·, Yij′·)=δFi2, Cov(Ȳij·, Yi′j′·)=δFi2×Aii';小区平均值与预测育种值之间的协方差可表示为Cov(Yij· , gi)=Cov(Ȳij·, gi)=2δFi2, Cov(Yi′j′·gi)=2δFi2×Aii';育种值的方差为Var(gii)=4δFi2;协方差Cov(gi, gi')=4δFi2×δFi'2×Aii'。分别按最佳线性无偏预测(best linear unbiased prediction, 简称BLUP)方法和最佳线性预测(best linear prediction, 简称BLP)方法预测育种值,并用预测育种值的方差、误差方差及其与真正育种值之间的相关系数表示预测精度。

毛泡桐种源群体平均值估算育种值时,最小平方估计的方差[Var(ĝ)’]和误差方差[Var(ĝ-g)’]分别为:Var(ĝ)’=4×(δF2FRi.2/rW.. 2/rm), Var(ĝ-g)’=Var(ĝ)’-Var(g)。

2 结果与分析 2.1 育种值分析 2.1.1 根据个体数值预测育种值

根据单株观测数据,用混合模型方程组预测8种泡桐的育种值,其中不考虑亲缘关系时把分子血缘相关矩阵规定为单位矩阵,考虑亲缘关系时用种间相似系数构造分子血缘相关矩阵。结果不管是否考虑亲缘关系,育种值的预测结果变动不大(表 2),在这两种情况下树高育种值的秩次相关达到极显著水平(0.857 1**),胸径则达到显著水平(0.714 3*)。

表 2 根据单株试验数据预测的育种值(BLUP) Tab.2 The breeding values predicted by BLUP and based on individual data
2.1.2 根据小区平均值预测育种值

根据小区平均值的预测结果列于表 3。可以看出,在不考虑亲缘关系的情况下,用BLUP方法预测的树高和胸径育种值,分别与BL P预测的,或者基于单株预测的结果比较接近,相应性状的秩次相关系数都在显著水平以上(0.809 5*~0.976 2**),并且与考虑亲缘关系预测相同性状育种值的排序十分接近,秩次相关系数分别达到极显著水平(树高:0.904 8**;胸径:0.857 1**)。不考虑亲缘关系并以BLP预测的树高育种值,与考虑亲缘关系以单株或小区平均值的BLUP预测结果排序也很相似,秩次相关系数达到显著水平(0.714 3*);胸径育种值的秩次相关没有树高密切,但显著性概率水平已经达到82%以上。

表 3 根据小区平均值预测的育种值 Tab.3 The breeding values predicted according to plot mean value
2.2 育种值预测方法 2.2.1 BLUP与BLP

BLUP观测值的期望值,是通过广义最小平方无偏地估算出来的,但BLP的期望值则是假设已经知道并由总平均值估算的。因此BLP没有估算固定效应的误差,总的误差方差比BLUP的小,预测遗传值与真正遗传值之间的相关系数相应地比BLUP的大(见表 4)。这并不能说明BLP比BLUP优越,相反,BLUP能够区分出遗传和环境影响(White et al., 1989),能够调整地点或重复的效应值,使结果更切合实际。由于固定效应的估算方法不同,导致了用BLUP和BLP的预测结果有一定差异。根据本文对8种泡桐的分析,用这两种方法按树高或胸径育种值选择出来的前3种泡桐是一致的,其余种的排序虽有变化,但秩次相关系数达极显著水平。此外,BLP不需要构建结构矩阵,计算过程简单,评定大批量育种材料时可以考虑只用BLP方法预测育种值。

表 4 根据小区平均值预测育种值的精度 Tab.4 The prediction precision of breeding values predicted according to plot mean values
2.2.2 简化预测方法

根据小区内单株观测值和小区平均值预测育种值,然后分别对试验材料排序,结果变动不大,特别是位次靠前的材料几乎无变化(表 2)。例如,假设研究材料没有亲缘关系,用BLUP预测树高育种值时,除排列在第6位的南方泡桐和第7位的海岛泡桐相互变换1次位置外,其余各泡桐种的位次无变化;预测胸径育种值时,只有排在第5、6及第7位的南方泡桐、海岛泡桐和川泡桐有位次变动。育种值处于大小两极端种类的排列顺序完全相同。由于以单株预测育种值时需要建立较大维数矩阵,而矩阵太大会延长计算时间,甚至使微机不能运行,因此,可以只按小区均值预测育种值。

预测经过选择材料的育种值时,估算材料间存在的亲缘关系是应用BLUP方法的前提条件之一(Bernardo, 1996; Henderson, 1985)。Bernardo以RFLP研究玉米的亲缘性,用正确和不正确的亲缘相关矩阵检验BLUP预测值的稳定性,结果在各种情况下预测值和观测值之间的相关系数变化很小(Bernardo, 1996)。本文在研究材料有亲缘关系和假设没有亲缘关系的条件下,无论是树高还是胸径,按单株预测还是小区均值预测,BLUP预测值的秩次相关系数都达到显著或极显著水平(显著性概率:0.046 5~0.002 0),这与玉米的育种值预测研究结果相类似,说明用BLUP预测泡桐育种值时,是否考虑亲缘关系对预测的泡桐育种值没有明显影响。由于用任何一种方法估算亲缘相关矩阵都需要投入一定的人力和物力,在今后的育种值预测中可以假设研究材料之间不存在亲缘关系。

2.2.3 预测育种值的误差

表 4可以看出,预测育种值的方差、误差方差以及预测育种值与真正育种值的相关,在不同情况下都有相似的变化趋势,即预测育种值的方差越大,误差方差就越小,预测育种值与真正育种值的相关相应地也越大。由表 4中的数据计算3个指标的相互关系,结果预测育种值和真正育种值的相关与预测育种值的方差、误差方差之间存在极显著的相关关系,因此,只用预测育种值与真正育种值的相关系数就可以同时代表预测育种值的方差和误差方差,反映预测的精度。

2.2.4 BLP与最小平方估算法的比较

预测育种值间的方差和误差方差都可以作为预测精度指标(White et al., 1988;1989)。当试验规模较大时,BLP的方差较大,误差方差较小,预测值趋于扩散;用最小平方估算时则相反,精确度越低,估算的值就越大。因此,用后者会趋于选择那些具有较少试验地点数、重复数和个体数的材料。利用毛泡桐种源试验胸径性状求算这两种方法的精度,结果如图 1图 2所示。可以看出,用最小平方估算方法估算育种值时,观测数据少的种源,方差和误差方差都大,容易被选;而观测数据多的种源不易当选。BLP则相反,观测数据少的种源,方差也小,此时预测的育种值收缩在零附近,很难被选中,即使被选中,因误差方差大,选择的可靠性也很差,而那些观测数据多的种源则容易被选中。从图中还可以看出,随着重复数和小区内株数的增大,这两种方法的预测结果趋于相同,此时预测育种值间的方差近似于种源的遗传方差,环境方差接近于0。对于毛泡桐种源试验的胸径性状来说,当重复数大于5,小区内的株数多于6个时,这两种预测方法的精度差别明显地变小。

图 1 BLP和最小平方估算法预测育种值之间的方差随重复数和小区内株数的变化 Fig. 1 The changes in the variance among the breeding value predicted by BLP with replication and individual numbers ①最小平方估算法The breeding values predicted by least squares estimates; ②BLP法The breeding values predicted by BLP.
图 2 BLP和群体平均值法预测育种值之间的误差方差随重复数和小区内株数的变化 Fig. 2 The changes in the error variance among the breeding value predicted by BLP and least squares estimates with replication and individual numbers ①最小平方估算法The breeding values predicted by least squares estimates; ②BLP法The breeding values predicted by BLP.
3 结论

根据8种泡桐的育种值分析,是否构建分子血缘相关矩阵对BLUP预测育种值的结果无显著影响,所以在作育种值预测时,可以不考虑分析材料之间的亲缘关系。当评定大批量育种材料时,为便于计算,可以用BLP代替BLUP预测育种值,此外,还可以用小区平均值代替单株观测值进行预测。

育种值的预测精度可以用预测育种值的方差、误差方差以及预测育种值与真正育种值的相关表示。由于这3个精度指标之间有一定的内在联系,可以只用预测育种值与真正育种值的相关反映预测精度。

在对育种材料进行选择时,BLP预测的育种值比最小平方估算值更可靠,但当试验重复数和小区内的株数逐渐增多时,两种方法预测的结果趋于相同。对于本文所分析的材料,当5次以上重复和每小区6个以上个体时,这两种预测方法的可靠性明显地接近。

参考文献(References)
马浩, 李佩健, 沈熙环. 1998. 毛泡桐种源育种值早期预测的研究. 林业科学研究, 11(2): 179-185. DOI:10.3321/j.issn:1001-1498.1998.02.012
吴仲贤. 1977. 统计遗传学. 北京: 科学出版社.
张源, 张勤. 1993. 畜禽育种中的线性模型. 北京: 北京农业大学出版社.
Bernardo R. 1996. Best linear unbiased prediction of maize single-cross performance. Crop Sci, 36: 50-56. DOI:10.2135/cropsci1996.0011183X003600010009x
Bernardo R. 1996. Best linear unbiased prediction of maize sinlge-cross performance given erroneous inbred relationship. Crop Sci, 36: 862-866. DOI:10.2135/cropsci1996.0011183X003600040007x
Bernardo R. 1993. Estimation of coefficient of coancestry using molecular markers in maize. Theor Appl Genet, 85: 1055-1062. DOI:10.1007/BF00215047
Cotterill P P, Dean C A. 1990. Successful tree breeding with index selection. Australia:CSIRO.
Ericsson T, ǒDanell. 1995. Genetic evaluation, multiple-trait selection criteria and genetic thinning of pinus contorta var. latifolia seed orchards in sweden. Scand J For Res, 10: 313-325. DOI:10.1080/02827589509382898
Henderson C R. 1985. Best linear unbiased prediction using relationship matrices derived from selected base populations. J Dairy Sci, 68(2): 443-448. DOI:10.3168/jds.S0022-0302(85)80843-2
Henderson C R. 1975. Inverse of a matrix of relationships due to sires and maternal grandsires. J Dairy Sci, 58(12): 1917-1921. DOI:10.3168/jds.S0022-0302(75)84809-0
Klein J I. 1995. Multiple-trait combined selection in jack pine family-test plantations using best linear prediction. Silvae Genetica, 44(5-6): 362-375.
Souza S M De, Hodge G R, White T L. 1992. Indirect prediction of breeding values for fusiform rust resistance of slash pine parents using greenhouse tests. Forest Sci, 38(1): 45-60.
Surles S E, White T L, Hodge G R. 1995. Genetic parameter estimates for seedling dry weight traits and their relationship with parental breeding values in slash pine. Forest Sci, 41(3): 546-563.
Surles S E, White T L, Hodge G H and Duryea M L. 1993. Relationships among seed weight components, seedling growth traits, and predicted field breeding values in slash pine. Can J for Res, 23: 1550-1556. DOI:10.1139/x93-195
Tibbits W, Hodge G R. 1998. Genetic parameters and breeding value predictions for Eucalyptus nitens wood fiber production traits. Forest Science, 44(4): 587-598.
White T L, Hodge G R. 1988. Best linear prediction of breeding values in a forest tree improvement program. Theor Appl Genet, 76: 719-727. DOI:10.1007/BF00303518
White T L, Hodge G R. 1989. Best linear prediction of breeding values in forest tree improvement. Dordrecht, Netherlands:Kluwer Academic Publishers.