文章信息
- 刘天颐, 杨会肖, 刘纯鑫, 王金榜, 黄少伟
- Liu Tianyi, Yang Huixiao, Liu Chunxin, Wang Jinbang, Huang Shaowei
- 火炬松基因资源的育种值预测与选择
- Prediction of Breeding Values and Selection to the Gene Resources of Loblolly Pine
- 林业科学, 2014, 50(8): 60-67
- Scientia Silvae Sinicae, 2014, 50(8): 60-67.
- DOI: 10.11707/j.1001-7488.20140809
-
文章历史
- 收稿日期:2014-02-17
- 修回日期:2014-04-30
-
作者相关文章
2. 广东省林业科学研究院 广州 510520;
3. 英德市林业科学研究所 英德 513055
2. Guangdong Academy of Forestry Guangzhou 510520;
3. Yingde Institute of Forestry Yingde 513055
育种值又称加性效应值,是林木选择育种中的重要参数,可以估算遗传增益。育种值不能直接度量,它包含在由各种遗传效应和环境效应共同作用得到的表型值内,可利用统计方法,通过表型值和个体之间的亲缘关系来剖分遗传效应和环境效应(White et al., 2007)。在林木遗传改良实践中,由于待测亲本群体数量庞大,子代测定林建立的时间、组成亲本及其所包含的家系数量、交配设计、田间试验设计和试验林的保存率等各不相同,导致观测数据复杂多样、难以分析,因此对育种值的精确预测变得更加困难(White et al., 1989)。利用最佳线性无偏预测法(best linear unbiased prediction, BLUP)预测随机效应的值,在所有的线性无偏预测中具有最小的方差(朱军,2000)。Henderson(1953;1963;1974;1975;1976a;1976b;1980)提出并完善了育种值的最佳线性无偏预测方法,并找出了由谱系对分子亲缘相关矩阵直接求逆的方法,该方法能在表型信息真实可靠、谱系资料完整正确、所用模型是真实模型以及模型中随机效应的方差组分已知的前提下同时估计固定效应值和预测育种值。ASReml是一个基于混合线性模型(mixed linear model)的统计软件包,适用于复杂的遗传分析,包括估计随机效应的方差组分、固定效应值和预测随机效应值等。该软件利用最佳线性无偏估计法(best linear unbiased estimation, BLUE)得到固定效应的最佳无偏估计值和利用最佳线性无偏预测法(BLUP)(Gilmour et al., 1995;2009)得到随机效应的最佳无偏预测值。
本研究采用ASReml 3.0软件对参试材料的生长数据进行分析。ASReml可以充分利用有关联的群体和个体间的亲缘关系信息来准确预测育种值。由于林木群体大小是有限的,在有限群体内,遗传漂变、近交和选择使得群体内的基因频率发生改变,致使该群体的遗传均值和遗传方差通常不是常数而是可变的,因此具有亲缘相关矩阵的线性混合模型能够解释在建立基本群体时遗传均值和方差的改变。ASReml在运算中首先通过迭代求解出随机效应方差和误差方差,然后计算系数矩阵和等式右边的向量,建立方程组并得到固定效应的最佳无偏估计值和随机效应的最佳无偏预测值(Kennedy et al., 1988;Gilmour, 1997)。
广东省火炬松(Pinus taeda)遗传改良正处于第2代向第3代过渡的阶段,面临着如何提高选择效率、获得稳定的遗传增益的问题。采用BLUP方法和谱系信息,能有效减小预测育种值的误差方差,提高选择的准确性,并使得不同世代个体育种值的预测成为可能,精确的BLUP预测值和基于个体育种值的前向选择将提高遗传改良进程中的选择效率和遗传增益。
1 材料与方法 1.1 试验地概况试验地位于广东省英德市林业科学研究所(24°15′N, 113°45′E)。年平均气温20.7 ℃,最高温38.5 ℃,最低温-3.6 ℃,年积温6 200 ℃,年降雨量1 917.77 mm。试验地为低丘,坡度< 25°,海拔50 m, 土壤为发育在砂页岩上的赤红壤,pH 5.2~6.7。
1.2 试验材料与试验设计在联合国发展计划署援建的火炬松改良种子园项目(CPR/91/153,1992—1996)资助下,从美国引进的258个不同改良程度的火炬松优良家系作为本研究的试验材料。
由于试验地难以一次性安排全部258个家系,同时为控制试验区内环境误差,按材料来源和类型划分为8个类群,对应8个试验号。根据各类群的改良代次可以分为三大类: 第一大类是优树自由授粉子代,包括沿海种源和山地种源2个类群;第二大类是第1代种子园材料,包括种子园自由授粉子代和控制授粉子代2类,根据原始资料代码分为8编号种源、大编号种源、1~27编号种源、第1代家系和全同胞家系5个类群;第三大类是第2代种子园材料,只有第2代种子园自由授粉子代1个类群。
每个类群的试验均采用随机完全区组设计,栽植密度为3 m×3 m, 1997年春造林。各试验详细情况见表 1,其中78,110号家系同时参与沿海种源和8编号种源试验。英德火炬松初级种子园自由授粉种子作为对照(CK),参加全部8个试验。
14年生时分别对试验林进行每木调查,测量树高与胸径。10年生时进行通直度调查,最高分为5分,其中通直无弯曲5分,1个弯曲4分,2个弯曲3分,3~4个弯曲2分,4个以上弯曲或分叉1分。本研究主要对14年生试验林的生长数据进行分析。
利用软件ASReml 3.0对火炬松8个类群分别进行各家系和个体树高与胸径育种值的预测(Gilmour et al., 2009)。
利用家系模型预测单类群的自由授粉家系育种值的模型如下1):
Yijkl=μ+Li + R(L)ij + Fk +R(L)Fijk+ eijkl。
利用家系模型预测单个类群的控制授粉家系育种值的模型如下2):
Yijklm= μ + Li +R(L)ij + Dk + Ml+R(L)DMijkl + eijklm。
利用个体模型以及个体间的亲缘关系系数预测多类群个体的育种值的模型如下3):
Yijkl= μ + Li + R(L)ij+ Tijkl + R(L)Fijk +eijkl。
1)计算半同胞家系胸径单株遗传力和育种值的程序(括号内文字是对程序指令的简单解释):
dbh14 ~ mu Loc Loc.Rep !r Family Rep.Loc.Family(固定效应为地块、地块内区组;随机效应为家系、地块内区组×家系)
0
!PIN !define
F Add_H 1*4 #4(半同胞家系加性方差=家系方差×4)
F totalG_H 1+2+3 #5(表型方差)
H heritA_H 4 5(遗传力=加性方差/表型方差)
2)计算全同胞家系胸径单株遗传力和育种值的程序:
dbh14 ~ mu Loc Loc.Rep !r Dad Mum Rep.Loc.Dad.Mum(固定效应为地块、地块内×区组;随机效应为父本、母本、地块内区组×父本×母本)
!PIN !define
F Add_H 1*2+2*2 #5(对于全同胞家系,加性方差=(母本方差+父本方差)×2)
F totalG_H 1+2+3+4 #6(表型方差)
H heritA_H 5 6(遗传力=加性方差/表型方差)
3)计算个体遗传力和育种值的程序:
dbh14 ~ mu Loc Loc.Rep !r-Family TreeID Rep.Loc.Family(固定效应为地块、地块内区组;-Family: 不对该效应进行分析;TreeID为亲缘关系系谱文件;随机效应为地块内区组×家系)
!PIN !define
F Add_H 1 #5(根据亲缘关系计算加性方差)
F totalG_H 1+2+3 #6(表型方差)
H heritA_H 4 5(遗传力=加性方差/表型方差)
程序运行后输出结果,其中.sln文件输出的是育种值,.pvc文件输出的是遗传力值,.asr文件输出的是模型拟合结果与方差成分。
上述的生物学模型可用一般混合线性模型概括如下:
y=Xb+Zu+e。
BLUP 预测每个个体性状育种值的公式为:
${{\hat{a}}_{i}}=h_{i}^{2}\left( {{y}_{i}}-\hat{\mu } \right)$。
遗传增益的计算公式如下:
$\Delta G=\frac{1}{m}\sum\limits_{i=1}^{m}{{{{\hat{a}}}_{i\text{S}}}}-\frac{1}{n}\sum\limits_{i}^{n}{{{{\hat{a}}}_{i\text{ALL}}}}$
表 2列出了各类群14年生时胸径育种值大于0的家系。根据预测的胸径育种值,结合树高的育种值,以15%入选率进行各类群的家系选择。结果沿海种源入选家系有4个,分别为81,86,127,129号家系,入选家系的遗传增益为0.93 cm, 达5.97%;山地种源入选家系有5个,分别为87,95,102,113,130号家系,入选家系的遗传增益为0.94 cm, 达6.64%;第1代家系类群入选家系有6个,分别为134,144,148,149,151,209,入选家系的遗传增益为1.17 cm, 达7.76%;8编号种源入选家系有5个,分别为170,182,183,201,233,入选家系的遗传增益为1.14 cm, 达6.63%;第2代家系类群入选家系有4个,分别为264,265,271,281,入选家系的遗传增益为0.93 cm, 达5.79%;大编号种源入选家系有4个,分别为162,169,231,195,入选家系的遗传增益为0.61 cm, 达4.07%;1-27编号种源入选家系有4个,分别为232,237,291,294,入选家系的遗传增益为1.19 cm, 达7.41%;全同胞家系类群入选家系有7个,分别为12,14,20,33,35,56,58,入选家系的遗传增益为1.40 cm, 达8.56%。
本研究主要以各家系14年生时预测的胸径育种值作为主要选择指标,同时结合树高的育种值进行选择。入选家系必须满足胸径和树高的育种值均大于0,即这2个性状都必须大于该类群的平均值。采用BLUP计算出的育种值都已经用遗传增益的形式表达出来,因此加性遗传增益可以通过入选群体各成员育种值的BLUP预测值的平均值来估计。因此,根据选择结果可知,全同胞家系类群入选家系胸径的遗传增益最高,达到1.40 cm, 为8.56%,预测入选家系的平均胸径能达到17.68 cm, 处于所有参试类群的首位,是本批引入的火炬松基因资源里遗传型最优良的一个类群。
作为对照(CK)的英德火炬松种子园第1代自由授粉种子,其生长量在各类群试验中都处于平均水平之上。
2.2 各类群个体育种值的预测结果与选择表 3列出了根据14年生时预测的胸径育种值、主要采用配合选择并结合通直度指标选出的优良单株,同时选择少量家系育种值排名靠前、个体育种值较高的单株。入选的77个单株胸径的遗传增益为2.08 cm, 树高的遗传增益为0.65 m, 通直度得分均在4分以上,入选率为1%。各类群入选个体胸径的遗传增益在1.82~2.56 cm之间,达11.24%~14.85%;树高的遗传增益在0.51~1.07 cm之间,达4.87%~10.56%;入选个体胸径的平均生长量为22.82 cm, 树高的平均生长量为12.16 m, 均大于对照。
在参与试验的8个类群中,沿海种源的生长表现要优于山地种源,与国内外报道结果一致,即火炬松优良种源来自低纬度的沿海地区。全同胞家系树高和胸径的总体表现均最优,这也再次证明采用科学的交配设计,通过控制授粉,可以获得较大的遗传增益,这与我国火炬松核心群体育种实践结果也是一致的(刘天颐等,2013)。
作为对照的广东省英德市第1代火炬松种子园自由授粉子代,在8个试验中均排在前列,高于各试验平均水平,这证明我国火炬松良种选育是有效的,种子园生产的种子用于生产造林可以获得较大的增益。但这并不代表这批试验的火炬松基因资源价值不高。这批基因资源的引进对于我国火炬松良种选育具有重要意义,为现有的火炬松基因资源补充大量新的遗传材料,应该予以长期保留。
3.2 根据育种值进行选择的效率与准确性由于在野外实测过程中,胸径的测定较树高更为准确,因此本研究主要根据预测的胸径育种值进行选择。各类群以入选率为15%进行优良家系的选择,主要采用配合选择,根据预测的育种值以1%的入选率选出优良单株。为保证尽可能宽的遗传基础,每个类群都选出各自的优良家系进入基因库作为候选育种材料,适当选择所在家系育种值较高、个体育种值排在前列的单株。最终选出39个优良家系、77个优良单株。
BLUP计算育种值的过程中会根据数据的质量和数量给它们赋予权重,估算出每个单株的育种值,而不是以群体的单株遗传力来估算单株育种值,它在计算时考虑到地形环境的变化对育种值的影响,并根据环境误差等计算单株育种值向群体平均育种值(群体平均育种值一般为“0”)退缩或收缩的量。预测的育种值差异直接体现候选群体基因型值的差异,这有利于育种工作者开展选择。
选择过程中,育种工作者经常面临对候选家系如何取舍的问题,本研究也遇到同样的问题。在大编号种源优良家系的选择中,根据预测的胸径育种值,173号家系可以入选,但其树高育种值为-0.14,排在其后的189号家系存在同样的情况,195号家系胸径的育种值比173和189号家系稍低,但其树高育种值表现优良,最终195号家系入选。如果仅考虑家系的生长表现,则205和199号家系的生长表现要接近甚至优于195号家系,但它们的胸径育种值低于195号家系。在单株选择过程中,在生长表现差异不大的情况下,育种值高的单株优先入选。在没有育种值作参考的情况下,开展选择工作耗费的时间与精力将更多,而为保证不漏选,需要扩大入选范围,造成选育成本的上升。
在进行个体生长性状育种值的预测时,通过构建亲缘关系矩阵,可以调整由于群体内非随机交配引起的个体间的遗传关系,使得对育种值的估算更加准确。国内对于构建亲缘关系矩阵用于估算个体育种值的研究还停留在理论分析与验证阶段(孙晓梅等,2011;边黎明等,2012)。本研究利用个体间的亲缘关系的BLUP方法估计亲本和子代个体的育种值,据此开展火炬松优良家系与个体的选育,提高了选育的效率与准确性,为火炬松良种的后续选育奠定了基础。
3.3 入选家系与个体的利用本研究筛选出胸径育种值较高的39个家系,约占家系总数的15%,这些火炬松优良家系在英德林业科学研究所的火炬松种子园基地生长良好,具有推广前景。这些家系是由联合国发展计划署援建的火炬松改良种子园项目所提供,资料完备,有利于亲本的重复查找。对于表现特别优良的家系,可以考虑重复引种或直接引进其亲本材料。
入选的优良个体77株大部分来自优良家系,个别来自育种值排在前列的家系,其个体育种值表现优异。这些入选个体将用于充实火炬松第2代育种群体,其中最优的10个加入第2代核心群体,与该群体其他亲本通过控制授粉获得第3代核心群体的基本群体,其余67个补充入第2代主群体,与该群体的其他亲本通过自由授粉获得第3代主群体的基本群体。
广东省火炬松多世代遗传改良研究已经迈向第3代,通过本研究将补充一批优质遗传材料进入育种群体,保证在良种选育过程中保持较宽的遗传基础,尽可能降低近交造成的衰退。同时,由于育种材料来源的增加,亲缘关系日趋复杂,如何高效利用这些材料、提高选择效率与准确性,是当前面临的首要问题。通过估计亲本和子代个体的育种值,以基因型选择代替表型选择是目前国外林木育种采用的选择方法,本研究采用这种方法进行火炬松基因资源的选择,提高了选育的有效性和准确性。
3.4 ASReml软件的应用本研究采用ASReml 3.0软件对258个火炬松家系和所有参试个体生长性状的育种值进行预测,依据育种值对所有家系和个体进行排序,为火炬松家系和个体选择与利用提供了依据。该软件正是利用BLUP方法得到随机效应的最佳无偏预测值。ASReml在林木遗传分析中具有很好的应用前景,但要让其真正发挥作用则必须有与其配套的选育方案与试验设计。
ASReml采用BLUP估算育种值,但在其运算过程中要把对照(CK)数据剔除,只针对参试材料进行分析,这与目前国内常用的数据分析方法不同。国内大部分的试验设计都是通过设置共同对照来分析比较不同试验中各参试材料的生长情况,特别是当参试家系数较多的情况下,由于田间试验条件的限制,一般都把参试家系分成多个试验组,每组设置共同对照,在以后的数据分析时,利用共同对照对参试材料生长数据进行校正。本研究在安排258个家系进行田间试验时也采取了这样的试验设计。但ASReml目前仍未有适用于该试验设计的统计模型,只能对单一试验进行分析,无法对全部分组试验进行整合分析。在本研究数据分析过程中同样面临这个问题,只能对单个类群的试验进行分析,使得试验数据无法获得最有效的利用,这在很大程度上限制了ASReml强大功能的发挥。国外在开展此类试验时,多采用平衡不完全区组设计,利用试验设计软件(如CycDesign),把所有参试家系统一在一个试验中,科学安排田间试验,获得的生长数据可直接利用ASReml软件进行分析。在今后开展林木子代测定试验时,应重视田间试验设计,使得测定数据发挥最大作用。
[1] | 边黎明, 施季森, 童春发, 等.2012.ASReml及其在林木遗传分析中的应用前景.林业科技开发, 26(4): 9-12.(1) |
[2] | 刘天颐, 刘纯鑫, 钟伟华, 等.2013.火炬松核心育种群体子代生长变异与选择.林业科学, 49(2): 27-32.(1) |
[3] | 孙晓梅, 杨秀艳.2011.林木育种值预测方法的应用与分析.北京林业大学学报, 33(2): 65-71.(1) |
[4] | 朱军.2000.线性模型分析原理.北京: 科学出版社.(1) |
[5] | Gilmour A R, Thompson R, Cullis B R. 1995. Average information REML: an efficient algorithm for variance parameter estimation in linear mixed models. Biometrics, 51(4): 1440-1450.(3) |
[6] | Gilmour A R. 1997. ASReml for testing fixed effects and estimating multiple trait variance components. Proceeding of the Association for the Advancement of Animal Breeding and Genetics, 12: 386-390.(1) |
[7] | Gilmour A R, Gogel B J, Cullis B R, et al. 2009. ASReml User Guide Release 3.0. Hemel Hempstead: VSN International Ltd.(1) |
[8] | Henderson C R. 1953. Estimation of variance and covariance components. Biometrics, 9 (2): 226-252.(1) |
[9] | Henderson C R. 1963. Selection index and expected genetic advance//Hanson W D, Robinsion H F. Statistical genetics and plant breeding. Washington DC: NAS-NRC Pub., 141-163.(1) |
[10] | Henderson C R. 1974. General flexibility of linear model techniques for sire evaluation. Journal of Dairy Science, 57 (8): 963-972. (1) |
[11] | Henderson C R. 1975. Use of all relatives in intraherd prediction of breeding values and producing abilities. Jounal of Dairy Science, 58(12):1910-1916. (1) |
[12] | Henderson C R. 1976a. Inverse of a matrix of relationships due to sires and maternal grandsires in an inbred population. Journal of Dairy Science, 59(9): 1585-1588. (1) |
[13] | Henderson C R. 1976b. A simple method for computing the inverse of a numerator relationship matrix used in prediction of breeding values. Biometrics, 32(1): 69-83. (1) |
[14] | Henderson C R. 1980. A simple method for unbiased estimation of variance components in the mixed model. Journal of Animal Science, 58(1): 119. (1) |
[15] | Kennedy B W, Sorenson D A. 1988. Properties of mixed-model methods for prediction of genetic merit//Proceedings of the Second International Conference on Quantitative Genetics. Sunderland, USA: Sinauer Associates, 91-103.(1) |
[16] | White T L, Hodge G R. 1989. Predicting breeding values with applications in forest tree improvement. Dordrecht: Kluwer Academic Publishers.(1) |
[17] | White T L, Thomas A W, Neale D B. 2007. Forest genetics. CAB International, Wallingford UK.(2) |