畜牧兽医学报  2021, Vol. 52 Issue (11): 3108-3117. DOI: 10.11843/j.issn.0366-6964.2021.011.012    PDF    
一种适用于单胎动物多品种选择的基因组关系矩阵
张洪志, 任端阳, 安丽霞, 乔利英, 刘文忠     
山西农业大学动物科学学院, 太谷 030801
摘要:旨在提出一种新型基因组关系矩阵并验证其在多品种联合群体中的模拟应用效果。本研究利用QMsim软件模拟牛的表型数据和基因型数据;利用Gmatrix软件构建常规G阵;利用R语言构建新型G阵,新型G阵在常规G阵的基础上,将多品种联合群体的非哈代-温伯格平衡位点考虑在内;利用DMU软件使用“一步”法模型计算基因组估计育种值(estimated genomic breeding value,GEBV);比较不同情况下使用两种G阵的GEBV预测准确性。结果表明,在不同遗传力及QTL数下,不对新型G阵使用A22阵加权就能达到常规G阵使用A22阵加权时的GEBV预测准确性。在系谱部分缺失时,新型G阵不加权较常规G阵加权时GEBV预测准确性高。证明,在系谱有部分缺失时,新型G阵对多品种GEBV的预测有一定优势。
关键词基因组选择    模拟研究    一步法    基因组关系矩阵    多品种    
A Novel Genomic Relationship Matrix Applied to Single Birth Animals for Across-breeds Genomic Selection
ZHANG Hongzhi, REN Duanyang, AN Lixia, QIAO Liying, LIU Wenzhong     
College of Animal Science, Shanxi Agricultural University, Taigu 030801, China
Abstract: This study aimed to propose a new genomic relationship matrix and validate its simulated application efficacy for an across-breeds population. The bovine phenotypic and genotypic data were simulated by QMsim software; General G matrix was constructed by Gmatrix software; The new G matrix was constructed by R language. Compared with the general G matrix, the new G matrix took into account the Hardy-Weinberg disequilibrium loci in combined population; The ssGBLUP method in DMU software was used to calculate the estimated genomic breeding values; The GEBV accuracies predicted by two G matrixes were compared for different situations. The results indicated that under different heritabilities and QTL numbers, the GEBV accuracy of the general G matrix using A22 matrix weighting could be achieved without using the A22 matrix weighting for the new G matrix. When the partial pedigree information missed, the GEBV accuracy of new G matrix without weighting outperformed general G matrix with weighting. In conclusion, new G matrix could perform better on GEBV prediction for across-breeds population when the partial pedigree information missed.
Key words: genomic selection    simulated research    ssGBLUP    genomic relationship matrix    across-breeds    

最佳线性无偏预测(best linear unbiased prediction, BLUP)使用系谱信息构建分子血缘相关矩阵(A阵),结合表型信息计算常规估计育种值(estimated breeding value, EBV)[1]。对于易测量、中高遗传力的性状,BLUP取得了较好的应用效果[2-3];但是对于低遗传力性状、限性性状、难以测定及生命晚期才能测定的性状等,其应用效果较差[4-5]

单核苷酸多态性(single nucleotide polymorphism, SNP)芯片可提供生物个体全基因组范围的基因型信息。随着SNP芯片技术的发展及其制作成本的降低[6],SNP芯片正被广泛应用于基因组选择(genomic selection, GS)[7-8]。GS是一种全基因组范围的标记辅助选择[9],用来计算畜禽个体的基因组估计育种值(genomic estimated breeding value, GEBV)。最初实施GS使用“多步”法[10],包括基因组最佳线性无偏预测(genomic BLUP, GBLUP)和贝叶斯及其改进方法[11-12]。多步法使用EBV[13]或逆回归育种值[14-15]作为伪表型值,通过伪表型值和基因组信息预测GEBV,从而用于选种[16]。由于使用伪表型值及一些参数估值有偏,多步法的可靠性较低[17]。一步法(single-step GBLUP, ssGBLUP)将基因组信息添加到由系谱信息构建的A阵中构建基因组关系矩阵(H阵),结合表型信息直接预测未基因分型个体的EBV及基因分型个体的GEBV。ssGBLUP的计算步骤较简单且准确性不比多步法低[17-18],已在奶牛育种中广泛应用[19-20],这得益于在奶牛中可以组建足够规模的参考群体[21]

对于肉牛、绵羊等家畜,通常群体规模较小,实施单品种GS(within-breed GS, wbGS)效果较差[22]。针对这一科学问题,提出并逐渐开始研究多品种GS(across-breeds GS, abGS)[23-24]。但是,目前缺少针对abGS的统计方法,使得abGS的应用效果较差[25]

本研究旨在提出一种针对abGS的基因组关系矩阵构建方法,并通过模拟研究对该方法的使用效果进行评估,为abGS的实际应用提供新思路。

1 材料与方法 1.1 数据模拟

1.1.1 群体结构   使用QMsim软件[26]模拟数据。模拟4个数量性状基因座(quantitative trait loci, QTL)数水平(50、100、500、1 000)及3个遗传力(heritability, h2)水平(0.1、0.3、0.5),共产生12个性状。模拟牛的29对常染色体的50K SNP标记信息。对整个模拟过程重复10次,以减少抽样误差。模拟的群体结构和基因组参数见表 1表 2

表 1 群体结构模拟参数 Table 1 Simulated parameters of the population structure
表 2 基因组模拟参数 Table 2 Simulated genomic parameters

第一步,模拟历史群体。起始群体规模为3 000头,至500代时,群体规模递增到40 000头,至800代时,群体规模递减到30 000头,以得到与实际肉牛群体相似的连锁不平衡(linkage disequilibrium, LD)程度和突变-漂变平衡[27]。整个历史群体创建阶段,公母数目保持一致,采用随机交配。

第二步,模拟5个当代群体,每个群体模拟13个世代,视为5个品种。5个当代群体相互独立,分别从历史群体最后一代随机选择10头公牛,100头母牛作为当代群体的初始群体。模拟群体的前9代作为扩繁群体,公牛的淘汰率为60%,公、母牛的增长率为35%;10~13代公、母牛淘汰率分别为60%和20%,公母牛数量不再增长。公、母牛随机交配,每头母牛每年生产1头后裔,公、母后裔各半。选择估计育种值(estimated breeding value, EBV)高的个体留种。

使用Henderson动物模型[28]BLUP估计EBV。模拟性状表型方差标准化为1,个体的真实育种值为所有QTL加性遗传效应之和,个体的表型值为真实育种值与随机残差之和。模拟数据不考虑固定效应。

1.1.2 基因组   基于牛的真实基因组信息[29-30],模拟29对常染色体,总长2 333 cM。为了模拟接近真实情况的SNP-QTL的LD,依据真实染色体长度及数目模拟基因组信息。模拟50 000个SNPs标记,假定SNP标记均匀分布在全基因组范围内,标记无效应。对QTL数设(50、100、500、1 000)4个水平,QTL的最小等位基因频率(minor allele frequency, MAF)为0.1。假定QTL在全基因组范围内随机分布,QTL效应值服从伽马分布(形状参数为0.4)。为了创建突变-漂变平衡,设置历史群体中QTL和SNP标记的回复突变率为10-5

1.1.3 参考群体和候选群体   选择5个品种的第8~12代个体作为联合参考群体,5个品种的第13代作为联合候选群体。5个群体中挑选10~12代有后裔的个体保留基因型信息,第13代随机选择250个个体(每个品种50个)保留基因型信息。对于基因分型个体,对其模拟不同比例(20%、40%、60%、100%)的系谱缺失,即个体的父号或母号未知。之前大部分GS的模拟研究只将无表型有基因分型的个体作为候选群体,Christensen用真实数据进行交叉验证发现[31],ssGBLUP模型对候选群体中基因分型和未进行分型的个体均能提高GEBV的准确性,在GS实施阶段,可以对部分候选群体进行基因分型就能整体提高GEBV的准确性。本研究只对部分候选群体进行基因分型,更有实践意义。

1.2 统计模型

使用ssGBLUP模型:

$ y=Xb+Zu+e $

其中,y为表型值向量;b为固定效应向量;u为育种值向量;e为随机残差效应向量。XZ分别为固定效应和育种值向量的关联矩阵。

混合模型方程组为:

$ {\left[ {\begin{array}{*{20}{c}} {X' X}&{X' Z}\\ {Z' X}&{Z' Z + {H^{ - 1}}\lambda } \end{array}} \right]\left[ \begin{array}{l} {\hat b}\\ {\hat u} \end{array} \right] = \left[ \begin{array}{l} X' y\\ Z' y \end{array} \right]} $

其中,λ =σe2/σu2,var(u)=u2,var(e)=e2

H阵为:

$ \begin{align} & \ \ \ \ \ H=\text{ } \\ & \left[ \begin{matrix} {{A}_{11}}+{{A}_{12}}A_{22}^{-1}\left( G-{{A}_{22}} \right)A_{22}^{-1}{{A}_{21}} & {{A}_{12}}A_{22}^{-1}G \\ GA_{22}^{-1}{{A}_{21}} & G \\ \end{matrix} \right] \\ \end{align} $

H阵的逆表示为:

$ {{H}^{-1}}={{A}^{-1}}+\left[ \begin{matrix} 0 & 0 \\ 0 & G_{w}^{-1}-A_{22}^{-1} \\ \end{matrix} \right] $

其中,Gw=(1-w)G+wA22A阵为基于系谱构建的分子血缘相关矩阵,A22阵为基因分型个体对应的分子血缘相关矩阵,G为利用标记信息构建的基因组关系矩阵,w为对A22的加权系数,本研究中,w取值0和0.05(其中:newGw=0.95newG+0.05A22Gw=0.95G+0.05A22)。使用两种G阵构建H阵:

(1) 常规/标准G阵:

$ G=\frac{ZZ' }{2\sum _{1}^{n}{{p}_{i}}(1-{{p}_{i}})}, Z=M-2P $

(2) 新型G阵(newG):

$ newG=\frac{NN' }{2\sum _{1}^{n}{{p}_{j}}\left( 1-{{p}_{j}} \right)}, N=(M-4P+2\sqrt{Q}) $

其中,M阵的维度为mn列,m为基因分型个体数,n为标记数。标记位点基因型用(0,1,2)表示,0和2代表两种纯合基因型,1代表杂合基因型。P阵中的元素为标记的第二等位基因频率,Q阵的元素为标记的第二纯合基因型频率,pj为第j个标记的第二等位基因频率。

对于联合群体中符合哈代-温伯格平衡(Hardy-Weinberg equilibrium, HWE)的位点,若Q0为该位点的第二纯合基因型频率,p0为第二等位基因频率,则:

(1) $ \sqrt{{{Q}_{0}}}={{p}_{0}}$

(2) ${{N}_{0}}={{M}_{0}}-4{{p}_{0}}+2\sqrt{{{Q}_{0}}}={{M}_{0}}-2{{p}_{0}}+2\left( \sqrt{{{Q}_{0}}}-{{p}_{0}} \right)={{M}_{0}}-2{{p}_{0}}={{Z}_{0}} $

对于联合群体的非HWE(Hardy-Weinberg disequilibrium, HWDE)位点,若Q1为第二纯合基因型频率,p1为第二等位基因频率,则:

(1) $ \sqrt{{{Q}_{1}}}>{{p}_{1}}$

(2) $ {{N}_{1}}={{M}_{1}}-4{{p}_{1}}+2\sqrt{{{Q}_{1}}}={{M}_{1}}-2{{p}_{1}}+2\left( \sqrt{{{Q}_{1}}}-{{p}_{1}} \right)>{{M}_{1}}-2{{p}_{1}}={{Z}_{1}}$

即对于联合群体的HWDE位点,若其第二纯合基因型频率为Q1,则该位点在HWE下,第二等位基因期望频率为$\sqrt{{{Q}_{1}}} $,大于实际的第二等位基因频率p1。用m(0,1,2)表示某个等位基因在二倍体个体上某个位点的个数,m的实际均值为2p1m的期望均值2 $\sqrt{{{Q}_{1}}} $,差值(d=2 $\sqrt{{{Q}_{1}}} $ -2p1)反映了群体间某一位点的均值差异程度。当群体在某一位点处于HWDE时,在该位点的等位基因频率差异存在,则d值不为0。构建newG阵时考虑HWED,在分子部分加入d,通过模拟研究评估newG的预测效果。

1.3 GEBV的预测准确性

使用Gmatrix软件[32]构建常规G阵,使用R语言自编程序构建新型G阵,使用DMU软件[33]计算GEBV。

在不同h2、QTL数及基因分型个体系谱不同缺失比例下,通过候选群体GEBV与真实育种值(true breeding value, TBV)的相关性(correlation coefficient, cor)来衡量应用不同G阵的预测准确性:

$ cor=\frac{Cov\left( GEBV, TBV \right)}{\sqrt{Var\left( GEBV \right)Var(TBV)}} $

其中,Cov为协方差(covariance),Var为方差(variance)。

2 结果 2.1 参考群体和候选群体

本研究模拟了从相同的历史群体得到的5个独立的当代群体(品种),群体结构模拟结果见表 3。使用5个品种的第8~12代作为联合参考群体,个体数为31 935,其中10~12代中共有5 865个个体有基因型信息。将5个群体的第13代作为联合候选群体。候选群体共有7 445个个体,共有250个个体有基因型信息。

表 3 模拟数据的当代群体结构 Table 3 Structure of recent population obtained from QMsim
2.2 基因分型个体系谱无缺失时各模型的预测准确性

基因分型个体系谱无缺失时,QTL数和h2变化时各模型的预测准确性见表 4。可见,QTL数为50,h2为0.3和0.5,及QTL数为100、500和1 000,各种h2时,newGw阵和Gw阵准确性相同,且较newG阵高0.0%~0.2%。QTL数为50,h2为0.1时,newG阵较newGw阵和Gw阵准确性高0.1%。在各QTL数及h2情况下,G阵准确性最低。

表 4 基因分型个体系谱无缺失时不同QTL数和遗传力下各模型的预测准确性(10次重复的均值) Table 4 Prediction accuracy for different methods with alternative QTL numbers and heritabilities when the pedigree of genotyped individuals was complete(averaged over 10 replicates)
2.3 基因分型个体系谱部分缺失时各模型的预测准确性

基因分型个体系谱不同比例缺失(20%、40%、60%)时,QTL数和h2变化时各模型的预测准确性见表 5。可见,各QTL数和h2情况下,newG阵的准确性最高,newGw阵与Gw阵准确性有略微差异(-0.4%~0.3%),G阵准确性最低。随着基因分型个体系谱缺失比例增加,在各QTL数及h2情况下,除G阵外,其他3种G阵准确性逐渐下降,相对于newG阵,newGw阵和Gw阵准确性降低幅度较大。系谱缺失对G阵无明显影响,随着缺失比例增加,G阵准确性甚至会增加。

表 5 基因分型个体系谱不同缺失比例下不同QTL数和遗传力下各模型的预测准确性(10次重复的均值) Table 5 Prediction accuracy for different methods with alternative QTL numbers and heritabilities when the pedigree of genotyped individuals was missing by different ratio (average over 10 replicates)

不同基因分型个体系谱缺失比例下,newG阵较Gw阵的优势(预测准确性差值)变化见图 1。可见,对于所有QTL数,随着h2降低,newG阵优势逐渐增加。这表明,在基因分型个体系谱部分缺失时,newG阵较Gw阵在低遗传力时优势更明显。

图 1 基因分型个体系谱缺失(20%(A),40%(B),60%(C))时newG阵与Gw阵GEBV准确性差值 Fig. 1 The difference of GEBV accuracies between the newG and Gw when 20%(A), 40%(B), 60%(C) genotyped individuals' pedigree was missing
2.4 基因分型个体系谱全部缺失时各模型的预测准确性

基因分型个体系谱全部缺失,QTL数和h2变化时各模型的预测准确性见表 6。可见,各QTL数及h2情况下,newG阵、newGw阵、Gw阵的准确性有轻微差异(±0.1%),且均较G阵高。

表 6 基因分型个体系谱完全缺失时不同QTL数和遗传力下各模型的预测准确性(10次重复的均值) Table 6 Prediction accuracy for different methods with alternative QTL numbers and heritabilities when the pedigree of genotyped individuals was missing completely(average over 10 replicates)

结合表 3~表 6可见,在不同比例的基因分型个体系谱缺失情况下,对于所有G阵,随着h2增加,预测准确性增加,而预测准确性随QTL数并没有明显变化规律。

3 讨论

GS方法的模拟研究是其发展的重要过程,新方法实际应用之前,需要使用模拟数据对其电脑程序、算法及可靠性进行评估,为其实际应用提供参考。然而,数据模拟软件的设计及运行软件时的参数设置与真实情况往往有一定差异,使得模拟研究与实际应用的结果有偏差,如:在模拟研究中,非线性模型明显优于GBLUP法[34],然而使用真实数据验证时,非线性模型较GBLUP只有轻微或没有优势[35]。本研究中,newG阵在模拟研究中显示出一些优势,而其还需要在实际数据中进一步验证。本研究模拟肉牛的多品种联合群体,对于其他单胎动物的多品种或同品种不同地区、不同国家的联合群体理论上仍然适用。

试验结果显示,不同模型的准确性随着h2的增大而提高,Luan等[36]使用实际数据应用GBLUP及Bayes模型时显示出了相似的结果,由此推测,低遗传力性状需要更多的表型来提高GEBV预测准确性。本试验中,不同模型的准确性随QTL数的变化无明显变化,在Daetwyler等[37]的模拟研究中,BayesB模型随着QTL数减少而准确性增高,GBLUP在不同QTL数时,准确性基本无变化。由此可以推测,这可能是由于GBLUP及ssGBLUP假设所有标记解释相同的效应方差,且无主效基因[16],造成了本试验中应用G阵和newG阵时对QTL数的变化不敏感。

本研究中,Gw(Gw=0.95G+0.05A)阵准确性明显高于G阵,Christensen等[31]指出,w反映了标记未能捕获的加性遗传效应方差部分,VanRaden[16]指出,G阵不能保证可逆性,而应用Gw阵可以保证可逆,同时在模拟研究中显示,w值在0.01~ 0.05范围对准确性的影响可以忽略。本研究中提出的newG阵中元素在形式上可以拆分为(newGij= Gij+αijαij取值范围为0.001~0.003),newG阵与Gw阵在系谱完整时得到的准确性基本相同,可以推测newG阵为非奇异阵,保证了其可逆性。Vitezica等[38-39]指出,由于基因分型群体(构建G阵)与系谱包含的所有个体(构建A阵)间标记等位基因频率的差异,造成了G阵和A22阵(基因分型个体的亲缘相关矩阵)的不兼容,为了改善GA22的兼容性,提出了使用(G*=G+Ⅱ′αα为常数,α=A22G),对G阵进行微调,使GEBV预测准确性有轻微提高,newG阵与G*阵形式相似,不同之处在于newG阵和G*阵构建的出发点不同,进而产生了不同的结果。VanRaden[16]指出,A阵中的元素为亲缘相关的期望值,则G阵为亲缘相关的实现值,即(E(G)=A22),本研究中观察到当系谱部分缺失时,newG阵较Gw阵准确性高,可以推测,当系谱缺失时,A阵较G阵可靠性较低,使用A阵对G阵加权,反而会降低G阵的可靠性,然而,newG阵并不依赖A阵加权,因而,系谱部分缺失时,利用newG阵预测GEBV的准确性增高。

阻碍肉牛、绵羊等畜种实施GS的因素有:1)参考群体规模少;2)群体中同品种个体较少,群体中多品种混杂[40];3)信息记录系统不完善,如:系谱记录,表型记录等[41]。因此,研究多品种联合或同品种不同地区联合实施GS是未来的趋势[25]。对于abGS,各品种间等位基因频率的差异会造成多品种联合群体出现大量HWDE位点[42],目前还没有将HWDE考虑入GS的方法,本研究考虑HWDE因素构建基因组关系矩阵,在系谱部分缺失情况下具有优势,然而,HWDE对abGS的影响还有待进一步研究。

4 结论

本研究针对abGS的G阵构建进行了探索,提出了一种G阵构建方法。结果表明,新型G阵在不需要加权的情况下就能达到常规G阵加权时的GEBV预测准确性,在系谱部分缺失时,应用新型G阵较加权常规G阵的GEBV准确性有一些提高。

参考文献
[1]
HENDERSON C R. Best linear unbiased estimation and prediction under a selection model[J]. Biometrics, 1975, 31(2): 423-447. DOI:10.2307/2529430
[2]
COWLING W A, STEFANOVA K T, BEECK C P, et al. Using the animal model to accelerate response to selection in a self-pollinating crop[J]. G3 (Bethesda), 2015, 5(7): 1419-1428. DOI:10.1534/g3.115.018838
[3]
DEKKERS J C M. Application of genomics tools to animal breeding[J]. Curr Genomics, 2012, 13(3): 207-212. DOI:10.2174/138920212800543057
[4]
CALUS M P L, DE HAAS Y, PSZCZOLA M, et al. Predicted accuracy of and response to genomic selection for new traits in dairy cattle[J]. Animal, 2013, 7(2): 183-191. DOI:10.1017/S1751731112001450
[5]
PARK M N, ALAM M, KIM S, et al. Genomic selection through single-step genomic best linear unbiased prediction improves the accuracy of evaluation in Hanwoo cattle[J]. Asian-Australas J Anim Sci, 2020, 33(10): 1544-1557. DOI:10.5713/ajas.18.0936
[6]
MOSER D W, MILLER S P, RETALLICK K J, et al. Genomic selection in the beef industry: current achievements and future directions[J]. J Anim Sci, 2019, 97(S3): 54-55.
[7]
ZHANG H H, YIN L L, WANG M Y, et al. Factors affecting the accuracy of genomic selection for agricultural economic traits in maize, cattle, and pig populations[J]. Front Genet, 2019, 10: 189. DOI:10.3389/fgene.2019.00189
[8]
TSAIRIDOU S, HAMILTON A, ROBLEDO D, et al. Optimizing low-cost genotyping and imputation strategies for genomic selection in Atlantic salmon[J]. G3 (Bethesda), 2020, 10(2): 581-590. DOI:10.1534/g3.119.400800
[9]
MEUWISSEN T H E, HAYES B J, GODDARD M E. Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics, 2001, 157(4): 1819-1829. DOI:10.1093/genetics/157.4.1819
[10]
MISZTAL I, LOURENCO D, LEGARRA A. Current status of genomic evaluation[J]. J Anim Sci, 2020, 98(4): skaa101. DOI:10.1093/jas/skaa101
[11]
WANG X Q, MIAO J, CHANG T P, et al. Evaluation of GBLUP, BayesB and elastic net for genomic prediction in Chinese Simmental beef cattle[J]. PLoS One, 2019, 14(2): e0210442. DOI:10.1371/journal.pone.0210442
[12]
DUARTE J L G, GORI A S, HUBIN X, et al. Performances of Adaptive MultiBLUP, Bayesian regressions, and weighted-GBLUP approaches for genomic predictions in Belgian Blue beef cattle[J]. BMC Genomics, 2020, 21(1): 545. DOI:10.1186/s12864-020-06921-3
[13]
VANRADEN P M, WIGGANS G R. Derivation, calculation, and use of national animal model information[J]. J Dairy Sci, 1991, 74(8): 2737-2746. DOI:10.3168/jds.S0022-0302(91)78453-1
[14]
GARRICK D J, TAYLOR J F, FERNANDO R L. Deregressing estimated breeding values and weighting information for genomic regression analyses[J]. Genet Sel Evol, 2009, 41(1): 55. DOI:10.1186/1297-9686-41-55
[15]
RICARD A, DANVY S, LEGARRA A. Computation of deregressed proofs for genomic selection when own phenotypes exist with an application in French show-jumping horses[J]. J Anim Sci, 2013, 91(3): 1076-1085. DOI:10.2527/jas.2012-5256
[16]
VANRADEN P M. Efficient methods to compute genomic predictions[J]. J Dairy Sci, 2008, 91(11): 4414-4423. DOI:10.3168/jds.2007-0980
[17]
LEGARRA A, CHRISTENSEN O F, AGUILAR I, et al. Single Step, a general approach for genomic selection[J]. Livest Sci, 2014, 166: 54-65. DOI:10.1016/j.livsci.2014.04.029
[18]
SILVA R P, ESPIGOLAN R, BERTON M P, et al. Genomic prediction ability for carcass composition indicator traits in Nellore cattle[J]. Livest Sci, 2021, 245: 104421. DOI:10.1016/j.livsci.2021.104421
[19]
AGUILAR I, MISZTAL I, JOHNSON D L, et al. Hot topic: a unified approach to utilize phenotypic, full pedigree, and genomic information for genetic evaluation of Holstein final score[J]. J Dairy Sci, 2010, 93(2): 743-752. DOI:10.3168/jds.2009-2730
[20]
AGUILAR I, FERNANDEZ E N, BLASCO A, et al. Effects of ignoring inbreeding in model-based accuracy for BLUP and SSGBLUP[J]. J Anim Breed Genet, 2020, 137(4): 356-364. DOI:10.1111/jbg.12470
[21]
VAN DEN BERG I, MEUWISSEN T H E, MACLEOD I M, et al. Predicting the effect of reference population on the accuracy of within, across, and multibreed genomic prediction[J]. J Dairy Sci, 2019, 102(4): 3155-3174. DOI:10.3168/jds.2018-15231
[22]
MRODE R, OJANGO J M K, OKEYO A M, et al. Genomic selection and use of molecular tools in breeding programs for indigenous and crossbred cattle in developing countries: current status and future prospects[J]. Front Genet, 2019, 9: 694. DOI:10.3389/fgene.2018.00694
[23]
BOICHARD D, DUCROCQ V, CROISEAU P, et al. Genomic selection in domestic animals: principles, applications and perspectives[J]. C R Biol, 2016, 339(7-8): 274-277. DOI:10.1016/j.crvi.2016.04.007
[24]
HOZÉ C, FRITZ S, PHOCAS F, et al. Efficiency of multi-breed genomic selection for dairy cattle breeds with different sizes of reference population[J]. J Dairy Sci, 2014, 97(6): 3918-3929. DOI:10.3168/jds.2013-7761
[25]
MEUWISSEN T, HAYES B, GODDARD M. Genomic selection: a paradigm shift in animal breeding[J]. Anim Front, 2016, 6(1): 6-14. DOI:10.2527/af.2016-0002
[26]
SARGOLZAEI M, SCHENKEL F S. QMSim: a large-scale genome simulator for livestock[J]. Bioinformatics, 2009, 25(5): 680-681. DOI:10.1093/bioinformatics/btp045
[27]
ANDONOV S, LOURENCO D A L, FRAGOMENI B O, et al. Accuracy of breeding values in small genotyped populations using different sources of external information—A simulation study[J]. J Dairy Sci, 2017, 100(1): 395-401. DOI:10.3168/jds.2016-11335
[28]
HENDERSON C R. Best linear unbiased estimation and prediction under a selection model[J]. Biometrics, 1975, 31(2): 423-447. DOI:10.2307/2529430
[29]
SNELLING W M, CHIU R, SCHEIN J E, et al. A physical map of the bovine genome[J]. Genome Biol, 2007, 8(8): R165. DOI:10.1186/gb-2007-8-8-r165
[30]
BRITO F V, NETO J B, SARGOLZAEI M, et al. Accuracy of genomic selection in simulated populations mimicking the extent of linkage disequilibrium in beef cattle[J]. BMC Genet, 2011, 12(1): 80. DOI:10.1186/1471-2156-12-80
[31]
CHRISTENSEN O F, MADSEN P, NIELSEN B, et al. Single-step methods for genomic evaluation in pigs[J]. Animal, 2012, 6(10): 1565-1571. DOI:10.1017/S1751731112000742
[32]
SU G, MADSEN P. User's guide for Gmatrix: a program for computing Genomic relationship matrix[J]. AU Tjele Dk, 2011.
[33]
MADSEN P, SØRENSEN P, SU G S, et al. DMU-a package for analyzing multivariate mixed models[C]//Proceedings of the 8th World Congr. Geneti. Appl. to Livest Prod Belo Horizonte. 2006: 247.
[34]
MEUWISSEN T, GODDARD M. Accurate prediction of genetic values for complex traits by whole-genome resequencing[J]. Genetics, 2010, 185(2): 623-631. DOI:10.1534/genetics.110.116590
[35]
ERBE M, HAYES B J, MATUKUMALLI L K, et al. Improving accuracy of genomic predictions within and between dairy cattle breeds with imputed high-density single nucleotide polymorphism panels[J]. J Dairy Sci, 2012, 95(7): 4114-4129. DOI:10.3168/jds.2011-5019
[36]
LUAN T, WOOLLIAMS J A, LIEN S, et al. The accuracy of genomic selection in Norwegian red cattle assessed by cross-validation[J]. Genetics, 2009, 183(3): 1119-1126. DOI:10.1534/genetics.109.107391
[37]
DAETWYLER H D, PONG-WONG R, VILLANUEVA B, et al. The impact of genetic architecture on genome-wide evaluation methods[J]. Genetics, 2010, 185(3): 1021-1031. DOI:10.1534/genetics.110.116855
[38]
VITEZICA Z G, AGUILAR I, MISZTAL I, et al. Bias in genomic predictions for populations under selection[J]. Genet Res, 2011, 93(5): 357-366. DOI:10.1017/S001667231100022X
[39]
GAO H D, MADSEN P, AAMAND G P, et al. Bias in estimates of variance components in populations undergoing genomic selection: a simulation study[J]. BMC Genomics, 2019, 20(1): 956. DOI:10.1186/s12864-019-6323-8
[40]
MARJANOVIC J, HULSEGGE B, CALUS M P L. Relatedness between numerically small Dutch Red dairy cattle populations and possibilities for multibreed genomic prediction[J]. J Dairy Sci, 2021, 104(4): 4498-4506. DOI:10.3168/jds.2020-19573
[41]
IBTISHAM F, ZHANG L, XIAO M, et al. Genomic selection and its application in animal breeding[J]. Thai J Vet Med, 2017, 47(3): 301-310.
[42]
MISZTAL I, AGUILAR I, LOURENCO D, et al. Emerging issues in genomic selection[J]. J Anim Sci, 2021, 99(6): skab092. DOI:10.1093/jas/skab092

(编辑   郭云雁)