畜牧兽医学报  2020, Vol. 51 Issue (9): 2079-2088. DOI: 10.11843/j.issn.0366-6964.2020.09.005    PDF    
利用猪1.4M高密度SNP芯片检测巴马香猪全基因组拷贝数变异
邱恒清1,2, 肖石军1, 郭源梅1     
1. 江西农业大学 省部共建种猪遗传改良与养殖技术国家重点实验室, 南昌 330045;
2. 江西省吉安市畜牧兽医局, 吉安 343000
摘要:旨在检测巴马香猪基因组上的拷贝数变异(CNV),并探究标记密度对于CNV检测效率和准确率的影响。本研究利用319头巴马香猪(其中阉公猪160头和母猪159头)1.4M高密度SNP芯片的数据,采用PennCNV和R-Gada两种软件进行CNVs检测;然后通过重叠CNV融合法,构建拷贝数变异区域(CNVR),并用全基因组关联分析(GWAS)对频率大于5%的CNVR进行验证;最后根据不同的标记密度,均匀抽取一定数目的SNPs来探究标记密度对CNV检测效率和准确性的影响。结果,PennCNV和R-Gada软件分别检测到6 327和3 489个CNVs,分别构成795和340个CNVRs,其中226个为共同CNVRs。在这226个共同CNVRs中,最短的为3.98 kb,最长的为1 297.78 kb,总长度为33.27 Mb,其中102个(45%)与前人报道的CNVRs重叠。在PennCNV检出的795个CNVRs中,有135个频率大于5%,其中20个得到GWAS验证,验证率为15%。随着SNP密度的逐渐增加,CNV的检测效率和检测准确性不断提高,尤其是小片段CNVs的检测效率。本研究利用1.4M SNP芯片的数据,通过PennCNV和R-Gada软件绘制巴马香猪CNVR的草图,为将来鉴别与重要经济性状相关的CNVRs奠定了基础。同时,揭示了标记密度对CNV检测效率和准确性有正面影响,为后续CNV研究选择合适的标记密度提供了一定的参考。
关键词巴马香猪    拷贝数变异    1.4M高密度SNP芯片    
Detection of Genome-wide Copy Number Variation Using Porcine 1.4M High-density SNP Chips in Bama Xiang Pigs
QIU Hengqing1,2, XIAO Shijun1, GUO Yuanmei1     
1. State Key Laboratory of Pig Genetic Improvement and Production Technology, Jiangxi Agricultural University, Nanchang 330045, China;
2. Animal Husbandry and Veterinary Bureau of Ji'an City in Jiangxi Province, Ji'an 343000, China
Abstract: The aim of this study was to detect the copy number variation (CNV) in the genome of Bama Xiang pigs and investigate the effect of marker density on the efficiency and accuracy of CNV detection. PennCNV and R-Gada were employed to detect CNVs using the 1.4M high-density SNP chip data of 319 (160 hogs and 159 gilts) Bama Xiang pigs, and the CNV region (CNVR) was constructed by merging overlapping CNVs. Only the CNVR with higher frequency than 5% was verified by the genome-wide association study (GWAS). Finally, according to the marker densities, a certain number of SNPs were evenly extracted, and the effect of marker density on CNV detection efficiency and accuracy was explored. There were 6 327 CNVs detected by PennCNV and 3 489 CNVs detected by R-Gada, which made up of 795 and 340 CNVRs, respectively, including 226 CNVRs identified by both programs. Among the 226 CNVRs, the shortest was 3.98 kb, the longest was 1 297.78 kb, and their total length was 33.27 Mb, of which 102 (45%) overlapped the CNVRs reported previously. Among the 795 CNVRs detected by PennCNV, 135 had a higher frequency than 5%, 20 of which had been verified by GWAS, and the verification rate was 15%. With the SNP density increasing, the efficiency and accuracy of CNV detection were increased, especially for the small size CNVs. A CNVR sketch of Bama Xiang pigs had been drawn using 1.4M SNP chips, which was helpful to identify CNVRs associated with important economic traits in the future. At the same time, we revealed the positive effect of marker density on the efficiency and accuracy of CNV detection, and the results provided a reference of choosing marker density for the follow-up research of CNV detection.
Key words: Bama Xiang pig    copy number variation    1.4M high-density SNP chip    

拷贝数变异(copy number variation, CNV)是指大于50 bp的DNA片段插入、缺失、重复等引起拷贝数发生改变的一种基因组结构变异(structural variation, SV)[1-2]。除很小一部分会致病以外,大部分CNV在许多物种的基因组中以遗传多样性的形式存在[3-7]。在人类[1, 8]、小鼠[9]、牛[10-12]、猪[13-14]、绵羊[15]、山羊[16]等物种中都已经开展了CNV的鉴定及其图谱的绘制,这对基因组变异的功能分析大有裨益。基因组测序[17-19]、比较基因组杂交芯片(array-based comparative genomic hybridization, aCGH) [20-22]和60K SNP芯片[23-26]的数据均可用来检测猪基因组上的CNV,但是它们的检测效率和准确性是有差异的。利用基因组测序数据的检测效率和准确性较高,但耗时费力且成本很高,因此目前难以大规模开展。利用60K SNP芯片来检测CNV[23-25],虽然检测效率和准确性较低,但是几乎没有什么成本,因为芯片检测的主要目的是用来做GWAS,检测CNV只是作为副产品,因此使用较广泛。通过增加芯片中SNP的数量来提高CNV的检测效率[27],尤其是小片段CNV的检测效率,是今后利用芯片来检测CNV的一个发展方向[26]。相比人类[8],猪基因组中检测到的CNV还远未达到饱和[28]。前人研究表明,同类物种不同品种之间存在一定比例的差异CNV[23, 29-30],因此,绘制猪高分辨率的CNV图谱时,需要在不同猪种间开展CNV检测的研究。与商业猪种相比,中国地方猪种具有较丰富的遗传多样性和较高的杂合度,这有助于检测在选择过程中被淘汰了的CNV。

本研究利用319头巴马香猪1.4M SNP芯片数据,使用PennCNV[31]和R-Gada[32]两种软件对巴马香猪全基因组CNV进行检测,可增强对巴马香猪基因组结构变异的了解,为今后CNV与中国地方猪种重要经济表型的相关性研究提供相应的信息。另外,通过分析标记密度对CNV检测效率和准确性的影响,可探究CNV检测需要的SNP标记数量。

1 材料与方法 1.1 试验动物

本试验以319头巴马香猪为研究对象,其中阉公猪(30~35日龄阉割)160头,母猪159头,覆盖43头公猪和61头母猪的血缘[33]。319头巴马香猪均购自广西巴马自治县巴马香猪繁育基地,购买时为40~50日龄。购买后转运至江西省南昌市蒋巷镇国鸿生态园猪场统一饲养,饲喂全价配合日粮,自由采食和饮水。饲养至(300±5)日龄,运至附近的国鸿生猪屠宰场,进行屠宰测定和样品采集。

1.2 基因分型和质量控制

采用酚氯仿DNA提取方法,从耳组织中提取DNA。经过质检后把DNA的浓度调整到50 ng·μL-1,放置4 ℃冰箱备用。按照Affymatrix猪1.4M SNP芯片检测流程,对319头巴马香猪进行基因型分型。该芯片是本实验室在Affymatrix公司定制的芯片:根据中国地方猪种和外来商品猪种的全基因组序列,在全基因组范围内筛选出多态性好、分布均匀的1 350 646个SNPs,其中包含Illumina猪60K SNP芯片所有的SNPs[34]。利用R语言的GenABEL包[35]对芯片分型结果进行质量控制,剔除SNP检测率低于90%的个体,剔除检测率低于95%、次等位基因频率小于1%和极显著偏离哈代温伯格平衡(P < 0.000 001)的SNPs。经过质量控制后,剔除性染色体上的和没有物理位置的SNPs,剩余个体和SNPs用于拷贝数变异的检测。

1.3 CNV检测及其CNVR的定义

本研究使用PennCNV和R-Gada两个软件来检测CNV,每个CNV中至少包含4个SNPs。PennCNV是基于隐马尔可夫模型(hidden Markov model, HMM)的CNV检测软件[31]。它有test、trio和joint 3种选项,其中后两种可以结合系谱信息对CNV检测结果进行优化。本研究无系谱信息,因此只能采用test选项。运行test选项时,参数文件detect_cnv.pl中各参数的设置分别为B等位型信号强度占比(B allele fluorescence, BAF)值为0.01,信号强度比对数(Log R ratio, LRR)的标准偏差(LRR_SD)小于0.3,基因组波动因子(UC factor)为0.05,其余参数使用软件默认值。R-Gada是一个CNV检测的R语言程序包[32],它采用的分段算法(segmentation algorithm)根据探针信号的强度值差异,通过稀疏贝叶斯学习(sparse Bayesian learning, SBL)找到断点,并进行二元分割,从而得到每一个片段的拷贝数的宽度。R-Gada运行参数分别为稀疏贝叶斯学习的α值为0.8,反向剔除(backward elimination, BE)的临界值为6,其余参数为程序默认值。

用SNP芯片数据检测CNV时,无法精确判断CNV边界,因此,一般把彼此重叠的CNV定义成一个CNV区域(CNV region, CNVR)。CNVR可以通过CNV包含的SNP数量或者在群体中的频率等方式来划分[24, 36],但多数研究采用的是重叠CNV融合法(merging overlapping CNVs)[8]。该方法可以检测出尽可能多的CNVRs,但也容易掺入不具备代表性的低频CNVs。为了剔除低频CNVs,本研究对该方法作了部分修改:假设在基因组某区域内检测到多个互相重叠的CNVs,根据它们覆盖区域的分布,截取中间95%的区域为CNVR,左右各2.5%的位置分别为该CNVR的起始和终止位置。把PennCNV和R-Gada两个软件检测出来的CNVRs,根据它们起始和终止位置在相应的染色体位置上描绘出来,构建巴马香猪全基因组CNVR图谱。

1.4 CNVR验证

把CNVR内CNV的拷贝数当作表型,利用R语言的GenABEL包[35],采用GRAMMAR方法进行全基因组关联分析(GWAS),对频率高于5%、PennCNV鉴别的CNVRs进行验证。如果在CNVR区域及其左右50 kb范围内检测到基因组显著关联的SNP,则认为该CNVR真实存在。由于前面已经对SNP进行了质控,因此不需要再进行质控。利用常染色体上所有SNPs来计算个体间的亲缘系数矩阵,并把微效多基因效应作为随机效应拟合在GWAS的加性效应模型中,剔除群体层化效应,同时通过全基因组控制残差膨胀系数,对剩余的群体层化效应进行进一步校正。采用Bonferroni校正确定5%基因组显著水平为临界值。

GWAS验证成功率可能会受CNVR频率的影响,本研究把CNVR分成两类:一类为高频CNVR,即频率大于等于10%;另一类为低频CNVR,即频率介于5%~10%之间。通过卡方检验,检测CNVR频率是否影响CNVR的验证率。

1.5 标记密度对CNV检验的影响

为了研究标记密度对CNV检测效率及其准确性的影响,本研究从1.4M SNP中剔除性染色体上的和没有物理位置的SNPs,按照一定比例每隔一定数目选取一个SNP,用PennCNV软件在相同的参数下对CNV进行检测,将检测结果与1.4M的结果进行比较,分别计算出检测率和准确率。把1.4M SNP检测出的CNVs当作真实CNVs,检测效率是指当前标记密度下检测出的真实CNVs占整个真实CNVs的比例,准确率是指当前标记密度下检测出的真实CNVs所占的比例。

标记密度对大片段CNV检测的影响可能小于对小片段CNV的影响。根据片段大小,把CNV分为大(>100 kb)、中(介于50~100 kb)和小片段(< 50 kb)3类,并统计不同标记密度下它们的检出效率和检测准确率。

2 结果 2.1 芯片数据质控

除2个个体因SNP的检出率(call rate)低于0.9没有通过质控外,其余个体均通过了质控。质控前共有1 350 646个SNPs,506 817个SNPs没有通过质控,其中38 317个偏离了哈代温伯格平衡(P < 0.000 001),195 097个的检出率低于95%(call rate < 0.95),273 403个的次等位基因频率小于0.01(MAF < 0.01)。质控后性染色体上还有4 939个SNPs,另外有87 567个SNPs没有物理位置,这些SNPs不用于后续分析。最后剩317个个体和751 323个SNPs用于CNV的检测,SNP的位置信息基于猪参考基因组Sscrofa 11.1 (https://www.ncbi.nlm.nih.gov/genome/?term=pig)构建。

2.2 CNV和CNVR的检测

经BAF < 0.01和LRR_SD < 0.3控制之后,剩余283个个体用于CNVs检测。PennCNV共检测到了9 319个CNVs。剔除只在一个个体中检测到的CNV后,剩余的6 327个CNVs构成了795个CNVRs,其中缺失(loss)131个,获得(gain)561个,插入缺失(indel)103个。最短的CNVR为2.17 kb,最长的为1.81 Mb,总长为60.46 Mb,覆盖基因组的2.33%。

R-Gada检测到4 156个CNVs,剔除只在1个个体中检测到的CNV后,剩余的3 489个CNVs构成了340个CNVRs,其中缺失215个,获得78个,插入缺失47个。最短的CNVR为3.04 kb,最长的为4.28 Mb,总长为65.25 Mb,覆盖基因组的2.51%。

PennCNV和R-Gada共同检测到226个CNVRs,分别占它们检出CNVR的28.43%和66.47%。分别将两种方法检测的结果绘制成CNVR图谱(图 1)。

染色体的上方和下方分别为PennCNV和R-Gada的检测结果 The detection results of PennCNV and R-Gada are showed above and below the chromosome, respectively 图 1 巴马香猪拷贝数变异在基因组上的分布 Fig. 1 The detected CNVs distribution in the genome of Bama Xiang pigs
2.3 CNVR的验证

在PennCNV检出的795个CNVRs中,有135个频率大于5%,其中有20个得到了GWAS的验证(图 2表 1)。当CNVR的频率大于等于10%时验证率达到31.4%,显著高于(χ2 = 8.63,P = 0.003 3)频率在5%~10%的CNVRs。

A.被验证的CNVRs;B.未被验证的CNVRs。实线、虚线和短虚线分别表示1%基因组、5%基因组和染色体显著水平的阈值 A. The validated CNVRs; B. The invalidated CNVRs. The solid, dotted and short dashed horizontal lines indicate the significant threshold values at 1% genome-wide, 5% genome-wide and chromosome levels (suggestive), respectively 图 2 GWAS验证CNVR的Manhattan图 Fig. 2 Manhattan plots of GWAS validating CNVR
表 1 GWAS验证的CNVRs Table 1 The CNVRs validated by GWAS
2.4 标记密度对CNV检测的影响

随着SNP标记密度的增加,CNV检测效率和准确率均增加(图 3)。在标记密度比较低时,大片段CNV的检测率较高;当标记数量到达70万之后,大片段CNV的检测率增长缓慢。中等片段的CNV随标记数量的增加而增加,且其数量一直没有超过大片段的CNV。小片段的CNV在标记少于80万时增长较慢,但在标记大于80万时增长较快(图 4)。

图 3 标记密度对CNVs检测效率和准确率的影响 Fig. 3 The effects of marker density on the efficiency and accuracy of CNVs identification
图 4 标记密度对不同长度CNV检测效率的影响 Fig. 4 The effects of marker density on the detection efficiency of CNVs with different sizes
3 讨论

本研究利用猪1.4M高密度SNP芯片的数据,使用PennCNV和R-Gada两种软件来检测CNV和CNVR,构建了巴马香猪的CNVR图谱,并研究标记密度对CNV检测效率和准确性的影响。猪1.4M高密度SNP芯片共包含1 350 646个SNPs,经质控后相邻SNPs之间的平均物理距离为3.08 kb。根据这两种软件所检出CNVR所在染色体上的位置,绘制成巴马香猪CNVR图谱。增加标记密度,能够提高CNV的检出效率和准确性,尤其对小片段的CNV。

3.1 高密度SNP芯片的优势

利用全基因测序数据来检测CNV,检测效率很高,但是由于全基因组测序费用较高,限制了这种方法的使用。利用SNP芯片数据来检测CNV,检测效率相对较低,但是其成本基本可以忽略(SNP芯片检测的主要目的是做GWAS),因此在畜禽中应用比较广泛。与60K SNP芯片相比,1.4M SNP芯片在基因组上具有更高的覆盖度,相邻SNP之间的距离更小,因此,对小片段的CNV的检测效率更强。利用60K SNP芯片一般把长度大于50 kb作为判定CNV存在的标准。1.4M SNP芯片的标记密度是60K SNP芯片的23倍,因此对小于50 kb的CNVs也具有较高的检出效率(图 4)。

3.2 与前人报道CNVR的比较

本研究中,两种软件共检测到226个CNVRs,其中102个CNVRs(45%)与已报道的CNVRs重叠(表 2)[17-18, 20, 23, 25, 28, 37],69个CNVRs至少与两个已报道的CNVRs重叠,特别是位于1号和11号染色体末端的4个CNVRs,与上述7个研究报道的CNVRs均有重叠。当样本大小分别为14、120、905和1 693时,使用60K SNP芯片检测到的CNVRs与本研究鉴别的CNVRs之间的重合率分别为2.65%[28]、12.39%[37]、15.04%[25]和18.14%[23],重合率极显著地(χ2 = 54.34, P = 9.51×10-12)受样本大小的影响。运用全基因组测序和aCGH数据检测的CNVRs与本研究鉴别的CNVRs之间的重合率更高,分别为18.58%[17]、30.84%[18]和21.68%[20]。一般来说,鉴别的CNVRs越多与本研究重合率就越高。

表 2 本研究中检测到的CNVRs与已报道CNVRs的比较 Table 2 Comparison of CNVRs detected in the study with the reported CNVRs
3.3 CNVR覆盖基因组区域内的基因及相关分析

在这226个CNVRs中,大部分CNVRs与生长、肉质、繁殖等性状的QTLs区域重叠,但是与体型大小相关的候选基因(HMGA1、PLAG1、BMP2等)[38-39]或受选择区域并不重叠[40],且它们覆盖的基因组区域大多没有注释,这表明CNV主要存在于基因组的非编码区域,可能是通过调控其他功能基因的表达来行使自己的功能。

3.4 两种方法不同检测程序的比较

本研究使用了PennCNV和R-Gada两种软件进行CNV的检测,虽然它们的算法不同,但是它们鉴别的CNVRs重合率高达65.6%,远远高于前人用60K SNP芯片采用不同的算法所得结果之间的重合率(小于50%)[41],这表明,本研究鉴别的CNVRs比较可靠。根据前人的报道,重合率主要受样本大小、标记密度、检测平台和算法、遗传背景等影响[42-44]。本研究中,样本大小比较适中,标记密度高,可能是导致两种算法重叠率高的主要原因。在标记密度很低时,很难确定某个算法在检测准确度和敏感度方面是否优于其他的算法[41, 45]

3.5 CNV低验证效率的分析

在利用SNP芯片检测CNV的报道中,更多的研究倾向于使用PennCNV[23, 25, 28, 37],因此,本研究仅对PennCNV鉴别的CNV进行验证。对于GWAS来说,319个个体的群体比较小,GWAS的检验效率比较低,因此对于低频的CNV很难用GWAS方法进行验证。验证结果表明,GWAS无法验证频率小于5%的CNV是否存在,但能验证30%的频率大于10%的CNVs。鉴于GWAS的验证效率较低,没有通过验证的CNV也有可能是真实存在的CNV。

3.6 SNP芯片密度对CNV检测率和准确性的影响

利用60K SNP芯片时,相邻标记的平均物理距离约为50 kb,对小于50 kb的CNV检测效率很低。当利用1.4M SNP芯片时,相邻标记的平均物理距离约为5 kb,对小于50 kb的CNV也有一定的检测效率。当标记数量在700 k左右时,大于50 kb的CNV检出率在70%以上。对小于50 kb的CNV来说,标记数量为1.4M时,检测效率仍呈线性增长,因此,增加标记数量可以在一定程度上提高CNV的检测率和准确性,尤其是小片段的CNVs。

4 结论

本研究利用PennCNV和R-Gada软件分别鉴别了795和340个巴马香猪的CNVRs,其中226个是共同检测出的。当标记数量为60K时,对小于50 kb的CNVs检测效率很低;即使标记数量达1.4M时,对小于50 kb的CNVs检测率还是比较低。因此,继续增加标记数量仍然可以提高CNV的检测效率,尤其是小片段的CNVs。

致谢: 本研究得到了江西农业大学省部共建种猪遗传改良与养殖技术国家重点实验室主任黄路生教授的大力支持,得到了龚焕发博士的帮助。

参考文献
[1] FEUK L, CARSON A R, SCHERER S W. Structural variation in the human genome[J]. Nat Rev Genet, 2006, 7(2): 85–97.
[2] ALKAN C, COE B P, EICHLER E E. Genome structural variation discovery and genotyping[J]. Nat Rev Genet, 2011, 12(5): 363–376. DOI: 10.1038/nrg2958
[3] COE B P, STESSMAN H A F, SULOVARI A, et al. Neurodevelopmental disease genes implicated by de novo mutation and copy number variation morbidity[J]. Nat Genet, 2019, 51(1): 106–116. DOI: 10.1038/s41588-018-0288-4
[4] MACÉ A, KUTALIK Z, VALSESIA A.Copy number variation[M]//EVANGELOU E.Genetic Epidemiology.New York: Humana Press, 2018: 231-258.
[5] GEISTLINGER L, DA SILVA V H, CESAR A S M, et al. Widespread modulation of gene expression by copy number variation in skeletal muscle[J]. Sci Rep, 2018, 8(1): 1399.
[6] VERBITSKY M, WESTLAND R, PEREZ A, et al. The copy number variation landscape of congenital anomalies of the kidney and urinary tract[J]. Nat Genet, 2019, 51(1): 117–127. DOI: 10.1038/s41588-018-0281-y
[7] BHANUPRAKASH V, CHHOTARAY S, PRUTHVIRAJ D R, et al. Copy number variation in livestock:a mini review[J]. Vet World, 2018, 11(4): 535–541. DOI: 10.14202/vetworld.2018.535-541
[8] REDON R, ISHIKAWA S, FITCH K R, et al. Global variation in copy number in the human genome[J]. Nature, 2006, 444(7118): 444–454. DOI: 10.1038/nature05329
[9] UMEMORI J, MORI A, ICHIYANAGI K, et al. Identification of both copy number variation-type and constant-type core elements in a large segmental duplication region of the mouse genome[J]. BMC Genomics, 2013, 14(1): 455. DOI: 10.1186/1471-2164-14-455
[10] 裴生伟, 王丽, 曹学涛, 等. 牛全基因组拷贝数变异研究进展[J]. 畜牧兽医学报, 2018, 49(5): 871–878.
PEI S W, WANG L, CAO X T, et al. Research progress on genomic copy number variations in cattle[J]. Acta Veterinaria et Zootechnica Sinica, 2018, 49(5): 871–878. (in Chinese)
[11] ZHOU Y, CONNOR E E, WIGGANS G R, et al. Genome-wide copy number variant analysis reveals variants associated with 10 diverse production traits in Holstein cattle[J]. BMC Genomics, 2018, 19(1): 314. DOI: 10.1186/s12864-018-4699-5
[12] 刘梅.牛羊全基因组拷贝数变异的挖掘及遗传效应研究[D].杨凌: 西北农林科技大学, 2019.
LIU M.Digging of whole genome copy number variation and its genetic effects in cattle and goat[D]. Yangling: Northwest A & F University, 2019.(in Chinese) http://cdmd.cnki.com.cn/Article/CDMD-10712-1019844370.htm
[13] WANG Y, ZHANG T R, WANG C D. Detection and analysis of genome-wide copy number variation in the pig genome using an 80 K SNP Beadchip[J]. J Anim Breed Genet, 2020, 137(2): 166–176. DOI: 10.1111/jbg.12435
[14] 王州, 冉雪琴, 牛熙, 等. 皱皮香猪3个基因组拷贝数变异的多态性分布[J]. 中国畜牧杂志, 2019, 55(6): 31–38.
WANG Z, RAN X Q, NIU X, et al. Distribution of polymorphism for the copy number variation in the genome of Xiang pig with wrinkle skin[J]. Chinese Journal of Animal Science, 2019, 55(6): 31–38. (in Chinese)
[15] YANG L, XU L Y, ZHOU Y, et al. Diversity of copy number variation in a worldwide population of sheep[J]. Genomics, 2018, 110(3): 143–148. DOI: 10.1016/j.ygeno.2017.09.005
[16] LIU M, ZHOU Y, ROSEN B D, et al. Diversity of copy number variation in the worldwide goat population[J]. Heredity (Edinb), 2019, 122(5): 636–646.
[17] RUBIN C J, MEGENS H J, BARRIO A M, et al. Strong signatures of selection in the domestic pig genome[J]. Proc Natl Acad Sci U S A, 2012, 109(48): 19529–19536. DOI: 10.1073/pnas.1217149109
[18] PAUDEL Y, MADSEN O, MEGENS H J, et al. Evolutionary dynamics of copy number variation in pig genomes in the context of adaptation and domestication[J]. BMC Genomics, 2013, 14(1): 449. DOI: 10.1186/1471-2164-14-449
[19] REVILLA M, PUIG-OLIVERAS A, CASTELLÓ A, et al. A global analysis of CNVs in swine using whole genome sequence data and association analysis with fatty acid composition and growth traits[J]. PLoS One, 2017, 12(5): e0177014. DOI: 10.1371/journal.pone.0177014
[20] WANG J Y, JIANG J C, WANG H F, et al. Enhancing genome-wide copy number variation identification by high density array CGH using diverse resources of pig breeds[J]. PLoS One, 2014, 9(1): e87571. DOI: 10.1371/journal.pone.0087571
[21] LI Y, MEI S Q, ZHANG X Y, et al. Identification of genome-wide copy number variations among diverse pig breeds by array CGH[J]. BMC Genomics, 2012, 13(1): 725. DOI: 10.1186/1471-2164-13-725
[22] FADISTA J, NYGAARD M, HOLM L E, et al. A snapshot of CNVs in the pig genome[J]. PLoS One, 2008, 3(12): e3916. DOI: 10.1371/journal.pone.0003916
[23] CHEN C Y, QIAO R M, WEI R X, et al. A comprehensive survey of copy number variation in 18 diverse pig populations and identification of candidate copy number variable genes associated with complex traits[J]. BMC Genomics, 2012, 13(1): 733. DOI: 10.1186/1471-2164-13-733
[24] RAMAYO-CALDAS Y, CASTELLÓ A, PENA R N, et al. Copy number variation in the porcine genome inferred from a 60 k SNP BeadChip[J]. BMC Genomics, 2010, 11(1): 593. DOI: 10.1186/1471-2164-11-593
[25] LONG Y, SU Y, AI H S, et al. A genome-wide association study of copy number variations with umbilical hernia in swine[J]. Anim Genet, 2016, 47(3): 298–305. DOI: 10.1111/age.12402
[26] WANG J Y, JIANG J C, FU W X, et al. A genome-wide detection of copy number variations using SNP genotyping arrays in swine[J]. BMC Genomics, 2012, 13(1): 273. DOI: 10.1186/1471-2164-13-273
[27] WANG K, CHEN Z, TADESSE M G, et al. Modeling genetic inheritance of copy number variations[J]. Nucleic Acids Res, 2008, 36(21): e138. DOI: 10.1093/nar/gkn641
[28] WANG J Y, WANG H F, JIANG J C, et al. Identification of genome-wide copy number variations among diverse pig breeds using SNP genotyping arrays[J]. PLoS One, 2013, 8(7): e68683.
[29] MILLS R E, WALTER K, STEWART C, et al. Mapping copy number variation by population-scale genome sequencing[J]. Nature, 2011, 470(7332): 59–65. DOI: 10.1038/nature09708
[30] LIU G E, HOU Y L, ZHU B, et al. Analysis of copy number variations among diverse cattle breeds[J]. Genome Res, 2010, 20(5): 693–703. DOI: 10.1101/gr.105403.110
[31] WANG K, LI M Y, HADLEY D, et al. PennCNV:an integrated hidden Markov model designed for high-resolution copy number variation detection in whole-genome SNP genotyping data[J]. Genome Res, 2007, 17(11): 1665–1674. DOI: 10.1101/gr.6861907
[32] PIQUE-REGI R, CÁCERES A, GONZÁLEZ J R. R-Gada:a fast and flexible pipeline for copy number analysis in association studies[J]. BMC Bioinformatics, 2010, 11(1): 380.
[33] 黄涛, 黄晓畅, 邱恒清, 等. 巴马香猪周身皮肤厚度的测量及其与7号染色体候选SNPs位点的关联分析[J]. 中国农业科学, 2016, 49(16): 3219–3228.
HUANG T, HUANG X C, QIU H Q, et al. Measurement of skin thickness along the whole body sites and association study with candidate snps on sus scrofa chromosome 7 in Bamaxiang pigs[J]. Scientia Agricultura Sinica, 2016, 49(16): 3219–3228. (in Chinese)
[34] GONG H F, XIAO S J, LI W B, et al. Unravelling the genetic loci for growth and carcass traits in Chinese Bamaxiang pigs based on a 1.4 million SNP array[J]. J Anim Breed Genet, 2019, 136(1): 3–14. DOI: 10.1111/jbg.12365
[35] AULCHENKO Y S, RIPKE S, ISAACS A, et al. GenABEL:an R library for genome-wide association analysis[J]. Bioinformatics, 2007, 23(10): 1294–1296. DOI: 10.1093/bioinformatics/btm108
[36] XU L Y, HOU Y L, BICKHART D M, et al. Comparative analysis of cnv calling algorithms:literature survey and a case study using Bovine high-density SNP data[J]. Microarrays, 2013, 2(3): 171–185. DOI: 10.3390/microarrays2030171
[37] XIE J, LI R R, LI S, et al. Identification of copy number variations in Xiang and Kele pigs[J]. PLoS One, 2016, 11(2): e0148565. DOI: 10.1371/journal.pone.0148565
[38] GUO Y M, HOU L J, ZHANG X F, et al. A meta analysis of genome-wide association studies for limb bone lengths in four pig populations[J]. BMC Genet, 2015, 16: 95.
[39] 候利娟.在四个实验猪群中利用全基因组关联分析及其荟萃分析定位影响四肢骨骼长度的基因位点[D].南昌: 江西农业大学, 2016.
HOU L J.A genome-wide association study and meta analysis for limb bone lengths in four pig populations[D]. Nanchang: Jiangxi Agricultural University, 2016.(in Chinese) http://cdmd.cnki.com.cn/Article/CDMD-10410-1016280634.htm
[40] 李完波, 朱亚玲, 艾华水, 等. 猪小体型相关受选择基因位点的研究[J]. 畜牧兽医学报, 2016, 47(10): 1977–1985.
LI W B, ZHU Y L, AI H S, et al. Identifying signatures of selection related to small body size in pigs[J]. Acta Veterinaria et Zootechnica Sinica, 2016, 47(10): 1977–1985. (in Chinese)
[41] PINTO D, DARVISHI K, SHI X H, et al. Comprehensive assessment of array-based platforms and calling algorithms for detection of copy number variants[J]. Nat Biotechnol, 2011, 29(6): 512–520. DOI: 10.1038/nbt.1852
[42] HOU Y L, LIU G E, BICKHART D M, et al. Genomic characteristics of cattle copy number variations[J]. BMC Genomics, 2011, 12(1): 127. DOI: 10.1186/1471-2164-12-127
[43] MATSUZAKI H, WANG P H, HU J, et al. High resolution discovery and confirmation of copy number variants in 90 Yoruba Nigerians[J]. Genome Biol, 2009, 10(11): R125. DOI: 10.1186/gb-2009-10-11-r125
[44] JIANG L, JIANG J C, WANG J Y, et al. Genome-wide identification of copy number variations in Chinese Holstein[J]. PLoS One, 2012, 7(11): e48732. DOI: 10.1371/journal.pone.0048732
[45] ZHANG D D, QIAN Y D, AKULA N, et al. Accuracy of CNV detection from GWAS data[J]. PLoS One, 2011, 6(1): e14511. DOI: 10.1371/journal.pone.0014511