2. 扬州大学农业科技发展研究院, 教育部农业与农产品安全国际合作联合实验室, 扬州 225009;
3. 扬州大学创新创业学院, 扬州 225009
2. Joint International Research Laboratory of Agriculture and Agri-Product Safety of Ministry of Education of China, Institute of Agricultural Science and Technology Development, Yangzhou University, Yangzhou 225009, China;
3. College of Innovation and Entrepreneurship, Yangzhou University, Yangzhou 225009, China
生物基因组中存在极为丰富的遗传变异,这些遗传变异是生物进化的重要驱动力,是遗传多样性和表型多样性的决定因素。生物基因组遗传变异形式繁多,传统概念将拷贝数变异(copy number variation, CNV)归属于基因组内一种1 kb~5 Mb之间大规模的结构变异(structural variation, SV)[1],包括插入、缺失、重复以及三者互相结合衍生出的复合多位点变异。高通量测序技术的发展使遗传变异的检测变得更为容易,较小片段的功能研究也成为可能,现如今,已将CNV的定义范围扩大到50 bp~ 5 Mb之间的结构变异[2]。CNV通常是由不平衡DNA重排引起的,它是染色体水平的结构变化,与整个染色体的结构变异有关。CNV是人类基因组中正常变异和致病变异的重要来源。病原性CNV片段通常非常大,并包含多个参与发育的基因和一些具有高度进化保守性的基因。CNV广泛存在于基因组,当基因所在片段出现CNV时,该基因的表达和功能也将随之改变。与单核苷酸多态性(single nucleotide polymorphism, SNP)相比,CNV位点可能对个体间的遗传差异有着更为直接的影响。
1 CNV的形成机制在CNV的形成过程中,绝大部分CNV来自于父母的遗传,小部分是由新的突变形成。目前认为,CNV形成的分子机制主要有两大类(DNA的重组和复制错误)4种:1)非等位基因同源重组(non-allelic homologous recombination, NAHR);2)非同源末端连接(non-homologous end joining, NHEJ);3)复制叉停滞及模板转换(fork stalling and template switching, FoSTeS);4)LINE-1(long interspersed nucleotide element-1, LINE-1)逆转录转座。
同源重组是DNA修复过程的一种重要机制,NAHR主要是由于两个非等位配对的序列发生交换所导致的,通常是一些序列相似性很高的低拷贝重复序列(low copy repeats, LCRs)或者片段重复序列(segmental duplications, SDs)。NHEJ是真核生物细胞用来修复DNA双链断裂的一种修复机制。NAHR和NHEJ这两种机制均归属于DNA重组,但难以解释部分CNV的重排结构,可能原因是DNA复制过程中发生了错误复制。Lee等[3]提出了复制叉停滞及模板转换(FoSTeS),即DNA复制过程中,停滞的复制叉导致滞后链脱落并在其他复制叉上进行DNA复制合成。复制叉的方向和模板链复制的位置决定了CNV的类型(重复型或缺失型)。另一种则是基于LINE1转座子,其逆转录转座过程由RNA介导[4],在转录和逆转录的转座过程中产生新的CNV,其特点是产生的CNV会随机插入基因组中。
2 CNV的作用机制现有的大量研究均表明,CNV可能与一些遗传性疾病以及表型性状有关,如自闭症患者中比例极高的染色体16p11.2微缺失综合征[5]。部分与神经发育相关的CNV也是导致癫痫发作的重要因素,在将近13%的病例中存在致病性和可能致病性的CNV[6]。一般认为,CNV主要是通过影响基因的表达从而引起表型变异,主要包括剂量效应(dosage effects)和位置效应(position effects)。剂量效应是指CNV通过所包含基因的缺失或重复来改变基因的表达量,从而引起功能表达异常及表型变异。例如在对小儿肾功能衰竭的研究中发现,肾和尿道的先天性异常表型与TBX6基因拷贝数的数量密切相关[7]。位置效应则是指CNV可间接影响CNV位点周围基因的表达调控进而引起基因功能的改变。由于基因的剂量补偿效应等机制存在,部分CNV也可能对其附近基因的表达并不产生明显影响。此外,缺失型的CNV也有可能会导致隐性有害基因暴露表达。
3 CNV的检测方法目前,在全基因组范围内检测CNV的方法主要有3种:比较基因组杂交(array-based comparative genome hybridization, aCGH)技术、SNP芯片技术和基于新一代基因测序(next generation sequencing, NGS)的全基因组重测序(whole-genome sequencing, WGS)[8]技术。aCGH技术是基于微阵列技术的比较基因组杂交,将测试样品与参考样品杂交后,利用荧光探针检测两者的相对荧光强度,并根据荧光强度比确定DNA序列的CNV类型。SNP芯片技术是根据SNP分型结果来判断CNV情况,其利用SNP芯片直接比较待测样本与其他样本的相对强度,同样以相对强度比判断拷贝数类型。
目前,基于NGS的全基因组重测序技术能够获得更多且更为精细的结构变异,其原理是将DNA序列进行随机切断并打碎成短序列,经过PCR复制扩增后,通过映射算法将这些reads数据映射到参考基因组,再通过隐马尔科夫模型(hidden markov model,HMM)[9]等模型以映射结果判断拷贝数变异。目前,对于全基因组测序数据,通常有4种不同的策略方法来检测拷贝数变异:read深度(read depth, RD)、双末端映射(paired-end mapping, PEM)、拆分read(split read, SR)和组装(assembly, AS)[10-11]。
3.1 read深度检测法RD方法原理基于拷贝数和对应区域测序深度具有相关性。通常情况下,基因组染色体发生拷贝数缺失的区域的reads数量小于正常区域的reads数量。而发生拷贝数复制区域的reads数量则会大于正常数量。RD方法的优势是能准确检测CNV的数量,也可以进行大规模的CNV检测。代表软件有CNVnator[12]、ReadDepth[13]等。
3.2 双末端映射检测法PEM检测法识别CNV的原理利用了双端测序获得的插入片段长度和双端位置信息,PEM检测法也是最早应用于CNV检测的方法。该方法将实际测序的双末端之间的平均插入片段长度与基于参考基因组的预期大小进行比较。当个体基因组发生拷贝数缺失时,对比至参考基因组时实际测得的reads之间的插入片段的长度会发生显著变化;而发生拷贝数复制时,测得的reads间插入片段长度一般不发生显著变化,但双末端的reads位置信息会发生改变。PEM检测法适用于处理一些中等规模的CNV复制或缺失检测,但对小规模CNV不敏感。代表软件有PEMer[14]、BreakDancer[15]等。
3.3 拆分read检测法SR法是利用测序测得的一类较为特殊的reads进行CNV检测,其特点是reads的一端能够比对映射至参考基因组,而另一端完全或部分无法比对映射成功。此类reads的出现即代表了拷贝数变异的发生,进一步可以通过分析reads间的距离和位置判断该拷贝数变异的类型。SR法优势在于可以精确地检测拷贝数变异的起始位置并进行断点,但识别大规模CNV的能力有限。代表软件有Pindel[16]、PRISM[17]等。
3.4 组装检测法该方法是将测序得到的短序列reads进行拼接,形成一些长序列的重叠群再与参考基因组进行比对。理论上,如果测序片段长度足够长且测序准确,所有形式的基因组变异包括CNV均可通过组装技术检测到。然而,鉴于现阶段测序片段长度较短且组装过程对于硬件要求较高,目前,AS法应用较少。而基于第三代测序技术虽然可以获得较长的片段,但随机错误率比较高,需要较高的测序深度来降低错误率,致使成本又难以控制。代表软件有Cortex[18]、Magnolya[19]等。
3.5 综合运用多种方法上述4种拷贝数变异检测方法均有各自明显的优缺点。例如,RD法是几种算法中唯一可以测出CNV具体数目的方法,但却无法明确CNV的边界位置;PEM检测方法对大部分中等规模的CNV检测均适用,但在一些复杂重复区域,由于难以将一些小片段准确地分离比对,会导致一些长度较小的CNV被忽视。此外,SR法优点在于检测断点时较精确,但因为只利用了单端reads,也受限于现有测序长度,在检测小规模的插入和缺失方面很出色,但识别较大CNV的能力却有限。AS方法也受限于读长和组装难度而难以大规模运用。鉴于此,综合运用多种方法来进行拷贝数变异检测越来越成为主流。代表软件有LUMPY[20]、HugeSeq pipeline[21]等。
基于NGS测序技术进行CNV检测的优势在于利用了其边测序边合成的特点,可以实现大量DNA序列的同步快速检测,但也导致了CNV检测结果的准确性在一定程度上受到了二代测序的限制。二代测序主要的测序错误来源包括碱基的替换、插入和缺失,为尽可能避免测序错误对CNV检测结果的影响,进行NGS测序时,对送测样品的测序深度有一定要求,这无形中提高了测序成本。同时,在进行CNV检测之前,对NGS测序结果进行合理的校正可显著提高检测结果的准确性[22]。
4 CNV的验证方法经拷贝数变异检测后得到的预测CNV区域需对其进行验证以证明该CNV区域是否真实存在。目前,对于CNV进行鉴定和验证的常用方法主要有荧光原位杂交(fluorescence in situ hybridization, FISH)和荧光定量PCR(real-time fluorescence quantitative PCR, qPCR)两种:1)荧光原位杂交:通过将带有荧光标记的核酸探针与目的DNA片段进行杂交,最终利用荧光信号来检测CNV在染色体上的位置。FISH方法对技术和成本要求较高,对小片段的拷贝数变异检测效果较差,不适用于相关基因或调控区内CNV的验证;2)荧光定量PCR:原理是利用样本的目标基因与内参基因进行相对定量,然后利用两者的检测值来推断目标基因的拷贝数状态[23],是目前验证CNV最常用的检测方法之一,其操作简便,检测速度较快且重复性较好,是CNV验证公认的金标准。除上述两种常见的CNV验证方法以外,近年来,也有将数字PCR(dPCR)和锁核酸(locked nucleic acid, LNA)水解探针等新方法应用于CNV的验证[24]。
5 CNV在家禽育种中的研究进展随着基因组学研究的兴起,CNV领域的研究发展迅速。从最早期果蝇的棒状染色体,到对人类部分遗传疾病CNV的关注,再到现阶段猪[25]、牛[26]、羊[27]等畜牧养殖动物的CNV研究都做了大量工作。
家禽遗传育种学家同样在家禽中挖掘出了许多与表型性状相关的CNV,许多导致质量性状差异的突变都与CNV或者更为复杂的结构变异有关。对羽毛生长速度的研究中,Elferink等[28]发现,相比快羽,慢羽是由Z染色体上存在的一个包含有PRLR和SPEF2基因的176 324 bp重复片段导致的。研究表明,鸡的冠形中豆冠、复冠以及玫瑰冠这3种冠形的形成原因均与染色体结构变异有关。豆冠表型与SOX5基因内含子上发生的拷贝数重复相关[29];复冠表型则与2号染色体上EOMES基因下游一个20 kb的序列重复有关[30];玫瑰冠的形成原因与Imsland等[31]发现的7号染色体上一个7.4 Mb片段的倒置引起MNR2基因位置发生改变,并相应影响了MNR2的表达有关。在对矮小型鸡匍匐性状的研究中,Jin等[32]发现,鸡7号染色体上存在一包含IFF基因的11 896 bp的缺失,引发了匍匐形状。Guo等[33]对惠阳胡须鸡胡须性状的致因突变进行定位发现,27号染色体上存在的一个复杂结构变异引起HOXB8基因位置发生改变,产生胡须性状。Bai等[34]使用SNP芯片对喙畸形北京油鸡进行CNV检测关联分析发现,在喙畸形鸡全基因组水平上检测到两个高置信度且特异性的拷贝数变异区域(copy number variable regions,CNVR),并预测区域内LRIG2基因可能与喙畸形性状发生相关。另外,许多研究表明,CNV与色素沉积密切相关。2011年,Gunnarsson等[35]在对鸡深棕色羽色的研究中发现,SOX10转录因子上游一个8.3 kb的片段缺失与SOX10表达水平的降低呈正相关,并最终影响了下游黑色素形成过程,导致了深棕色羽色。丝羽乌骨鸡的主要特征是乌皮乌骨,其本质为色素过度沉积。在丝羽乌骨鸡20号染色体上第一个CNV区域上存在一个复杂的重组结构区域,该区域内的EDN3基因是黑色素过度沉积的关键基因[36]。在对绿壳性状的研究中,Wang等[37]发现,在东乡绿壳蛋鸡的1号染色体上有SLCO1B3基因特异性表达。进一步研究发现,该基因上游存在一个4.2 kb的插入序列,这一插入导致了绿壳性状的发生。这些结果均表明,在为适应市场需求开发一些具有典型质量性状特征的新品种时,CNV可作为家禽现代育种中的重要遗传分子标记。
此外,疾病以及复杂数量性状的发生是由环境因素及多个微效基因共同决定的,当基因所在片段出现CNV时,该基因的表达和功能将随之改变,且一些比较大的CNV通常可能会影响不止一个基因。因此,CNV在对复杂数量性状方面的研究上有着天然的优势。目前,在家禽中已经发现CNV可能与一些疾病和复杂数量性状相关。在马立克氏病的研究中,Luo等[38]通过对抗病系和易感系进行CNV检测和关联分析发现,67个CNVR与62个马立克氏病易感性候选基因重叠。Yan等[39]检测到1 546个抗马立克氏病特异CNVR和1 866个易感性特异CNVR。Xu等[40]发现,基因组中CNV缺失可能会提高马立克氏病的易感性。Bai等[41]通过CNV检测揭示了马立克氏病抗病力遗传机制,并预测IRF2基因为重要候选基因。对于家禽遗传育种工作而言,诸如生长发育、肉品质、繁殖性能和抗病能力等复杂数量性状是尤其值得重视的。育种工作者针对不同鸡品种尝试采用不同的检测方法进行全基因组的CNV检测,试图找到相关性状的关键CNV。在骨密度的研究中发现,鲁西斗鸡中SOCS2基因的拷贝数显著高于其他品种[42]。Sohrabi等[43]对伊朗Creeper鸡和Arian鸡的CNV检测中发现了5 467个CNVR,其中,在作为商业肉鸡的Arian品种中,发现两个与产蛋性能以及体重相关的CNV。Lin等[44]发现,参与调控肌肉生长相关基因转录的SOX6基因外显子中存在的拷贝数变异与SOX6基因的表达成正相关。周伟等[45]发现,鸡16号染色体上存在两个CNV,其中,缺失型CNV2与血清IgG含量显著相关。这些研究结果为改良家禽生产性能、改善家禽肉品质和提高家禽抗病能力方面的育种工作提供了一定的参考。
随着检测技术的升级进步,关于鸡CNV遗传图谱的构建研究也在不断补充和完善。最早阶段由Griffin等[46]率先使用aCGH方法在火鸡和鸡上检测出20个CNV,同时期,Skinner等[47]利用鸡和北京鸭检测出15个CNV,Wang等[48]在白来航、洛岛红和科尼什3个品种上鉴定出总长度16 Mb,占鸡基因组1.3%的96个CNV。2010年以后,基于SNP芯片和重测序的检测技术逐渐得到越来越多的应用。2013年,Jia等[49]首次使用60 K SNP芯片对白来航和矮小鸡的CNV进行检测,发现13.55 Mb共209个CNVR,涵盖鸡常染色体基因组1.42%。同年,Crooijmans等[50]使用aCGH方法开始在全基因组范围内对CNV进行检测,共发现了1 556个CNVR,达到整个鸡基因组的5.4%,而其中约75%的CNV均为缺失型。同一时期,Fan等[51]第一次使用基于NGS的全基因组重测序技术进行CNV检测,在丝羽乌骨鸡和台湾地区本土鸡中共发现了8 839个CNV。之后,Yi等[52]利用WGS对鸡的12个品种进行CNV检测,共鉴定出8 840个总长98.2 Mb覆盖染色体基因组9.4%的CNVR。如今,重测序检测出的CNV数目量级比过往已经达到了新的层次,覆盖的基因组范围也更广,在不久的将来会有更多更精确的CNV被发现和补充。
在现阶段的育种工作中,以SNP为核心目标研究野生祖先和驯养物种之间的遗传分化关系一直是重点方向。但有研究表明,野生祖先和驯养动植物之间的CNV遗传关系可能更容易揭示人工选择的遗传基础[53-54]。现阶段,通过使用全基因组测序鉴定家禽的CNV一定程度上揭示了其在基因组水平上驯化选择的作用。Seol等[55]对4种不同类型(肉鸡、蛋鸡、肉蛋杂交鸡、原鸡)的65只鸡进行全基因组测序,鉴定出663个驯化相关CNVR,群体差异分析后发现,不同品种间存在许多特有的不同拷贝数类型的基因组区域,即人工选择引起的遗传变异在CNV水平有效。目前,在家禽上,利用CNV突变进行育种还难以实现,不过在植物(苜蓿、水稻、杨树)及鱼类(比目鱼)上已有利用物理辐射进行Indel诱变育种的相关报道[56-57],Indel作为小片段的插入一定程度上表征了CNV诱变育种的可行性。
6 展望拷贝数变异本质上是基因组的重排,现阶段,CNV作为生物基因组中重要的遗传变异类型之一已经得到广泛关注,许多物种如人、鼠、猪、牛等的CNV遗传图谱均已构建。类似人们早期关注人类疾病发生机制,CNV在家禽上也是从疾病性状开始研究,之后的研究重点再由生产相关的质量性状转移至更为复杂的数量性状上,这种趋势的出现也得益于CNV相比SNP具有DNA片段更长,更容易影响多个基因的特点。可以预见,随着测序技术的进一步发展和参考基因组的完善,更多、更精确的CNV会被发现和补充。但不可忽视的是,现有的CNV检测大多因为采取不同的分析方法,或者不同的算法处理导致CNV检测结果的重复性和准确性并不高。其中,aCGH技术、SNP芯片技术受限于探针和芯片密度,假阳性较高;基于重测序技术的CNV的检测虽然高效快捷,但对于基因组内的一些高度重复的复杂区域内的CNV片段或者一些较短的小CNV片段依旧没有足够好的处理方法。因此,研究人员首先面临最直接的问题之一,即如何快速、高效、准确地进行CNV的精准检测定位,这需要更为科学的测序方法以及更完善的组装算法模型。对于现有的检测软件,可以尝试制定较为合理的综合指标来判定软件的检测适用情况,如考量对不同大小、不同类型CNV的敏感性、特异性以及软件之间的检测结果的一致性、软件的计算成本等[58],一些功能性指标如可视化等也可为新的软件开发指明方向[59]。另外,现有的各种CNV公共资源受限于检测方法、检测平台噪声、灵敏度的不同导致结果差异较大,这些资源难以得到完善的整合利用[60],在不久的将来,是否能够跨学科、跨领域的基于深度学习、人工智能等开发新一代的综合预测模型,通过整合基因组将来源不同的CNV检测资源充分整合利用值得期待。
在育种工作方面,CNV遗传图谱可以帮助遗传学家对疾病和性状进行基因定位。目前,关于物种的CNV遗传图谱构建进展迅速,但尚有一些问题值得关注。首先,目前CNV遗传图谱还未充分发挥作用,部分已经绘制的CNV图谱较为粗略,100 bp~20 kb的信息尚不完全[61],诸多CNV还做不到与表型对应,应用CNV进行育种可能还有一段路要走。其次,对于现有的CNV遗传图谱,实际比对过程中容易出现重复性低的问题,一方面是因为早期的CNV检测受限于方法局限性较大,小片段无法检测或者假阳性较高,CNV的边界也非常模糊;另一方面则是CNV受遗传背景差异影响较大,CNV在全基因组上的分布,既存在个体特异性,也存在品种特异性,在某一个品种中存在的拷贝数变异,在另外一个品种中极有可能不存在。另外,目前畜禽类的CNV遗传图谱的构建工作还稍显不足,尤其在家禽方面,大多都是围绕着鸡展开,至于鸭、鹅、鸽、鹌鹑等其他经济养殖禽类还没有较为完善的CNV遗传图谱,这方面工作亟需开展。
综合现有诸多遗传疾病、重要经济性状与CNV的关联分析结果来看,测序技术的进步和分析算法的完善帮助育种工作者们在猪、牛、羊、鸡等畜禽上挖掘出了越来越多的与抗病、高产等优良性状相关的CNV。可以预测,开发CNV作为家禽育种工作中的遗传分子标记从而进行针对性的具有高抗病性或优良生产性状的品种选育工作具有广阔的应用前景。
[1] | SCHERER S W, LEE C, BIRNEY E, et al. Challenges and standards in integrating surveys of structural variation[J]. Nat Genet, 2007, 39(7 Suppl): S7–S15. |
[2] | ALKAN C, COE B P, EICHLER E E. Genome structural variation discovery and genotyping[J]. Nat Rev Genet, 2011, 12(5): 363–376. DOI: 10.1038/nrg2958 |
[3] | LEE J A, CARVALHO C M B, LUPSKI J R. A DNA replication mechanism for generating nonrecurrent rearrangements associated with genomic disorders[J]. Cell, 2007, 131(7): 1235–1247. DOI: 10.1016/j.cell.2007.11.037 |
[4] | GOODIER J L, KAZAZIAN H H Jr. Retrotransposons revisited:the restraint and rehabilitation of parasites[J]. Cell, 2008, 135(1): 23–35. |
[5] | COE B P, STESSMAN H A F, SULOVARI A, et al. Neurodevelopmental disease genes implicated by de novo mutation and copy number variation morbidity[J]. Nat Genet, 2019, 51: 106–116. DOI: 10.1038/s41588-018-0288-4 |
[6] | COPPOLA A, CELLINI E, STAMBERGER H, et al. Diagnostic implications of genetic copy number variation in epilepsy plus[J]. Epilepsia, 2019, 60(4): 689–706. |
[7] | VERBITSKY M, WESTLAND R, PEREZ A, et al. The copy number variation landscape of congenital anomalies of the kidney and urinary tract[J]. Nat Genet, 2019, 51(1): 117–127. DOI: 10.1038/s41588-018-0281-y |
[8] | SHEN W, SZANKASI P, DURTSCHI J, et al.Genome-wide copy number variation detection using NGS: data analysis and interpretation[M]//MURRAY S S.Tumor Profiling.New York: Humana Press, 2019: 113-124. |
[9] | ZHU M F, NEED A C, HAN Y J, et al. Using ERDS to infer copy-number variants in high-coverage genomes[J]. Am J Hum Genet, 2012, 91(3): 408–421. |
[10] | XI R B, LEE S, PARK P J. A survey of copy-number variation detection tools based on high-throughput sequencing data[J]. Curr Protoc Hum Genet, 2012, 75(1): 7.19.1–7.19.15. |
[11] | ZHANG L, BAI W Y, YUAN N, et al. Comprehensively benchmarking applications for detecting copy number variation[J]. PLoS Comput Biol, 2019, 15(5): e1007367. |
[12] | ABYZOV A, URBAN A E, SNYDER M, et al. CNVnator:an approach to discover, genotype, and characterize typical and atypical CNVs from family and population genome sequencing[J]. Genome Res, 2011, 21(6): 974–984. DOI: 10.1101/gr.114876.110 |
[13] | MILLER C A, HAMPTON O, COARFA C, et al. ReadDepth:a parallel R package for detecting copy number alterations from short sequencing reads[J]. PLoS One, 2011, 6(1): e16327. DOI: 10.1371/journal.pone.0016327 |
[14] | KORBEL J O, ABYZOV A, MU X J, et al. PEMer:a computational framework with simulation-based error models for inferring genomic structural variants from massive paired-end sequencing data[J]. Genome Biol, 2009, 10(2): R23. |
[15] | CHEN K, WALLIS J W, MCLELLAN M D, et al. BreakDancer:an algorithm for high-resolution mapping of genomic structural variation[J]. Nat Methods, 2009, 6(9): 677–681. DOI: 10.1038/nmeth.1363 |
[16] | YE K, SCHULZ M H, LONG Q, et al. Pindel:a pattern growth approach to detect break points of large deletions and medium sized insertions from paired-end short reads[J]. Bioinformatics, 2009, 25(21): 2865–2871. DOI: 10.1093/bioinformatics/btp394 |
[17] | JIANG Y, WANG Y D, BRUDNO M. PRISM:pair-read informed split-read mapping for base-pair level detection of insertion, deletion and structural variants[J]. Bioinformatics, 2012, 28(20): 2576–2583. DOI: 10.1093/bioinformatics/bts484 |
[18] | IQBAL Z, CACCAMO M, TURNER I, et al. De novo assembly and genotyping of variants using colored de Bruijn graphs[J]. Nat Genet, 2012, 44(2): 226–232. DOI: 10.1038/ng.1028 |
[19] | NIJKAMP J F, VAN DEN BROEK M A, GEERTMAN J M A, et al. De novo detection of copy number variation by co-assembly[J]. Bioinformatics, 2012, 28(24): 3195–3202. DOI: 10.1093/bioinformatics/bts601 |
[20] | LAYER R M, CHIANG C, QUINLAN A R, et al. LUMPY:a probabilistic framework for structural variant discovery[J]. Genome Biol, 2014, 15(6): R84. DOI: 10.1186/gb-2014-15-6-r84 |
[21] | LAM H Y K, PAN C P, CLARK M J, et al. Detecting and annotating genetic variations using the HugeSeq pipeline[J]. Nat Biotechnol, 2012, 30(3): 226–229. |
[22] | YANG H, ZHU D M. Combinatorial detection algorithm for copy number variations using high-throughput sequencing reads[J]. Int J Pattern Recogn Artif Intell, 2019, 33(14): 1954034. DOI: 10.1142/S021800141954034X |
[23] | D'HAENE B, VANDESOMPELE J, HELLEMANS J. Accurate and objective copy number profiling using real-time quantitative PCR[J]. Methods, 2010, 50(4): 262–270. DOI: 10.1016/j.ymeth.2009.12.007 |
[24] | CASSINARI K, QUENEZ O, JOLY-HÉLAS G, et al. A simple, universal, and cost-efficient digital PCR method for the targeted analysis of copy number variations[J]. Clin Chem, 2019, 65(9): 1153–1160. DOI: 10.1373/clinchem.2019.304246 |
[25] |
王立刚, 张跃博, 颜华, 等. 拷贝数变异全基因组关联鉴定猪骨率性状候选基因[J]. 畜牧兽医学报, 2019, 50(11): 2208–2214.
WANG L G, ZHANG Y B, YAN H, et al. Identification of candidate genes for porcine bone rate traits by genome-wide association of copy number variation[J]. Acta Veterinaria et Zootechnica Sinica, 2019, 50(11): 2208–2214. (in Chinese) |
[26] | JIA C J, WANG H B, LI C, et al. Genome-wide detection of copy number variations in polled yak using the Illumina BovineHD BeadChip[J]. BMC Genomics, 2019, 20(1): 376. DOI: 10.1186/s12864-019-5759-1 |
[27] | LIU M, ZHOU Y, ROSEN B D, et al. Diversity of copy number variation in the worldwide goat population[J]. Heredity, 2019, 122(5): 636–646. DOI: 10.1038/s41437-018-0150-6 |
[28] | ELFERINK M G, VALLÉE A A A, JUNGERIUS A P, et al. Partial duplication of the PRLR and SPEF2 genes at the late feathering locus in chicken[J]. BMC Genomics, 2008, 9(1): 391. DOI: 10.1186/1471-2164-9-391 |
[29] | WRIGHT D, BOIJE H, MEADOWS J R S, et al. Copy number variation in intron 1 of SOX5 causes the Pea-comb phenotype in chickens[J]. PLoS Genet, 2009, 5(6): e1000512. DOI: 10.1371/journal.pgen.1000512 |
[30] | DORSHORST B, HARUN-OR-RASHID M, BAGHER -POOR A J, et al. A genomic duplication is associated with ectopic Eomesodermin expression in the embryonic chicken comb and two duplex-comb phenotypes[J]. PLoS Genet, 2015, 11(3): e1004947. DOI: 10.1371/journal.pgen.1004947 |
[31] | IMSLAND F, FENG C G, BOIJE H, et al. The rose-comb mutation in chickens constitutes a structural rearrangement causing both altered comb morphology and defective sperm motility[J]. PLoS Genet, 2012, 8(6): e1002775. DOI: 10.1371/journal.pgen.1002775 |
[32] | JIN S H, ZHU F, WANG Y Y, et al. Deletion of Indian hedgehog gene causes dominant semi-lethal creeper trait in chicken[J]. Sci Rep, 2016, 6(1): 30172. DOI: 10.1038/srep30172 |
[33] | GUO Y, GU X R, SHENG Z Y, et al. A complex structural variation on chromosome 27 Leads to the ectopic expression of HOXB8 and the muffs and beard phenotype in chickens[J]. PLoS Genet, 2016, 12(6): e1006071. DOI: 10.1371/journal.pgen.1006071 |
[34] | BAI H, SUN Y, LIU N, et al. Genome-wide detection of CNVs associated with beak deformity in chickens using high-density 600K SNP arrays[J]. Anim Genet, 2018, 49(3): 226–236. |
[35] | GUNNARSSON U, KERJE S, BED'HOM B, et al. The Dark brown plumage color in chickens is caused by an 8.3-kb deletion upstream of SOX10[J]. Pigm Cell Melanoma Res, 2011, 24(2): 268–274. DOI: 10.1111/j.1755-148X.2011.00825.x |
[36] | DORSHORST B, MOLIN A M, RUBIN C J, et al. A complex genomic rearrangement involving the Endothelin 3 locus causes dermal hyperpigmentation in the chicken[J]. PLoS Genet, 2011, 7(12): e1002412. DOI: 10.1371/journal.pgen.1002412 |
[37] | WANG Z P, QU L J, YAO J F, et al. An EAV-HP insertion in 5' Flanking region of SLCO1B3 causes blue eggshell in the chicken[J]. PLoS Genet, 2013, 9(1): e1003183. DOI: 10.1371/journal.pgen.1003183 |
[38] | LUO J, YU Y, MITRA A, et al. Genome-wide copy number variant analysis in inbred chickens lines with different susceptibility to Marek's disease[J]. G3 (Bethesda), 2013, 3(2): 217–223. DOI: 10.1534/g3.112.005132 |
[39] | YAN Y Y, YANG N, CHENG H H, et al. Genome-wide identification of copy number variations between two chicken lines that differ in genetic resistance to Marek's disease[J]. BMC Genomics, 2015, 16(1): 843. DOI: 10.1186/s12864-015-2080-5 |
[40] | XU L Y, HE Y H, DING Y, et al. Characterization of copy number variation's potential role in Marek's disease[J]. Int J Mol Sci, 2017, 18(5): 1020. DOI: 10.3390/ijms18051020 |
[41] | BAI H, HE Y H, DING Y, et al. Genome-wide characterization of copy number variations in genetic resistance to Marek's disease using next generation sequencing[J]. BMC Genet, 2020, 21: 77. |
[42] | BI H, YI G, YANG N. Increased copy number of SOCS2 gene in Chinese gamecocks[J]. Poult Sci, 2017, 96(5): 1041–1044. DOI: 10.3382/ps/pew391 |
[43] | SOHRABI S S, MOHAMMADABADI M, WU D D, et al. Detection of breed-specific copy number variations in domestic chicken genome[J]. Genome, 2018, 61(1): 7–14. |
[44] | LIN S D, LIN X R, ZHANG Z H, et al. Copy number variation in SOX6 contributes to chicken muscle development[J]. Genes, 2018, 9(1): 42. DOI: 10.3390/genes9010042 |
[45] |
周伟, 刘冉冉, 郑麦青, 等. 鸡16号染色体SNP单倍型和拷贝数变异对血清IgG含量的影响[J]. 畜牧兽医学报, 2013, 44(9): 1355–1362.
ZHOU W, LIU R R, ZHENG M Q, et al. Haplotypes and copy number variation of genome in chromosome 16 and their association with IgG level in chickens[J]. Acta Veterinaria et Zootechnica Sinica, 2013, 44(9): 1355–1362. (in Chinese) |
[46] | GRIFFIN D K, ROBERTSON L B, TEMPEST H G, et al. Whole genome comparative studies between chicken and turkey and their implications for avian genome evolution[J]. BMC Genomics, 2008, 9(1): 168. DOI: 10.1186/1471-2164-9-168 |
[47] | SKINNER B M, ROBERTSON L B W, TEMPEST H G, et al. Comparative genomics in chicken and Pekin duck using FISH mapping and microarray analysis[J]. BMC Genomics, 2009, 10(1): 357. DOI: 10.1186/1471-2164-10-357 |
[48] | WANG X F, NAHASHON S, FEASTER T K, et al. An initial map of chromosomal segmental copy number variations in the chicken[J]. BMC Genomics, 2010, 11(1): 351. DOI: 10.1186/1471-2164-11-351 |
[49] | JIA X, CHEN S, ZHOU H, et al. Copy number variations identified in the chicken using a 60K SNP BeadChip[J]. Anim Genet, 2013, 44(3): 276–284. DOI: 10.1111/age.12009 |
[50] | CROOIJMANS R P M A, FIFE M S, FITZGERALD T W, et al. Large scale variation in DNA copy number in chicken breeds[J]. BMC Genomics, 2013, 14(1): 398. DOI: 10.1186/1471-2164-14-398 |
[51] | FAN W L, NG C S, CHEN C F, et al. Genome-wide patterns of genetic variation in two domestic chickens[J]. Genome Biol Evol, 2013, 5(7): 1376–1392. DOI: 10.1093/gbe/evt097 |
[52] | YI G Q, QU L J, LIU J F, et al. Genome-wide patterns of copy number variation in the diversified chicken genomes using next-generation sequencing[J]. BMC Genomics, 2014, 15(1): 962. DOI: 10.1186/1471-2164-15-962 |
[53] | HOVHANNISYAN G, HARUTYUNYAN T, AROUTIOUNIAN R, et al. DNA copy number variations as markers of mutagenic impact[J]. Int J Mol Sci, 2019, 20(19): 4723. DOI: 10.3390/ijms20194723 |
[54] | LYE Z N, PURUGGANAN M D. Copy number variation in domestication[J]. Trends Plant Sci, 2019, 24(4): 352–365. DOI: 10.1016/j.tplants.2019.01.003 |
[55] | SEOL D, KO B J, KIM B, et al. Identification of copy number variation in domestic chicken using whole-genome sequencing reveals evidence of selection in the genome[J]. Animals, 2019, 9(10): 809. DOI: 10.3390/ani9100809 |
[56] | HOU J L, ZHANG X Y, WANG G X, et al. Novel breeding approach for Japanese flounder using atmosphere and room temperature plasma mutagenesis tool[J]. BMC Genomics, 2019, 20(1): 323. DOI: 10.1186/s12864-019-5681-6 |
[57] | HENRY I M, ZINKGRAF M S, GROOVER A T, et al. A system for dosage-based functional genomics in poplar[J]. Plant Cell, 2015, 27(9): 2370–2383. DOI: 10.1105/tpc.15.00349 |
[58] | ZHAO L L, LIU H, YUAN X G, et al. Comparative study of whole Exome sequencing-based copy number variation detection tools[J]. BMC Bioinf, 2020, 21(1): 97. DOI: 10.1186/s12859-020-3421-1 |
[59] | MARKHAM J F, YERNENI S, RYLAND G L, et al. CNspector:a web-based tool for visualisation and clinical diagnosis of copy number variation from next generation sequencing[J]. Sci Rep, 2019, 9(1): 6426. |
[60] | SEAL D B, DAS V, GOSWAMI S, et al. Estimating gene expression from DNA methylation and copy number variation:a deep learning regression model for multi-omics integration[J]. Genomics, 2020, 112(4): 2833–2841. DOI: 10.1016/j.ygeno.2020.03.021 |
[61] |
刘欣, 王立刚, 王立贤. 拷贝数变异及其研究进展[J]. 畜牧兽医学报, 2010, 41(8): 927–931.
LIU X, WANG L G, WANG L X. Current progress in copy number variation study[J]. Acta Veterinaria et Zootechnica Sinica, 2010, 41(8): 927–931. (in Chinese) |