家鸡(Gallus domesticus)属于鸟纲,鸡形目,雉科,原鸡属。研究表明,南亚、东南亚和我国北方地区是重要家鸡起源地[1]。我国幅员辽阔,地形复杂,加之各民族间的不同文化以及劳动人民长期自然选择和人工选择,鸡种体型外貌如羽色、羽型、肤色、冠型、爪型及生产性状方面差异显著,是家禽遗传资源的重要组成部分。据2011年出版的《中国畜禽遗传资源志家禽志》一书收录鸡品种116个,其中地方品种鸡107个[2]。
1977年,Sanger等[3]发明的DNA双脱氧链终止测序法标志着基因组学研究的开端。经过科研人员持续不断的技术改良和革新测序手段和平台,以Roche公司的454技术(2005年)、Illumina公司的Solexa技术(2006年)和ABI公司的SOLiD技术(2007年)为标志的第二代高通量测序技术(Next-generation sequencing,NGS)相继诞生,对动物基因组重测序的发展起到了重要的作用[4]。鸡既是重要的农业经济动物,能够为人类生活提供优质的蛋和肉等禽产品,同时也是研究遗传多样性和进化选择机制的模式生物之一,是分子生物学和现代医学研究的重要素材[5, 6]。本文将介绍鸡基因组测序的发展历程,概述鸡基因组测序研究内容,讨论鸡基因组测序工作的遇到问题以及展望。旨为家鸡种质资源的改良和分子育种提供重要的参考资料。
1 鸡全基因组de novo测序全基因组de novo测序亦称为从头测序,是指不参考或者依赖某物种现有序列和其他物种的资料,对某物种直接进行基因组测序,然后应用生物信息学手段对测序序列进行拼接和组装,完成一个完整的基因组序列,从而绘制该物种的全基因组序列图谱。对研究物种的基因组结构和功能基因信息,阐明和解释物种的进化及其生物学特性具有重要的意义[7]。
在“人类基因组计划”(Human genome project,HGP)进行得如火如荼的同时,家禽科学领域也进行着场类似的革命,并且取得了大的成功。2004年,《Nature》杂志报道了鸡de novo全基因组组装工作的结果,首次发表了其完整基因组序列,标志着这一物种学科发展的新开端。“鸡基因组测序工程”中测序文库的基因组DNA均来自于一只雌性近交系的红色原鸡,具有Z和W性染色体,含有常染色体50%的基因组。所有序列组装拼接是在6.6倍整个基因组shotgun序列覆盖率的情况下完成的;序列拼接程序为PCAP,拼接是在一个基于BAC文库的物理图谱和遗传图谱的指导下完成,拼装序列含有1.05 Gb个碱基对,其中contigs的N50长度是36 kb,总覆盖率为98%,碱基替代率为0.02%[8]。鸡基因组测序计划的完成,不仅为遗传学、发育生物学的相关研究提供了大量重要的信息,也为理解脊椎动物的进化提供了一个关键物种的信息,其所有可利用的信息资源都为后基因组学的研究奠定了基础
藏鸡是一种分布于青藏高原的古老鸡种,经过长期的自然选择和人工选择作用,对青藏高原特殊环境表现出很强的适应性,这是其他鸡种所不具备的独特种质特性。2015年,中国科学院昆明动物研究所张亚平课题组对一只雌性藏鸡进行de novo测序,绘制完成高质量的藏鸡基因组序列图谱,标志着中国地方鸡种遗传资源的开发利用进入一个更高的层面。并且对5只红原鸡和其他27只不同地区的家鸡(10只藏鸡,8只本地鸡,8只西双版纳斗鸡和1只罗曼商品代母鸡)进行了全基因组重测序,通过比较基因组学和群体基因组学手段揭示了藏鸡的高原适应性进化的遗传机制。分析结果显示藏鸡分成两个群体,两个群体之间没有基因交流,推断这两支藏鸡可能分别来自两个独立的世系。随后分别对两支藏鸡群体进行有效群体规模研究和选择信号检测发现,两个群体中受到选择作用的基因在钙离子信号通路中出现富集,说明钙离子通路在藏鸡的高原适应中有着重要的作用。该研究在基因组水平对藏鸡品种资源进行了初步的评估,揭示了藏鸡高原适应的潜在遗传机制,对藏鸡品种资源的保护和培育均具有理论指导意义,而且对研究人类高原缺氧反应提供了重要的线索[9]。
随着测序技术和生物信息学的飞速发展,一个物种基因组计划的完成,意味着这一物种学科的新开端,不同种属鸡基因组的破译使人们可以更好的了解不同品种鸡的生物学特性,丰富了品种的多样性,根据不同的特点,做好保种的同时,加快不同品种的选育进程。
2 鸡全基因组重测序全基因组重测序是指对基因组信息已知参考基因组的物种不同个体进行的整个基因组测序,通过生物信息学的分析,并在个体或群体水平进行序列差异性分析的测序方法。具有分析结果快速、准确、灵敏度高和自动化的技术特点。可以检测到大量与性状关联的遗传变异信息(包括SNP、Indel、SV和CNV甚至新基因等)。通过变异信息注释、系统进化和群体遗传结构分析等方法,不仅可以预测动物重要性状候选基因;同时能够利用SNPs研究物种的遗传多样性、遗传图谱构建、进化历史、环境适应性、自然选择等生物学问题,为分子遗传育种奠定了数据基础,进而缩短分子育种的实验周期[10, 11]。
2.1 鸡全基因组重测序解析品种遗传多样性受国外品种的冲击,我国优良地方品种鸡数量不断下滑,品种资源流失严重。随着鸡全基因组序列的公布,鸡全基因重测序研究取得了较大进展。Shibolet等[12]利用全基因组重测序鉴别家鸡在进化过程中可能存在的突变。对家鸡及其野生祖先红原鸡进行了全基因组重测序,共发现了7 000 000个SNPs,1 300个缺失突变和若干选择性清除,并且发现TSHR基因在该研究的所有家鸡中均存在选择性清除,该基因在脊椎动物的代谢调节及生殖过程中发挥着重要作用。Seo等[13]采用Illumina HiSeq 2000测序平台对韩国不同羽色的本地鸡种进行重测序分析,获得36 660 731 136±1 257 159 120 bp的原始序列,从29号染色体和Z染色体上共获得4 006 068± 97 534个SNPs,在这些已鉴别的SNPs中有2 948 648± 81 414个是已知,其中被定义的SNPs有1 181± 150个;新发现的SNPs是1 047 951± 14 956个,未被定义的SNPs有8 238± 1 019个。同义突变的SNPs有26 266±1 456,错义突变有11 467 ± 604个和特征改变有8 180± 458个。
Yi等[14]基于全基因组重测序基础研究了12只来源于不同品种鸡的全基因组CNV,发现了8 840个CNVs区域,覆盖了98.2 Mb,占鸡基因组的9.4%,这些CNVs大小从1.1-268.8 kb不等,平均长度为11.1 kb。总共预测到2 214个CNVs跨越2 216个具有特定生物学功能相关的基因。同时被部分CNVs覆盖的区域发现了FZD6L基因和IMS1基因,这两个基因与疾病易感性和抗病性相关。Fan等[15]对一只丝羽乌骨鸡和一只台湾本地鸡进行了深度为23X和25X的全基因组重测序,共鉴定出大约760万个SNPs和8 839个CNVs,其中42% SNPs为新发现;13 537个基因的编码区存在27 852个非同义突变,分析了这些检出变异与表型的可能关系,选择清除分析发现ROHO2、ARID4B、NELL1等与生长相关、食欲和代谢调节等途径相关的基因被确认。
2.2 鸡全基因组重测序揭示进化机制2010年,Rubin等[16]利用全基因组测序的方法研究家鸡在驯化过程中受选择的位点,首先对蛋鸡、肉鸡等8个品种的家鸡的基因组进行混池测序,鉴定出约700万个SNPs和1 300个缺失,应用标准化杂合度方法筛选鸡驯化过程受选择的基因,鉴定出了一些与繁殖、生长和代谢有关的位点。Wang等[17]利用全基因组重测序技术对5只红色原鸡和8只云南本地鸡进行测序,平均测序深度18.9×。一共获得17 115 375个SNPs,约一半位于基因间区。其中70 990个SNPs引起氨基酸非同义替代,174 748个引起同义替代。有445个基因发生终止密码子的缺失与获得。基因组数据分析意外发现大量视觉相关基因在家鸡驯化过程中受到正选择作用,而非选择压力放松;结合家鸡和红原鸡的视网膜、大脑皮层、纹状体、视叶和小脑蚓部的转录组数据,揭示了家鸡视觉退化的遗传机制。Qanbari等[18]利用商用鸡的重测序数据,基于位点的杂合度发现IGF1、INSR、LEPR等基因受选择影响。
2.3 鸡全基因组重测序揭示质量性状遗传机制Jin等[19]通过兴义矮脚鸡为研究材料,组建Cp基因型分离家系,采用全基因组重测序及生物信息分析,首次揭开了鸡匍匐性状形成的基因之谜,其由7号染色体上21 798 705-21 810 600 bp区域IHH基因的缺失所引起,有助于对我国地方鸡品种资源的保护、开发和利用。Wang等[20]通过对东乡鸡、卢氏绿壳蛋鸡和美国的一个绿壳蛋品种Araucana鸡全基因组重测序等研究,发现鸡绿壳蛋色的形成是由SLCOIB3基因上游EAV-HP序列的插入而引起的。SLCOIB3基因及其突变是迄今为止世界上第一个被发现的与蛋壳颜色形成相关的基因突变。鸡丝羽表型是由常染色体上的隐性基因控制的单基因遗传性状,是一些品种特有的表型性状。Feng等[21]通过高通量测序分析发现,鸡丝羽表型是由鸡3号染色体上PDSS2基因的一个顺式调控SNP位点突变所引起的,建立了丝羽性状的DNA分子标记。Wright等[22]通过连锁分析和重测序分析等方法发现,在SOX5基因的一段非编码序列拷贝数的增加形成了豆冠表型,揭开了鸡豆冠的分子机制。Eriksson等[23]通过研究发现鸡黄色皮肤形成是由个或多个顺式调控和组织特异性调控的突变进而影响BCDO2基因的表达造成的。
3 鸡全基因组测序研究面临的问题和展望近年来,第二代高通量测序技术发展迅猛,技术不断进行改进,检测成本不断降低,测序通量和读长都得到明显改善,如Illumina公司发布的Hiseq X Ten测序平台、Pacific Biosciences公司的PacBio测序。虽然二代测序技术解决了以前的很多研究难题,给全基因组测序技术带来更新突破的同时也使得其局限性和挑战性日益凸显。其后期巨大的数据量对生物信息学分析能力的要求也越来越高以及如何方便准确地储存、分析、传递及利用数据是一个亟待解决的问题[24, 25]。再者,虽然与第一代测序技术相比价格有了明显的降低,但全基因组重测序其受限样品量,较适合大规模的测序,总体价格有望更低,有效利用这些数据,从海量的数据中充分挖掘出其中的生物学意义,检索和交换数据成为一个重大课题。以单分子测序为特点的单分子DNA测序技术等经济实惠的第三代测序技术也已经发展起来[26],增加了测序读长和通量,并且无DNA扩增环节,极大地降低了测序成本,在全基因组测序方面都得到了很好的应用[27],将有利于展开鸡全基因基因组测序工作,促进基因组学研究的发展。
我国地方鸡遗传资源非常丰富。首先从头测序方面,只是破译了藏鸡的基因组序列,如斗鸡等特殊鸡的品种全基因组信息还未知,更应该深度开发我国特殊性状物种的测序,促进重要基因资源的挖掘、保护和利用;其次,科研人员虽然在不同群体发现SNPs、InDels和CNVs等大量的变异信息,但对很多鸡品种核心种质的重测序工作还未开展,开展核心种质资源重测序对鸡遗传资源保护及特殊种质资源的开发保护利用具有重要科学意义。然后通过开展从单一基因研究深入到全基因组关联分析研究中,大力推动我国基因组学在基因克隆与分子育种领域的应用研究,提高育种能力和水平。最后加强与转录组学、代谢组学、蛋白质组学和降解组学的等多组学的相关研究,促进基因组学生物信息的共享与利用。
[1] | Xiang H, Gao J, Yu B, et al. Early Holocene chicken domestication in northern China[J]. Proc Natl Acad Sci USA, 2014, 111(49): 17564–17569. DOI:10.1073/pnas.1411882111 |
[2] | 中国畜禽遗传资源志—编委会中国畜禽遗传资源志家禽志[M]. 北京: 中国农业出版社, 2011. |
[3] | Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain terminating inhibitor[J]. Proceeding of the National Academy of Sciences, 1977, 74(12): 5463–5467. DOI:10.1073/pnas.74.12.5463 |
[4] | Mardis ER. Next-generation DNA sequencing methods[J]. Annu Rev Genomics Hum Genet, 2008, 9(1): 387. DOI:10.1146/annurev.genom.9.081307.164359 |
[5] | Stern C. The chick:A great model system becomes even greater[J]. Developmental Cell, 2005, 8(1): 9–17. |
[6] | Burt DW. Emergence of the chicken as a model organism:implications for agriculture and biology[J]. Poultry Science, 2007, 86(7): 1460–1471. DOI:10.1093/ps/86.7.1460 |
[7] | Yue GD, Gao Q, Luo LH, et al. The application of high-throughput sequencing technology in plant and animal research[J]. Scientia Sinica, 2012, 42(2): 107–124. DOI:10.1360/052011-634 |
[8] | Hillier LDW, Miller W, Birney E, et al. Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution[J]. Nature, 2004, 432(7018): 695–716. DOI:10.1038/nature03154 |
[9] | Wang MS, Li Y, Peng MS, et al. Genomic analyses reveal potential independent adaptation to high altitude in tibetan chickens[J]. Molecular Biology and Evolution, 2015, 32(7): 1880–1889. DOI:10.1093/molbev/msv071 |
[10] | Stratton M. Genome resequencing and genetic variation[J]. Nature Biotechnology, 2008, 26(1): 65–66. DOI:10.1038/nbt0108-65 |
[11] | Schuster SC. Next-generation sequencing transforms today's biology[J]. Nature Methods, 2008, 5(1): 16–18. |
[12] | Shibolet S, Coll R, Gilat T, et al. Whole-genome resequencing reveals loci under selection during chicken domestication[J]. Nature, 2010, 464(7288): 587–591. DOI:10.1038/nature08832 |
[13] | Seo DW, Oh JD, Jin S, et al. Erratum to:Single nucleotide polymorphism analysis of Korean native chickens using next generation sequencing data[J]. Molecular Biology Reports, 2015, 42(2): 471–477. DOI:10.1007/s11033-014-3790-5 |
[14] | Yi G, Qu L, Liu J, et al. Genome-wide patterns of copy number variation in the diversified chicken genomes using next-generation sequencing[J]. BMC Genomics, 2014, 15(1): 1–16. DOI:10.1186/1471-2164-15-1 |
[15] | Fan WL, Chen SN, Chen CF, et al. Genome-wide patterns of genetic variation in two domestic chickens[J]. Genome Biology and Evolution, 2013, 5(7): 1376–1392. DOI:10.1093/gbe/evt097 |
[16] | Rubin CJ, Zody MC, Eriksson J, et al. Whole-genome resequencing reveals loci under selection during chicken domestication[J]. Nature, 2010, 464(7288): 587–591. DOI:10.1038/nature08832 |
[17] | Wang MS, Zhang RW, Su LY, et al. Positive selection rather than relaxation of functional constraint drives the evolution of vision during chicken domestication[J]. Cell Research, 2016, 26(5): 556. DOI:10.1038/cr.2016.44 |
[18] | Qanbari S, Strom TM, Haberer G, et al. A high resolution genome-wide scan for significant selective sweeps:an application to pooled sequence data in laying chickens[J]. PLoS One, 2012, 7(11): 49525. DOI:10.1371/journal.pone.0049525 |
[19] | Jin S, Zhu F, Wang Y, et al. Deletion of Indian hedgehog gene causes dominant semi-lethal Creeper trait in chicken[J]. Scientific Reports, 2016, 6: 30172. DOI:10.1038/srep30172 |
[20] | Wang Z, Qu L, Yao J, et al. An EAV-HP insertion in 5' Flanking region of SLCO1B3 causes blue eggshell in the chicken[J]. Plos Genetics, 2013, 9(1): e1003183. DOI:10.1371/journal.pgen.1003183 |
[21] | Feng C, Gao Y, Dorshorst B, et al. A cis-regulatory mutation of PDSS2 causes silky-feather in chickens[J]. PLoS Genetics, 2014, 10(8): 761–768. |
[22] | Wright D, Boije H, Meadows JR, et al. Copy number variation in intron 1 of SOX5 causes the Pea-comb phenotype in chickens[J]. PLoS Genetics, 2009, 5(6): 98–111. |
[23] | Eriksson J, Larson G, Gunnarsson U, et al. Identification of the yellow skin gene reveals a hybrid origin of the domestic chicken[J]. PLoS Genetics, 2008, 4(2): 78–84. |
[24] | Li Y, Li YH, Yang QW, et al. Research on crop germplasm resources based on genomics:present situation and prospect[J]. Agricultural Sciences in China, 2015, 48(17): 3333–3353. |
[25] | van Vliet AH. Next generation sequencing of microbial transcriptomes:challenges and opportunities[J]. FEMS Microbiology Letters, 2010, 302(1): 1–7. DOI:10.1111/fml.2010.302.issue-1 |
[26] | Zhang DF, Ma QY, Yin TM, et al. The third generation sequencing technology and its application[J]. China Biotechology, 2013, 33(5): 125–131. |
[27] | Baker M. Gene data to hit milestone[J]. Nature, 2012, 487(7407): 282–283. DOI:10.1038/487282a |