四川动物  2015, Vol. 34(1) 107-110

扩展功能

文章信息

黄族豪, 杨承忠
HUANG Zuhao, YANG Chengzhong
动物线粒体基因组GC含量分析
Analysis of GC Contents in Animal Mitogenome
四川动物, 2015, 34(1): 107-110
Sichuan Journal of Zoology, 2015, 34(1): 107-110
10.3969/j.issn.1000-7083.2015.01.019

文章历史

收稿日期:2014-06-20
接受日期:2014-08-14
动物线粒体基因组GC含量分析
黄族豪1, 杨承忠2*     
1. 井冈山大学生命科学学院, 江西吉安343009;
2. 重庆师范大学生命科学学院, 重庆市动物生物学重点实验室, 重庆 401331
摘要:碱基组成是指基因组中腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶的相对含量,一般用鸟嘌呤和胞嘧啶的含量(GC含量)表示。前人的研究表明,不同类群的核基因组GC含量存在差异, 然而,对于动物线粒体基因组碱基组成的研究却很少。为此,本文统计和分析了分属于20个门的609个动物线粒体基因组的碱基组成。结果表明,各门动物间线粒体基因组GC含量没有显著差异,不能反映各动物门间的进化关系。脊椎动物鱼纲、两栖纲、爬行纲、鸟纲和哺乳纲及其代表性目的线粒体基因组GC含量虽有一定差异,但并未发现明显的变化规律。
关键词动物线粒体基因组     碱基组成     变异    
Analysis of GC Contents in Animal Mitogenome
HUANG Zuhao1, YANG Chengzhong2*     
1. School of Life Sciences, Jinggangshan University, Ji'an, Jiangxi Province 343009, China;
2. Chongqing Key Laboratory of Animal Biology, College of Life Sciences, Chongqing Normal University, Chongqing 401331, China
Abstract:Base composition refers to the relative content of adenine, guanine, cytosine, and thymine within a genome, which is commonly represented by GC contents. Many previous studies demonstrated that the base compositions of nuclear genome as well as its features were variable in different phyla. However, few studies were concerned on the GC contents in animal mitochondrial genome. Hence, base compositions of 609 mitochondrial genomes belonged to 20 phyla were analyzed in this paper. The results indicated that the GC contents of mitochondrial genomes in animal phyla had no significant difference and could not reflect the evolutionary relationships among them. Certain differences on GC contents were observed in the vertebrates (Pisces, Amphibia, Reptile, Aves and Mammalia), but no significant rules were found.
Key words: animal mitochondrial genome     base composition     variation    

碱基组成是指基因组中腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)的相对含量。碱基组成在全基因组尺度上一般用GC含量(GC content)表示。在核基因组中,碱基组成是一个变化很大的参数,基因组的差异首先通过碱基组成的变化表现出来。基因组的碱基组成具有种的特异性,但没有组织和器官的特异性(Saccone & Pesole,2003王进,严明,2008)。生长发育阶段和营养状态不会影响基因组的碱基组成。

随着PCR(polymerase chain reaction)技术的出现(Mullis et al.,1986)以及DNA测序技术的不断发展和完善(Metzker,2010Niedringhaus et al.,2011),人们可以获得各类物种的DNA序列,为对比分析基因组的碱基组成变化特征提供了方便(Perna & Kocher,1995武伟等,2007)。Grantham等(1980)证明每个核基因组都有自己的碱基组成特征,从而提出了基因组假说(genome hypothesis)。后来出现了各种用于核基因组碱基组成研究的方法,如语言学的方法等(王进,严明,2008)。很多生物类群的碱基组成也得到了研究(武伟等,2007高英凯等,2009)。

GC相对于AT的丰度是区分细菌基因组的特征之一,不同的原核生物GC含量的变化非常大(Muto & Osawa,1987王进,严明,2008)。真核生物核基因组的GC含量差别没有原核生物的那么大,但其GC含量在真核基因识别中也起着非常重要的作用(Bernardi,2000孙啸等,2004),特别是脊椎动物和植物核基因组等值区在物种适应和进化中的研究取得了重要进展(Argos et al.,1979Bernardi et al.,1985马德如,1998Bernardi,2000Eyre-Walker & Hurst,2001孙啸等,2004王进,严明,2008)。对于基因组GC含量变化差异的原因,学者们做了很多工作,如对鸟类、节肢动物、细菌等的分析,研究发现在一些无脊椎动物中,碱基组成存在种的差异(Sueoka,19881999D'Onofrio & Bernardi,1992Cheng et al.,1993Bernardi,2000Galtier et al.,2001刘运强等,2001钟军等,2002Foerstner et al.,2005;Necsulea & Lobry,2006武伟等,2007高英凯等,2009)。黄族豪等: 动物线粒体基因组GC含量分析

前人对动物核基因组碱基组成相关的研究较多,而对于动物线粒体基因组碱基组成的研究却很少(高英凯等,2009)。动物线粒体基因组由于其特殊的遗传方式和组织结构,其碱基组成的规律可能与核基因组不同。为此,本文对不同类群的动物线粒体基因组的碱基组成进行了统计分析,以期为动物基因组遗传和进化模式的深入研究积累基础资料。1 研究方法1.1 动物线粒体基因组序列

动物线粒体基因组序列在NCBI(http://www.ncbi.nlm.nih.gov/guide/)网站下载。共下载了609个线粒体基因组序列。基因组均以FASTA文件格式保存。1.2 数据分析

对FASTA格式保存的线粒体基因组,用我们编写的python脚本计算每个线粒体基因组的GC含量。利用SPSS 16.0软件对不同类群GC含量进行整理分析。用Kruskal-Wallis test和Steel-Dwass test对不同分类阶元的线粒体基因组GC含量进行差异性比较。2 结果

对609个动物线粒体基因组统计分析表明,平均GC含量为33.7%,最低的为13%,最高的为49%,变化无明显规律。对各动物门的线粒体基因组GC含量的统计结果表明,含量最低的类群是栉水母动物门Ctenophora(20%),最高的为扁盘动物门Placozoa(42%)和半索动物门Hemichordata(42%)(图 1)。动物类群从低等到高等,其碱基含量并未呈现明显的规律性变化(图 1)。

图 1 线粒体基因组GC含量在各动物门间的变化 Fig. 1 The GC contents in mitogenomes of 20 Phyla a. 原生动物门,b. 多孔动物门,c. 扁盘动物门,d. 腔肠动物门,e. 栉水母动物门,f. 扁形动物门,g. 棘头动物门,h. 线虫动物门,i. 轮虫动物门,j. 环节动物门,k. 星虫动物门,l. 软体动物门,m. 节肢动物门,n. 苔藓动物门,o. 腕足动物门,p. 箒虫动物门,q. 棘皮动物门,r. 毛颚动物门,s. 半索动物门,t. 脊索动物门

a. Protozoa,b. Porifera,c. Placozoa,d. Coelenterata,e. Ctenophora,f. Platyhelminthes,g. Acanthocephala,h. Nematoda,i. Rotifera,j. Annelida,k. Sipuuculoidea,l. Mollusca,m. Arthropoda,n. Bryozoa,o. Brachiopoda,p. Phoronida,q. Echinodermata,r. Chaetognatha,s. Hemichordata,t. Chordata

对脊椎动物鱼纲Pisces、两栖纲Amphibia、爬行纲Reptile、鸟纲Aves和哺乳纲Mammalia这5个类群的GC含量进行比对分析。结果表明:GC含量在鱼纲与鸟纲之间差异无统计学意义(P>0.05),在爬行纲和哺乳纲之间差异无统计学意义(P>0.05),除此之外各类群两两之间差异都有统计学意义(P<0.05)(图 2)。

图 2 线粒体基因组GC含量在脊椎动物各类群间的变化 Fig. 2 The GC contents in mitogenomes of Vertebrata YG. 鱼纲,LQG. 两栖纲,PXG. 爬行纲,NG. 鸟纲,BRG. 哺乳纲; u-w.表示相同字母间差异无统计学意义,不同字母间差异有统计学意义。

YG. Pisces,LQG. Amphibia,PXG. Reptile,NG. Aves,BRG. Mammalia; u-w. different letlers indicate significant difference in GC contents(P<0.05).

我们进一步对鱼纲、两栖纲、爬行纲、鸟纲和哺乳纲的下级分类阶元进行了比较分析。其中,鱼纲抽选了鲈形目Perciformes、鲤形目Cypriniformes、鲟形目Acipenseriformes和鲀形目Tetraodontiformes;两栖纲抽选了无尾目Anura和有尾目Caudata;爬行纲抽选了龟鳖目Testudines和有鳞目Squamata;鸟纲抽选了雀形目Passeriformes、鸡形目Galliformes、雁形目Anseriformes和鹤形目Gruiformes;哺乳纲抽选了灵长目Primates、食肉目Carnivora、鲸偶蹄目Cetartiodactyla和翼手目Chiroptera。结果表明,鱼纲抽选的4个目之间差异均无统计学意义(P>0.05);两栖纲抽选的2个目之间差异有高度统计学意义(P<0.01);爬行纲抽选的2个目之间差异有高度统计学意义(P<0.01);鸟纲的4个目中,雁形目与所有其他3个目差异有统计学意义(P<0.05),除此外,各目间差异均无统计学意义(P>0.05);哺乳纲抽选的4个目中,除了灵长目与偶蹄目之间差异有统计学意义(P<0.05)外,其余各目之间差异均无统计学意义(P>0.05)。3 讨论

从各动物线粒体基因组GC含量之间的差异性来看,动物线粒体基因组GC含量整体上并不能反映类群特征和进化关系,无论纲、门还是目的水平,各类群线粒体基因组GC含量的变化并无明显规律。这可能与动物线粒体基因组本身的结构特征有关:各基因间排列紧凑,很少有基因间隔区域;蛋白质编码基因的总长度占了线粒体基因组的70%左右;控制区是整个线粒体基因组中变异度最高的一个区域,但其长度所占的比例却很低。而核基因组却不同,核基因组中存在着大量的非编码区域,这些区域的变异增加了核基因组碱基组成上的较大差异,而这些差异可能与动物类群或动物进化历史有着紧密的联系。与之相比,动物线粒体基因组的碱基组成差异却要小得多,这种较小的差异主要是由碱基替换造成,而核基因组碱基差异的来源却要广泛得多。一些学者研究了脊椎动物核基因组大小与GC含量的关系(如Stingo et al.,1989Vinogradov & Borkin,1993Vinogradov,1994)。Vinogradov(1998)通过研究154种脊椎动物发现,GC含量与基因组大小呈显著性正相关。尤其是,小基因组中的GC含量变化更大,但大基因组中的基本稳定在46%左右。一个可能的原因是大基因组更容易突变,而GC碱基对的高稳定性有利于大基因组(Vinogradov,1998)。然而,本研究中,动物线粒体基因组含量最低的类群是栉水母动物门(20%),最高的为扁盘动物门和半索动物门(42%)(图 1)。栉水母动物门线粒体基因组长度范围为10 326~11 016 bp,扁盘动物门和半索动物门线粒体基因组长度范围分别为32 661~43 079 bp和15 708~17 037 bp。在所有这些类群中,扁盘动物门线粒体基因组最长,而线粒体长度最短的却不是栉水母动物门,而是原生动物门(6003~6014 bp)。比较这20个类群中线粒体基因组大小和线粒体基因组GC含量的关系发现,动物线粒体基因组GC含量的高低与线粒体基因组大小并无必然联系。这表明动物线粒体基因组的变化规律并不符合Vinogradov(1998)所发现的GC含量与基因组大小呈显著性正相关的规律。虽然动物线粒体基因组的碱基组成含量的变化在类群或进化上无明显规律,但动物线粒体基因组具有环形结构、基因排列紧凑、几乎不发生重组和典型的母系遗传等特征(Avise & Saunders,1984),使其在物种分类、系统发生和遗传多样性方面的应用很广泛(Burridge,1999Xiao et al.,2001Xiao et al.,2005Yang et al.,20122013Wang & Yang,2013)。

致谢: 感谢重庆师范大学赵元莙教授和四川大学杜联明博士在本研究中给予的帮助!
参考文献
高英凯, 苗永旺, 苏小茜, 等. 2009. 74种鸟类线粒体基因组碱基组成及特征分析[J]. 云南农业大学学报, 24(1): 51-58.
刘运强, 廖顺尧, 鲁成, 等. 2001. 动物线粒体编码序列相邻碱基组成对核苷酸替换的影响[J]. 西南农业大学学报, 23(3): 270-272.
马德如. 1998. 脊椎动物基因组进化原因的争论[J]. 生命的化学, 18(1): 7-9.
孙啸, 陆祖宏, 谢建明. 2004. 生物信息学概论[M]. 北京: 清华大学出版社.
王进, 严明. 2008. 比较基因组学手册-原理与方法[M]. 北京: 化学工业出版社.
武伟, 刘洪斌, 张泽, 等. 2007. 节肢动物线粒体基因组碱基组成特征分析[J]. 生物信息学, (3): 102-105.
钟军, 赵贵军, 张振书, 等. 2002. 基因组内碱基分布整体均衡与局部不均衡的研究进展[J]. 遗传, 2493: 351-355.
Argos P, Rossmann MG, Grau UM, et al. 1979. Thermal stability and protein structure[J]. Biochemistry, 18(25): 5698-5703.
Avise JC, Saunders NC. 1984. Hybridization and introgression among species of sunfish Lepomis analysis by mitochondrial DNA and allozyme markers[J]. Genetics, 108: 237-255.
Bernardi G, Olofsson B, Filipski J, et al. 1985. The mosaic genome of warm-blooded vertebrates[J]. Science, 228: 953-958.
Bernardi G. 2000. The compositional evolution of vertebrate genomes[J]. Gene, 259: 31-43.
Burridge CP. 1999. Molecular phylogeny of Nemadactylus and Acantholatris (Perciformes : Cirrhitoides: Cheilodactylidae), with implications for taxonomy and biogeography[J]. Molecular Phylogenetics and Evolution, 13: 93-109.
Cheng JW, Chou SH, Reid BR. 1993. Base pairing genometry in GA mismatches depengds entirely on the neighboring sequence[J]. Journal of Molecular Biology, 228(5): 1037-1041.
D'Onofrio G, Bernardi G. 1992. A universal compositional correlation among codon positions[J]. Gene, 110(1): 81-88.
Eyre-Walker A, Hurst LD. 2001. The evolution of isochors[J]. Nature Review Genetics, 2(7): 549-555.
Foerstner KU, Mering C von, Hooper SD, et al. 2005. Environments shape the nucleotide composition of genomes[J]. EMBO Reports, 6(12): 1208-1213.
Galtier N, Piganeau G, Mouchiroud D, et al. 2001. GC-content evolution in mammalian genomes: the bias gene conversion hypothesis[J]. Genetics, 159: 907-911.
Grantham R, Gautier C, Gouy M, et al. 1980. Codon catalog usage and the genome hypothesis[J]. Nuclei Acids Research, 8:r49-r62.
Metzker ML. 2010. Sequencing technologies-the next generation[J]. Genetics, Nature, 11: 31-46.
Mullis K, Faloona F, Scharf S, et al. 1986. Specific enzymatic amplification of DNA in vitro: The polymerase chain reaction[J]. Cold Spring Harbor Symp Quant Biol, 51: 263-273.
Muto A, Osawa S. 1987. The guanine and cytosine content of genomic DNA and bacterial evolution[J]. Proceedings of the National Academy of Sciences of the United States of America, 84(1): 166-169.
Necsulea A, Lobry JR. 2006. Revisiting the directional mutation pressure theory: the analysis of a particular genomic structure in Leishmania major[J]. Gene, 385: 28-40.
Niedringhaus TP, Milanova D, Kerby MB, et al. 2011. Landscape of Next-Generation Sequencing Technologies[J]. Analytical Chemistry, 83: 4327-4341.
Perna NT, Kocher TD. 1995. Patterns of nucleotide composition at fourfold degenerate sites of animal mitochondrial genomes[J]. Journal of Molecular Evolution, 41: 353-358.
Saccone C, Pesole G. 2003. Handbook of Comparative Genomics: Principles and Methodology[M]. John Wiley & Sons, Inc.
Stingo V, Capriglione T, Rocco L, et al. 1989. Genome size and A-T rich DNA in selachians[J]. Genetica, 79: 197-205.
Sueoka N. 1988. Directional mutation pressure and neutral molecular evolution[J]. Proceedings of the National Academy of Sciences of the United States of America, 85(8): 2653-2657.
Sueoka N. 1999. Two aspects of DNA base composition : G+C content and translation-coupled deviation from intra-strand rule of A=T and G=C[J]. Journal of Molecular Evolution, 49(1): 49-62.
Vinogradov AE, Borkin LJ. 1993. Allometry of base pair-specific DNA contents in Tetrapoda[J]. Hereditas, 118: 155-163.
Vinogradov AE. 1994. Measurement by flow cytometry of genomic AT/GC ratio and genome size[J]. Cytometry, 16: 34-40.
Vinogradov AE. 1998. Genome size and GC-percent in vertebrates as determined by flow cytometry: the triangular relationship[J]. Cytometry, 31: 100-109.
Wang Q, Yang C. 2013. The Phylogeny of the Cetartiodactyla Based on Complete Mitochondrial Genomes[J]. International Journal of Biology, 5(3): 30.
Xiao H, Chen SY, Liu ZM, et al. 2005. Molecular phylogeny of Sinocyclocheilus (Cypriniformes: Cyprinidae) inferred from mitochondrial DNA sequences[J]. Molecular Phylogenetics and Evolution, 36: 67-77.
Xiao W, Zhang Y, Liu H. 2001. Molecular systematics of Xenocyprinae (Teleostei: Cyprinidae) : taxonomy, biogeography, and coevolution of a special group restricted in east Asia[J]. Molecular Phylogenetics and Evolution, 18: 163-173.
Yang C, Zhang X, Guo Y, et al. 2012. The complete mitochondrial genome of the Chinese Sika deer (Cervus nippon Temminck, 1838), and Phylogenetic analysis among Cervidae, Moschidae and Bovidae[J]. Journal of Natural History, 46(27-28): 1747-1759.
Yang C, Xiang C, Qi W, et al. 2013. Phylogenetic analyses and improved resolution of the family Bovidae based on complete mitochondrial genomes[J]. Biochemical Systematics and Ecology, 48: 136-143.