中国海洋大学学报自然科学版  2020, Vol. 50 Issue (10): 47-54  DOI: 10.16441/j.cnki.hdxb.20190384

引用本文  

刘盼盼, 李语丽, 刘福云, 等. 栉孔扇贝LTR逆转录转座子的基因组分布特征及时空表达模式分析[J]. 中国海洋大学学报(自然科学版), 2020, 50(10): 47-54.
LIU Pan-Pan, LI Yu-Li, LIU Fu-Yun, et al. Investigation of Genome-Wide Distribution and Spatio-Temporal Expression Patterns of LTR Retrotransposons in Chlamys farreri[J]. Periodical of Ocean University of China, 2020, 50(10): 47-54.

基金项目

中央高校基本科研业务费专项(201841001);国家自然科学基金项目(31702330);山东省泰山学者支持计划项目资助
Supported by the Fundamental Research Funds for the Central Universities (201841001); National Natural Science Foundation of China (31702330); Taishan Scholar Project Fund of Shandong Province of China

通讯作者

李语丽,E-mail: liyuli@ouc.edu.cn

作者简介

刘盼盼(1992-),女,硕士生,主要从事扇贝遗传育种研究。E-mail: 17854238595@163.com

文章历史

收稿日期:2019-11-20
修订日期:2019-12-16
栉孔扇贝LTR逆转录转座子的基因组分布特征及时空表达模式分析
刘盼盼1 , 李语丽1,2 , 刘福云1 , 于洪伟1 , 包振民1,3 , 王师1,2     
1. 中国海洋大学海洋生命学院,海洋生物遗传学与育种教育部重点实验室,山东 青岛 266003;
2. 海洋生物学与生物技术功能实验室,青岛海洋科学与技术试点国家实验室,山东 青岛266237;
3. 海洋渔业科学与食物产出过程功能实验室,青岛海洋科学与技术试点国家实验室,山东 青岛266237
摘要:长末端重复序列(LTR)逆转录转座子在真核生物中是普遍存在的,通过“复制-黏贴”的方式插入到基因组的其它位置,影响基因的活性及基因组的结构。DNA测序技术的快速发展为分子生物学研究提供了大量的组学资源,也为全基因组水平逆转录转座子的系统分析提供了数据支持。本研究基于已发表的栉孔扇贝(Chlamys farreri)基因组信息,系统分析了栉孔扇贝LTR逆转录转座子的基因组分布特征及在胚胎发育各个时期和成体各个组织的表达模式。研究发现栉孔扇贝LTR总长度与染色体长度呈正相关关系,而LTR密度(每Mb染色体上的LTR拷贝数)与染色体长度呈负相关关系;Gypsy、Ngaro和DIRS是栉孔扇贝基因组中数量最多、总长度最长的三类LTR亚家族,且主要分布在基因间区;相比于其它种类的LTR,Gypsy和Ngaro在胚胎发育各个时期和各个成体组织/器官中具有显著的表达优势,而且在胚胎发育过程中呈现动态表达模式,其中表达量的峰值和低谷分别出现在担轮幼虫时期和壳顶幼虫时期;Gypsy和Ngaro在大部分组织/器官中占据表达优势,唯一例外的组织是肝胰腺,其表达量最高的LTR类型为ERV1。本研究对栉孔扇贝逆转录转座子基因组分布特征及时空表达模式的系统分析为进一步理解转座子的功能以及对基因组进化的作用提供了重要线索。
关键词栉孔扇贝    LTR逆转录转座子    分布特征    时空表达模式    

转座子又被称为跳跃因子(Mobile genetic elements),最早是由Mc Clintock在玉米中发现[1]的。近几十年的研究表明,转座子存在于所有真核生物的基因组中,并对基因组的进化起着重要的作用[2]。根据转座方式的不同,转座子主要被分为两大类,第一类是过“剪切-黏贴”的方式进行移动的DNA类型的转座子,这种转座的方式并不会影响基因组的大小;第二大类是通过“复制-黏贴”的方式,以RNA为中介插入基因组的其它位置,这类转座子又被称为逆转录转座子,这种转座方式会直接影响基因组的大小。逆转录转座子根据结构的不同分为LTR逆转录转座子和非常末端重复序列(non-LTR)逆转录转座子。LTR逆转录转座子是真核生物基因组最为丰富的组成成分之一[3]。LTR逆转录转座子一般包括五个不同的亚家族——Ty1-copia、PAO、DIRS、Ty-3 Gypsy和ERV(vertebrate retrovirus),它们广泛分布于动物和植物基因组中[4]。LTR逆转录转座子结构与逆转录病毒十分相似[5],通常翻译抗原蛋白(gag)和多聚蛋白(pol)的基因,包含在一个开放阅读框或者两个开放阅读框中[6]pol基因翻译与转座相关的酶,包括整合酶(INT)、逆转录酶(RT)以及内切酶(RNaseH)。DIRS、Ngaro与其它几类逆转录转座子的区别比较大,这两类逆转录转座子属于YR(酪氨酸重组酶)类型的逆转录转座子[7],YR(酪氨酸重组酶)代替了INT整合酶的功能。

动物中LTR逆转录转座子超家族的分布情况是不一样的,通过对昆虫、线虫、脊索动物、真菌[3, 8-9]基因组中的逆转录转座子Gypsy和Copia的研究发现,这两类逆转录转座子在分布、拷贝数量、多样性上是显著不同的。Gypsy在各类后生动物物种都广泛存在,占有重要的比例,尤其在无脊椎动物中Gypsy是分布最为丰富的一类LTR;Copia在植物中报道的较多,而在动物中分布较少[10],研究发现近1/3的后生动物不存在这类转座子[11];Copia和BEL在拷贝数量以及多样性上都低于Gypsy[12];Ngaro与DIRS都属于YR类型的转座子,研究发现DIRS和Ngaro逆转录转座子在鸟类以及哺乳类中是缺失的,但普遍存在于昆虫、鱼类、海洋生物以及爬行类动物中[13]

逆转录转座子的转座与扩张是基因组扩增的主要因素,作为逆转录转座子重要成分之一的LTR逆转录转座子,除了能够影响基因组的大小之外,还能够通过拷贝之间的同源重组对基因组不稳定性产生显著的影响,也可能对基因组进化产生长期影响[14-15]。转座子在基因组中并非是随机分布的,它们与一些功能元件之间有密切的联系[16-17],转座子不仅影响基因组的结构,还在基因表达调控中发挥重要的作用,有些转座子偏好插入基因或接近基因侧翼区域,导致影响基因功能的突变。一些转座子如果插入到基因的启动子区,该转座子的调控元件会对基因的表达产生影响[18]

软体动物门是仅次于节肢动物门的第二大后生动物门类,具有丰富的形态多样性和广泛的环境适应性(海水、淡水、陆地等),是研究转座子的一类较好的生物模型。软体动物转座子的研究已经取得了一些进展,比如对牡蛎(Craistostrea virginica)中的MITE Pearl [19]、滨螺(Littorina saxatilis)中的Tc1 / mariner [20]、腹足动物和双壳类中新的SINE超家族[21-22]的鉴定和功能分析;在缅甸软蛤(Mya arenaria)及在深海双壳类中的细胞中检测到活跃的Gypsy元件Steamer[23-24]。近期,Thomas等则对九种软体动物的Gypsy、Copia、BEL逆转录转座子进行了鉴定和比较分析,发现Gypsy亚家族占有明显主导地位[25]。由于贝类基因组学研究起步较晚,相对于模式动物来说,贝类的转座子研究相对匮乏,此前软体动物中多是针对单个逆转录转座子或某个/些亚家族进行研究,缺乏对转座子起源进化、功能机制的系统认知。

转录组学和表观基因组学最近的研究表明,LTR提供了许多新的基因调节元件,包括组织特异性启动子和增强子[26],革新了人们对LTR的传统认知。本文利用已发表的栉孔扇贝(Chlamys farreri)基因组信息[26],对栉孔扇贝LTR逆转录转座子各个亚家族拷贝数量及长度进行了统计,对LTR在染色体上的分布特征进行了分析,并对栉孔扇贝Gypsy、Ngaro、DIRS三类主要LTR与基因的关系做了初步的探讨,同时对LTR逆转录转座子各个亚家族在胚胎发育时期的表达模式进行了分析。这些结果为进一步理解转座子对基因组进化的作用提供有益参考。

1 数据来源与分析方法 1.1 数据来源

本研究使用的数据来源于已发表的栉孔扇贝基因组重复序列的注释信息,其重复序列的鉴定是通过以下流程实现的:使用RepeatModeler[27],RepeatScout,Piler[28]和LTR_FINDER[29]软件预测出来的数据结合RepBase核酸库,通过Uclust[30]软件按照80-80-80原则进行整合,最后利用RepeatMasker[29]软件进行注释得到denovo从头预测以及homology-based的转座子元件;TE proteins则是基于RepBase蛋白库分别通过RepeatProteinMask[27]软件注释基因组得到的转座子元件;将上述两种方法鉴定的转座子合并、去冗余后获得用于后续分析的逆转录转座子[31]。栉孔扇贝胚胎时期转录组数据同样来源于已发表的数据[31]

1.2 分析方法 1.2.1 栉孔扇贝LTR逆转录转座子的分类统计及分布特征

利用栉孔扇贝转座子的注释文件统计每条染色体上分布的LTR逆转录转座子的拷贝数量、长度,计算LTR逆转录转座子在每条染色体上的分布密度及皮尔森相关系数,探究染色体长度与LTR逆转录转座子拷贝数以及染色体长度与LTR逆转录转座子的分布密度之间的相关性;利用栉孔扇贝基因结构注释文件统计基因在染色体上的数量及位置信息;通过栉孔扇贝转座子的注释文件统计LTR逆转录转座子各个亚家族在染色体上的位置信息,并利用bedtools[32]来统计每10 kb染色体上分布的LTR逆转录转座子各个亚家族的数量; 最后绘制Circos[33]图展示LTR逆转录转座子各个亚家族及基因在染色体上的分布特征。

利用bedtools[34]统计了Gypsy、Ngaro及DIRS分别分布在基因间区、基因组上游3 kb、下游3 kb的数量,进而统计了分布在基因编码区(CDS)区、5’UTR区、3’UTR区、内含子区域分布的三类逆转录转座子的数量。

1.2.2 栉孔扇贝LTR逆转录转座子在胚胎发育各个时期及在成体各个组织中的表达

将LTR逆转录转座子中分布最多的Ngaro、DIRS、Gypsy、Copia和ERV1在胚胎各个发育时期的表达量以及在成体各个组织中的表达量进行统计,数据处理具体流程:

1.TPM的计算,首先利用将栉孔扇贝转座子注释文件中的LTR逆转录转座子的注释信息根据Perl脚本单独提出为CF.LTR.all。利用Cufflinks软件将CF.LTR.all的格式转换为gtf的格式;将栉孔扇贝胚胎幼虫各个时期的数据以及成体各个组织的数据(已经进行了reads的过滤)以栉孔扇贝的基因结构文件为参考序列, 利用STAR进行比对命令行得到比对好的SAM文件将得到的SAM文件转换为BAM格式得到BAM文件,然后将BAM文件进行排序,将排序好的文件通过featureCounts进行counts统计得到count文件。将得到的栉孔胚胎各个时期以及成体各个组织的表达进行count统计。以raw count (RC)为标准,利用Perl脚本计算各个LTR转座子在各个胚胎发育时期以及各个成体组织的TPKM值。各个发育时期的表达量以及在成体各个组织中的表达量进行统计,绘制柱状图。

2.计算各个转座子在胚胎发育各个时期以及成体各组织表达量的标准差,规定标准差在≥10时认为是差异表达的,利用筛选出来的这些转座子以及其TPM值,利用软件R包进行热图的绘制。得到各个时期各个转座子表达的热图以及成体各个组织转座子的表达热图。

2 结果 2.1 栉孔扇贝LTR逆转录转座子的分类统计及分布特征分析

栉孔扇贝中逆转录转座子拷贝数量最多的是LTR逆转录转座子,有42万个拷贝。LTR逆转录转座子主要包含6个亚家族,其中拷贝数量最多的是Gypsy、Ngaro和DIRS(见表 1)。通过LTR逆转录转座子各个亚家族的长度分布可以看出,Gypsy、Ngaro、DIRS三类逆转录转座子在基因组中总的碱基数目上也占有较大的比例(见图 1)。

表 1 栉孔扇贝逆转录转座子各个亚家族分类及拷贝数量 Table 1 Classification and copy number statistics of retrotransposons in C. farreri scallop
图 1 LTR逆转录转座子各个亚家族的长度分布 Fig. 1 Length distribution of various LTR retrotransposons

栉孔扇贝LTR逆转录转座子在不同染色体上的分布是不同的。不同染色体上LTR的拷贝数是不同的(见表 2),染色体长度与LTR逆转录转座子总长度之间具有正相关性(皮尔森相关系数r=0.906 6),即染色体长度越长,分布的LTR逆转录转座子的总长度越长,同时LTR逆转录转座子的拷贝数量也越多。染色体长度与每Mb拷贝数之间具有负相关性(皮尔森相关系数r=-0.919 9),即染色体越长,LTR逆转录转座子的分布密度越小。

表 2 栉孔扇贝LTR逆转录转座子在各条染色体上的分布数量以及密度 Table 2 Distribution number and density of LTR retrotransposon on each chromosome of scallop

为了进一步调查转座子的分布与基因的关系,本研究统计了Gypsy、Ngaro、DIRS三大类拷贝数量较多的逆转录转座子在基因上下游3 kb及基因内部的分布情况。三类逆转录转座子均表现为在基因间区的分布最多,Gypsy、DIRS分布在基因间区的转座子占比都在50%以上,Ngaro分布在基因间区的比例是三类LTR中最低的,而Ngaro在基因区分布的比例较其它两类偏高(见图 2)。三类逆转录转座在基因区有相似的分布规律,绝大部分分布在内含子区域,分布在CDS区域的转座子数量较少(见图 3)。

(A: Gypsy; B: Ngaro; C: DIRS: ) 图 2 Gypsy,Ngaro,DIRS逆转录转座子在基因上、下游,内部和间区的分布统计 Fig. 2 Distribution of Gypsy, Ngaro and DIRS in upstream, downstream, internal and IG regions of gene
图 3 Gypsy、Ngaro、DIRS逆转录转座子在基因区的分布 Fig. 3 Distribution of Gypsy, Ngaro and DIRS in gene region
2.2 LTR逆转录转座子在胚胎发育各个时期的表达模式

为了了解不同类型的逆转录转座子在栉孔扇贝胚胎发育时期的活跃情况,本研究绘制了Gypsy、Ngaro、DIRS、Pao、Copia和ERV1六类主要LTR的表达模式(见图 4)。在胚胎发育的各个时期六类主要的LTR逆转录转座子都有表达,其中Gypsy和Ngaro这两类逆转录转座子在胚胎发育各个时期的表达量都远高于其它四类,表明Gypsy和Ngaro这两类逆转录转座子在整个胚胎发育时期都处于较活跃状态。Gypsy及Ngaro类型转座子呈现动态表达,表现为从受精卵时期到壳顶幼虫时期呈现先上升后下降的趋势,到了壳顶期整体又有下降的趋势,表达量的峰值出现在担轮幼虫时期。其它四类LTR的表达量整体偏低。

(Zygote:受精卵;2~8 cells:多细胞期;Blastula:囊胚期;Gastrula:原肠胚;Trochophore:担轮幼虫;Dstage veliger:D形幼虫期;Umbo early/middle/post:壳顶幼虫前期/中期/后期;Pedi veliger:匍匐幼虫;Juvenile:稚贝) 图 4 LTR逆转录转座子的六个主要亚家族胚胎发育过程的表达模式 Fig. 4 Expression profiles of the six major subfamilies of LTR retrotransposonsduring embryonic stages

根据LTR逆转录转座子在胚胎发育各个时期的整体表达情况,对表达量较高的Gypsy和Ngaro中具有差异表达的LTR绘制了胚胎发育各个时期的表达模式图(见图 5),从图中可以看出这两类逆转录转座子在胚胎发育过程中不是恒定表达的,而是在不同时期有不同特异高表达的转座子种类,而且相邻的时期表达模式往往比较接近。高表达的LTR即处于活跃状态的LTR,在胚胎发育早期(原肠胚时期之前)和发育后期(稚贝时期)要明显多于壳顶幼虫时期,这与图 4中两类LTR的总表达模式是一致的。

(Zygote:受精卵;2~8 cells:多细胞期;Blastula:囊胚期;Gastrula:原肠胚;Trochophore:担轮幼虫;Dstage veliger:D形幼虫期;Umbo early/middle/post:壳顶幼虫前期/中期/后期;Pedi veliger:匍匐幼虫;Juvenile:稚贝) 图 5 差异表达的Gypsy及Ngaro逆转录转座子在胚胎发育各个时期的表达模式 Fig. 5 Expression patterns of differentially expressed Gypsy and Ngaro retrotransposons at various stages during embryo development
2.3 LTR逆转录转座子在各成体组织器官中的表达模式

为了了解不同类型的逆转录转座子在栉孔扇贝各组织器官中的活跃情况,本研究绘制了Gypsy、Ngaro、DIRS、Pao、Copia和ERV1六类主要LTR的组织器官表达模式图(见图 6)。不同种类逆转录转座子的表达具有组织的差异性。与胚胎发育过程的表达模式类似,Gypsy和Ngaro两种类型的逆转录转座子在大部分组织器官中占据表达优势。与胚胎发育时期略有不同的是,在成体组织器官中Gyspy的表达优势更明显,体现为在绝大部分组织器官中Gypsy的表达量都高于Ngaro。唯一例外的组织是肝胰腺,肝胰腺中表达量最高的LTR类型为ERV1,是其它组织器官中表达量的4~5倍,而在其它组织器官中占表达优势的Gypsy和Ngaro在肝胰腺中表达量非常低。

(Gill:鳃;Mantle:外套膜;Kidney:肾;Mgonad:雄性性腺;Fgonad:雌性性腺;Eye:眼;Foot:足;Hepatopancreas:肝胰腺;Hemolymph:血淋巴;Adductor muscle:横纹肌;Smooth muscle:平滑肌) 图 6 LTR逆转录转座子的六个主要亚家族在成体各个组织的表达柱形图 Fig. 6 Histogram of expression of six major subfamilies of LTR retrotransposons in adult tissues

通过绘制Gypsy和Ngaro两类高表达的LTR转座子在成体各组织器官的差异表达情况,发现LTR较活跃的组织器官主要有鳃、肾、性腺、血淋巴(见图 7)。作为组织类型接近的雄性性腺和雌性性腺,其LTR的表达模式差别非常大,其中Gypsy类型的LTR主要在雄性性腺中发挥作用,而Ngaro类型的LTR在雌雄性腺中高表达的模块几乎没有交集,表明高表达的Ngaro在这两种组织中是不同的。在组成闭壳肌的两种肌肉类型——横纹肌和平滑肌中,高表达的LTR种类也是不同的,横纹肌中活跃的Gypsy和Ngaro类型的LTR明显多于平滑肌。

(Gill:鳃;Mantle:外套膜;Kidney:肾;Mgonad:雄性性腺;Fgonad:雌性性腺;Eye:眼;Foot:足;Hepatopancreas:肝胰腺;Hemolymph:血淋巴;Adductor muscle:横纹肌;Smooth muscle:平滑肌) 图 7 差异表达的Gypsy及Ngaro逆转录转座子在成体各个组织中的表达模式(a: Gypsy; b: Ngaro) Fig. 7 Expression pattern of differentially expressed Gypsy and Ngaro retrotransposons in adult tissues(a: Gypsy; b: Ngaro)
3 讨论

LTR逆转录转座子是真核生物基因组的重要组成成分,是影响基因组进化的一个重要因素。在不同种类的后生动物中,LTR逆转录转座子亚家族的分布情况是不一样的,Gypsy在无脊椎动物中是分布最为广泛的一类LTR逆转录转座子[35];而对于YR类型的逆转录转座子,研究发现DIRS和Ngaro在鸟类以及哺乳类中是缺失的,而主要分布在昆虫、鱼类、海洋生物以及爬行类动物中[8]。在栉孔扇贝转座子中,LTR逆转录转座子各个亚家族在染色体上的总长度与染色体的长度呈现显著的正相关,染色体越长分布的转座子总长度越长,而分布密度与染色体长度之间是显著负相关关系,染色体越长每Mb包含的转座子的数量越少。在建鲤中则发现转座子是弥散分布的,但基本都分布在染色体的顶端[34];Takahashi等[36]的研究表明转座子在染色体上的分布位置并没有规律性;在植物中发现的Gypsy分布多的地方基因明显分布少,Gypsy主要集中在着丝点附近分布[37];由此可见在不同的物种内转座子在染色体上的分布特征存在着很大的差异性。通过对三类转座子在基因上下游、基因内部、基因间区的统计发现三类逆转录转座子都有50%左右的LTR分布在基因的间区,分布在基因间区的转座子可能会导致复杂的重排过程从而影响基因的调控[38-39]。分布在基因区的三类逆转录转座子在内含子区分布的数量是最多的,远高于在CDS区的分布数量,产生这种结果的原因可能是:内含子区域相比编码区域受到更小的选择压力,因而插入内含子区域的转座子往往会有更大的存活机会[40]

目前关于转座子在胚胎发育时期的表达与功能的研究还较少,有研究报道在人、小鼠以及绵羊的胎盘中检测到了很多ERV编码的Env蛋白,这种蛋白能够促进细胞融合以及合胞体的形成[41],敲掉特定的ERV之后早期胚胎发育会受阻。斑马鱼中通过qPCR发现逆转录转座子在脑与心脏中的表达量明显的高于其他组织中的表达量[42]。在建鲤中鉴定到的Gypsy逆转录转座子JRE,在建鲤的各个组织中都有表达而在肝以及心脏中的表达量略高于其他组织[43]。本研究通过生物信息学的手段,分析了LTR逆转录转座子在胚胎发育各个时期以及成体各个组织中的表达量及表达模式。Gypsy及Ngaro在胚胎发育的各个时期及成体各个组织中都具有较高的表达量,表明这两类逆转录转座子处于较为活跃的状态。本研究也在在扇贝胚胎发育时期也鉴定到了大量表达的ERV1转座子,为后续研究其在扇贝胚胎发育中的作用提供了重要的线索, 同时发现肝脏中ERV的表达量明显高于其他组织,而在肝脏中Gypsy及Ngaro表达量明显低于其他组织。在胚胎发育的不同时期以及成体各个组织,Gypsy、Ngaro都有各自特异性高表达的转座子,这些特异高表达的转座子具体生物学功能还需要进一步的实验验证。

本研究通过对栉孔扇贝逆转录转座子在基因组的分布特征和时空表达模式进行系统分析,为系统认知逆转录转座子并深入理解逆转录转座子对基因组进化的作用提供了新的线索。

参考文献
[1]
McClintock B. The origin and behavior of mutable loci in maize[J]. Proceedings of the National Academy of Sciences, 1950, 36(6): 344-355. DOI:10.1073/pnas.36.6.344 (0)
[2]
Lisch K D R. Perspective: Transposable elements, parasitic DNA, and genome evolution[J]. Evolution, 2001, 55(1): 1-24. (0)
[3]
Havecker E R, Gao X, Voytas D F. The diversity of LTR retrotransposons[J]. Genome Biology, 2004, 5(6): 225. DOI:10.1186/gb-2004-5-6-225 (0)
[4]
Kidwell M G. Transposable elements and the evolution of genome size in eukaryotes[J]. Genetica (Dordrecht), 2002, 115(1): 49-63. (0)
[5]
Xiong Y, Eickbush T H. The site-specific ribosomal DNA insertion element R1Bm belongs to a class of non-long-terminal-repeat retrotransposons[J]. Molecular and Cellular Biology, 1988, 8(1): 114-123. (0)
[6]
Malik H S, Burke W D, Eickbush T H. The age and evolution of non-LTR retrotransposable elements[J]. Molecular Biology and Evolution, 1999, 16(6): 793-805. DOI:10.1093/oxfordjournals.molbev.a026164 (0)
[7]
Gaffney P M, Pierce J C, Mackinley A G, et al. Pearl, a novel family of putative transposable elements in bivalve mollusks[J]. Journal of Molecular Evolution, 2003, 56(3): 308-316. DOI:10.1007/s00239-002-2402-5 (0)
[8]
Llorens C, Munoz-Pomer, Bernad L, et al. Network dynamics of eukaryotic LTR retroelements beyond phylogenetic trees[J]. Biology Direct, 2009, 4(1): 41. (0)
[9]
Donnart T, Mathieu Piednoёl, Higuet D, et al. Filamentous ascomycete genomes provide insights into copia retrotransposon diversity in fungi[J]. BMC Genomics, 2017, 18(1): 410. DOI:10.1186/s12864-017-3795-2 (0)
[10]
Yoshida M A, Ishikura Y, Moritaki T, et al. Genome structure analysis of molluscs revealed whole genome duplication and lineage specific repeat variation[J]. Gene, 2011, 483(1-2): 63-71. DOI:10.1016/j.gene.2011.05.027 (0)
[11]
Craven R C, Leure-Dupree A E, Weldon R A, et al. Genetic analysis of the major homology region of the Rous sarcoma virus Gag protein[J]. Journal of Virology, 1995, 69(7): 4213-4227. DOI:10.1128/JVI.69.7.4213-4227.1995 (0)
[12]
Smyth D R, Verma D P S. Plant Retrotransposons[M]. Boca Raton, FL: CRC Press, 1993. (0)
[13]
Bourque G, Burns K H, Gehring M, et al. Ten things you should know about transposable elements[J]. Genome Biology, 2018, 19(1): 199. DOI:10.1186/s13059-018-1577-z (0)
[14]
Miller W J, Capy P. Applying mobile genetic elements for genome analysis and evolution[J]. Molecular Biotechnology, 2006, 33(2): 161-174. (0)
[15]
Todorovska E. Retrotransposons and their role in plant—Genome Evolution[J]. Biotechnology & Biotechnological Equipment, 2007, 21(3): 294-305. (0)
[16]
Liu Y H, Zhang M, Wu C, et al. DNA is structured as a linear "jigsaw puzzle" in the genomes of Arabidopsis, rice, and budding yeast[J]. Genome, 2014, 57(1): 9-19. (0)
[17]
Wu C, Wang S, Zhang H B. Interactions among genomic structure, function, and evolution revealed by comprehensive analysis of the Arabidopsis thaliana genome[J]. Genomics, 2006, 88(4): 394-406. DOI:10.1016/j.ygeno.2006.05.003 (0)
[18]
Kidwell M G, Lisch D. Transposable elements as sources of variation in animals and plants[J]. Proceedings of the National Academy of Sciences of the United States of America, 1997, 94(15): 7704-7711. DOI:10.1073/pnas.94.15.7704 (0)
[19]
Mathieu Piednoёl, Isabelle R Gonçalves, Higuet D, et al. Eukaryote DIRS1-like retrotransposons: An overview[J]. BMC Genomics, 2011, 12(1): 621. DOI:10.1186/1471-2164-12-621 (0)
[20]
Gaffney P M, Pierce J C, Mackinley A G, et al. Pearl, a novel family of putative transposable elements in bivalve mollusks[J]. Journal of Molecular Evolution, 2003, 56(3): 308-316. DOI:10.1007/s00239-002-2402-5 (0)
[21]
Puzakova L V, Puzakov M V. The Tc1/mariner DNA transposons in the genome of mollusk Littorina saxatilis[J]. Russian Journal of Genetics, 2017, 53(12): 1358-1365. DOI:10.1134/S1022795417120110 (0)
[22]
Luchetti A, E va, Mantovani B, et al. RUDI, a short interspersed element of the V-SINE superfamily widespread in molluscan genomes[J]. Molecular Genetics and Genomics, 2016, 291(3): 1419-1429. DOI:10.1007/s00438-016-1194-z (0)
[23]
Matetovici I, Sajgo S, Ianc B, et al. Mobile element evolution playing jigsaw—SINEs in gastropod and bivalve mollusks[J]. Genome Biology and Evolution, 2016, 8(1): 253-270. DOI:10.1093/gbe/evv257 (0)
[24]
Arriagada G, Metzger M J, Muttray A F, et al. Activation of transcription and retrotransposition of a novel retroelement, Steamer, in neoplastic hemocytes of the mollusk Mya arenaria[J]. Proceedings of the National Academy of Sciences, 2014, 111(39): 14175-14180. DOI:10.1073/pnas.1409945111 (0)
[25]
Thomas-Bulle C, Mathieu Piednoёl, Donnart T, et al. Mollusc genomes reveal variability in patterns of LTR-retrotransposons dynamics[J]. BMC Genomics, 2018, 19(1): 921. (0)
[26]
Li Y, Sun X, Hu X, et al. Scallop genome reveals molecular adaptations to semi-sessile life and neurotoxins[J]. Nature Communications, 2017, 8(1): 1721. DOI:10.1038/s41467-017-01927-0 (0)
[27]
Wang H, Liu J S. LTR retrotransposon landscape in Medicago truncatula: More rapid removal than in rice[J]. BMC Genomics, 2008, 9(1): 382. DOI:10.1186/1471-2164-9-382 (0)
[28]
Mccarthy E M, Mcdonald J F. LTR STRUC: A novel search and identification program for LTR retrotransposons[J]. Bioinformatics, 2003, 19(3): 362-367. (0)
[29]
Wang H, Xu Z, Yu H. LTR retrotransposons reveal recent extensive inter-subspecies nonreciprocal recombination in Asian cultivated rice[J]. BMC Genomics, 2008, 9(1): 565. DOI:10.1186/1471-2164-9-565 (0)
[30]
Cheong Xin Chan, Maisarah Mahbob, Mark A Ragan. Clustering evolving proteins into homologous families[J]. BMC Bioinformatics, 2013, 14(1): 120. (0)
[31]
Li Y, Sun X, Hu X, et al. Scallop genome reveals molecular adaptations to semi-sessile life and neurotoxins[J]. Nature Communications, 2017, 8(1): 1721. DOI:10.1038/s41467-017-01927-0 (0)
[32]
Sophie Bérubé, Butcher J, Stintzi A. Analyzing prokaryotic RNA-Seq data: A case study identifying Holo-Fur regulated genes in Campylobacter jejuni[J]. Methods in Molecular Biology, 2017, 1512: 245-256. (0)
[33]
Thomas-Bulle C, Mathieu Piednoёl, Donnart T, et al. Mollusc genomes reveal variability in patterns of LTR-retrotransposons dynamics[J]. BMC Genomics, 2018, 19(1): 921. (0)
[34]
丁炜东, 曹丽萍, 曹哲明, 等. 建鲤基因组中一个ty3-gypsy反转录转座子的发现与分析[J]. 中国水产科学, 2016, 23(2): 284-296.
Ding W D, Cao L P, Cao Z M, et al. Isolation and analysis of aty3-gypsy retrotransposon from the genome of Cyprinus carpio var. Jian[J]. Fishery Sciences of China, 2016, 23(2): 284-296. (0)
[35]
Chaux N D L, Wagner A. BEL/Pao retrotransposons in metazoan genomes[J]. BMC Evolutionary Biology, 2011, 11(1): 154. DOI:10.1186/1471-2148-11-154 (0)
[36]
Aki T, Toshihiko S, Tsuyoshi K. Genetic mapping of escalated aggression in wild-derived mouse strain MSM/Ms: Association with serotonin-related genes[J]. Frontiers in Neuroscience, 2014, 8: 156. (0)
[37]
刘震, 张树林, 史莹慧, 等. 四倍体海岛棉LTR反转录转座子的数量与分布[J]. 生物技术通报, 2018, 34(5): 124-130.
Liu Z, Zhang T L, Shi Y H, et al. Quantitative and distribution characteristics of ltr retrotransposons in tetraploid Gossypium barbadense[J]. Biotechnology Bulletin, 2018, 34(5): 124-130. (0)
[38]
Kidwell M G, Lisch D. Transposable elements as sources of variation in animals and plants[J]. Proceedings of the National Academy of Sciences of the United States of America, 1997, 94(15): 7704-7711. DOI:10.1073/pnas.94.15.7704 (0)
[39]
Kloeckener-Gruissem B, Vogel J M, Freeling M. The TATA box promoter region of maize Adh1 affects its organ-specific expression[J]. EMBO J, 1992, 11: 157-166. DOI:10.1002/j.1460-2075.1992.tb05038.x (0)
[40]
Wei B, Liu H, Liu X, et al. Genome-wide characterization of non-reference transposons in crops suggests non-random insertion[J]. BMC Genomics, 2016, 17(1): 536. DOI:10.1186/s12864-016-2847-3 (0)
[41]
Wang J, Li X, Wang L, et al. A novel long intergenic noncoding RNA indispensable for the cleavage of mouse embryos[J]. EMBO Reports, 2016, 17(10): 1452-1470. DOI:10.15252/embr.201642051 (0)
[42]
高波, 王伟, 钱跃, 等. 斑马鱼转座子时空表达特性[J]. 生物信息学, 2017, 15(4): 201-206.
Gao B, Wang W, Qian Y, et al. Temporal and spatial expression characteristics of transposons in zebrafish[J]. Bioinformatics, 2017, 15(4): 201-206. (0)
[43]
Cao L, Yin G, Cao Z, et al. Identification and characterization of a LTR retrotransposon from the genome of Cyprinus carpio var. Jian[J]. Genetica, 2016, 144(3): 325-333. DOI:10.1007/s10709-016-9901-6 (0)
Investigation of Genome-Wide Distribution and Spatio-Temporal Expression Patterns of LTR Retrotransposons in Chlamys farreri
LIU Pan-Pan1 , LI Yu-Li1,2 , LIU Fu-Yun1 , YU Hong-Wei1 , BAO Zhen-Min1,3 , WANG Shi1,2     
1. Ministry of Education Key Laboratory of Marine Genetics and Breeding, College of Marine Life Sciences, Ocean University of China, Qingdao 266003, China;
2. Laboratory for MarineBiology and Biotechnology, Pilot National Laboratory for Marine Science and Technology(Qingdao), Qingdao 266237, China;
3. Laboratory for Marine Fisheries Science and Food Production Processes, Pilot National Laboratory for Marine Science and Technology (Qingdao), Qingdao 266237, China
Abstract: LTR retrotransposons are ubiquitous in eukaryotes and can be inserted into other locations in genomes by the way of "copy-and-paste", which affects the activity of genes and the structures of genomes. The rapid development of DNA sequencing technology provides great genomic resources for molecular biology research, and also provides opportunities for the systematic analysis of retrotransposons at the genome-wide level. Based on the published genome information of Chlamys farreri, this study comprehensively analyzed the characteristics of genome distribution and expression patterns of LTR retrotransposons in various stages during embryonic development and adult tissues of Chlamys farreri. It revealed that the total length of LTR was positively correlated with the length of chromosomes, while the density of LTR (LTR copies per Mb) was negatively correlated with the length of chromosomes. Gypsy, Ngaro and DIRS were the three LTR subfamilies with the largest numbers and the longest total length in the Chlamys farreri genome, and they were mainly distributed in intergenic regions. Compared with other LTR retrotransposons, the expression of Gypsy and Ngaro was dominant in most scallop tissues/organs, except hepatopancreas, in which ERV was the most highly expressed LTR retrotransposon subfamily. This study provides important insights for further understanding of putative molecular functions of LTR retrotransposons and their roles in scallop genome evolution.
Key words: Chlamys farreri    LTR retrotransposons    distribution characteristics    spatio-temporal expression patterns