2. 石河子大学动物科技学院, 石河子 832000
2. College of Animal Science and Technology, Shehezi University, Shihezi 832000, China
包虫病是一种危害性极其严重的人兽共患寄生虫病[1-2],该病呈世界性分布,我国20省份有该病的报道,主要流行于西部一些牧区,包括青海、西藏、新疆等。包虫病是导致我国西部农牧区牧民因病致贫、因病返贫的主要原因之一。我国包虫病受威胁人口数和患者数仍居全球首位[1, 3]。该病严重危害疫区群众的生命财产安全,同时也严重影响我国的国际声誉。
细粒棘球绦虫是包虫病的主要病原之一。据报道在原头蚴发育为成虫的过程中,一些编码基因及信号通路发挥着重要的功能[4]。有没有其他的调控因子(诸如非编码RNA)参与这一发育过程尚不清楚,有研究报道表明有部分miRNA可能参与调控此发育过程[5-7]。作为ceRNA调控网络的重要成员,lncRNA是否同样参与此发育过程,目前尚未见文献报道。lncRNA是一种长链非编码的RNA分子,其长度大于200 nt,虽然不具有开放阅读框,没有编码蛋白的能力,但它们的作用是不可替代的。近年来,越来越多的研究证实,lncRNA广泛参与DNA甲基化、组蛋白修饰、染色质重塑等生物过程,能与miRNA、mRNA、蛋白质分子作用结合,在表观遗传、转录及转录后水平上等多种水平调控基因表达[8-9]。既往因为不确定lncRNA的调控机制,往往被认为是基因转录的副产物,而今它的生物学功能正在被一点点揭开,越来越多的研究者也为它诸多角色所着迷。
为了进一步揭示lncRNA在原头蚴发育中的调控机制,本研究对细粒棘球绦虫原头蚴表达的lncRNA进行了测序研究,拟丰富细粒棘球绦虫lncRNA数据,同时为揭示lncRNA在细粒棘球绦虫原头蚴生长发育中的调控机制提供新的视角。
1 材料与方法 1.1 实验材料在新疆石河子市牛羊定点屠宰场分别采集3只细粒棘球蚴感染绵羊的肝(图 1A),收集虫体沉淀,备用[7]。显微镜下观察原头蚴形态及活力(图 1B)。每个患病绵羊来源的虫体为一个生物学重复,共设3个生物学重复。
使用SMARTer Ultra Low RNA Kit for Illumina Sequencing试剂盒进行细粒棘球绦虫原头蚴的裂解和第一条cDNA链的合成,使用AMPure XP beads试剂盒纯化后,用Advantage 2 PCR kit试剂盒扩增第一条cDNA链,并再次纯化,最终得到双链cDNA。Qubit 2.0定量检测,合格后用Covaris系统超声打断双链cDNA短片段进行末端修复,加A尾并连接测序接头后,纯化,选择片段大小在200 bp左右的文库进行PCR富集得到最终的cDNA文库。先使用Qubit 2.0进行文库的初步定量,稀释文库至2 ng·μL-1,随后用Agilent 2100对文库的insert size进行检测,符合预期后,使用qPCR方法对文库的有效浓度进行准确定量(文库有效浓度>2 nmol·μL-1),以保证文库质量。文库检验合格后,把不同文库按照有效浓度及目标数据量的需求,进行Hiseq/MiSeq测序。
使用Tophat2将得到的原始测序序列比对到细粒棘球绦虫参考基因组上,用Cufflinks软件组装出高质量的转录本,用Cuffcompare将其与已注释的转录本信息进行比较,得到潜在的转录本(类别符号为i、j、o、u、x的转录本),然后使用CNCI筛选得到长度大于200 bp且外显子数目大于2个的潜在的非编码转录本,最后与Pfam数据库进行比对,去除能编码蛋白质的转录本,得到最终的lncRNA。
1.3 lncRNA靶向mRNA的预测为了进一步预测609个lncRNA分子潜在的靶向mRNA,本研究搜索该分子上、下游300 kb范围内的所有编码基因,并与该lncRNAs有显著共表达(皮尔森相关性计算)的基因取交集。这些在基因组上临近且表达模式上存在共表达的基因很可能被该lncRNAs所调控。
1.4 lncRNA分子的功能预测对于表达量前200的lncRNAs,计算得到与之共表达的编码基因,用超几何分布检验方法计算每个GO(或pathway)条目中差异基因富集的显著性。计算的结果会返回一个富集显著性的P值,小的P值表示差异基因在该GO(或pathway)条目中出现了富集。同时,对表达量前200的lncRNA分子进行KEGG分析。
1.5 部分lncRNA分子的mRNA转录水平分析将无菌采集的细粒棘球绦虫原头蚴保存于液氮中,备用。总RNA提取采用Invitrogen Trizol Reagent试剂,提取方法参照试剂说明书实验步骤进行。lncRNA反转录采用康为世纪公司10 μL反转录体系的CW2582 cDNA合成试剂盒。
以上述cDNA为模板,以GAPDH为内参基因,对lncRNA分子进行qRT-PCR扩增,反应体系:SYBR Premix Ex Taq Mix(2×) 10 μL,上游引物(10 mmol·L-1)0.4 μL,下游引物(10 mmol·L-1)0.4 μL,cDNA 1 μL,加ddH2O至20 μL。反应条件:95 ℃预变性30 s;95 ℃ 5 s,60 ℃ 20 s,共40个循环。每个基因做3个重复,采用相对比较△Ct (Qr=2-△△Ct)[10]法计算目的基因的相对表达量。
1.6 部分lncRNA分子在细粒棘球绦虫原头蚴的组织分布根据lncRNA分子的序列设计荧光原位杂交探针,探针由广州外显子生物技术有限公司合成。全量组织荧光原位杂交的操作流程主要参照Olson实验室网站(http://www.olsonlab.com/)公开的操作方法以及参考文献所述方法进行[11],主要包括样品的固定、蛋白酶处理、预杂交、杂交、复染等过程。
2 结果 2.1 测序数据预处理总共从细粒棘球绦虫原头蚴(PSC)得到105 123 380条reads序列,在去除低质量的reads序列和接头序列后,最终还剩101 522 658条洁净序列,其GC含量为52.00%。与参考基因组的比对结果显示,有57 153 101条reads序列可比对到参考基因组序列上(表 1)。
采用四步法对测序获得数据进行了筛选分析来获取候选的lncRNA,最终得到长度超过200 bp且不具有蛋白编码能力的lncRNA候选分子609个,均为新发现的lncRNA。
2.2.2 lncRNA分子的种类分析根据其与编码序列的位置关系可分为intergenic lncRNA(简称lincRNA)、intronic lncRNA、anti-sense lncRNA和sense lncRNA四种类型。其中lincRNA型的lncRNA分子最多,为431个,占总数的70.77%;其他依次为sense lncRNA型99个,anti-sense lncRNA型68个和intronic lncRNA型11个,见图 2。
分析结果表明,609个候选的lncRNA分子,其长度均大于200 bp,其中最小的lncRNA分子为206 bp,文库编号为TCONS-00031229,最大的lncRNA分子为5 352 bp,文库编号为TCONS-00018829。平均长度为1 158 bp,长度在2 000 bp以内的lncRNA有532个,占总数的87.36%,见图 3。
分析发现609个候选的lncRNA分子,其外显子数目均大于等于2个,其中含有2个外显子的lncRNA分子有412个,占总数的67.65%;含有3个外显子的lncRNA分子有130个,占总数的21.35%;含有4个外显子的lncRNA分子有44个,占总数的7.22%;含有5个外显子的lncRNA分子有9个,占总数的1.48%,其余占2.30%,见图 4。
分析发现609个候选的lncRNA分子,其GC含量在30%~60%,并且大多数lncRNA分子的GC含量在45%左右,见图 5。
分析结果显示,609个候选的lncRNA分子在细粒棘球绦虫原头蚴中存在差异表达,其中表达量前10的lncRNA分子依次是TCONS-00015284、TCONS-00004969、TCONS-00031442、TCONS-00018064、TCONS-00013492、TCONS-00001987、TCONS-00031141、TCONS-00015687、TCONS-00031040和TCONS-00031052,见表 2。同时研究结果显示,和具有蛋白编码功能的mRNA相比,lncRNA的表达水平较低。
对表达量前200的lncRNA分子进行了GO功能注释,结果表明这些lncRNA分子主要与MAP激酶的负调控、SMC结合复合物、IMP的生物合成以及乙酰转移酶激活剂活性相关,见图 6A。KEG信号通路分析结果显示,表达量前200的lncRNA分子参与虫体细胞凋亡、萜类骨架生物合成、碳代谢以及背腹轴形成等生物过程,见图 6B。
本研究对609个候选lncRNA分子潜在的靶向mRNA进行了预测,结果显示与机体5大信号通路(Wnt信号通路、Hedgehog信号通路、NF-κB信号通路、cAMP信号通路和Notch信号通路)存在潜在靶向调控作用的lncRNA分子数量分别为79、31、10、128和43个。同时本研究还预测了与细粒棘球原头蚴双相发育密切相关的胆酸盐信号通路存在潜在调控关系的lncRNA分子,结果显示,有84个lncRNA可能参与此信号通路的调控,见表 3。预测有73个参与背腹轴信号通路的相关lncRNA分子。本研究还发现同一个lncRNA分子可能存在多个潜在靶向基因,比如lncRNA分子TCONS-00000903潜在的靶向基因有5个,分别为EgrG-000062600、EgrG-000160100、EgrG-000483100、EgrG-001123600和EgrG-002002700,见图 7A。同时,也存在多个lncRNA分子调控同一个靶基因的现象,比如编码基因EgrG-000630800有9个潜在的与其互作的lncRNA分子,分别为TCONS-00004553、TCONS-00006106、TCONS-00011615、TCONS-00018804、TCONS-00020339、TCONS-00021709、TCONS-00027988、TCONS-00028256和TCONS-00030128,见图 7B。
采用RT-PCR方法对表达量前10的lncRNA分子进行了扩增验证,结果表明扩增片段大小均与预期大小一致,见图 8A。且测序结果显示扩增序列与转录组测序结果一致,表明扩增结果准确无误。同时,研究采用qRT-PCR技术对表达量前10的lncRNA分子在细粒棘球绦虫原头蚴的转录水平进行了验证,结果表明qRT-PCR的验证结果与测序结果一致,其表达量由高到低依次为TCONS-00015284、TCONS-00004969、TCONS-00031442、TCONS-00018064、TCONS-00013492、TCONS-00001987、TCONS-00031141、TCONS-00015687、TCONS-00031040和TCONS-00031052,见图 8B。
组织分布为了验证部分lncRNA分子在细粒棘球绦虫原头蚴的组织分布,选择了2个lncRNA分子对其全量组织原位杂交分析,结果表明,这些分子在原头蚴的吸盘以及表皮细胞均有分布,见图 9。
与其他物种相比,寄生虫lncRNA的研究相对滞后,相关文献报道亦较少。截止目前,仅有模式生物秀丽线虫、疟原虫、弓形虫、新孢子虫、利什曼原虫、血吸虫以及阴道毛滴虫lncRNA研究的文献报道。Nam和Bartel[12]首次对秀丽线虫lncRNA进行了研究,与蛋白质编码基因相比,lncRNA分子具有时空表达特性, 同时这些分子参与众多生物过程如雄性性别决定,精子的形成等。Liao等[13]对疟原虫的lncRNA进行了研究,结果鉴定得到164个新的lncRNA分子,进一步的注释研究发现,其中有69个lncRNAs分子参与代谢过程,生物合成过程,调节生物过程,生物体的定位和分解过程等。其中研究比较深入的是一种与恶性疟原虫var毒力基因家族相关的lncRNA分子。当var基因上游启动子激活时,此lncRNA分子与var基因的激活相关。另一方面,用互补肽核酸分子干扰这些lncRNAs可以下调var基因活性,删除表观遗传记忆,并诱导表达开关[14-15]。Broadbent等[16]采用全转录组分析鉴定出了一个由22个端粒相关的lncRNAs分子组成的家族,此家族参与端粒的维持、毒力基因的调控以及其他一些潜在的寄生虫染色体末端生物学过程。在弓形虫lncRNA研究方面,Hassan等[17]采用RNA-sequencing技术鉴定得到了18个新的lncRNA分子,但并未做进一步研究。随后,Ramaprasad等[18]分析了弓形虫和新孢子虫的lncRNAs分子,结果在弓形虫中鉴定得到668个基因间lncRNAs分子,209个反义lncRNAs分子;在新孢子虫中鉴定得到881个基因间lncRNAs分子,300个反义lncRNAs分子。在利什曼原虫lncRNA的研究方面,Rastrojo等[19]研究发现在利什曼原虫转录组中,存在1 884个非编码的RNA序列,之后Pawar等[20]对这些序列深入分析发现,其中有8个属于编码序列,进一步为基因组的精确注释提供了依据。在阴道毛滴虫lncRNA研究方面,Woehle等[21]发现在阴道毛滴虫的转录组数据中,存在成千上万的可以比对到参考基因组但没有注释的基因,这些序列有的长度可达数个碱基。这些序列可能代表着一些lncRNAs。然而,这些lncRNAs序列大约有一半与基因组中有注释位点的蛋白编码基因的序列相似。这为寄生虫中存在成百上千的假基因转录提供了证据。2018年,有两篇关于血吸虫lncRNA研究的文献报道,研究分别在曼氏血吸虫和日本血吸虫中分离得到3 247和3 033个候选的lncRNA分子,后又有学者在曼氏血吸虫中鉴定得到170个新的lncRNA分子,研究者推测这些lncRNA分子可能在虫体的生长发育以及耐药性方面发挥重要作用[22-23]。
笔者在NCBI以及CNKI数据库中文献检索的结果显示,截至目前,没有细粒棘球绦虫lncRNA相关的文献报道。笔者所在研究小组近期采用RNA-sequencing技术对细粒棘球绦虫原头蚴lncRNA表达谱进行了测序分析,在细粒棘球绦虫原头蚴中共鉴定得到609个新的lncRNA分子,其平均长度为1 158 bp,其四种类型的lncRNAs分子均存在,有2个外显子数目的lncRNA分子有412个,有3个外显子数目的lncRNA分子有130个,有4个外显子数目的lncRNA分子有44个,有5个外显子数目的lncRNA分子有9个。研究进一步采用cis分析方法,对测序得到的609个lncRNAs分子进行互作靶基因的预测,搜索其上、下游300 kb范围内的所有编码基因,将与该lncRNAs有显著共表达(皮尔森相关性计算)的基因取交集。这些在基因组上临近且表达模式上存在共表达的基因很可能被该lncRNAs所调控。笔者分析了与虫体生长发育、免疫调控等信号通路相关的lncRNAs分子,最终筛选得到与Wnt/β-catenin信号通路相关lncRNA分子79个,与Notch信号通路相关的lncRNA分子43个,与Hedgehog信号通路相关的lncRNA分子31个,与cAMP信号通路相关的lncRNA分子128个,与NF-κB相关的lncRNA分子10个,与胆酸盐信号通路相关的lncRNA分子84个。随后笔者又采用核酸原位杂交技术对Wnt/β-catenin信号通路相关的部分lncRNA分子进行了组织定位分析,结果显示这些lncRNA分子在原头蚴的吸盘以及表皮细胞中均有分布。这些数据将为进一步研究lncRNA分子在细粒棘球绦虫原头蚴发育中的功能及作用提供参考依据。需要说明的是,本研究仅对寄生于绵羊肝的原头蚴进行了分析,至于不同的寄生部位以及不同的寄生宿主会不会造成lncRNA表达谱的不同,目前未见相关文献报道。笔者推测随着寄生部位和寄生宿主的变化,lncRNA的表达谱可能会发生相应变化,但这一推断还有待于进一步的试验验证。
随着高通量测序技术的飞速发展和大规模应用,大量ncRNA被发现和预测出来,其中以lncRNA为代表的ncRNA已逐渐在分子生物学领域崭露头角[21]。近年来,虽有大量lncRNA不断在生物体内挖掘出来,但研究仍停留于表层阶段,距离完全揭示这类基因中“暗物质”的生物学功能还有很长的路要走。同样,对细粒棘球绦虫lncRNA的研究还处于初始阶段,对其生物学功能还知之甚少。因此在后续的研究中,我们应注重解决以下几个科学问题:一是蛋白质作为lncRNA重要结合物,在lncRNA生物学功能的发挥中具有极其重要的作用,研究蛋白质分子如何与lncRNA互作将更有助于对lncRNA精细的分子调控机制作深层次理解。二是在lncRNA与另一生物大分子RNA相互作用的研究中还存在诸多不足。就RNA分子种类而言,现有的研究大多集中于miRNA上,相对缺乏对其他ncRNA(tRNA、rRNA、siRNA、piwiRNA和snoRNA等)的报道,因此,研究lncRNA如何与这些RNA分子作用将是其未来的发展方向,不仅能弥补lncRNA生物学调控网络的空白,还能为lncRNA-RNA分子间的互作模式带来新的理解。
4 结论对细粒棘球绦虫原头蚴表达的lncRNA进行了测序研究。首次在原头蚴中发现了609个新的lncRNA分子,进一步分析这些lncRNAs分子发现,这些非编码的长链RNA分子可能广泛参与细粒棘球绦虫原头蚴的生长发育过程。这些数据为进一步揭示lncRNA在细粒棘球绦虫原头蚴生长发育中的调控机制提供了新的视角。
[1] |
许春晓, 孔席丽. 包虫病的流行及防治现状[J]. 中兽医学杂志, 2015(9): 67.
XU C X, KONG X L. Epidemiology and control of hydatid disease[J]. Chinese Journal of Traditional Veterinary Science, 2015(9): 67. (in Chinese) |
[2] | SIRACUSANO A, DELUNARDO F, TEGGI A, et al. Host-parasite relationship in cystic echinococcosis:an evolving story[J]. Clin Dev Immunol, 2012, 2012: 639362. |
[3] | SAVIOLI L, DAUMERRIE D. Working to overcome the global impact of neglected tropical diseases[R]. Geneva: World Health Organization, 2010. |
[4] | ZHENG H J, ZHANG W B, ZHANG L, et al. The genome of the hydatid tapeworm Echinococcus granulosus[J]. Nat Genet, 2013, 45(10): 1168–1175. DOI: 10.1038/ng.2757 |
[5] | CUCHER M, PRADA L, MOURGLIA-ETTLIN G, et al. Identification of Echinococcus granulosus microRNAs and their expression in different life cycle stages and parasite genotypes[J]. Int J Parasitol, 2011, 41(3-4): 439–448. DOI: 10.1016/j.ijpara.2010.11.010 |
[6] | BAI Y, ZHANG Z Z, JIN L, et al. Genome-wide sequencing of small RNAs reveals a tissue-specific loss of conserved microRNA families in Echinococcus granulosus[J]. BMC Genomics, 2014, 15: 736. DOI: 10.1186/1471-2164-15-736 |
[7] |
王正荣, 薄新文, 张艳艳, 等. 细粒棘球绦虫原头蚴microRNA表达谱分析[J]. 畜牧兽医学报, 2018, 49(11): 2477–2485.
WANG Z R, BO X W, ZHANG Y Y, et al. microRNA profile analyses of the protoscoleces in Echinococcus granulosus[J]. Acta Veterinaria et Zootechnica Sinica, 2018, 49(11): 2477–2485. DOI: 10.11843/j.issn.0366-6964.2018.11.020 (in Chinese) |
[8] | WILUSZ J E, SUNWOO H, SPECTOR D L, et al. Long noncoding RNAs: functional surprises from the RNA world[J]. Genes Dev, 2009, 23(13): 1494–1504. DOI: 10.1101/gad.1800909 |
[9] | MERCER T R, DINGER M E, MATTICK J S. Long non-coding RNAs: insights into functions[J]. Nat Rev Genet, 2009, 10(3): 155–159. DOI: 10.1038/nrg2521 |
[10] | PFAFFL M W. A new mathematical model for relative quantification in real-time RT-PCR[J]. Nucleic Acid Res, 2001, 29(9): e45. DOI: 10.1093/nar/29.9.e45 |
[11] |
王正荣, 薄新文, 张艳艳, 等. 细粒棘球绦虫原头蚴蛋白表达谱分析[J]. 畜牧兽医学报, 2017, 48(8): 1519–1528.
WANG Z R, BO X W, ZHANG Y Y, et al. Protein profile analyses of protoscoleces in Echinococcus granulosus[J]. Acta Veterinaria et Zootechnica Sinica, 2017, 48(8): 1519–1528. (in Chinese) |
[12] | NAM J W, BARTEL D P. Long noncoding RNAs in C. elegans[J]. Genome Res, 2012, 22(12): 2529–2540. DOI: 10.1101/gr.140475.112 |
[13] | LIAO Q, SHEN J, LIU J F, et al. Genome-wide identification and functional annotation of Plasmodium falciparum long noncoding RNAs from RNA-seq data[J]. Parasitol Res, 2014, 113(4): 1269–1281. DOI: 10.1007/s00436-014-3765-4 |
[14] | EPP C, LI F, HOWITT C A, et al. Chromatin associated sense and antisense noncoding RNAs are transcribed from the var gene family of virulence genes of the malaria parasite Plasmodium falciparum[J]. RNA, 2009, 15(1): 116–127. |
[15] | AMIT-AVRAHAM I, POZNER G, ESHAR S, et al. Antisense long noncoding RNAs regulate var gene activation in the malaria parasite Plasmodium falciparum[J]. Proc Natl Acad Sci U S A, 2015, 112(9): E982–E991. DOI: 10.1073/pnas.1420855112 |
[16] | BROADBENT K M, PARK D, WOLF A R, et al. A global transcriptional analysis of Plasmodium falciparum malaria reveals a novel family of telomere-associated lncRNAs[J]. Genome Biol, 2011, 12: R56. DOI: 10.1186/gb-2011-12-6-r56 |
[17] | HASSAN M A, MELO M B, HAAS B, et al. De novo reconstruction of the Toxoplasma gondii transcriptome improves on the current genome annotation and reveals alternatively spliced transcripts and putative long non-coding RNAs[J]. BMC Genomics, 2012, 13: 696. DOI: 10.1186/1471-2164-13-696 |
[18] | RAMAPRASAD A, MOURIER T, NAEEM R, et al. Comprehensive evaluation of Toxoplasma gondii VEG and Neospora caninum LIV genomes with tachyzoite stage transcriptome and proteome defines novel transcript features[J]. PLoS One, 2015, 10(4): e0124473. DOI: 10.1371/journal.pone.0124473 |
[19] | RASTROJO A, CARRASCO-RAMIRO F, MARTÍN D, et al. The transcriptome of Leishmania major in the axenic promastigote stage: transcript annotation and relative expression levels by RNA-seq[J]. BMC Genomics, 2013, 14: 223. DOI: 10.1186/1471-2164-14-223 |
[20] | PAWAR H, PAI K, PATOLE M S, et al. A novel protein coding potential of long intergenic non-coding RNAs (lincRNAs) in the kinetoplastid protozoan parasite Leishmania major[J]. Acta Trop, 2017, 167: 21–25. DOI: 10.1016/j.actatropica.2016.12.012 |
[21] | WOEHLE C, KUSDIAN G, RADINE C, et al. The parasite Trichomonas vaginalis expresses thousands of pseudogenes and long non-coding RNAs independently from functional neighbouring genes[J]. BMC Genomics, 2014, 15: 906. DOI: 10.1186/1471-2164-15-906 |
[22] | LIAO Q, ZHANG Y W, ZHU Y C, et al. Identification of long noncoding RNAs in Schistosoma mansoni and Schistosoma japonicum[J]. Exp Parasitol, 2018, 191: 82–87. DOI: 10.1016/j.exppara.2018.07.001 |
[23] | OLIVEIRA V F, MOARES L A G, MOTA E A, et al. Identification of 170 new long noncoding RNAs in Schistosoma mansoni[J]. Biomed Res Int, 2018, 2018: 1264697. |