中国生物工程杂志  2015, Vol. 35 Issue (9): 66-70

文章信息

李冉, 王恬, 朱鸿亮
LI Ran, WANG Tian, ZHU Hong-liang
长链非编码RNA的生物学功能和研究方法
Biological Function and Research Methods of Long Noncoding RNA
中国生物工程杂志, 2015, 35(9): 66-70
China Biotechnology, 2015, 35(9): 66-70
http://dx.doi.org/10.13523/j.cb.20150910

文章历史

收稿日期: 2015-04-10
修回日期: 2015-05-15
长链非编码RNA的生物学功能和研究方法
李冉, 王恬, 朱鸿亮     
中国农业大学食品科学与营养工程学院 北京 100083
摘要: 长链非编码RNA(long-noncoding RNA,lncRNA)是一类长度大于200nt的非编码RNA(noncoding RNA,ncRNA),不具有编码蛋白质的功能,直接以RNA的形式发挥作用,以诱饵分子、信号分子、引导分子和支架分子的方式在转录水平和转录后水平调节蛋白质编码基因的表达,参与细胞分化和个体发育等生命过程.lncRNA存在普遍的转录现象,但与蛋白质编码基因相比表达水平较低.基因组测序结果显示生物体内仅有少量的编码基因,绝大部分基因以非编码的形式存在于动物和植物体内起调控作用.近年来以miRNA和siRNA为代表的ncRNA的研究已经取得了丰硕的成果,而lncRNA的研究才刚刚开始,但是已经有研究表明lncRNA有广泛的生物学功能,如染色体修饰、X染色体沉默、干扰或激活转录和核内运输等.以转录组测序、微阵列和荧光原位杂交为代表的研究方法也在发展完善.
关键词: ncRNA     lncRNA     生物学功能    
Biological Function and Research Methods of Long Noncoding RNA
LI Ran, WANG Tian, ZHU Hong-liang     
College of Food Science and Nutritional Engineering, China Agricultural University, Beijing 100083, China
Abstract: Long noncoding RNA (lncRNA),longer than 200 nucleotides, can not encode protein, and directly plays a role in the form of RNA at transcription and post-transcription level as decoys, signals, guides, and scaffolds. Compared with the expression of encoding protein gene, the expression of lncRNA is lower. Genomewide studies have uncovered there are only a small amount of the encoding gene, while there are a large number of ncRNAs, which play regulatory role in plants, animals and human. In recent years, the study of ncRNA has been mainly on miRNA and siRNA, having achieved fruitful results. However the research of lncRNA has just begun, some researches have shown that lncRNA has extensive biological functions,such as chromosome modification, X chromosome silencing, transcription interference, transcription activation, and nuclear transport. Meanwhile the related research methods represented for RNA-seq, microarray, and FISH are also developing.
Key words: ncRNA     lncRNA     Biological function    

随着高通量基因测序技术和大规模转录组研究的应用及发展,传统的基因表达调控和中心法则等一些经典理论受到前所未有的挑战。以“人类基因组计划”为代表的研究表明,在人类基因组中约有93%的序列可以被转录出来,其中能编码蛋白质的序列不超过2%,而98%以上的是非编码序列[1],这些不编码蛋白质的转录物被称为非编码RNA(noncoding RNA,ncRNA)。ncRNA广泛存在于多种生物体中,根据其功能可以分为持家ncRNA和调控ncRNA。持家ncRNA包括rRNA、tRNA、细胞核小分子RNA (small nuclear RNA,snRNA) 和核仁小分子RNA(small nucleolar RNA,snoRNA);调控ncRNA根据转录本的大小分为短链非编码RNA(small ncRNA,sncRNA)和长链非编码RNA(long ncRNA,lncRNA)。lncRNA开放阅读框(open reading frame,ORF)较短,一般小于100个氨基酸,并且在体内的表达量很低。不同于small RNA,lncRNA的二级结构更加复杂,存在于细胞核和细胞质中,具有时空表达特异性。根据lncRNA与蛋白质编码基因的位置IncRNA可分为重叠型、双向型、内含子型和顺式反义型[2];根据其功能可分为诱饵分子、信号分子、骨架分子和引导分子[3]

lncRNA大多由RNA 聚合酶Ⅱ(RNA polymerase Ⅱ,RNA PⅡ)转录得到[4],转录本长度大于200nt,结构类似于mRNA,部分lncRNA经过剪切作用可以形成3′多聚腺苷酸尾(ployA tail)和5′帽子结构。40%~50%的lncRNA都有内含子,某些基因间的IncRNA(long intergenic ncRNA,lincRNA)对转录过程、RNA输出和抑制RNA沉默途径起调控作用[5, 6, 7]

1 lncRNA的生物学功能

在物种的进化过程中,sncRNA序列的保守性较高,大多数的sncRNA在人和小鼠这两个物种间的保守性达到80%~90%。与之相比,lncRNA序列的保守性较低,序列的相似性与编码蛋白质基因的内含子区域相似。但是研究发现lncRNA序列上的低保守性并不影响它在功能上的保守性。除基因序列保守性,lncRNA在染色体上位置的保守性也影响基因功能。

在生物体内,lncRNA直接以RNA的形式在表观遗传调控、转录调控、转录后调控及细胞周期调控和细胞分化调控等多种层面上调控基因表达水平[8, 9]。lncRNA在细胞核内表达量低时以顺式的形式作用,表达量高时则以反式的形式作用[10, 11, 12]。转录出的lncRNA可以增强其他的功能性转录[13],哺乳动物的基因上有很多位点可以转录出lincRNA,而这些lincRNA在基因调控中起着十分广泛的作用[14]

1.1 植物中lncRNA的生物学功能

植物中的lncRNA对植物的生殖发育和胁迫应答有非常重要的作用[15]。水稻中有一个1 236bp、与雄性不育有关的lncRNA-LDMAR(long-day-specific male-fertility-associated RNA),它的作用机制是LDMAR的启动子区域甲基化,抑制了LDMAR的转录,造成水稻花药的早熟性细胞程序性死亡,最终导致光照敏感的雄性不育[16]。lncRNA的一种重要效应方式是作为诱饵分子间接调控目的基因转录。lncRNA-Gas5(growth arrest-specific 5)能利用自身的RNA序列模拟结合在糖皮质激素效应基因启动子区域的激素效应元件上,从而抑制糖皮质激素的受体功能。拟南芥中也有一个lncRNA-COLDAIR(cold assisted intronic noncoding RNA),它由FLC (Flower LocusC)基因的第一个内含子转录而来,参与拟南芥的春化作用,它与PRC2(ploycomb repressive complex 2)结合,招募PRC2到FLC基因位点来介导染色质重塑,抑制FLC基因的表达,使植物正常开花。

在植物中,lncRNA的一种作用模式是通过形成稳定的RNA-DNA三聚体控制转录因子在启动子区域的特异性结合位点。拟南芥中COOLAIR (cold induced long antisense intragenic RNA)上的一小段启动区域能合成FLC转录的NAT(lncRNA的一种),lncRNA还能将这个双链DNA区域重新装配成RNA-DNA和单链DNA的形式[17, 18],单链DNA被称为“R-loop”,其降解区域受AtNDX限制,AtNDX能抑制COOLAIR的转录。

1.2 动物中lncRNA的生物学功能

一些lncRNA只在真核生物发育的特定阶段表达。有研究发现这类RNA在果蝇和线虫的发育过程中呈动态表达变化,多数lncRNA的时间和空间表达模式精确,但部分表达模式在不同种的果蝇中保守存在。通过原位杂交发现在黑腹果蝇胚胎发育过程中,有33个lncRNA高表达,但是仅有16个在中枢神经系统表达[19]

动物中的lncRNA能在修饰染色质标记时发挥作用,并且能够直接与染色质修饰器相互作用[9, 20]。有研究发现,动物lncRNA中有一类称为enhancer RNA(eRNA),由基因的增强域或是转录因子的结合位点转录而来,通过招募转录激活因子或转录抑制因子及控制染色质的拓扑异构体形式来调节转录活动[21, 22, 23, 24, 25]

Xist是哺乳动物中X染色体失活过程的关键基因[26],是lncRNA的一种。在哺乳动物中存在剂量补偿效应: X失活中心(X inactivation center,Xic)使一条染色体失活,等位基因完全沉默[11]Xist基因的位于Xic,通过与PRC2形成复合体介导基因沉默。Xist由X染色体转录得到,并附着于该染色体上,通过引起组蛋白甲基化导致X染色体失活。

1.3 人体内lncRNA的生物学功能

人体内的二氢叶酸还原酶基因——DHFR含有2个启动子,依赖RNA的转录抑制:上游的启动子启动lncRNA转录,并与下游的启动子碱基互补形成ncRNA和蛋白质复合物,该复合物结构稳定,能够阻止TFIIB与启动子结合,从而抑制下游基因转录[27, 28]。这说明lncRNA在邻近基因中起抑制调节作用[29]

lncRNA与人类疾病和肿瘤有密切的关系。先天性畸形、神经系统疾病,以及心血管疾病都与某些lncRNA有关。除FOXL2基因突变外,lncRNA失调也是导致睑裂狭小综合征的重要原因:在FOXL2基因附近发现的lncRNA-PISRT1在病变体中发生缺失现象。随着分子肿瘤学研究的深入,人们发现lncRNA涉及白血病、前列腺癌、乳腺癌、肝细胞癌、结肠癌等多种肿瘤的发生[29, 30, 31, 32]。最早发现具有肿瘤抑制作用的lncRNA是母源表达基因3 (maternally expressed gene 3,MEG3)[33]。父源印迹引起MEG3转录,MEG3调控区超甲基化导致其转录失活。MEG3有M1、M2和M3这3种二级结构,并通过其二级结构来介导抑癌基因的转录活化。MEG3在多数正常细胞中具有转录活性,尤其在脑和脑垂体中转录活性最高[34]。在恶性肿瘤细胞中,MEG3转录水平非常低甚至检测不出。

2 lncRNA的研究方法

LncRNA的长度和复杂的结构决定其承载大量的遗传信息,其功能也具有特异性强和多样性的特点,所以研究方法相应复杂多样。目前有关lncRNA的研究方法主要分为分子生物学和生物化学两种。

分子生物学方法是人们发现、预测和鉴定lncRNA的一个重要方法,主要包括微阵列(microarray)、转录组测序(RNA-seq)、荧光原位杂交 (fluorescence in situ hybridization,FISH)和RNA干扰(RNA interfering ,RNAi)等技术。

传统的微阵列不用于检测lncRNA,但是研究发现有些lncRNA的结构类似于mRNA,因此传统微阵列检测的数据一部分包含lncRNA的信息,并由此发现大量lncRNA。rom等[35]通过微阵列技术在人类各种细胞中检测到3 019个lncRNA;转录组测序技术能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点,提供最全面的转录组信息[36]。RNA-seq是基于第二代高通量测序技术的转录组测序,通过测出mRNA、small RNA和ncRNA的序列,反映它们的表达水平。RNA-seq具有灵敏度高、信号数字化、检测范围广和全基因组分析的特点,广泛应用于转录本结构的研究、转录本变异的研究、非编码区功能的研究、基因表达水平的研究及发现新转录本等领域。近年来,通过高通量RNA-seq测序技术,在果蝇中发现了1 119个lncRNA,在拟南芥中发现了2 708个lncRNA[37],在玉米中预测了20 163个lncRNA[38]。随着高通量测序技术的发展,双端链特异性转录组测序(paired-end strand-specific RNA-seq)技术可以更准确的提供转录本信息,并且可以为转录组重建及表达水平估计提供转录本的方向信息[39]

荧光原位杂交技术是根据已知微生物不同分类上种群特异的DNA序列,以荧光标记的特异寡聚核苷酸片段为探针,与DNA分子杂交,检测该特异性微生物种群的丰度与存在的技术,具有稳定、经济、安全和灵敏度高等特点,但是不能全部杂交。Tsai等[40]利用FISH发现lncRNA-MALAT1主要定位于细胞分裂间期的剪接斑点。qRT-PCR (quantitative reverse transcription PCR)广泛应用于分析lncRNA的表达水平和模式,通过该技术验证了lncRNA在拟南芥和玉米等植物中具有组织特异性表达的特点。而RNAi技术主要用于lncRNA的功能研究。有人为了研究 HOTAIR 与PRC2和 LSD1 之间的相互作用,用小干扰 RNA沉默HOTAIR,结果表明HOTAIR是这两种组蛋白修饰复合体的骨架分子[41]。有人利用RNAi技术鉴定出5个与拟南芥抗病相关的lncRNA的生物功能。

研究lncRNA的调控还用到生物化学的方法。lncRNA的生物化学研究方法主要有RNA-pull down assay、RIP(RNA-binding protein immunoprecipitation)、CLIP(crosslinking immunopurification)、CHART (capture hybridization analysis of RNA targets)和ChIRP(chromatin isolation by RNA purification)等技术[42, 43, 44],这些技术是以特定蛋白质为研究中心,发掘与蛋白质特异结合的lncRNA。但是这些方法不能用来研究某个lnRNA的调控机制。CHART (capture hybridization analysis of RNA targets)和ChIRP(chromatin isolation by RNA purification)方法的出现为lncRNA互作网络和调控机制的深入研究奠定了强有力的技术基础。

3 展望

近年来,随着大量非编码基因的发现,人们的研究重点从编码基因转移到非编码基因,探究它在生物体内的作用机制,已经有研究表明非编码基因在哺乳动物和植物中起着重要的调控作用,影响其生长发育。lncRNA作为非编码基因的重要组成部分,有关它的研究还处于初级阶段,仍面临许多问题。例如,把lncRNA定义为长度小于200nt的ncRNA仍存在争议,lncRNA结构复杂,以目前的生物信息学技术很难从lncRNA的结构推断其作用机制和生物学功能;lncRNA的调控作用复杂多样,除了在蛋白质和染色质中的作用外,也存在与RNA之间的相互作用;目前有关lncRNA新的研究方法和预测功能的工具不够,不能很好地预测lncRNA的调节机制和生物学功能,也不能更加系统地、深入地研究lncRNA。目前的研究结果表明,lncRNA在人和哺乳动物体内可参与生物学过程,包括转录水平和转录后水平的基因调控。相比较而言,植物体内lncRNA的研究较为落后,目前仅在拟南芥、水稻、小麦和玉米中对lncRNA进行了初步的系统识别和功能研究。距离完全揭示lncRNA的作用机制和生物学功能还有很大距离,需要探索系统的新方法技术来挖掘lncRNA的结构与生物学功能的关系,揭示其作用机制。通过对lncRNA的研究,可以更好地帮助我们研究基因表达调控和一些特性。

参考文献
[1] Human Genome Sequencing Consortium I. Finishing the euchromatic sequence of the human genome. Nature, 2004, 431(7011): 931-945.
[2] Mercer Tr D M M J. Long non-coding RNAs: insights into functions. Nature Reviews Genetics, 2009, 10(3): 155-159.
[3] Wang K C, Chang H Y. Molecular mechanisms of long noncoding RNAs. Molecular Cell, 2011, 43(6): 904-914.
[4] Heo J B, Lee Y, Sung S. Epigenetic regulation by long noncoding RNAs in plants. Chromosome Rese[1] Human Genome Sequencing Consortium I. Finishing the euchromatic sequence of the human genome. Nature, 2004, 431(7011): 931-945.
[5] Akua T, Shaul O. The Arabidopsis thaliana MHX gene includes an intronic element that boosts translation when localized in a 5' UTR intron. Journal of Experimental Botany, 2013, 64(14): 4255-4270.
[6] Christie M, Croft L J, Carroll B J. Intron splicing suppresses RNA silencing in Arabidopsis. The Plant Journal, 2011, 68(1): 159-167.
[7] Chung B Y W, Simons C, Firth A E, et al. Effect of 5' UTR introns on gene expression in Arabidopsis thaliana. BMC Genomics, 2006, 7(1): 120.
[8] Batista PJ, Chang H Y. Long noncoding RNAs: cellular address codes in development and disease. Cell, 2013, 152(6): 1298-1307.
[9] Khalil A M, Guttman M, Huarte M, et al. Many human large intergenic noncoding RNAs associate with chromatin-modifying complexes and affect gene expression. Proc Natl Acad Sci USA, 2009, 106(28): 11667-11672.
[10] Kung J T Y, Colognori D, Lee J T. Long noncoding RNAs: past, present, and future. Genetics, 2013, 193(3): 651-669.
[11] Lee J T. The X as model for RNA's niche in epigenomic regulation. Cold Spring Harbor Perspectives in Biology, 2010, 2(9): a3749.
[12] Yang L, Froberg J E, Lee J T. Long noncoding RNAs: fresh perspectives into the RNA world. Trends in Biochemical Sciences, 2014, 39(1): 35-43.
[13] Øom U A, Shiekhattar R. Long noncoding RNAs usher in a new era in the biology of enhancers. Cell, 2013, 154(6): 1190-1193.
[14] Ulitsky I, Bartel D P. lincRNAs: genomics, evolution, and mechanisms. Cell, 2013, 154(1): 26-46.
[15] Zhang Y, Chen Y. Long noncoding RNAs: new regulators in plant development. Biochemical and Biophysical Research Communications, 2013, 436(2): 111-114.
[16] Ding J, Lu Q, Ouyang Y, et al. A long noncoding RNA regulates photoperiod-sensitive male sterility, an essential component of hybrid rice. Proceedings of the National Academy of Sciences, 2012, 109(7): 2654-2659.
[17] Sun Q, Csorba T, Skourti-Stathaki K, et al. R-loop stabilization represses antisense transcription at the arabidopsis FLC locus. SCIENCE, 2013, 340(6132): 619-621.
[18] Wahba L A K D. The Rs of biology: R-loops and the regulation of regulators. Yangtze River Academic, 2013, 50(5):611-612.
[19] Inagaki S, Numata K, Kondo T, et al. Identification and expression analysis of putative mRNA-like non-coding RNA in Drosophila. Genes to Cells, 2005, 10(12): 1163-1173.
[20] Wang K C, Yang Y W, Liu B, et al. A long noncoding RNA maintains active chromatin to coordinate homeotic gene expression. Nature, 2011, 472(7341): 120-124.
[21] Ariel F, Jegu T, Latrasse D, et al. Noncoding transcription by alternative RNA polymerases dynamically regulates an auxin-driven chromatin loop. Mol Cell, 2014, 55(3): 383-396.
[22] Kim T, Hemberg M, Gray J M, et al. Widespread transcription at neuronal activity-regulated enhancers. Nature, 2010, 465(7295): 182-187.
[23] Lam M T Y, Li W, Rosenfeld M G, et al. Enhancer RNAs and regulated transcriptional programs. Trends in Biochemical Sciences, 2014, 39(4): 170-182.
[24] Li W, Notani D, Ma Q, et al. Functional roles of enhancer RNAs for oestrogen-dependent transcriptional activation. Nature, 2013, 498(7455): 516-520.
[25] Natoli G, Andrau J C. Noncoding transcription at enhancers: general principles and functional models. Annu Rev Genet, 2012, 46: 1-19.
[26] Kondo T, Plaza S, Zanet J, et al. Small peptides switch the transcriptional activity of shavenbaby during drosophila embryogenesis. Science, 2010, 329(5989): 336-339.
[27] Hung T, Chang H Y. Long noncoding RNA in genome regulation Prospects and mechanisms. Rna Biology, 2010, 7(5): 582-585.
[28] Martianov I, Ramadass A, Serra Barros A, et al. Repression of the human dihydofolate reductase gene by a non-coding interfering transcript. Nature, 2007, 445(7128): 666-670.
[29] Wu H J, Wang Z M, Wang M, et al. Widespread long noncoding RNAs as endogenous target mimics for microRNAs in plants. Plant Physiology, 2013, 161(4): 1875-1884.
[30] Daughters R S, Tuttle D L, Gao W, et al. RNA gain-of-function in spinocerebellar ataxia type 8. PLoS Genetics, 2009, 5(8): e1000600.
[31] Faghihi M A, Modarresi F, Khalil A M, et al. Expression of a noncoding RNA is elevated in Alzheimer' disease and drives rapid feed-forward regulation of β-secretase. Nature Medicine, 2008, 14(7): 723-730.
[32] Sonkoly E, Bata-Csorgo Z, Pivarcsi A, et al. Identification and characterization of a novel, psoriasis susceptibility-related noncoding RNA gene, PRINS. Journal of Biological Chemistry, 2005, 280(25): 24159-24167.
[33] Zhang X, Rice K, Wang Y, et al. Maternally expressed gene 3 (MEG3) noncoding ribonucleic acid: isoform structure, expression, and functions. Endocrinology, 2010, 151(3): 939-947.
[34] Huarte M, Guttman M, Feldser D, et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response. Cell, 2010, 142(3): 409-419.
[35] Ørom U A, Derrien T, Beringer M, et al. Long noncoding RNAs with enhancer-like function in human cells. Cell, 2010, 143(1): 46-58.
[36] Wang Z, Gerstein M, Snyder M. RNA-seq: a revolutionary tool for transcriptomics. Nature Reviews Genetics, 2009, 10(1): 57-63.
[37] Liu J, Jung C, Xu J, et al. Genome-wide analysis uncovers regulation of long Intergenic noncoding RNAs in Arabidopsis. The Plant Cell, 2012, 24(11): 4333-4345.
[38] Li L, Eichten S R, Shimizu R, et al. Genome-wide discovery and characterization of maize long non-coding RNAs. Genome Biol, 2014, 15(2): R40.
[39] Ilott N E, Ponting C P. Predicting long non-coding RNAs using RNA sequencing. Methods, 2013, 63(1): 50-59.
[40] Tsai M C, Manor O, Wan Y, et al. Long noncoding RNA as modular scaffold of histone modification complexes. Science, 2010, 329(5992): 689-693.
[41] Chu C, Qu K, Zhong F L, et al. Genomic maps of long noncoding RNA occupancy reveal principles of RNA-chromatin interactions. Molecular Cell, 2011, 44(4): 667-678.
[42] Simon M D, Wang C I, Kharchenko P V, et al. The genomic binding sites of a noncoding RNA. Proceedings of the National Academy of Sciences of the United States of America, 2011, 108(51): 20497-20502.
[43] Yan B, Wang Z, Guo J. The research strategies for probing the function of long noncoding RNAs. Genomics, 2012, 99(2): 76-80.
[44] Zhu J, Fu H, Wu Y, et al. Function of lncRNAs and approaches to lncRNA-protein interactions. Science China Life Sciences, 2013, 56(10): 876-885. arch, 2013, 21(6-7): 685-693.