人类全基因组测序结果显示,具有编码蛋白质功能的基因不到全部基因组序列的2%,而在占据人类基因组98%以上的非蛋白编码序列中,绝大多数被转录成长度大于200个碱基的长非编码RNA(long noncoding RNAs,lncRNAs)。长非编码RNA是指无蛋白质编码功能、但往往具有mRNA 结构特征(帽式结构和poly A 尾巴)的RNA[1],在对小鼠cDNA文库的大规模测序研究中被首次发现[2]。近年来,随着二代测序技术的广泛应用,长链非编码RNA的神秘面纱才逐渐被揭开,长非编码RNA是具有多种功能的转录本。lncRNA的表达不仅具有细胞或组织特异性,其中某些lncRNA还仅在真核生物发育过程的特定阶段产生。越来越多针对长非编码RNA的功能研究表明,lncRNA可以通过影响mRNA的转录、剪接、转运、稳定性和翻译等过程,调节蛋白质基因的表达。从而影响剂量补偿、基因印迹、细胞周期、端粒生物学、亚细胞结构组成、发育、配子形成及染色体结构动态变化等生物学过程。有的lncRNA转录后很快被降解,但同样具有重要的调节功能;有的lncRNA 虽短暂表达,但可以产生长期的调控效应。lncRNAs的异常表达与人类疾病相关,如与老化相关的阿尔茨海默病(AD)和认知障碍、心血管疾病、糖尿病和癌症等[3]。因此,更好地了解lncRNAs的功能会促进我们对细胞调节和疾病机制的理解。然而由于lncRNAs不具有蛋白质编码基因序列所具有的指示功能,所以直接对lncRNAs的功能进行研究具有一定的困难。目前对lncRNAs功能的研究主要有lncRNAs表达的高通量分析、高通量数据的验证和lncRNA-蛋白质相互作用的研究。此外,近年来生物信息技术的快速发展也为lncRNAs功能的研究提供了新的契机。我们将对lncRNA在衰老和老化相关疾病的研究进展及lncRNAs功能的研究方法进行综述。
1 长非编码RNA与衰老以及人类老化相关疾病 1.1 长非编码RNA与衰老lncRNAs调节生物体生命周期、组织老化或细胞衰老的研究仍处于起步阶段,但lncRNAs作为新兴的重要ncRNAs,可能在衰老网络和衰老相关疾病中发挥作用。lncRNAs参与轴突和树突联系的发育和与神经网络可塑性相关或与学习和记忆相关的长时程增强的突触调制。在包括老化相关疾病的许多人类疾病中出现多种lncRNAs失调[4]。lncRNA可能作为一种新颖的基于衰老分子机制的代表。然而,关于lncRNAs参与调节细胞衰老复杂过程的信息仍然极少,但随着转录组的持续发展,大量涉及脑老化动态变化的lncRNAs被发现,这表明这些lncRNAs可能在大脑衰老过程中起着非常重要的作用。
在衰老过程中除了lncRNAs的表达模式发生改变,lncRNAs还可能通过直接参与老化网络在组织老化或细胞衰老水平调节老化。lncRNA ANRIL参与原癌基因诱导衰老的关键效应器并在老化期间诱导INK4a、ARF和/或INK4b的抑制。在首次系统研究老化相关的lncRNAs时,研究人员对增殖和衰老的成纤维细胞进行RNA深度测序时发现,许多衰老相关lncRNAs(SAL-RNA)存在差异表达。在这些lncRNAs中,有些SAL-RNAs可调节衰老的发作并保护衰老细胞活力,这表明lncRNAs直接促成衰老表型的形成。此外,有报道称 lncRNA MALAT1在衰老成纤维细胞下调,这与在成纤维细胞中降低MALAT1可启动细胞衰老的结果相符。这种作用部分归因于当MALAT1水平较低时B-MYB前体mRNA剪接产生的致癌转录因子b-myb/myb12的下调。反过来,b-Myb的水平降低可缩短G2/M细胞周期进程,促进细胞衰老[5]。
lncRNAs可影响参与细胞衰老途径的调节,在细胞周期进程中起重要作用。细胞衰老的关键调节剂p53可以激活具有增殖抑制功能的许多lncRNAs。反之,lncRNAs也可靶向作用于p53和p53途径分子,从而影响p53的活性。lincRNA-p21作为p53基因的真正下游靶标,细胞凋亡中起作用,同时又反过来作为p53途径中几个重要促存活基因的关键抑制剂。沉默lincRNA-p21可阻断程序性细胞死亡(即细胞凋亡),而不是细胞周期停滞[6]。哺乳动物雷帕霉素靶蛋白(mTOR)通路在从细胞周期停滞到衰老的转化过程中起了至关重要的作用。mTOR具有上游调节信号和下游底物两个不同细胞复合物(mTORC1和mTORC2)的催化亚基。雷帕霉素可阻断mTORC1激酶,抑制或减速细胞转化而使细胞保持静止状态。抑制mTOR通路可延长包括小鼠在内的模式生物的寿命。Uchl1AS lncRNA也参与mTOR信号通路。其功能是在应激信号通路的控制下由雷帕霉素抑制mTORC1导致UCHL1蛋白增加而实现的。这种蛋白质的突变与早发型家族性帕金森病有关,并在特发性帕金森氏病和AD下调。从上述信息,可以容易地得出结论,lncRNAs在复杂的细胞衰老调控网络起关键作用。
1.2 lncRNAs在老化相关疾病中的作用衰老是生活中不可避免的一部分,不幸的是衰老成了与老化相关的慢性疾病,如AD、认知障碍等疾病发作的最大危险因素[3](Tab1)。
长非编码RNA | 长非编码RNA功能或特性 | 功能障碍类型 |
BACE1-AS | 在体外和体内上调BACE1 mRNA和蛋白的表达。BACE1 mRNA的表达在BACE1-AS的调控下驱动AD相关的病理生理 | 表达和相互作用 |
BCYRN1/BC200 | BC200水平的增加优先出现在AD的主要影响脑区(布氏9区)。AD晚期患者BC200出现定位错误并在核周体聚集。这些结果表明,这些突触lncRNAs的失调参与了早期和晚期AD突触和神经网络的功能障碍。 | 表达 |
BC1 | 负调节纹状体多巴胺D2受体介导的突触传递,可能通过对与D2受体产生相互作用并下调D2受体的蛋白质去抑制作用。 | 表达 |
HAR1 | HAR1,高度保守的基因组区域,由位于神经元miRNA, miR-124-3约80 kb的一对顺反结构lncRNAs (HAR1F和HAR1R) 组成。HD患者纹状体HAR1水平明显降低;精神分裂症和AD与reelin基因及其反义转录本HAR1相关; HAR1也与HD有关,转录抑制因子REST病理性细胞核,导致一些重要的神经元基因的阻遏。 | 表达和调节 |
FMR4/ASFMR1 | ASFMR1在脆性X综合征患者中沉默,在突变前携带者上调,这表明共同的过程是负责调节这些转录本的表达。 | 表达 |
UBE3A-AS | UBE3A-AS是母系表达的UBE3A基因的反义转录本,是天使综合征的候选基因,表明UBE3A-AS可能负责阻抑父系UBE3A的表达。 | 基因座 |
17A | 嵌入在GABA B2受体的lncRNA在AD患者脑组织表达异常;17A通过调节GABA可变剪接影响胞内与GABA受体相关的下游信号通路;17A在反应炎症刺激中表达,并促进淀粉样蛋白β(Aβ)分泌,增加病态的Aβ42: Aβ40的比值。 | 表达 |
ANRIL (CDK2BAS/p15AS) | 最近的研究显示ANRIL2邻近的单核苷酸多态性与包括AD在内的多种疾病相关 | 突变 |
AD中BACE1(β位淀粉样前体蛋白裂解酶1)反义转录物BACE1-AS是人神经系统疾病研究最为透彻的调控关键基因的lncRNA。BACE1可使淀粉样前体蛋白(APP) 在脑内异常代谢导致β淀粉样蛋白(Aβ) 在脑内沉积。BACE1在AD患者脑内的表达高于正常人。BACE1-AS能够在细胞各种外界压力刺激条件下,与BACE1 mRNA形成RNA复合物来防止BACE1 mRNA 受到核酸酶的降解,从而增加BACE1 mRNA的稳定性,导致更多的Aβ累积,且促进更多BACE1-AS的表达,这个正反馈循环最终加速AD的发展。研究表明使用BACE1-AS siRNA 降低BACE1-AS的表达水平后,BACE1 mRNA与Aβ的表达水平也同时下降,这就表明BACE1-AS是一个较理想的治疗AD 的药物靶点[7]。
脑胞质(BC)RNA 是AD和脑老化的另一种lncRNA。小鼠BC1 RNA和人的BCYRN1/BC200 RNA是将核蛋白颗粒转运到树突的lncRNA转录本,可在翻译水平调节基因表达。AD患者Brodmann 9区(受AD影响的主要脑区)的BCYRN1/BC200水平较相同年龄的正常人持续升高,且该脑区的BCYRN1/BC200水平与AD严重程度呈正相关[8]。BCYRN1/ BC200 RNA与一些涉及mRNA异常转运的RNA结合蛋白相互作用,例如翻译起始调节因子poly(A)结合蛋白(PABP1),与神经元和少突胶质细胞的mRNA转运有关的hnRNPA2和突触结合胞质RNA相互作用蛋白(synaptotagmin-binding cytoplasmic RNA interacting protein,SYNCRIP),SYNCRIP是mRNA转运颗粒的一部分,可能参与神经元突触后位点局部定位蛋白质的合成。所有的这些似乎都证明了BCYRN1/BC200在树突局部蛋白质合成中具有调节作用,AD和脑老化时CYRN1/ BC200的过表达可能引起突触树突退化。此外,位于突触区域的BC1可能具有BCYRN1/BC200 lncRNA类似的功能,它与翻译支架复合体中的关键蛋白相互作用并且通过调节决定突触功能的突触蛋白质的合成维持长时程突触可塑性。BC1 lncRNA通过抑制与多巴胺D2受体产生相互作用并下调D2受体的突触蛋白负向调节纹状体多巴胺D2受体介导的突触传递。将BC1-/-小鼠关在笼子里饲养时不表现明显的表型或者神经异常,但是当将其放养时,BC1-/-小鼠表现出异常认知和异常行为表型,更容易焦虑,成活率降低。
除了AD,lncRNAs还与认知和行为障碍有关。例如主要表达在新皮层发育期Cajal-Retzius细胞的高加速区1(HAR1)。HAR1控制径向迁移和皮质板锥体神经元的层定位。HAR1与涉及正常认知功能和多种认知障碍(例如,神经元迁移缺陷、自闭症、精神分裂症、双相性精神障碍、癫痫症、中风和AD)的reelin共表达。亨廷顿病(HD)患者纹状体中HAR1的表达降低。此外FMR1反义RNA1(FMR4/ASFMR1)与脆性X综合征(FXS,自闭症的常见原因)有关。
lncRNAs也与印迹疾病有关,例如天使综合征(angelman syndrome,AS)患者的泛素蛋白连接酶E3A(UBE3A)-ATS。天使综合症由母系单基因遗传缺陷所致。UBE3A缺乏导致这种印迹相关的神经发育障碍。UBE3A在大多数组织中呈双等位基因表达,但只有母系等位基因UBE3A在大脑中表达。天使综合征患者母系UBE3A基因缺失或失活,导致神经细胞UBE3A功能性丧失,反义lncRNA转录物UBE3A-ATS可调节表观遗传沉默的父系等位基因,使体内沉睡的父系UBE3A基因重新开始活跃,从而增加父系UBE3A在大脑的表达,让它能够指导合成大脑发育所需的正确蛋白质,而为天使综合征提供新的治疗方案[9]。
神经内分泌蛋白反义(NESPAS) lncRNA来源于基因座,调节在蓝斑-去甲肾上腺素系统中明显表达的神经内分泌蛋白55(NESP55)。蓝斑-去甲肾上腺素系统是状态依赖性神经网络活动的重要调质,并与神经退行性疾病和神经障碍相关。此外,脑老化及相关认知表型与lncRNA介导的突触和神经网络连通性、可塑性和应激反应的改变有关。lncRNA HSR1,在促进细胞保护的热休克反应中起重要作用,并与神经发育、脑老化和各种神经退行性疾病的分子发病机制有关。
总之,中枢神经系统中的转录境况特别复杂,因为mRNAs和lncRNAs都受神经元活动调控,这种错综复杂的调控网络的中断可能会导致正常的大脑发育和功能的破坏。研究lncRNA的行为机制无疑将为神经障碍的分子基础提供有价值的见解,这可能会产生新的治疗和诊断方法。
2 IncRNAs表达的高通量分析 2.1 芯片基因芯片的发展对于实现基因的大量分析而言是一种飞跃式的进步,它们对于全基因组基因表达分析的巨大容量使得其成为发现靶标的理想工具,从而使我们能够快速地评估不同组织或不同细胞类型中转录谱间的差异。随着越来越多的lncRNA被发现,专门针对lncRNA的芯片也被设计开发出来,如晶芯人类长非编码RNA表达谱芯片和Arraystar lncRNA芯片等同时针对mRNA和lncRNA进行大规模检测,发现差异表达的lncRNA和mRNA,并挖掘二者之间的关联。Arraystar lncRNA芯片检测支气管上皮囊性纤维化患者和非囊性纤维化人群发现在30 586个lncRNA中有差异表达的有1 063 个,在26 109个编码蛋白的基因中720个有差异表达,经GO生物信息学分析显示囊性纤维化主要与炎症相关。研究结果还提示lncRNA失调在囊性纤维化患者肺部慢性感染和炎症中起着重要的作用[10]。
Ørom等用芯片对人成纤维细胞、角质细胞和HeLa细胞进行lncRNAs转录谱分析时检测到了一千多种lncRNAs。Dinger等采用了专门设计的芯片来检查小鼠胚胎干细胞分化期间其胚胎干细胞的表达图谱,确定在分化期间表达的lncRNAs有945个,其中174个差异性表达并与全能性或特定事件的分化相关联。Pang等发现CD8+T细胞表达数百种lncRNAs,其中有许多是淋巴特异性的和/或随淋巴细胞分化或活化动态地改变。Mercer等通过芯片平台揭示了lncRNAs在神经元和少突胶质细胞谱系特异性、神经元-胶质细胞命运转换,以及少突胶质细胞包括髓鞘形成在内的进展期的动态表达模式。
2.2 转录组分析转录组(RNA-seq)是指细胞在特定发育阶段或生理状态下所有转录本的集合,包括mRNA、非编码RNA和小分子RNA。与传统的芯片杂交相比,RNA-Seq具有定量更准确、可重复性更高、检测范围更广、分析更可靠等特点,能够对任何物种进行全基因组水平的基因表达差异研究,可以检出低丰度转录本。除了分析基因表达水平,RNA-Seq还能发现新的转录本、SNP、剪接变体,并提供等位基因特异的基因表达。
Soreq等[11]利用RNA-seq技术和一种用于深度探索全基因组RNA-seq数据集的新颖计算流程检测并分析了帕金森病患者治疗前后白细胞的lncRNAs,他们新发现了7 000多个lncRNAs,大大丰富了目前可利用而又为数不多的人组织来源的lncRNAs数据库。Pauli等按时间顺序在斑马鱼早期发育的八个阶段进行了转录组测序,确定了在胚胎发育过程中由多外显子转录所产生的1 133个非编码转录本。为识别转移性黑色素瘤中差异性表达基因和单核苷酸变异,Liu等[12]使用RNA-seq技术对两个正常样本和两个转移性黑色素瘤样本进行了转录组测序,他们确定了18个显著的差异性表达基因和33 096个单核苷酸变异。Lin等对iPS细胞来源的人类神经元进行转录组分析结果显示lncRNAs参与了神经的发生和神经功能障碍。另外,在RNA-seq 测序数据的帮助下,Rackham等发现线粒体基因组产生的lncRNAs 受核基因编码的蛋白质的调控。
3 高通量数据的验证尽管芯片和RNA-seq是发现靶标非常好的工具,然而待测靶标的验证还有赖于其它分子生物学方法的帮助。Northern blots、实时定量聚合酶链式反应(Q-PCR)、荧光原位杂交(FISH)、RNA干扰(RNAi)是用来进行高通量数据验证相对比较成熟的方法。
3.1 Northern blots和Q-PCRNorthern blots可以直接检测RNA转录本的存在和不同发育阶段、不同环境和不同治疗阶段组织和细胞RNA的表达模式。实时定量聚合酶链式反应(Q-PCR)是一种扩增并同时量化目标分子的实验室技术,Q-PCR可以结合逆转录定量细胞或组织中的信使RNA和非编码RNA。Furuno等运用Northern blots和Q-PCR证实了已知蛋白编码基因以外的8个新lncRNAs的存在。Perez等应用Northern blots证明了lncRNAs转录本的长度与癌症发病有关。Q-PCR方法可精确定量不同人体组织及乳腺癌和卵巢癌中每个非编码RNA的表达。
3.2 荧光原位杂交(FISH)FISH是用来检测和定位组织样本中特定RNA转录物的一种细胞遗传学技术,它可以帮助定义细胞和组织中基因表达的时空模式。RNA荧光原位杂交(RNA-FISH)是研究lncRNAs的分布和功能的重要工具[13]。研究者们已经运用该技术检测并定位了许多lncRNAs,例如Xist、MALAT1、MEN ε/β、Kcnq1ot1和HA117等。为了揭示在X染色体失活中的作用,Chureau等运用RNA-FISH技术分析了FTX在雌性胚胎干细胞分化过程中的表达。Tripathi等运用RNA-FISH技术分析MALAT1的位置结果表明MALAT1富集在间期细胞核内。Sasaki等通过RNA-FISH揭示了MENε/β信号定位于离散斑点,表示核小体存在于所有细胞系中。此外,Redrup等应用RNA-FISH技术于E12.5胎盘切片中检测KCNQ1、Kcnq1ot1和Xist。进一步实验结果表明,Kcnq1ot1形成了一个区域,若基因位于该区域内部则有可能使表观遗传失活,而基因位于该区域外则没有这种现象。Liu等[14]用FISH检测先天性巨结肠症患者结肠时发现长非编码RNA HA117主要分布在狭窄段的肠粘膜和肌层。
3.3 RNA干扰(RNAi)自从AndrewFire等揭示了RNA具有干扰基因表达的机制自今,RNAi技术在生物学领域得到了长足的发展,尤其是在lncRNAs的研究领域方面。这与其自身的优点是密切相关的,RNAi对基因表达的选择性以及其dsRNA的稳定性,使RNAi 技术较反义RNA技术具有一定的优势。
研究发现采用RNAi技术降低非编码RNA的表达可导致其邻近的蛋白质编码基因表达下降,表明lncRNAs 在人类细胞系中起增强子的作用。HOTAIR是一个模块化的双功能RNA,对复合物中核心蛋白复合体2(PRC2)和LSD1具有不同的结合结构域。用小干扰RNA沉默HOTAIR可以解除PRC2和LSD1之间的相互作用,这表明HOTAIR可能在PRC2和LSD1之间充当支架作用。用shRNA敲低gadd7可以明显降低脂质和非脂质诱导的活性氧,还可以明显地推迟和削弱活性氧引起的内质网应激反应,这表明非编码RNA gadd7可能是内质网应激反应的调节因子。此外,在白血病NB4细胞髓样分化期间,敲低HOTAIRM1可降低RA诱导的HOXA1和HOXA4的表达,并选择性地降低髓样分化基因ITGAM和ITGB218的转录诱导,说明HOTAIRM1通过调控基因表达在髓细胞生成过程中起着一定作用。
4 IncRNA-蛋白质相互作用的研究方法越来越多的研究表明,lncRNAs以RNA-蛋白质复合物的形式起调控作用,例如染色质修饰复合物、转录因子复合物、核糖核蛋白复合物等。因此,对lncRNAs和蛋白质相互作用加以研究有助于揭开lncRNAs生物学过程的机制。
4.1 RNA免疫沉淀(RIP)在研究活细胞或组织中蛋白质和RNA之间的相互作用时,RNA免疫沉积(RNA-immunoprecipatation,RIP)是一种非常有价值的实验技术。该技术运用针对目标蛋白的抗体把相应的RNA-蛋白质复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行分析。Pandey等用RIP技术揭示Kcnq1ot1与H3K9甲基转移酶和PRC2间的相互作用。Rinn等借助hnRNP-K的抗体,运用RIP技术证实了在MEF细胞核抽提物中,lincRNA-p21和hnRNP-K之间存在相互作用,lincRNA-p21通过hnRNP-K调节p53介导的细胞凋亡[6]。此外,Zhao等用RIP技术揭示了RepA、Xist和Tsix都是与PRC2存在相互作用的非编码RNA。
4.2 RIP-Chip和RIP-SeqRIP-Chip和 RIP-Seq是RIP分别与Chip和RNA-seq结合所形成的衍生技术,目前这两种技术都已被广泛地应用于寻找RNA和蛋白的相互作用中。Khalil等用RIP-Chip技术发现有大量的lncRNAs与染色质修饰复合物有关联并且影响基因的表达,其中PRC2在干细胞更新和人类疾病中发挥重要作用。在小鼠胚胎干细胞中,Mohamed等用RIP-Chip技术揭示了一些保守lncRNAs转录由POU5F1和NANOG调控,Nanog可能调节干细胞多能性。Zhao等使用 RIP-Chip和RIP-Seq方法捕获胚胎干细胞中PRC2的转录组,并确定了9000多个与PRC2相互作用的RNA转录本。
4.3 CLIP和c-KLAN交联-免疫沉淀法(crosslinking-immunopurification,CLIP)为活体实验中探测RNA与蛋白间的相互作用提供了一种突破性的研究策略。该法的主要过程是用紫外线照射组织或细胞,当细胞中RNA和RNA结合蛋白之间近距离接触时便可形成共价键。紫外交联后用免疫共沉淀的试验方法对RNA及RNA结合蛋白 (RBPs)进行分离纯化,RNA随即被转换成cDNA文库,并且使用Solexa技术进行深入测序,与lncRNA结合的蛋白可通过SDS-PAGE分离染色后进行质谱鉴定或直接通过液质联用的方法进行蛋白质鉴定。Ule等首次采用CLIP技术证实了NOVA依赖性的剪接调控功能。如今以CLIP技术为基础已经衍生出了高通量测序交联-免疫沉淀技术(HITS-CLIP)、光活性增强的核糖核苷交联和免疫共沉淀技术(PAR-CLIP)、单核苷酸分辨率交联-免疫沉淀技术(iCLIP)。
非编码RNA沉默与定位分析技术(combined knockdown and localization analysis of non-coding RNAs,c-KLAN)是一种近年来发现的研究lncRNAs功能及其细胞定位非常有价值的技术,该技术针对目的lncRNA设计引物,将其逆转录成cDNA,PCR扩增cDNA。一方面对扩增产物进行体外转录生成dsRNA,用核糖核酸内切酶Ⅲ酶切dsRNA来制备esiRNA (endoribonuclease-prepared siRNA),用于对lncRNA进行功能缺失研究;另一方面用荧光标记的UTP对扩增产物进行体外转录,以制备lncRNAs正义或反义的FISH探针从而达到对特定组织或细胞中靶lncRNAs进行定位的目的。Chakraborty等运用c-KLAN技术确定了多能性相关非编码转录物1(pluripotency-associated noncoding transcript 1,Panct1)主要位于胚胎干细胞的细胞核中,同时进一步研究发现Panct1在维持胚胎干细胞的多能性方面起着决定性作用。
4.4 ChIRP-seqChIRP-seq是以RNA纯化的染色质分离 (chromatin isolation by RNA purification,ChIRP)技术为基础,经进一步改造而形成的,是一种检测与RNA结合的DNA和蛋白质的高通量测序方法。该法的基本原理是基于生物素和链霉亲和素之间、寡核苷酸探针与lncRNAs之间的相互作用,生物素化的寡核苷酸探针与lncRNAs杂交后可以被结合有链霉亲和素的磁珠拉下来,这样与lncRNAs结合的染色质复合体也被拉下来,最后把染色体片段做高通量测序,以确定该lncRNA能够结合到基因组的哪些区域。Quinn等运用ChIRP-seq技术确定了3个lncRNAs(drosophila roX2、human TERC和HOTAIR)在基因组上的定位,这些lncRNAs的结合位点具有序列特异性或区域特异性。例如,roX2主要定位于X染色体上,并且趋向定位于每个基因的3'端;TERC主要富集于端粒DNA和Wnt受体信号通路基因上;HOTAIR lncRNA优先定位于富含GA的DNA区域。
最近,Chang等对ChIRP进行了改造,发布了称为dChIRP(domain-specific ChIRP)的新技术。该技术可以在天然环境下剖析lncRNAs不同结构域的功能,这无疑将为研究lncRNAs功能提供了又一个实用的工具。他们首先设计了生物素化的反义寡核苷酸池来靶标lncRNAs的特定结构域。随后通过交联保护了细胞中的lncRNAs互作,并利用超声处理使lncRNAs形成结构域大小的片段。最后通过链霉亲和素磁珠,将lncRNAs结构域连同它的互作搭档一起纯化出来,并对这些纯化产物进行分析(WB、逆转录定量PCR、定量PCR或者测序),从而鉴定了RNA-蛋白、RNA-RNA和RNA-染色质间的互作。通过dChIRP技术他们对一种称为roX1的雄性果蝇剂量补偿效应所需的lncRNAs进行研究,并揭示了roX1功能域的组成结构,向人们展示了由3个不同结构域组成的3指手掌结构,其中的3个指状结构域负责与染色质互作,是功能独立的RNA亚单位[15]。
5 生物信息学与耗时且昂贵的传统实验方法相比,用生物信息学技术对lncRNAs的功能进行计算预测正逐渐得到研究人员的青睐。例如,Tartaglia等开发的catRAPID在线算法,该算法可以通过对所要研究的蛋白和RNA的序列分析来预测它们之间可能存在的相互作用,其基本原理是基于RNA和蛋白质的二级结构、氢键和分子间作用力。据Tartaglia介绍,该算法可在10 min内完成输入序列与整个转录组(或蛋白质组)的比对分析,这大大节约了实验时间与实验成本。其网址为http://service.tartaglialab.com/page/catrapid_group。Liao等已经利用catRAPID算法预测了约340个 lncRNAs的功能,主要涉及器官或组织的生成,细胞转运或代谢过程等方面。
在lncRNAs的功能研究中,建立相关的lncRNAs数据库并对lncRNAs进行功能注释是非常有必要的,这使得研究人员知道要寻找什么,并让他们知道如何对他们新发现的东西进行命名,从而方便其他研究人员对lncRNAs进行研究。 为了便于研究和学术交流,相关研究人员已经建立了多个在线1ncRNA数据库(Tab2)。这些数据库所收录的1ncRNA数据来自已发表的论文和GenBank。
Database name | Website | Reference |
Noncoding RNA datahase | http://biobases.ibch.poznan.pl/ncRNA/ | [16] |
fRNAdb | http://www.ncrna.org/frnadb/ | [17] |
NRFD | http://jsm-research.imb.uq.edu.au/nred/cgi-bin/ncrnadb.pl | [18] |
lncRNAdb | http://www.lncrnadb.org/ | [19] |
ncFANs | http://www.ebiomed.org/ncFANs/ | [20] |
NONCODE | http://www.noncode.org/ | [21] |
LNCipedia | http://www.lncipedia.org | [22] |
Rnadb | http://research.imb.uq.edu.au/rnadb/ | [23] |
Non-coding | http://www.man.poznan.pl/5SData/ncRNA/index.html | [24] |
Rfam | http://rfam.sanger.ac.uk/ | [25] |
ChIPBase | http://deepbase.sysu.edu.cn/chipbase/ | [26] |
lncRNADisease | http://cmbi.bjmu.edu.cn/lncrnadisease | [27] |
近年来对lncRNAs的研究呈现出一种井喷模式,然而与已发现的lncRNAs的数量相比,目前对lncRNAs功能研究所取得的成果依旧很少,其主要原因如下:首先,lncRNAs物种之间保守性不高,这使得不同生物之间进行lncRNAs功能比对更加困难,同时也导致了一个给定的lncRNAs功能的不确定性。其次,lncRNAs数据库还不充足,lncRNAs功能预测工具还很少,以及lncRNAs功能研究的实验技术还不完善等原因都对lncRNAs的功能研究有一定的限制。
但是我们必须认识到,lncRNAs的功能研究尚处于起步阶段,就lncRNAs的研究正逐渐成为基因组研究的又一个热点以及当前生物信息技术的快速发展而言,我们相信更多的科研人员将投身于lncRNAs的功能研究中,更多更有效的研究工具将如雨后春笋般层出不穷,这必将有助于我们进一步解析lncRNAs的功能及其分子调控机制,最终揭开lncRNAs的神秘面纱。
[1] | Hung T, Chang H Y. Long noncoding RNA in genome regulation:prospects and mechanisms [J]. RNA Biol, 2010, 7(5):582-5. |
[2] | Okazaki Y, Furuno M, Kasukawa T, et al. Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs [J]. Nature, 2002, 420 (6915):563-73. |
[3] | Li X, Wu Z, Fu X, et al. lncRNAs:Insights into their function and mechanics in underlying disorders [J]. Mutat Res Rev Mutat Res, 2014, 762:1-21. |
[4] | Abdelmohsen K, Panda A, Kang M J, et al. Senescence-associated lncRNAs:senescence-associated long noncoding RNAs [J]. Aging Cell, 2013, 12(5):890-900. |
[5] | Tripathi V, Shen Z, Chakraborty A, et al. Long noncoding RNA MALAT1 controls cell cycle progression by regulating the expression of oncogenic transcription factor B-MYB [J]. PLoS Genet, 2013, 9(3):e1003368. |
[6] | Wu G, Cai J, Han Y, et al. LincRNA-p21 regulates neointima formation, vascular smooth muscle cell proliferation, apoptosis, and atherosclerosis by enhancing p53 activity [J]. Circulation, 2014, 130 (17):1452-65. |
[7] | Evin G, Hince C. BACE1 as a therapeutic target in Alzheimer's disease:rationale and current status [J]. Drugs Aging, 2013, 30(10):755-64. |
[8] | 徐 宏,梁尚栋. 长非编码RNA与其他表观遗传学的相互调控与神经系统疾病[J].中国药理学通报, 2012, 28(10):1348-51.Xu H, Liang S D. Epigenetic regulation mediated by long noncoding RNA in nervous system disease [J].Chin Pharmacol Bull, 2012, 28(10):1348-51. |
[9] | Martins-Taylor K, Hsiao J S, Chen P F, et al. Imprinted expression of UBE3A in non-neuronal cells from a Prader-Willi syndrome patient with an atypical deletion [J]. Hum Mol Genet, 2014,23(9):2364-73. |
[10] | McKiernan P J, Molloy K, Cryan S A, et al. Long noncoding RNA are aberrantly expressed in vivo in the cystic fibrosis bronchial epithelium [J]. Int J Biochem Cell Biol, 2014, 52:184-91. |
[11] | Soreq L, Guffanti A, Salomonis N, et al. Long non-coding RNA and alternative splicing modulations in Parkinson's leukocytes identified by RNA sequencing. [J]. PLoS Comput Biol, 2014, 10(3):e1003517. |
[12] | Liu D, Zhao Z G, Jiao Z L, et al. Identifying differential expression genes and single nucleotide variations using RNA-seq in metastatic melanoma [J]. Genet Mol Res, 2014, 13(4):8153-62. |
[13] | Tripathi V, Fei J, Ha T, et al. RNA fluorescence in situ hybridization in cultured Mammalian cells [J]. Methods Mol Biol, 2015, 1206:123-36. |
[14] | Liu H, Luo Y, Li S, et al. Expression profiles of HA117 and its neighboring gene DPF3 in different colon segments of Hirschsprung's disease [J]. Int J Clin Exp Pathol, 2014, 7(7):3966-74. |
[15] | Quinn J J, Ilik I A, Qu K, et al. Revealing long noncoding RNA architecture and functions using domain-specific chromatin isolation by RNA purification [J]. Nat Biotechnol, 2014, 32(9):933-40. |
[16] | Erdmann V A, Szymanski M, Hochberg A, et al. Non-coding, mRNA-like RNAs database Y2K [J]. Nucleic Acids Res, 2000, 28(1):197-200. |
[17] | Mituyama T, Yamada K, Hattori E, et al. The Functional RNA Database 3.0:databases to support mining and annotation of functional RNAs [J]. Nucleic Acids Res, 2009, 37:D89-92. |
[18] | Dinger M E, Pang K C, Mercer T R, et al. NRED:a database of long noncoding RNA expression [J]. Nucleic Acids Res, 2009, 37:D122-6. |
[19] | Amaral P P, Clark M B, Gascoigne D K, et al. 1ncRNAdb:a reference database for long noncoding RNAs [J]. Nucleic Acids Res, 2011, 39:D146-51. |
[20] | Liao Q, Xiao H, Bu D C, et al. ncFANs:a web server for functional annotation of long non-coding RNAs [J]. Nucleic Acids Res, 2011, 39(Web Server issue):W118-24. |
[21] | Xie C, Yuan J, Li H, et al. NONCODEv4:exploring the world of long non-coding RNA genes [J]. Nucleic Acids Res, 2014, 42:D98-103. |
[22] | Volders P J, Helsens K, Wang X, et al. LNCipedia:A database for annotated human lncRNA transcript sequences and structures [J]. Nucleic Acids Res, 2013, 41:D246-51. |
[23] | Pang K C, Stephen S, Dinger M E, et al. RNAdb 2.0-an expanded database of mammalian non-coding RNAs [J]. Nucleic Acids Res, 2007, 35:D178-82. |
[24] | Erdmann V A, Szymanski M, Hochberg A, et al. Non-coding, mRNA-like RNAs database Y2K [J]. Nucleic Acids Res, 2000, 28(1):197-200. |
[25] | Burge S W, Daub J, Eberhardt R, et al. Rfam 11.0:10 years of RNA families [J]. Nucleic Acids Res, 2013, 41:D226-32. |
[26] | Yang J H, Li J H, Jiang S, et al. ChiPBase:A database for decoding the transcriptional regulation of long non-coding RNA and microRNA genes from chip-seq data [J]. Nucleic Acids Res, 2013, 41:D177-87. |
[27] | Chen G, Wang Z, Wang D, et al. lncRNAdisease:A database for long-non-coding RNA-associated diseases [J]. Nucleic Acids Res, 2013, 41:D983-6. |