中国医科大学学报  2022, Vol. 51 Issue (2): 169-173

文章信息

曲浩宁, 朱文韬, 何群
QU Haoning, ZHU Wentao, HE Qun
基于生物信息学构建阿尔茨海默病内源竞争RNA调控网络
Construction of regulatory network of competing endogenous RNA in Alzheimer's disease based on bioinformatics analysis
中国医科大学学报, 2022, 51(2): 169-173
Journal of China Medical University, 2022, 51(2): 169-173

文章历史

收稿日期:2021-04-22
网络出版时间:2021-12-30 16:55
基于生物信息学构建阿尔茨海默病内源竞争RNA调控网络
曲浩宁 , 朱文韬 , 何群     
中国医科大学生命科学学院生物信息学教研室, 沈阳 110122
摘要目的 探讨阿尔茨海默病(AD)中差异长链非编码RNA(lncRNA)与靶向微RNA(miRNA)、mRNA的相互作用关系及其导致AD的发病机制。方法 在基因表达综合数据库(GEO)中下载数据,筛选出在AD早中晚期存在差异表达的lncRNA和mRNA,运用RegRNA预测lncRNA的靶向miRNA,TargetScan,TargetMiner,miRDB预测miRNA的靶向mRNA,DAVID对mRNA进行富集分析和京都基因与基因组百科全书(KEGG)通路分析,cytoscape进行网络图构建,对差异表达的mRNA进行蛋白质相互作用(PPI)分析并运用cytoscape找出关键基因。结果 从数据集GSE28146中早中晚差异表达的侯选差异基因(pDEGs)中筛选出LINC02047LINC01124LINC00582LINC02478,预测差异lncRNA的下游靶miRNA有hsa-mir-132-3phsa-mir-1254hsa-mir-3612hsa-mir-4640-5phsa-mir-4690-3phsa-mir-4786-3p,然后预测靶miRNA的下游mRNA并构建AD的lncRNA-miRNA-mRNA调节网络。结论 LINC02047LINC01124LINC02478通过对miR-4060、miR-4090、miR-4786、miR-3612、miR-1254和miR-132的调控影响AD的发生发展。
关键词阿尔茨海默病    内源竞争RNA    长链非编码RNA    生物信息学    
Construction of regulatory network of competing endogenous RNA in Alzheimer's disease based on bioinformatics analysis
Department of bioinformatics, School of life sciences, China Medical University, Shenyang 110122, China
Abstract: Objective To explore the interaction between differential long noncoding RNA (lncRNA) and targeted microRNA (miRNA) and messenger RNA (mRNA) in Alzheimer's disease (AD) and AD pathogenesis. Methods The data were downloaded from the GEO database. Differentially expressed lncRNA and mRNA in the early, middle, and late stages of AD were screened. The targeted miRNA of lncRNA was predicted using the RegRNA web server. The targeted mRNA of miRNA was predicted using TargetScan, TargetMiner, and miRDB. DAVID was used for mRNA enrichment and KEGG pathway analyses. The resulting network was constructed using Cytoscape. Protein-protein interaction analysis of differentially expressed mRNA was performed. The key genes were identified using Cytoscape. Results Select LINC02047, LINC01124, LINC00582, LINC02478 from the pDEFs differentially expressed in the early, mid-late and late stages in the data set GSE28146. Predict the downstream target miRNA of the differential lncRNA, and then predict the downstream mRNA of the target miRNA and construct the lncRNA-miRNA-mRNA regulatory network of AD. Conclusion LINC02047, LINC01124, LINC02478 may influence the occurrence and development of AD through the regulation of miR-4060, miR-4090, miR-4786, miR-3612, miR-1254, and miR-132.

我国阿尔茨海默病(Alzheimer’s disease,AD)患者数量随着人口老龄化而不断增加[1]。AD是一种渐进性中枢神经退行性疾病,目前认为AD的主要致病机制有β-淀粉样蛋白(Aβ)生成增加、tau蛋白沉积、神经系统免疫炎症反应、氧化应激损伤、糖代谢异常等[2-3]。长链非编码RNA(long non-coding RNA,lncRNA)在神经退行性疾病中有重要作用,并可能通过竞争性结合微RNA(microRNA,miRNA)形成复杂的内源竞争RNA(competing endogenous RNA,ceRNA)调控网络,从而引发神经退行性疾病[4]

lncRNA是一组长度不小于200个核苷酸、没有明显编码蛋白潜能的非编码RNA(non-coding RNA,ncRNA)[1]。研究[2-4]表明,lncRNA在转录和转录后水平参与基因表达的调控,并具有明显的组织特异性、细胞特异性、时空特异性和发育阶段特异性,其变化和发育也与疾病状态有关,故在多种疾病的进展中起着关键作用。lncRNA有多种功能,细胞质中的lncRNA可以诱捕miRNA与之结合,通过ceRNA机制竞争性地结合miRNA来调节基因表达。[5]

1 材料与方法 1.1 筛选差异表达靶基因

从基因表达综合数据库(gene expression omnibus,GEO)(https://www.ncbi.nlm.nih.gov/geo/)中下载数据GSE28146,使用GEO数据库GEO2R以P < 0.05为条件分别筛选AD轻度组、中度组和重度组与正常对照组比较的差异基因(differentially expressed genes,DEGs),AD轻度组筛选出DEGs 2 612个,AD中度组筛选出DEGs 3 120个,AD重度组筛选出DEGs 3 187个。应用Venny 2.1.0 [Venny 2.1.0(csic.es)],取轻、中、重度组DEGs的交集为候选差异基因(candidate differentially expressed genes,pDEGs),在pDEGs中筛选差异表达的lncRNA进行后续分析。

1.2 lncRNA靶基因的预测及富集分析

利用在线分析工具RegRNA(http://regrna2.mbc.nctu.edu.tw/)预测lncRNA的靶基因。RegRNA是专门用来进行RNA功能性的motif预测网站,该网站预测内容包含转录motif、mRNA降解原件、RNA-RNA结合、翻译预测等功能。

1.3 预测lncRNA的亚细胞定位

应用lnclocater(http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/)和iLoc-mRNA(http://lin-group.cn/server/iLoc-mRNA/predictor.php)对lncRNA的亚细胞定位进行预测,找到lncRNA具体存在的细胞位置。

1.4 miRNA靶基因的预测

应用miRDB(https:/www.mirdb.org/)、TargetScan(https://www.targetscan.org/)和TargetMiner(https://www.isical.ac.in/~bioinfo_miu/final_html_targetminer/hsa-miR-1254.html)3个在线数据库预测mRNA的靶基因,并用Venny 2.1.0绘制韦恩图,将此3个数据库得到的靶基因与GSE28146数据集中轻、中、重度3组共有的表达上调的pDEGs取交集作为最后miRNA靶基因集合。将靶向基因集提交DAVID(https://david.ncifcrf.gov/tools.jsp)网站以P < 0.05为条件进行基因本体(gene ontology,GO)分析和PATHWAY分析。

1.5 ceRNA网络的构建及其富集分析

将靶向基因集提交DAVID(https://david.ncifcrf.gov/tools.jsp)网站以P < 0.05为条件进行GO富集分析分析和PATHWAY分析。使用Cytoscape(3.8.0版)绘制ceRNA网络,构建GSE28146数据集中pDEGs得蛋白质相互作用(protein-protein interaction,PPI)网络并用cytoscape找到其关键基因,与miRNA靶基因集合做交集,以确定ceRNA网络中的lncRNA在疾病中是否有关键作用,调控关键蛋白。

2 结果 2.1 共有差异lncRNA的筛选结果

AD轻度组筛选出DEGs 2 612个,中度组筛选出DEGs 3 120个,重度组筛选出DEGs 3 187个。为了筛选在AD中其关键作用的基因,取早中晚3组与正常相比异常的252个DEGs,然后从数据集GSE28146中早中晚差异表达的pDEGs中筛选出LINC02047LINC01124LINC00582LINC02478,均为表达上调基因。

2.2 lncRNA的亚细胞定位

为了分析这些差异lncRNA是否参与ceRNA竞争机制,利用lnclocater和iLoc-mRNA网站对其亚细胞定位进行分析,结果显示,LINC02047LINC01124LINC02478定位于细胞质,见表 1

表 1 亚细胞定位 Tab.1 Data of subcellular localization
lncRNA name Subcellular localization Score Site
LINC02047 cytoplasm 0.886 872 617 43 lnclocater
LINC01124 cytoplasm 0.636 895 332 326 lnclocater
LINC02478 cytoplasm 0.967 674 iLoc-mRNA

2.3 lncRNA靶基因的预测结果

RegRNA预测LINC02047的靶基因为hsa-miR-132-3pLINC011124的靶基因有4个,分别为hsa-miR-1254hsa-miR-4640-5phsa-miR-4690-3phsa-miR-4786-3PLINC02478的靶基因为hsa-miR-3612

2.4 miRNA靶基因的预测结果

使用数据库miRDB、TargetMiner和TargetScan分别预测hsa-mir-132-3phsa-mir-1254hsa-mir-3612hsa-mir-4640-5phsa-mir-4690-3phsa-mir-4786-3p的靶基因。其中hsa-mir-132-3p用在线韦恩图工具Venny 2.1.0可得到靶基因交集126个,占总数4.4%。hsa-mir-1254靶基因交集722个,占总数11.6%。hsa-mir-3612靶基因交集290个,占总数3.3%。hsa-mir-4640-5p靶基因交集231个,占总数的3.3%(图 1)。hsa-mir-4690-3p靶基因交集126个,占总数2.2%。hsa-mir-4786-3p靶基因交集234个,占总数的3.4%。再将3个数据库预测到的靶基因交集在与早中晚3组共有表达上调的pDEGs取交集,见表 2。GO富集分析及京都基因与基因组百科全书(Kyoto encyclopedia of genes,KEGG)通路分析结果见表 34

A, hsa-miR-132-3p; B, hsa-miR-1254; C, hsa-miR-4640-5p; D, hsa-miR-4690-3p; E, hsa-miR-4786-3p; F, hsa-miR-3612. 图 1 miRNA靶基因预测结果 Fig.1 Prediction results of miRNA target genes

表 2 miRNA靶基因预测结果与早中晚3组pDEGs的交集 Tab.2 Intersection of prediction results of miRNA target genes and early, middle, and late differentially expressed genes
miRNA name Name of mRNA intersection
hsa-miR-132-3p LIN28BCAPRIN1
hsa-miR-1254 TRIM37BCL2L1WASLCSNK1G3DLGAP2POLR2DHEMK1NMNAT2
hsa-miR-4640-5p THRB
hsa-miR-4690-3p STRBPSVOP
hsa-miR-4786-3p LGALSLHEMK1GLI3NR2F2
hsa-miR-3612 CSNK1G3NOS1UBE3AFBXO21

表 3 miRNA靶基因GO富集分析结果 Tab.3 Gene ontology enrichment analysis results of miRNA target genes
Type Notes n P
GOTERM_BP_DIRECT ovarian follicle development 2 0.02
GOTERM_BP_DIRECT fertilization 2 0.02
GOTERM_MF_DIRECT steroid hormone receptor activity 2 <0.05

表 4 miRNA靶基因KEGG通路分析结果 Tab.4 KEGG pathway analysis results of miRNA target genes
Type Notes Genes P
KEGG_PATHWAY Hedgehog signaling pathway CSNK1G3GLI3 0.03
KEGG_PATHWAY RNA polymerase POLR2D 0.04

2.5 构建ceRNA网络

将所得lncRNA、miRNA与mRNA在cytoscape3.8.0中绘制出ceRNA网络,共21条通路,30个节点,27条边。见图 2。构建PPI网络后经cytoscape hubba分析得分较高的基因与miRNA交集后得到了4个得分较高的关键基因,分别为NMNAT2DLGAP2SVOPUBE3A,得分分别为20 541、17 936、12 362和95。

The blue node represents lncRNA, the red node represents miRNA, the green node represents mRNA, the red line represents the downstream pathway of linc01124, the green line represents the downstream pathway of linc02047, and the blue line represents the downstream pathway of linc02478. 图 2 lncRNA、miRNA与mRNA组成的ceRNA网络 Fig.2 Competing endogenous RNA network composed of lncRNA, miRNA, and mRNA

3 讨论

AD是全球痴呆最常见的类型,全球约有4 000万人患有AD,并且患病率逐年上升[7-8]。lncRNA的DEGs已被证实与神经退行性疾病的发生发展有密切关系[9],但尚无在AD调控网络作用机制中针对lncRNA的差异表达研究。

为了寻找与AD相关的关键lncRNA,本研究选取了GEO数据库GSE28146,分析了其正常组织与各个时期AD病例组织中DEGs,筛选差异表达的lncRNA。其中,LINC02047LINC01124LINC02478在AD早期、中期和晚期的病理组织中均存在差异。为进一步探讨上述3种lncRNA在AD发病机制中起到的关键作用,本研究通过亚细胞定位确定了这3个lncRNA在细胞质中的表达,表明上述lncRNA可通过ceRNA机制调控基因表达参与AD发病。

RegRNA预测结果显示,lncRNA通过调控miRNA而影响神经退行性病变中的基因表达。LINC01124具有抑制细胞增殖、迁移和侵袭的能力[10];miR-132被证实是AD神经元中最显著下调的miRNA,miR-132可促进神经突起的延长和分支,减少神经元死亡[11];miR-1254通过与靶区的非结构位点结合也可以起到阻遏作用[12],以上结果揭示了ceRNA的部分调控关系,然而对于LINC01124LINC02478,miR-4060,miR-4090,miR-4786,miR-3612的分子机制及其如何作用于神经退行性病变,迄今尚无研究阐明。

基于lncRNA-miRNA-mRNA调控关系,本研究对各项功能节点的可信度进行了筛选,并对ceRNA的调控过程构建了可视化网络。基于David对ceRNA网络进行分析的结果,基因组整体展现了抑制细胞增殖、迁移和侵袭与类固醇激素受体的功能。

KEGG通路分析提示其参与Hedgehog信号通路。Hedgehog信号通路在人胚胎干细胞神经分化的d6~d14持续活化,而Sonic Hedgehog作为Hedgehog信号通路家族成员之一,对基底前脑胆碱能神经元(basal forebrain cholinergic neurons,BFCNs)的发育分化起到至关重要的作用[13]。BFCNs投射系统的退行性病变是导致AD患者出现空间认知功能障碍的主要原因[14]。枢纽基因NMNAT2的缺失可能会导致自发性的轴突变性,使轴突运输受阻,进而引发AD [15-17];Dlgap2和AD表型在变异、基因和蛋白质表达以及甲基化水平上存在关联[18];Ube3A的缺失触发Arc和Ephexin-5的积累,分别驱动GluR1的内化和RhoA的激活,最终导致突触的剪断被Ube3A的恢复所阻断[19];神经元表达转运蛋白SV2相关蛋白(SVOP和SVOPL)在调节胞吐中起到关键作用[20]

本研究利用生物信息学软件挖掘了各时期AD中共差异表达的lncRNA,并绘制了其与靶向miRNA、mRNA的ceRNA网络图。结果验证了部分已被阐明的AD作用机制,同时也发现了尚未得到充分研究且可能成为潜在药物靶点的重要lncRNA与miRNA。本研究基于临床样本数据,探寻各期AD存在的共同差异,构建了完整的ceRNA调控网络,为AD分子机制的深入研究提供了严谨的数据支持。

参考文献
[1]
杨浩池, 张海英, 张云霞, 等. 干细胞治疗阿尔兹海默病的研究现状[J]. 海南医学院学报, 2020, 26(11): 876-880. DOI:10.13210/j.cnki.jhmu.20200303.001
[2]
NASERI NN, WANG H, GUO J, et al. The complexity of tau in Alzheimer's disease[J]. Neurosci Lett, 2019, 705: 183-194. DOI:10.1016/j.neulet.2019.04.022
[3]
陈晓晗, 李澎, 许义新, 等. 睡眠节律紊乱导致阿尔兹海默病相关机制的研究进展[J]. 中国临床医学, 2020, 27(3): 520-523. DOI:10.12025/j.issn.1008-6358.2020.20191055
[4]
赵丽, 马慧, 孙艳. 竞争性内源性RNA在神经退行性疾病中作用的研究进展[J]. 癌变·畸变·突变, 2020, 32(3): 238-240. DOI:10.3969/j.issn.1004-616x.2020.03.015
[5]
SUN CB, FU YH, GU X, et al. Macrophage-enriched lncRNA RAPIA[J]. Arterioscler Thromb Vasc Biol, 2020, 40(6): 1464-1478. DOI:10.1161/atvbaha.119.313749
[6]
WANG J, CAO B, ZHAO H, et al. Long noncoding RNA H19 prevents neurogenesis in ischemic stroke through p53/Notch1 pathway[J]. Brain Res Bull, 2019, 150: 111-117. DOI:10.1016/j.brainresbull.2019.05.009
[7]
SELKOE DJ, HARDY J. The amyloid hypothesis of Alzheimer's disease at 25 years[J]. EMBO Mol Med, 2016, 8(6): 595-608. DOI:10.15252/emmm.201606210
[8]
KAMETANI F, HASEGAWA M. Reconsideration of amyloid hypothesis and tau hypothesis in Alzheimer's disease[J]. Front Neurosci, 2018, 12: 25. DOI:10.3389/fnins.2018.00025
[9]
张园青, 赵志英, 魏谢泽, 等. 阿尔兹海默病细胞模型中差异表达lncRNA筛选分析[J]. 包头医学院学报, 2019, 35(12): 42-44. DOI:10.16833/j.cnki.jbmc.2019.12.018
[10]
WANG ZB, ZHANG HY, LU JB. Expression and effects of long non-coding RNA, LINC01124, in non-small cell lung cancer[J]. Onco Targets Ther, 2019, 12: 11729-11736. DOI:10.2147/ott.s214049
[11]
EL FATIMY R, LI S, CHEN Z, et al. MicroRNA-132 provides neuroprotection for tauopathies via multiple signaling pathways[J]. Acta Neuropathol, 2018, 136(4): 537-555. DOI:10.1007/s00401-018-1880-5
[12]
LI G, WU X, QIAN W, et al. CCAR15' UTR as a natural miRancer of miR-1254 overrides tamoxifen resistance[J]. Cell Res, 2016, 26(6): 655-673. DOI:10.1038/cr.2016.32
[13]
李媛媛. 人胚胎干细胞神经分化的分子机制及其在神经退行性疾病中的应用[D]. 北京: 中国科学院大学, 2015. https://d.wanfangdata.com.cn/thesis/Y2962784
[14]
Ma S, Zang T, Liu ML, et al. Aging-relevant human basal forebrain cholinergic neurons as a cell model for Alzheimer's disease[J]. Molecu neurodegener, 2020, 15(1): 61. DOI:10.1186/s13024-020-00411-6
[15]
LORETO A, HILL CS, HEWITT VL, et al. Mitochondrial impairment activates the Wallerian pathway through depletion of NMNAT2 leading to SARM1-dependent axon degeneration[J]. Neurobiol Dis, 2020, 134: 104678. DOI:10.1016/j.nbd.2019.104678
[16]
SUMMERS DW, FREY E, WALKER LJ, et al. DLK activation synergizes with mitochondrial dysfunction to downregulate axon survival factors and promote SARM1-dependent axon degeneration[J]. Mol Neurobiol, 2020, 57(2): 1146-1158. DOI:10.1007/s12035-019-01796-2
[17]
VICARIO-ORRI E, OPAZO CM, MUÑOZ FJ. The pathophysiology of axonal transport in Alzheimer's disease[J]. J Alzheimers Dis, 2015, 43(4): 1097-1113. DOI:10.3233/jad-141080
[18]
OUELLETTE AR, NEUNER SM, DUMITRESCU L, et al. Cross-species analyses identify Dlgap2 as a regulator of age-related cognitive decline and Alzheimer's dementia[J]. Cell Rep, 2020, 32(9): 108091. DOI:10.1016/j.celrep.2020.108091
[19]
OLABARRIA M, PASINI S, CORONA C, et al. Dysfunction of the ubiquitin ligase E3A Ube3A/E6-AP contributes to synaptic pathology in Alzheimer's disease[J]. Commun Biol, 2019, 2: 111. DOI:10.1038/s42003-019-0350-5
[20]
YAO J, DE LA IGLESIA HO, BAJJALIEH SM. Loss of the SV2-like protein SVOP produces no apparent deficits in laboratory mice[J]. PLoS One, 2013, 8(7): e68215. DOI:10.1371/journal.pone.0068215