中国医科大学学报  2023, Vol. 52 Issue (5): 413-419

文章信息

袁浩桐, 姜博文, 李真鹏, 井媛旭, 袁硕, 杨超
YUAN Haotong, JIANG Bowen, LI Zhenpeng, JING Yuanxu, YUAN Shuo, YANG Chao
基于生物信息学构建肝细胞癌预后相关circRNA-miRNA-mRNA调控网络
Construction of circRNA-miRNA-mRNA regulatory network related to liver cancer prognosis based on bioinformatics
中国医科大学学报, 2023, 52(5): 413-419
Journal of China Medical University, 2023, 52(5): 413-419

文章历史

收稿日期:2022-09-02
网络出版时间:2023-05-19 14:26:44
基于生物信息学构建肝细胞癌预后相关circRNA-miRNA-mRNA调控网络
袁浩桐1 , 姜博文1 , 李真鹏1 , 井媛旭1 , 袁硕1 , 杨超2     
1. 齐齐哈尔医学院口腔医学院,黑龙江 齐齐哈尔 161006;
2. 齐齐哈尔医学院医学技术学院生物化学教研室,黑龙江 齐齐哈尔 161006
摘要目的 应用生物信息学方法筛选肝细胞癌中差异表达的环状RNA(circRNA),构建肝癌预后相关circRNA-微RNA(miRNA)-mRNA调控网络。方法 从基因表达综合(GEO)数据库中下载肝癌相关circRNA数据集,应用GEO2R工具筛选差异表达circRNA,在Circular RNA Interactome及circBank数据库中预测与circRNA相结合的miRNA,在miRDB、RNAInter及TargetScan数据中预测miRNA的靶基因,构建circRNA-miRNA-mRNA调控网络。应用DAVID软件、STRING数据库、Cytoscape软件及GEPIA数据库对靶基因进行功能注释、通路分析、蛋白质-蛋白质相互作用网络(PPI)构建及预后分析,最后确定肝癌预后相关circRNA-miRNA-核心靶基因调控网络。结果 筛选出1个circRNA,为hsa_circRNA_0000301,与之结合的miRNA有4个,分别为hsa-miR-377-3p、hsa-miR-767-3p、hsa-miR-1178-3p及hsa-miR-1228-3p。功能注释和通路富集分析显示靶基因主要参与泛素依赖性蛋白质分解代谢等过程,且在MAPK等多个信号通路中显著富集。通过PPI网络及预后分析筛选出3个预后相关核心靶基因,分别为EIF4EPRKACBNRAS。最后构建出含有1个circRNA,2个miRNA,3个靶基因的肝癌预后相关调控网络。结论 本研究为深入挖掘肝癌发生的分子机制,寻找肝癌潜在的circRNA诊断标志物提供一定的研究依据。
关键词肝癌    环状RNA    微RNA    竞争性内源RNA    
Construction of circRNA-miRNA-mRNA regulatory network related to liver cancer prognosis based on bioinformatics
1. School of Stomatology, Qiqihar Medical University, Qiqihar 161006, China;
2. Department of Medical Technology, Qiqihar Medical University, Qiqihar 161006, China
Abstract: Objective To use bioinformatics methods to screen differentially expressed circle RNA (circRNA) in patients with hepatocellular carcinoma (HCC) and to construct a circRNA-microRNA (miRNA)-mRNA regulatory network related to the prognosis of HCC. Methods The HCC-related circRNA datasets were downloaded from the GEO database, differentially expressed circRNAs were screened using the GEO2R tool, and miRNAs bound to circRNAs were predicted in the circRNA Interactome and Circular Bank databases. Target genes of miRNAs were predicted in the miRDB, RNAInter, and TargetScan databases to construct circRNA-miRNA-mRNA regulatory networks. Functional annotation, pathway analysis, protein interaction network construction, and prognostic analysis were performed on target genes using DAVID software, STRING database, Cytoscape software, and GEPIA database, respectively. Finally, circRNA-miRNA-core target gene regulatory network related to liver cancer prognosis was determined. Results One circRNA, hsa_circRNA_0000301, was selected, and four miRNAs were identified: hsa-miR-377-3p, hsa-miR-767-3p, hsa-miR-1178-3p, and hsa-miR-1228-3p. Functional annotation and pathway enrichment analysis showed that target genes were mainly involved in ubiquitin-dependent protein catabolism and were significantly enriched in several signaling pathways, such as MAPK. Three prognostic related core target genes EIF4E, PRKACB, and NRAS were identified using PPI network and prognostic analysis. Finally, a prognostic regulatory network containing one circRNA, two miRNAs, and three target genes was constructed. Conclusion This study provides a basis for further exploration of the molecular mechanism of hepatocellular carcinoma and will guide the search for potential circRNA diagnostic markers for HCC.

肝癌是我国常见的恶性肿瘤之一,其病死率位居恶性肿瘤第3位[1]。肝细胞癌(hepatocellular carcinoma,HCC)是最常见的肝癌类型,约占肝癌的90%[2]。手术切除和肝移植是肝癌患者的根治性疗法,但术后转移及复发风险高,预后极差[3]。因此,深入探究肝癌发病机制,积极寻找肝癌早期分子标志物,对提高肝癌的预后有重要意义。

环状RNA(circle RNA,circRNA)是一类特殊的非编码RNA分子,首尾相接形成闭合的圆环,不易被RNA酶降解,被认为是有潜力的生物标志物[4]。circRNA可通过竞争性内源RNA(competitive endogenous RNA,ceRNA)机制,影响肝癌的发生和发展。HUANG等[5]发现circRNA_104348可通过吸附miR-187-3p,上调靶基因RTKN2的表达,促进肝癌细胞的增殖和迁移。但circRNA在肝癌中的研究仍处于初级阶段,有待进一步探讨[6]

本研究基于基因表达综合(Gene Expression Omnibus,GEO)数据库中下载的数据集GSE97332和GSE164803,筛选出肝癌相关差异表达circRNA,并构建肝癌预后相关ceRNA调控网络,为深入挖掘肝癌发生的分子机制,寻找肝癌潜在的circRNA诊断标志物提供一定的研究依据。

1 材料与方法 1.1 HCC芯片数据的收集

HCC相关circRNA表达谱数据下载自GEO数据库(http://www.ncbi.nlm.gov/geo/)。数据集GSE97332包括7例HCC样本和7例肝正常组织样本,芯片平台为GPL19978;GSE164803包括6例HCC样本和6例肝正常组织样本,芯片平台同为GPL19978。

1.2 HCC相关差异表达circRNA的筛选

采用GEO2R在线工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/),以校正后的P < 0.05、|log2FC| > 2为标准,筛选数据集GSE97332及GSE164803中的差异表达circRNA,交集分析得到共差异表达circRNA。

1.3 预测与circRNA相结合的微RNA(microRNA,miRNA)

分别在Circular RNA Interactome(https://circinteractome.nia.nih.gov/)与circBank(http://www.circbank.cn)数据库中预测与共差异表达circRNA相结合的miRNA,所得结果取交集作为后续研究的miRNA。

1.4 构建circRNA-miRNA-mRNA网络

分别在miRDB(http://mirdb.org/)、RNAInter(https://www.rna-society.org/rnainter/)、Targetscan(http://www.targetscan.org/)数据库中预测miRNA的下游靶基因mRNA。交集分析确定miRNA最终调控基因。依据ceRNA理论构建circRNA-miRNA-mRNA网络,并用Cytoscape3.7.2软件(http://www.cytoscape.org/)将网络可视化展示。

1.5 靶基因功能富集分析和通路富集分析

利用DAVID数据库(https://david.ncifcrf.gov/)对筛选出的靶基因进行基因本体(Gene Ontology,GO)功能富集分析和京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,富集标准为P < 0.01,基因数 > 10。

1.6 构建靶基因蛋白质-蛋白质相互作用网络(protein-protein interaction networks,PPI)并筛选核心基因

在STRING数据库(https://string-db.org/)中查询靶基因的蛋白质互作信息,以PPI combined score > 0.4为阈值条件,在Cytoscape3.7.2软件中构建PPI网络,应用CytoHubba插件中的Degree算法,选择前10位基因作为核心基因。

1.7 核心基因生存分析

应用基于基因表达水平值的交互式分析平台(Gene Expression Profiling Interactive Analysis,GEPIA)对核心靶基因进行生存分析,肿瘤类型选择“liver hepatocellular carcinoma,LIHC”,检测核心基因的表达对肝癌患者总生存率的影响,P < 0.05为差异有统计学意义。

2 结果 2.1 筛选HCC差异表达circRNA

应用GEO2R对HCC相关circRNA数据集进行差异表达circRNA筛选,以校正后P < 0.05,|log2FC| > 2为标准,从GSE97332中得到147个差异表达的circRNA,其中,上调97个,下调50个(图 1A);从GSE164803中得到67个差异表达的circRNA,其中,上调22个,下调45个(图 1B),将2组数据取交集仅得到1个共差异表达circRNA:hsa_circRNA_0000301,将其作为后续研究对象。

A, GSE97332;B, GSE164803. 图 1 GSE97332与GSE164803差异表达circRNA火山图 Fig.1 Volcano map of differentially expressed circRNAs in GSE97332 and GSE164803

2.2 构建HCC相关circRNA-miRNA-mRNA调控网络

采用生物信息学软件Circular RNA Interactome及circBank来预测与hsa_circRNA_0000301结合的miRNA,结果显示,通过Circular RNA Interactome得到8个与hsa_circRNA_0000301互作的miRNA,通过circBank得到26个与hsa_circRNA_0000301互作的miRNA(表 1),交集分析得到4个miRNA,即hsa-miR-377-3p、hsa-miR-767-3p、hsa-miR-1178-3p及hsa-miR-1228-3p。

表 1 生物信息学预测与hsa_circRNA_0000301相结合的miRNA Tab.1 Bioinformatics prediction of miRNAs associated with hsa_circRNA_0000301
Bioinformatics prediction tool miRNA
Circular RNA Interactome hsa-miR-1178,hsa-miR-1228,hsa-miR-370,hsa-miR-377
hsa-miR-487a,hsa-miR-600,hsa-miR-626,hsa-miR-767-3p
CircBank hsa-miR-377-3p,hsa-miR-342-3p,hsa-miR-329-3p,hsa-miR-362-3p,hsa-miR-603,hsa-miR-8485,
hsa-miR-1228-3p,hsa-miR-4789-3p,hsa-miR-1178-3p,hsa-miR-6893-3p,hsa-miR-6719-3p,
hsa-miR-6730-3p,hsa-miR-767-3p,hsa-miR-181a-2-3p,hsa-miR-216b-3p,hsa-miR-466,
hsa-miR-4789-5p,hsa-miR-888-3p,hsa-miR-3074-5p,hsa-miR-3667-3p,hsa-miR-4269,
hsa-miR-5582-5p,hsa-miR-6083,hsa-miR-628-5p,hsa-miR-6509-3p,hsa-miR-6773-3p

采用miRDB、RNAInter、TargetScan数据库预测上述4个miRNA的靶基因,交集分析确定miRNA最终调控基因。结果显示,hsa-miR-377-3p的靶基因有296个,hsa-miR-767-3p的靶基因有260个,hsa-miR-1178-3p的靶基因有154个,hsa-miR-1228-3p的靶基因有144个(图 2)。将4个miRNA的靶基因汇总去重后,最终得到813个靶基因。采用Cytoscape软件构建肝癌相关circRNA-miRNA-mRNA调控网络图。网络中包含1个circRNA节点、4个miRNA节点、813个mRNA节点和858条边。

A, target genes of hsa-miR-377-3p;B, target genes of hsa-miR-767-3p;C, target genes of hsa-miR-1178-3p;D, target genes of hsa-miR-1228-3p. 图 2 应用miRDB、RNAInter、TargetScan数据库预测miRNA的靶基因 Fig.2 Target genes of miRNAs were predicted using miRDB, RNAInter, and TargetScan databases

2.3 靶基因功能富集分析

应用DAVID数据库对与813个靶基因进行GO功能和KEGG通路富集分析。GO分析结果显示,有15个生物学过程存在富集,主要包括RNA聚合酶Ⅱ启动子的转录正调控、泛素依赖性蛋白质分解代谢过程、细胞对缺氧的反应等;10个细胞组分存在富集,主要有突触后膜、双细胞的紧密连接、核内体等;13个分子功能存在富集,主要有蛋白激酶结合、序列特异性DNA结合、RNA聚合酶Ⅱ核心启动子近端区域序列特异性DNA结合等(图 3)。KEGG分析结果显示,hsa_circRNA_0000301在6个通路中富集,包括与肝癌发生密切相关的MAPK信号通路、FoxO信号通路、Wnt信号通路等(图 4)。

图 3 GO功能富集结果 Fig.3 Gene ontology enrichment analysis results

图 4 KEGG通路富集分析结果 Fig.4 Results of KEGG pathway enrichment analysis

2.4 筛选核心靶基因

在STRING数据库中查询813个靶基因的蛋白质互作关系,构建PPI网络,应用Cytoscape中的CytoHubba插件,筛选出的10个核心基因为EGFRSTAT3SMAD2HIF1AMTOREIF4ENR3C1PRKACBNRASCHD4

2.5 核心靶基因生存分析

应用GEPIA数据库查询核心基因与肝癌患者预后的关系,结果显示,EIF4EPRKACBNRAS这3个基因高表达患者的总生存率均明显低于低表达患者,差异有统计学意义(P < 0.05),其他7个基因对肝癌患者总生存率的影响不显著(图 5)。

A, EGFR; B, STAT3; C, SMAD2; D, HIF1A; E, MTOR; F, EIF4E; G, NR3C1; H, PRKACB; I, NRAS; J, CHD4. 图 5 核心基因生存分析曲线 Fig.5 Survival analysis curves of core genes

2.6 构建HCC预后相关circRNA-miRNA-核心靶基因调控网络

在cytoscape软件中构建HCC预后相关circRNA-miRNA-核心靶基因调控网络,网络由1个circRNA节点、2个miRNA节点、3个预后相关核心靶基因节点组成(图 6)。

The red circle represents a circRNA, yellow diamonds represent miRNAs, and green triangles represent mRNAs. 图 6 HCC预后相关circRNA-miRNA-核心靶基因网络图 Fig.6 Network of circRNA-miRNA-core target genes related to the prognosis of HCC

3 讨论

肝癌具有难诊断、难治疗、易转移、易复发等临床特点[7],除早期可进行手术切除和肝移植外,几乎无根治性治疗方法。因此,深入探讨肝癌发病机制,寻找肝癌新的特异性生物靶点,实现早期诊断和治疗尤为重要。circRNA由于其自身性质稳定、表达具有时空特异性等天然优势,具有成为肿瘤生物标志物的先天条件[8]。近来研究[9]表明,circRNA在肝癌等多种癌症中异常表达,通过ceRNA机制吸附miRNA参与肿瘤的发生发展。

本研究通过对数据集GSE97332和GSE164803进行差异表达分析,筛选出1个circRNA:hsa_circRNA_0000301,提示该circRNA在HCC中具有一定的特异性。研究[10]表明,circRNA_0000301位于11号染色体上,其亲本基因为SPL1,circRNA_0000301参与乳腺癌的发生发展,但其在肝癌中的作用尚不清楚。进一步预测出与circRNA_0000301相结合的miRNA及下游靶基因,并构建ceRNA网络图。应用DAVID数据库对靶基因进行GO和KEGG功能富集分析,最后通过PPI网络及预后分析筛选出3个预后相关核心靶基因,分别为EIF4EPRKACBNRAS,并构建出circRNA-miRNA-核心靶基因调控网络。

GO分析结果显示,靶基因在RNA聚合酶Ⅱ启动子的转录正调控、泛素依赖性蛋白质分解代谢过程等功能存在富集。研究[11-13]表明,泛素介导的蛋白水解在肿瘤发生中发挥重要作用,如参与调节细胞周期进展、肿瘤转移等。KEGG分析结果表明靶基因可能在与HCC发生密切相关的MAPK信号通路、FoxO信号通路、Wnt信号通路中发挥作用。细胞内信号通路的失调可引起细胞增殖与凋亡异常,导致细胞癌变的发生[14]

研究[15]表明,EIF4E基因编码在真核翻译起始中起关键作用的蛋白分子,EIF4E的高表达可诱导细胞周期、细胞生长和血管生成等相关蛋白的表达上调,影响癌症的发生发展。据报道[16]EIF4E在HCC样本中表达升高,且与患者的不良预后相关,可作为肝癌患者的独立预后指标。PRKACB基因编码cAMP依赖性蛋白激酶催化亚单位β,该蛋白是丝氨酸/苏氨酸蛋白激酶家族成员之一,可调控细胞增殖、分化等多种细胞进程,参与肿瘤的生长及转移。YE等[17]研究发现,miR-302可靶向PRKACB抑制肝癌细胞的增殖和迁移。NRAS基因编码的N-Ras蛋白参与RAS/MAPK信号通路,调控细胞生长、增殖等过程。索拉菲尼是肝癌治疗的一线药物,研究[18]发现,NRAS在索拉菲尼耐药的肝癌细胞中显著高表达,敲除NRAS后可增强拉索菲尼对耐药细胞的治疗效果。

综上所述,本研究由生物信息学方法筛选出的3个HCC预后相关基因均在HCC的发生发展中发挥重要作用。本研究首次发现了可能与HCC发生密切相关的circRNA(hsa_circRNA_0000301),并构建出与HCC预后相关的circRNA-miRNA-核心靶基因ceRNA调控网络,为进一步挖掘肝癌发生的分子机制,寻找HCC潜在的circRNA诊断标志物提供一定的研究依据。

参考文献
[1]
TORRE LA, BRAY F, SIEGEL RL, et al. Global cancer statistics, 2012[J]. CA A Cancer J Clin, 2015, 65(2): 87-108. DOI:10.3322/caac.21262
[2]
BRAY F, FERLAY J, SOERJOMATARAM I, et al. Global cancer statistics 2018:globocan estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA A Cancer J Clin, 2018, 68(6): 394-424. DOI:10.3322/caac.21492
[3]
中华人民共和国国家卫生健康委员会医政医管局. 原发性肝癌诊疗指南(2022年版)[J]. 中国实用外科杂志, 2022, 42(3): 241-273. DOI:10.19538/j.cjps.issn1005-2208.2022.03.01
[4]
GARLAPATI P, LING JJ, CHIAO PJ, et al. Circular RNAs regulate cancer-related signaling pathways and serve as potential diagnostic biomarkers for human cancers[J]. Cancer Cell Int, 2021, 21(1): 317. DOI:10.1186/s12935-021-02017-4
[5]
HUANG GQ, LIANG M, LIU HY, et al. CircRNA hsa_circRNA_104348 promotes hepatocellular carcinoma progression through modulating miR-187-3p/RTKN2 axis and activating Wnt/β-catenin pathway[J]. Cell Death Dis, 2020, 11(12): 1065. DOI:10.1038/s41419-020-03276-1
[6]
YAO RZ, ZOU HF, LIAO WJ. Prospect of circular RNA in hepatocellular carcinoma: a novel potential biomarker and therapeutic target[J]. Front Oncol, 2018, 8: 332. DOI:10.3389/fonc.2018.00332
[7]
SHI LX, PENG F, TAO YG, et al. Roles of long noncoding RNAs in hepatocellular carcinoma[J]. Virus Res, 2016, 223: 131-139. DOI:10.1016/j.virusres.2016.06.008
[8]
常绪生, 韩廷, 康争春, 等. 基于GEO数据库胃癌差异表达环状RNA及其功能与通路研究[J]. 临床军医杂志, 2019, 47(12): 1298-1302. DOI:10.16680/j.1671-3826.2019.12.07
[9]
陈彦豪, 张艳玲. circRNA在肿瘤中的研究进展[J]. 现代肿瘤医学, 2022, 30(2): 346-351. DOI:10.3969/j.issn.1672-4992.2022.02.037
[10]
DENG ZM, DAI FF, ZHOU Q, et al. Hsa_circ_0000301 facilitates the progression of cervical cancer by targeting miR-1228-3p/IRF4 Axis[J]. BMC Cancer, 2021, 21(1): 583. DOI:10.1186/s12885-021-08331-4
[11]
杨义力. 蛋白质泛素化系统[J]. 生命科学, 2002, 14(5): 279-282. DOI:10.3969/j.issn.1004-0374.2002.05.007
[12]
丁祺, 宋旭东. 泛素化/去泛素化系统介导的蛋白质降解与肿瘤关系的研究[J]. 中国医药指南, 2009, 7(9): 46-49. DOI:10.3969/j.issn.1671-8194.2009.09.023
[13]
申香玉, 史磊, 申远. 泛素特异性蛋白酶在肿瘤发生发展中的作用[J]. 生命的化学, 2021, 41(4): 693-706. DOI:10.13488/j.smhx.20200545
[14]
DELIRE B, STÄRKEL P. The Ras/MAPK pathway and hepatocarcinoma: pathogenesis and therapeutic implications[J]. Eur J Clin Invest, 2015, 45(6): 609-623. DOI:10.1111/eci.12441
[15]
GRAFF JR, KONICEK BW, CARTER JH, et al. Targeting the eukaryotic translation initiation factor 4E for cancer therapy[J]. Cancer Res, 2008, 68(3): 631-634. DOI:10.1158/0008-5472.can-07-5635
[16]
JIANG XM, YU XN, HUANG RZ, et al. Prognostic significance of eukaryotic initiation factor 4E in hepatocellular carcinoma[J]. J Cancer Res Clin Oncol, 2016, 142(11): 2309-2317. DOI:10.1007/s00432-016-2232-2
[17]
YE Y, SONG YN, ZHUANG JH, et al. MicroRNA-302a-3p suppresses hepatocellular carcinoma progression by inhibiting proliferation and invasion[J]. Oncotargets Ther, 2018, 11: 8175-8184. DOI:10.2147/OTT.S167162
[18]
DIETRICH P, GAZA A, WORMSER L, et al. Neuroblastoma RAS viral oncogene homolog (NRAS) is a novel prognostic marker and contributes to sorafenib resistance in hepatocellular carcinoma[J]. Neoplasia, 2019, 21(3): 257-268. DOI:10.1016/j.neo.2018.11.011