中国医科大学学报  2021, Vol. 50 Issue (5): 402-407

文章信息

刘经纬, 李浩, 任玲, 邢承忠
LIU Jingwei, LI Hao, REN Ling, XING Chengzhong
基于TCGA数据库分析富含丝氨酸/精氨酸剪接因子家族在不同癌症中的表达及其预后意义
Pan-cancer expression and prognostic analysis of serine/arginine-rich splicing factor expression by TCGA
中国医科大学学报, 2021, 50(5): 402-407
Journal of China Medical University, 2021, 50(5): 402-407

文章历史

收稿日期:2020-12-01
网络出版时间:2021-05-17 8:56
基于TCGA数据库分析富含丝氨酸/精氨酸剪接因子家族在不同癌症中的表达及其预后意义
刘经纬 , 李浩 , 任玲 , 邢承忠     
中国医科大学附属第一医院肛肠外科, 沈阳 110001
摘要目的 揭示不同类型癌症中富含丝氨酸/精氨酸剪接因子(SRSF)的整体表达及其对预后的作用。方法 从癌症基因组图谱数据库(TCGA)中下载患者SRSF表达和临床信息,分析33种癌症类型中SRSF基因家族的表达差异及预后价值。利用R语言分析SRSF基因表达、突变及其相关细胞信号通路。结果 SRSF在多种癌症中异常表达,并与G2/M检查点、DNA修复、IL-2/STAT5信号转导、缺氧和KRAS多种信号转导通路以及免疫细胞浸润密切相关。SRSF的异常表达与癌症患者的预后显著相关。结论 SRSF基因异常表达可以预测癌症的预后,其可能作为癌症潜在标志物。
Pan-cancer expression and prognostic analysis of serine/arginine-rich splicing factor expression by TCGA
Department of Anorectal Surgery, The First Hospital of China Medical University, Shenyang 110001, China
Abstract: Objective To reveal expression patterns of serine/arginine-rich splicing factor (SRSF) and their effect on prognosis in different types of cancer. Methods Patients' clinical information and SRSF expression data were downloaded from the Cancer Genome Atlas (TCGA). We analysed expression levels of SRSF family genes and their correlation with prognosis in 33 cancer types. R language was used to analyse SRSF gene expression, mutations, and related cell signaling pathways. Results SRSF is abnormally expressed in a variety of tumors, correlating with alterations in G2/M checkpoints, DNA repair, IL-2/STAT5 signaling, hypoxia, KRAS, and other signaling pathways, as well as immune cell infiltration. Abnormal expression of SRSF significantly correlates with prognosis in cancer patients. Conclusion Abnormal SRSF gene expression can predict prognosis in cancer patients, and may be a useful tumor marker.

作为调控基因表达的重要转录后调节因子,可变剪接可产生相同RNA的不同同工型,并表达产生多种功能蛋白[1]。约90%的人类基因经历选择性剪接事件,从而显著增强人类基因组的编码能力[2]。根据有关顺式作用元件或反式作用剪接因子的信息,机体通过选择性纳入外显子并排除内含子信息,组装成熟的mRNA[3]。反映转录组和蛋白质组的各种RNA亚型的多样性受到多个选择性剪接调节的严格控制,以确保在特定时间特定细胞中mRNA转录本正确表达[4]

研究[5]报道,与正常组织相比,癌组织中某些选择性剪接模式失调,这表明异常的RNA剪接是癌症的新标志。某些选择性剪接事件与癌症的增殖、侵袭和转移有关[6-7],如NUMB基因的长剪接变体可促进肝癌细胞的增殖、迁移和侵袭,而短剪接变体可抑制这些生物学行为,并在肝细胞癌中发挥相反作用[8]。在前列腺癌中,蛋白前体加工酶PACE4基因通过选择性剪接产生新的剪接变体PACE4-altCT,该剪接变体在前列腺癌中高度表达,并可诱导前列腺癌细胞持续增殖[9]

癌症中异常的可变剪接是由于癌症相关基因的剪接元件突变或调控性剪接机制改变[10]。富含丝氨酸/精氨酸剪接因子(serine/arginine-rich splicing factor,SRSF)家族成员在mRNA的周转、输出和其他剪接的各种转录后调控中必不可少[11-12]。SRSF蛋白通常包括C端精氨酸-丝氨酸重复序列的RS结构域和几个RNA识别基序。研究[13-14]报道,SRSF蛋白调控的剪接转录本在多种癌症中均表现出促癌作用。如SRSF1水平升高导致CASP9BIN1基因的选择性剪接,产生促癌RNA亚型,从而干扰各种癌细胞的凋亡[15]。另外,SRSF3上调可诱导MCL-1基因改变,编码在乳腺癌细胞中发挥抗凋亡作用的同工型MCL-1L转录产物。

了解癌变过程中异常的可变剪接,可以揭示癌症潜在的致病机制,这将有利于改善癌症患者的治疗和预后。本研究根据癌症基因组图谱(The Cancer Genome Atlas,TCGA)癌症样本的数据,对全部癌症中的SRSF家族进行了全面分析,通过对一系列癌症进行表达和预后分析,阐明SRSF在不同癌症的发生、预后和治疗中的作用。

1 材料与方法 1.1 数据收集

本研究分析的结果基于TCGA(http://cancergenome.nih.gov)生成的组学数据集。共分析33个不同的TCGA癌症类型。所有的TCGA数据,包括表达、突变和临床信息(生存状态、阶段、等级、生存时间),均从癌症数据浏览器UCSC Xena(https://xenabrowser.net)下载。

1.2 数据处理

首先分析不同癌症差异表达的SRSF基因。为确定与某些途径激活或抑制相关的SRSF基因,计算SRSF基因表达与途径活性之间的皮尔逊相关系数(Pearson correlation coefficient,PCC)。为探索SRSF基因与免疫相关基因之间的相关性,计算SRSF基因表达与免疫相关基因之间的Spearman相关系数(Spearman correlation coefficient,SCC)。为探究SRSF基因的表达是否与患者生存相关,根据每个SRSF基因的中位表达,将所有患者分为高表达和低表达2组,分析SRSF表达与患者预后的关系。

1.3 统计学分析

使用R语言Deseq2软件包鉴定差异表达的基因。在每种癌症类型中,将P < 0.05且表达至少变化2倍的基因鉴定为差异表达的基因。SRSF基因表达与通路之间的|PCC| > 0.3且调节后P < 0.05的调节子-通路被鉴定为与SRSF基因显著相关。SRSF基因表达与免疫相关基因之间的|SCC| > 0.3且调节后P < 0.05被鉴定为与SRSF基因显著相关。根据每个SRSF基因的中位表达,将所有患者分为高表达和低表达2组,2组生存率的比较采用log-rank检验。P < 0.05为差异有统计学意义。

2 结果 2.1 SRSF基因在不同癌症类型中的表达谱

使用TCGA的计数数据,描述基因在不同癌症类型中的差异表达。SRSF基因在不同癌症类型中表现出异质性分布(图 1A)。大多数SRSF在癌症中差异表达,并且在许多癌症中SRSF5表达下降。此外,本研究可视化SRSF12在每种癌症中的差异表达(图 1B)。

A,SRSF gene expression in different cancer and normal tissue samples;B,comparison of SRSF12 gene expression in 16 cancer types between cancerous and matched normal tissues. 图 1 不同癌症类型的SRSF基因表达谱 Fig.1 SRSF expression profile in different cancer types

2.2 SRSF基因的全癌基因变异

SRSF基因的突变频率分析结果表明,大多数SRSF基因在子宫内膜癌中经常发生突变(图 2A)。总体平均突变频率范围为0%~11.1%,包括SFSF11SRSF6SRSF5在内的SRSF基因具有较高的突变频率。为了显示有关SRSF突变的更多详细信息,本研究通过oncoplot可视化子宫内膜癌中SRSF基因的详情突变情况(图 2B)。

A,pan-cancer mutation frequency in SRSF genes;B,oncoplot for SRSF genes in uterine corpus endometrial carcinoma. 图 2 SRSF基因的全癌基因改变 Fig.2 Pan-cancer alterations in SRSF

2.3 SRSF与癌症免疫状态的相关性

SRSF与癌症相关通路关系的分析(图 3A)结果表明,SRSF表达与各种致癌途径的激活或抑制显著相关。说明SRSF基因主要参与癌症相关通路,包括G2/M检查点、DNA修复、白细胞介素-2(interleukin 2,IL-2)/信号转导及转录激活蛋白5(signal transducer and activator of transcription 5,STAT5)信号转导、缺氧和KRAS信号转导。总结每个基因的相关通路数,结果表明,SRSF1SRSF3SRSF9SRSF11更可能与致癌过程有关(图 3B)。

A,network diagram demonstrating interactions between SRSF genes and cancer-related pathways;B,number of interacting pathways with each individual SRSF gene. 图 3 SRSF基因与癌症相关途径和免疫状态的相关性 Fig.3 Associations of SRSF genes with cancer-related pathways and immune status

2.4 SRSF基因的预后意义

通过Cox回归分析SRSF基因在不同癌症类型中的预后意义(图 4A)。在包括肾上腺皮质癌和肝细胞癌在内的癌症中,大多数SRSF与癌症患者的生存期较差有关。相反,SRSF能够预测某些癌症如胸腺癌的预后较好。此外,某些SRSF基因如SRSF12SRSF1可能会在不同癌症类型中发挥明显的不同预后作用。因此,本研究通过森林图说明SRSF基因在不同癌症类型中特定的预测结果(图 4B)。

A,summary of correlations between expression of SRSF genes and survival of patients with different cancers;B,forest plot for prognostic analysis of SRSF1 and SRSF12 across various cancer types. 图 4 SRSF基因的预后意义 Fig.4 Prognostic values of SRSF genes

3 讨论

近年来,越来越多的证据表明,RNA选择性剪接调节因子可能充当癌基因或抑癌基因,通过产生关键途径的某些RNA亚型而导致癌症的发展。选择性剪接的异常调节是癌症发生的关键过程,并为多种癌症提供了潜在的、丰富的、新的治疗靶标和生物标志物。通过全面分析TCGA中SRSF基因家族数据,本研究探讨了不同癌症类型中SRSF的表达、突变及其对预后的影响。结果表明,SRSF基因家族与多种癌症的发生、发展和预后密切相关。

使用TCGA的数据,本研究描述了SRSF基因在不同癌症类型中的表达。SRSF在大多数癌症中存在差异表达,并且SRSF基因在不同癌症类型中表现出异质性分布,表明SRSF显著参与了癌症的发展。已有研究报道,与非癌组织相比,肺癌组织中SRSF5SRSF6SRSF7表达显著增加。SRSF5可能成为小细胞肺癌和胸膜转移癌新的生物标志物。在神经胶质瘤中,SRSF1可以与NEAT1相互作用,并促进NEAT1 RNA的稳定性,通过调节细胞周期参与神经胶质瘤的形成。此外,SRSF1SRSF9以mTOR基因依赖的模式,通过促进Wnt信号通路的关键调节因子β-catenin的生物合成来促进癌变。

突变分析结果提示,大多数SRSF基因在子宫内膜癌中经常发生突变。有研究提出,子宫内膜癌代表突变频率较高的癌症类型。包括SFSF11SRSF6SRSF5在内的SRSF基因具有较高的突变频率,结肠癌、宫颈鳞癌和腺癌、直肠癌等表现出明显的SRSF基因突变。

SRSF的表达与各种致癌途径的激活或抑制显著相关,包括G2/M检查点、DNA修复、IL-2/STAT5信号转导、缺氧和KRAS信号转导。因此,SRSF可能通过影响癌细胞的核心生物学过程(如DNA修复和细胞周期)来参与癌症的调控。SRSF基因中,SRSF1SRSF3SRSF9SRSF11更可能与致癌过程有关,这些SRSF基因在癌症中的作用可能成为未来新的研究方向。

本研究通过Cox回归分析了SRSF基因在不同癌症类型中的预后意义。多个SRSF基因都与癌症患者预后较差相关,但也存在一些SRSF与癌症预后较好相关,这提示SRSF在不同癌症中的作用可能存在差异。且同一SRSF基因也可能对不同癌症的预后作用不同,这提示SRSF发挥作用的复杂性。SRSF基因在预测癌症预后方面具有广阔的潜力。

综上所述,本研究系统证明了SRSF基因在一系列癌症中的表达、突变、功能通路和预后价值。SRSF的表达与致癌途径包括G2/M检查点、DNA修复、IL-2/STAT5信号转导、低氧和KRAS信号转导显著相关。通过评估SRSF基因状态可以预测癌症患者的预后。这些发现为未来改善癌症发展和治疗提供了新的证据。

参考文献
[1]
PARONETTO MP, PASSACANTILLI I, SETTE C. Alternative splicing and cell survival: from tissue homeostasis to disease[J]. Cell Death Differ, 2016, 23(12): 1919-1929. DOI:10.1038/cdd.2016.91
[2]
GALLEGO-PAEZ LM, BORDONE MC, LEOTE AC, et al. Alternative splicing: the pledge, the turn, and the prestige: the key role of alternative splicing in human biological systems[J]. Hum Genet, 2017, 136(9): 1015-1042. DOI:10.1007/s00439-017-1790-y
[3]
BARALLE FE, GIUDICE J. Alternative splicing as a regulator of development and tissue identity[J]. Nat Rev Mol Cell Biol, 2017, 18(7): 437-451. DOI:10.1038/nrm.2017.27
[4]
NAFTELBERG S, SCHOR IE, AST G, et al. Regulation of alternative splicing through coupling with transcription and chromatin structure[J]. Annu Rev Biochem, 2015, 84: 165-198. DOI:10.1146/annurev-biochem-060614-034242
[5]
BIAMONTI G, CATILLO M, PIGNATARO D, et al. The alternative splicing side of cancer[J]. Semin Cell Dev Biol, 2014, 32: 30-36. DOI:10.1016/j.semcdb.2014.03.016
[6]
MARZESE DM, MANUGHIAN-PETER AO. Alternative splicing and cancer metastasis: prognostic and therapeutic applications[J]. Clin Exp Metastasis, 2018, 35(5/6): 393-402. DOI:10.1007/s10585-018-9905-y
[7]
EL MARABTI E, YOUNIS I. The cancer spliceome: reprograming of alternative splicing in cancer[J]. Front Mol Biosci, 2018, 5: 80. DOI:10.3389/fmolb.2018.00080
[8]
LU Y, XU W, JI J, et al. Alternative splicing of the cell fate determinant Numb in hepatocellular carcinoma[J]. Hepatology, 2015, 62(4): 1122-1131. DOI:10.1002/hep.27923
[9]
COUTURE F, SABBAGH R, KWIATKOWSKA A, et al. PACE4 undergoes an oncogenic alternative splicing switch in cancer[J]. Cancer Res, 2017, 77(24): 6863-6879. DOI:10.1158/0008-5472.can-17-1397
[10]
LATORRE E, HARRIES LW. Splicing regulatory factors, ageing and age-related disease[J]. Ageing Res Rev, 2017, 36: 165-170. DOI:10.1016/j.arr.2017.04.004
[11]
LIU B, BOSSING T. Single neuron transcriptomics identify SRSF/SR protein B52 as a regulator of axon growth and choline acetyltransferase splicing[J]. Sci Rep, 2016, 6: 34952. DOI:10.1038/srep34952
[12]
WESOLOWSKI S, VERA D, WU W. SRSF shape analysis for sequencing data reveal new differentiating patterns[J]. Comput Biol Chem, 2017, 70: 56-64. DOI:10.1016/j.compbiolchem.2017.07.004
[13]
FU Y, HUANG B, SHI Z, et al. SRSF1 and SRSF9 RNA binding proteins promote Wnt signalling-mediated tumorigenesis by enhancing β-catenin biosynthesis[J]. EMBO Mol Med, 2013, 5(5): 737-750. DOI:10.1002/emmm.201202218
[14]
LONG Y, SOU WH, YUNG KWY, et al. Distinct mechanisms govern the phosphorylation of different SR protein splicing factors[J]. J Biol Chem, 2019, 294(4): 1312-1327. DOI:10.1074/jbc.RA118.003392
[15]
SHULTZ JC, GOEHE RW, MURUDKAR CS, et al. SRSF1 regulates the alternative splicing of caspase 9 via a novel intronic splicing enhancer affecting the chemotherapeutic sensitivity of non-small cell lung cancer cells[J]. Mol Cancer Res, 2011, 9(7): 889-900. DOI:10.1158/1541-7786.mcr-11-0061