中国医科大学学报  2022, Vol. 51 Issue (8): 683-687

文章信息

马小雯, 杨巍, 郝靓
MA Xiaowen, YANG Wei, HAO Liang
基于生物信息学分析FAM110A在乳腺癌中的表达及临床意义
Bioinformational analysis of FAM110A expression and significance in breast cancer
中国医科大学学报, 2022, 51(8): 683-687
Journal of China Medical University, 2022, 51(8): 683-687

文章历史

收稿日期:2021-10-19
网络出版时间:2022-07-13 13:47
基于生物信息学分析FAM110A在乳腺癌中的表达及临床意义
马小雯1,2,3,4 , 杨巍5 , 郝靓1,2,3     
1. 中国医科大学法医学院化学教研室, 沈阳 110122;
2. 辽宁省法医学生物证据重点实验室, 沈阳 110122;
3. 中国医科大学司法鉴定中心, 沈阳 110122;
4. 中国医科大学临床二系, 沈阳 110122;
5. 辽宁省健康产业集团本钢总医院感染部, 辽宁 本溪 117000
摘要目的 基于多数据库探讨FAM110A在乳腺癌中的表达及临床意义。方法 通过Oncomine数据库和GEPIA网站对FAM110A mRNA表达进行泛癌分析。采用Oncomine数据库和UALCAN数据库对FAM110A在乳腺癌中的表达进行分析。采用GEPIA分析FAM110A表达水平与患者生存预后的关系。基于HPA数据库探讨FAM110A基因在肿瘤组织中的表达情况及定位。采用cBioportal和STRING数据库分析互作蛋白构建共表达分子调控网络。采用DAVID网站对FAM110A的共表达分子进行基因本体论(GO)及京都基因和基因组(KEGG)富集分析。结果 在乳腺癌中FAM110A的表达显著上升(P<0.05), 且与临床分期相关(F=2.84, P<0.05)。FAM110A高表达的乳腺癌患者预后不良(P<0.05)。GO和KEGG富集分析结果显示, FAM110A的共表达基因主要参与DNA转录调控和泛素介导的蛋白质水解等通路。结论 FAM110A在乳腺癌中的表达高于正常组织, 高表达患者预后不良, FAM110A的表达与乳腺癌肿瘤分化水平有关。
关键词乳腺癌    FAM110A    生物信息学    
Bioinformational analysis of FAM110A expression and significance in breast cancer
MA Xiaowen1,2,3,4 , YANG Wei5 , HAO Liang1,2,3     
1. Department of Chemistry, School of Forensic Medicine, China Medical University, Shenyang 110122, China;
2. Liaoning Province Key Laboratory of Forensic Bio-evidence Sciences, Shenyang 110122, China;
3. Center of Forensic Investigation, China Medical University, Shenyang 110122, China;
4. Second Department of Clinical Medicine, China Medical University, Shenyang 110122, China;
5. Department of Infection, Benxi Steel General Hospital of Liaoning Health Industry Group, Benxi 117000, China
Abstract: Objective To analyze the expression difference and clinical significance of FAM110A in breast cancer based on several databases. Methods We used Oncomine and GEPIA to explore the mRNA expression of FAM110A gene in several cancers. We chose the Oncomine and UALCAN databases to analyze the expression of FAM110A gene in breast cancer. The GEPIA was employed to discuss the relevance between FAM110A expression and survival prognosis by investigating the expression and localization of the FAM110A gene in tumor tissues based on the HPA database. The cBioportal and STRING databases were used to search for co-expressed genes of FAM110A in human breast cancer tissues and to construct a co-expressed gene network. We adopted the DAVID platform to analyze the co-expressed genes of FAM110A with GO and KEGG. Results The expression of FAM110A in breast cancer was higher than that in normal tissues(P<0.05), and its expression level was related to clinical stage(F=2.84, P<0.05). The prognosis of breast cancer patients who highly expressed FAM110A were poor(P<0.05). The GO cluster and KEGG pathway enrichment analysis showed that the FAM110A co-expressed genes were mainly involved in regulating DNA template transcription and ubiquitin mediated protein hydrolysis pathway, etc. Conclusion The expression of FAM110A in breast cancer is higher than that in normal tissues, and the prognosis of patients with high FAM110A expression is poor. This suggests that FAM110A expression is associated with a degree of tumor differentiation.
Keywords: breast cancer    FAM110A    bioinformatics    

乳腺癌是全球发病率最高的癌症。2020年公布的全球癌症数据显示,乳腺癌新发病例高达226万例[1]。乳腺癌的早期症状多不明显,进展迅速,晚期可发生远端转移,直接威胁患者生命。浸润型乳腺癌是乳腺肿瘤中高发的类型,其分化程度低,预后差,以浸润性导管癌最为常见[2]。目前,虽然乳腺癌得到了广泛研究,但发病机制仍不明确。

FAM110A定位于20号染色体的短臂。2007年,HAUGE在运用酵母双杂交方法筛选参与细胞周期进程的中心体、微管相关蛋白的实验中首次发现了FAM110家族蛋白。FAM110家族有3个成员定位于中心体,协助细胞周期的进展并参与微管的组织[3]。FAM110A的表达受到细胞周期的调控,与肝癌和前列腺癌的发生发展相关[4-5]。目前FAM110A在乳腺癌中鲜有研究,其作用机制尚不明确。本研究利用多种数据库进行数据挖掘,分析FAM110A在乳腺癌中的表达及对预后的影响,为进一步研究FAM110A在乳腺癌发生发展中的作用机制和治疗提供线索和依据。

1 材料与方法 1.1 数据来源

1.1.1 Oncomine数据库的数据提取和分析

在Onco-mine数据库(https://www.oncomine.org/resource/login.html) 中根据本研究的需求设定筛选条件。(1) Gene:FAM110A;(2) Analysis type:cancer vs normal analysis;(3) Cancer type:breast cancer;(4) Data type:All;(5) P<0.01,fold change >2,gene rank=top10%。

1.1.2 GEPIA数据库的数据提取及患者预后分析

利用GEPIA数据库(http://gepia.cancer-pku.cn/detail.php) 对FAM110A的表达与分期和预后的关系进行预测。设置分期筛选条件为(1) Gene:FAM110A;(2) Datasets selection:BRCA;(3) Log Scale:yes。设置预后筛选条件为(1) Gene:FAM110A;(2) Methods:Overall Survival;(3) Group cutoff:median;(4) Hazards ratio:yes;(5) 95% confidence interval:yes;(6) Axis units:months。

1.1.3 UALCAN数据库的数据提取和分析

利用UALCAN数据库(http://ualcan.path.uab.edu/) 补充验证FAM110A在肿瘤不同分期、不同分子分型中的表达差异,并探究FAM110A表达与基因甲基化水平的关系。设置筛选条件为(1) Enter gene symbol:FAM110A;(2) TCGA dataset:Breast invasive carcinoma;(3) Links for analysis:Expression;(4) based on:individual cancer stages/major subclasses。

1.1.4 标本来源

利用人类蛋白图谱(human protein atlas,HPA) 数据库(https://www.proteinatlas.org/) 获取FAM110A在乳腺癌组织和正常组织中的免疫组织化学染色图片。

1.1.5 蛋白-蛋白相互作用网络分析

通过STRING数据库(https://www.string-db.org/) 预测FAM110A相互作用蛋白。

1.1.6 共表达基因聚类分析及分子调控网络构建

从cBioPortal平台(http://www.cbioportal.org/) 获取TCGA数据库中FAM110A在乳腺癌中的共表达基因,然后运用DAVID数据库(https://david.ncifcrf.gov/) 对相关度较高的基因进行基因本体论(gene ontology,GO) 及京都基因和基因组(Kyoto encyclopedia of gene and genomes,KEGG) 富集分析。采用STRING数据库构建共表达分子调控网络,利用Cytoscape中的Cytohubba插件计算共表达分子网络中节点连接度,选取连接度最高的10个节点。

1.2 统计学分析

采用GraphPad Prism 9软件行统计学分析,采用t检验统计乳腺癌与正常组织之间FAM110A的表达差异。FAM110A不同病理分期间的表达差异比较采用单因素方差分析。采用Kaplan-Meier法进行生存分析,组间生存率采用log-rank检验,P<0.05为差异有统计学意义。

2 结果 2.1 FAM110A在所有肿瘤中的表达

根据设置的筛选条件,Oncomine数据库共有205项涉及FAM110A在不同肿瘤与正常组织比较的研究结果。其中10项研究有统计学意义。FAM110A在所有肿瘤中8项呈高表达,2项低表达。在乳腺癌中6项呈高表达。在GEPIA数据库中FAM110A在11种肿瘤组织中呈显著高表达。见图 1

图 1 FAM110A在所有肿瘤中的表达 Fig.1 Expression of FAM110A in all cancer types

2.2 FAM110A在乳腺癌中高表达

按照筛选条件检索GEPIA数据库,结果显示,乳腺癌组织与正常组织相比,其FAM110A表达显著上调,差异有统计学意义(P<0.05),见图 2A

A, expression of FAM110A in breast cancer in GEPIA; B, FAM110A protein expression in tissues; C, FAM110A is related to the cell cycle. *P<0.05. 图 2 FAM110A在乳腺癌中高表达 Fig.2 FAM110A is highly expressed in breast cancer

检索HPA数据库,共得到3例FAM110A正常乳腺组织样本中的免疫组织化学图片,12例乳腺癌组织样本中的免疫组织化学图片(图 2B)。乳腺癌样本中FAM110A呈高表达。在细胞内,FAM110A高表达于G2、S期,表达水平与细胞周期密切相关(图 2C)。

2.3 FAM110A在不同分子分型乳腺癌中的表达情况

利用UALCAN数据库针对乳腺癌的分子分型进行在线分析。结果显示,与正常组织相比,FAM110A在Luminal、HER(2+)、三阴性乳腺癌中的表达量均呈高表达(P均<0.05)。且除去Luminal与HER(2+)之外,各个分型之间FAM110A表达量差异均有统计学意义,见图 3

图 3 FAM110A在不同分型乳腺癌中表达水平 Fig.3 Expression of FAM110A in different types of breast cancer

2.4 FAM110A的表达与预后的相关性

运用GEPIA分析FAM110A表达水平与乳腺癌患者预后的关系,结果显示,FAM110A高表达组总生存期(overall survival,OS) 劣于低表达组(HR=1.4,P=0.043),见图 4A。在GEPIA数据库中在线分析FAM110A表达与乳腺癌分期的关系,结果显示,不同分期之间FAM110A的表达差异有统计学意义(F=2.84,P=0.023 3),见图 4B。利用UALCAN数据库在线分析得到相似结果。

A, patients expressing high FAM110A have a low overall survival rate; B, expression of FAM110A correlates positively with a tumor stage in GEPIA. 图 4 FAM110A高表达提示不良预后 Fig.4 High level of FAM110A expression is associated with poor prognosis

2.5 FAM110A共表达网络的构建及功能分析

运用STRING数据库得到FAM110A蛋白-蛋白相互作用网络图,富集P值为0.028 9,与FAM110A存在相互作用的蛋白节点有10个,分别为FAM19A1、SMIM13、CSPP1、GPANK1、IL9、ANKRD9、ZDHHC18、TMEM132D、FAM135B和KCTD3(图 5)。检索cBioportal数据库,乳腺癌中FAM110A的共表达基因共有20 033个(P均<0.05)。相关度最高的10个基因为MRPS26PPDPFSNRPBNSFL1CSLC2A4RGSCAND1ITPAMRPL41ARRDC1RBCK1。GO富集分析结果显示,FAM110A的共表达基因主要参与DNA模板转录调控,线粒体平移延伸等生物途径。KEGG通路富集分析结果显示,FAM110A的共表达基因主要参与泛素介导的蛋白质水解,癌症的中心碳代谢等通路。

图 5 FAM110A共表达分子网络 Fig.5 Co-expressed network of FAM110A

3 讨论

乳腺癌是起源于乳腺上皮组织的恶性肿瘤,发病率居全球女性恶性肿瘤的首位。其预后较好,患者生存率相对较高[6]。目前,乳腺癌主要根据临床病理和分子分型进行治疗,但三阴性乳腺癌和难治性多发耐药乳腺癌仍缺乏有效的治疗靶点[7]。因此,寻找乳腺癌的新治疗靶点和预后标志物对于乳腺癌的临床治疗极为重要。

FAM110A是FAM110家族成员,作为中心体相关蛋白,参与细胞周期调控[3]。有研究[4]表明,FAM110A的高表达与肝癌的发生和较差预后相关,但其在乳腺癌中的研究较少。本研究利用多种数据库分析FAM110A在乳腺癌中的表达水平及意义。

对Oncomine数据库中16项对比FAM110A在乳腺癌和正常组织中表达差异的研究进行分析,结果显示,FAM110A在乳腺肿瘤中呈高表达,可能诱导乳腺肿瘤的发生。FAM110A在不同分型乳腺癌中表达有统计学差异,可作为乳腺癌分型的标志物。分析HPA数据库中FAM110A的免疫组化结果,乳腺癌中FAM110A的表达高,定位于核质、胞质及囊泡中,高表达于S期和G2期。这与HAUGE等[3]研究结果一致。

GEPIA数据库分析结果显示,FAM110A随着乳腺癌分期的进展表达量显著上升,高表达的患者预后更差。甲基化是DNA的一种表观遗传修饰,对基因表达有影响。乳腺癌组织中FAM110A基因甲基化水平显著降低,提示甲基化修饰可能是上调FAM110A在乳腺癌中表达的重要因素。

STRING数据库分析结果显示,FAM110A可能与ANKRD9、FAM135B、CSPP1等分子存在相互作用。ANKRD9是一种E3泛素连接酶,通过蛋白酶体途径发挥抑癌作用[8]。FAM135B是一种细胞周期调控蛋白,可以正调控下游PI3K/Akt/mTOR通路[9]。有丝分裂相关蛋白CSPP1通过对于动点微管动态性的调节介导染色体的运动,保证有丝分裂的准确性[10]。FAM110A可与上述蛋白互作影响肿瘤发生。随后构建乳腺癌中FAM110A的共表达基因调控网络,通过研究关键节点的功能推断共表达基因网络参与的重要生物学途径。其中MRPL14作为连接度最高的节点,已被证实与乳腺癌相关[11-12]

本研究对于FAM110A的共表达基因进行功能分析,探究其参与的生物途径及通路。GO富集分析结果显示,FAM110A的共表达基因主要参与DNA模板转录调控等生物途径。KEGG通路富集分析结果显示,FAM110A的共表达基因主要参与泛素介导的蛋白水解等通路。

综上所述,FAM110A在乳腺癌中呈高表达,且在不同分型乳腺癌中有统计学差异。FAM110A的表达水平与患者预后呈负相关,与分期呈正相关,可作为新的乳腺癌预后标志物。目前对于FAM110A在乳腺癌中作用机制的研究仍较少。本研究初步预测了FAM110A参与的生物途径及信号通路,为乳腺癌的诊治及机制研究提供了思路。

参考文献
[1]
SUNG H, FERLAY J, SIEGEL RL, et al. Global cancer statistics 2020:globocan estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249. DOI:10.3322/caac.21660
[2]
杨文涛, 步宏. 第5版WHO乳腺肿瘤分类解读[J]. 中华病理学杂志, 2020, 49(5): 400-405. DOI:10.3760/cma.j.cn112151-20200303-00163
[3]
HAUGE H, PATZKE S, AASHEIM HC. Characterization of the FAM110 gene family[J]. Genomics, 2007, 90(1): 14-27. DOI:10.1016/j.ygeno.2007.03.002
[4]
萧正康, 马丹丹, 李中虎, 等. 肝癌组织FAM110A表达临床意义的数据库资料分析[J]. 中华肿瘤防治杂志, 2021, 28(3): 196-204, 222. DOI:10.16073/j.cnki.cjcpt.2021.03.05
[5]
TSURUTA H, VERHAEGH GW, SCHALKEN JA. mp31-13 the expression and function of fam110a in human prostate cancer[J]. J Urol, 2014, 191(4): e327. DOI:10.1016/j.juro.2014.02.922
[6]
陈万青, 郑荣寿. 中国女性乳腺癌发病死亡和生存状况[J]. 中国肿瘤临床, 2015, 42(13): 668-674.
[7]
中国抗癌协会乳腺癌诊治指南与规范(2019年版)[J]. 中国癌症杂志, 2019, 29(8): 609-680.
[8]
LEE YJ, LIM B, LEE SW, et al. ANKRD9 is associated with tumor suppression as a substrate receptor subunit of ubiquitin ligase[J]. Biochim Biophys Acta Mol Basis Dis, 2018, 1864(10): 3145-3153. DOI:10.1016/j.bbadis.2018.07.001
[9]
BI LW, WANG HJ, TIAN Y. Silencing FAM135B enhances radiosensitivity of esophageal carcinoma cell[J]. Gene, 2021, 772: 145358. DOI:10.1016/j.gene.2020.145358
[10]
朱丽娟. 动点蛋白CSPP1和Bubin的功能研究[D]. 合肥: 中国科学技术大学, 2014.
[11]
KIM TW, KIM B, KIM JH, et al. Nuclear-encoded mitochondrial MTO1 and MRPL41 are regulated in an opposite epigenetic mode based on estrogen receptor status in breast cancer[J]. BMC Cancer, 2013, 13: 502. DOI:10.1186/1471-2407-13-502
[12]
KIM MJ, YOO YA, KIM HJ, et al. Mitochondrial ribosomal protein L41 mediates serum starvation-induced cell-cycle arrest through an increase of p21(WAF1/CIP1)[J]. Biochem Biophys Res Commun, 2005, 338(2): 1179-1184. DOI:10.1016/j.bbrc.2005.10.064