武汉大学学报(医学版)   2016, Vol. 37Issue (2): 223-227   DOI: 10.14188/j.1671-8852.2016.02.012.
0

引用本文 

马敏星, 王帆, 胡卫东, 柴多, 赵成茂, 赵秋, 李瑾. 对结肠癌中CD133相关基因及通路的生物信息学筛选[J]. 武汉大学学报(医学版), 2016, 37(2): 223-227. DOI: 10.14188/j.1671-8852.2016.02.012.
MA Minxing, WANG Fan, HU Weidong, CHAI Duo, ZHAO Chengmao, ZHAO Qiu, LI Jin. Bioinformatics Filter of CD133 Related Genes and Pathways in Colorectal Cancer[J]. Medical Journal of Wuhan University, 2016, 37(2): 223-227. DOI: 10.14188/j.1671-8852.2016.02.012.

作者简介

马敏星,男,1982-,医学硕士,主要从事胃肠道肿瘤研究

基金项目

国家自然科学基金青年基金资助项目(编号:210700130)

通讯作者

李瑾,女,1975-,主任医师, 博士生导师,主要从事炎症性肠病基础及临床研究

文章历史

收稿日期:2015-06-05
对结肠癌中CD133相关基因及通路的生物信息学筛选
马敏星 1,2, 王帆 1,2, 胡卫东 3, 柴多 4, 赵成茂 4, 赵秋 1,2, 李瑾 1,2     
1. 武汉大学中南医院消化内科 湖北 武汉 430071;
2. 湖北省肠病医学临床研究中心 & 肠病湖北省重点实验室 湖北 武汉 430071;
3. 武汉大学中南医院肿瘤科 湖北 武汉 430071;
4. 青海省第五人民医院肿瘤科 青海 西宁 810007
[摘要] 目的: 寻找与结肠癌干细胞表面标志物CD133表达密切相关的基因及其参与的生物过程。 方法: 通过生物信息学方法,利用GEO数据库中结肠癌基因芯片数据,结合R2平台,筛选出与CD133表达显著相关的基因,分析相关基因在不同性别、肿瘤原发部位及分期中的表达差异。同时,利用GO及KEGG工具对与CD133表达显著相关基因进行基因本体和KEGG通路分析。 结果: 130例结肠癌标本中126例检测出CD133表达,与CD133表达显著相关基因共598个(正相关504个,负相关94个),且正负相关性前7位基因的表达与患者性别、肿瘤原发部位及分期无明显关系(P>0.05)。对基因本体及KEGG通路分析后发现,598个相关基因参与O聚糖合成、鞘糖脂合成等多个肿瘤相关生物过程。 结论: CD133在结肠癌中普遍表达,CD133表达相关的基因参与了多个肿瘤生物过程,为深入研究结肠癌干细胞分子标志物相关基因及其参与的生物过程提供了一定参考。
关键词CD133    结肠癌干细胞    生物信息学    基因芯片    
Bioinformatics Filter of CD133 Related Genes and Pathways in Colorectal Cancer
MA Minxing1,2, WANG Fan1,2, HU Weidong3, CHAI Duo4, ZHAO Chengmao4, ZHAO Qiu1,2, LI Jin1,2     
1. Dept. of Gastroenterology, Zhongnan Hospital of Wuhan University, Wuhan 430071, China;
2. Hubei Clinical Center & Key Lab of Intestinal & Colorectal Diseases, Wuhan 430071, China;
3. Dept. of Oncology, Zhongnan Hospital of Wuhan University, Wuhan 430071, China;
4. Dept. of Gastroenterology, the Fifth People Hospital of Qinhai Province, Xining 810007, China
[Abstract] Objective: To search for genes and biological process which are closely related to expression of colon cancer stem cell marker CD133. Methods: By bioinformatics method, using GEO database colon cancer microarray data, combined with the R2 platform, to screen genes which are associated with a significant expression of CD133, and to observe different expression of related genes in different sex, the primary site and staging of tumor. Results: The expression of CD133 was found in 126 samples of 130 samples of colon cancer, and a total of 598 genes was significantly associated with CD133 expression (504 samples of positive, 94 samples of negative), and the expression of the top seven genes were not related to sex, tumor primary site and stage (P > 0.05). By the gene ontology and KEGG pathway analysis, 598 genes were found involved in multiple tumor related biological process of O-glycan synthesis, synthetic sheath glycolipids. Conclusion: CD133 common expression in the colon cancer, CD133 expression of related genes involved in multiple tumor biological process provide a certain reference for further research on colon cancer stem cells related genes and their molecular markers involved in biological processes.
Key words: CD133    Colorectal Cancer Stem Cells    Bioinformatic    Gene Microarray    

结肠癌是全球高发的恶性肿瘤之一。近年来,国内其发病率也呈现逐年上升趋势。O’Brien等研究发现CD133+的人结肠癌干细胞具有自我更新和分化、重建成结肠癌细胞群体的能力,极少量这种细胞就能分化成新的肿瘤细胞进而增殖形成肿瘤[1],提示CD133可能是结肠癌肿瘤干细胞的表面标志物之一[2],进而与结肠癌细胞耐药、复发、转移和预后相关。因此,对结肠癌细胞CD133相关基因及信号通路的研究,有助于结肠癌干细胞作用机制的研究,以及寻找结肠癌新的治疗靶点。

生物信息学是20世纪80年代末随着基因组测序数据迅猛增加而逐渐形成的一门交叉学科。利用基因芯片技术和生物信息学方法系统分析肿瘤相关基因及其调控机制,是当前功能基因组学的重要研究手段。本研究利用基因芯片分析平台R2对来自基因芯片公共数据库的结肠癌基因表达谱芯片数据分析,筛选出与CD133表达相关的基因,分析相关性基因与患者年龄、肿瘤原发部位、肿瘤分期的关系,同时对相关性基因进行本体和信号通路进行分析。

1 材料与方法 1.1 材料

本研究所用到的芯片数据平台是GPL570芯片平台(Affymetrix Human Genome U133 Plus 2.0 Array)。本研究涉及的GSE37892数据集由Olschwang等提交,包括130例结肠癌样本,GEO数据库登录号GSM929494-GSM929623。

1.2 方法 1.2.1 相关性基因筛选及临床相关性分析

利用R2平台(http://r2.amc.nl)提供的多种可视化应用程序,分析130例结肠癌标本中CD133的表达情况,筛选出与CD133表达显著相关的基因(P<0.01),分析不同年龄、肿瘤原发部位和肿瘤分期中,这些相关性基因的表达是否存在差异。涉及到的所有多组率的比较均采用单因素方差分析,两独立样本间比较采用两独立样本t检验分析比较目的基因表达水平,计量资料以“均数±标准差”表示,以P<0.01认为差异具有统计学意义。

1.2.2 相关性基因本体及通路分析

利用GO (Gene Ontology)工具(http://www.geneontology.org/)对CD133表达显著相关的基因进行分子功能、细胞定位及生物学过程分析,同时利用KEGG (Kyoto Encyclopedia of Genes and Genomes)工具(http://www.genome.jp/kegg/)对相关基因可能涉及的信号通路进行分析。

2 结果 2.1 CD133在所选数据集中的表达

在此数据集130例结肠癌样本中,126例样本测得CD133表达,平均表达值为1 117.6,CD133在此数据集中每个样本中的表达量,以2为底的对数值表示,样本顺序依据CD133表达值由低到高排列(图 1)。

图 1 CD133在数据集所有样本中的表达情况
2.2 CD133相关基因筛选

利用R2提供的可视化应用,对所有130例样本的基因芯片结果进行统计学分析,发现总共有598个基因的表达水平与CD133的表达水平存在显著性相关(P<0.01), 其中504个基因表现为正向相关,94个基因表现为负向相关。正负相关性前7位基因如表 1所示。

表 1 与CD133表达呈正向和负向相关基因

分别以性别、原发部位(分为左,右半结肠)、肿瘤分期(分为Ⅱ期、Ⅲ期)对130例结肠癌样本进行分组,分析正负相关性前7位的基因在各组中的表达情况。整体上,与CD133表达正相关的基因的表达水平高于负相关的基因,但这些相关基因的表达与性别、肿瘤原发部位以及肿瘤分期均无明显关系(P>0.05)(图 2)。

图 2 与CD133表达正、负相关性前7位的基因在不同年龄、原发部位和肿瘤分期各组中的表达情况
2.3 基因本体分析

对598个CD133表达相关基因进行GO本体富集分析,发现共555个基因涉及的43个GO通路(P<0.01),部分见表 3(颜色加深为负相关基因,其余为正相关基因)。这些基因主要涉及到O-聚糖生物过程、细胞迁移、膜组件、基底内外侧膜、高尔基体膜、磷脂代谢过程、脂质结合、清道夫受体活性、甘油磷脂合成、胆固醇平衡、蛋白质异寡聚化等细胞组成、分子功能及生物学过程。

表 2 CD133相关基因的GO本体分析
表 3 CD133相关基因的KEGG通路分析
2.4 KEGG通路分析

对598个CD133表达相关基因进行KEGG通路分析,发现共223个基因涉及的13个通路(P<0.01),见表 3。这些相关基因主要涉及到鞘糖脂生物合成、黏蛋白和O聚糖生物合成、胰液分泌、磷脂酰肌醇信号系统、醛固酮调节钠重吸收、矿物质吸收、鞘脂类代谢、甲状腺激素合成、癌症中胆碱代谢、胰岛素分泌等多种通路。

2.5 对比分析

在GO基因本体及KEGG通路分析中,与CD133表达相关的基因均与O型多聚糖生物合成通路显著相关,涉及基因均与CD133表达呈正相关,且均有GALNT3、GALNT6、GALNT7 GALNT12和GCNT1基因参与。

3 讨论

结肠癌是全球高发的恶性肿瘤之一。阐明结肠癌的发病机制,寻找根治结肠癌的特异性靶点,开发特异性靶向药物,增强基础放化疗,对结肠癌的治疗至关重要。寻找特异性的表面标记物并分选肿瘤干细胞, 是进一步研究肿瘤发生、转移、复发和预后的关键。CD133为细胞表面蛋白家族中的一员,在胃、脑、卵巢、前列腺等多种组织中被用来分离干细胞[3, 4],也作为结肠癌干细胞的特异表面标志被应用于实验研究[5]。通过对CD133表达存在相关性的基因进行筛选,并对CD133相关信号通路及其参与基因等进行统计分析,可以对完善结肠癌干细胞特异性标志具有一定参考价值,并且能对结肠癌干细胞恶性生物学行为的深入研究起到一定辅助作用。

本研究将筛选出所有130个样本中均有表达,且与CD133表达正负相关度最高的14个基因,在以性别、原发部位、肿瘤分期进行样本分类后进行上述基因表达情况对比,发现与肿瘤患者的性别、肿瘤原发部位以及肿瘤分期无明显相关性差别。至少很大程度上表明上述基因的表达贯穿肿瘤发病全程,不受上述条件相关因素影响或调控基因表达。表达与CD133存在正向相关的7个基因中,Granelli等[6]研究SEL1L基因(human Sel-1-like gene)与食管鳞状细胞癌的关系中发现, SEL1L在食管癌中表达上调, 从食管正常黏膜-不典型增生-食管癌的发展过中, SEL1L可能起一定的作用并可作为识别食管癌高风险患者的生物标记物。Colomba等[8]研究发现,Vav3在前列腺癌和乳腺癌中发挥重要作用,活化的Vav3可以促进肿瘤细胞的生长。上述两种基因由于其在结肠癌样本中高度表达,并与CD133表达高度相关,是否与结肠癌发病、演进、以及预后存在关系,是否可做为结肠癌干细胞特异性标志并成为诊断和治疗的靶点,有待进一步研究。Sada等[8]认为syk是一种候选抑癌基因,syk的表达缺失会致免疫细胞发育、成熟障碍,机体的免疫监测力下降,对突变、异常增生的细胞失去免疫力,从而导致肿瘤易发。然而在本研究中,发现其与CD133表达却呈明显正相关,其意义有待进一步研究。

表达与CD133存在负向相关的7个基因中,研究发现UVRAG (ultraviolet irradiation resistance-associated gene)过度表达可以抑制结肠癌细胞的增殖和成瘤[9],符合其与CD133表达情况呈负向相关表现,表明UVRAG是一个潜在的肿瘤抑制基因。PIK3CA在结直肠癌发生发展过程中具有重要作用,该基因突变产物能促进肿瘤的发生,并能增强肿瘤细胞的侵袭能力, 促进肿瘤的发生,并能增加肿瘤侵袭性[10],然而本研究中发现其与CD133表达却呈明显负向相关。

通过GO基因本体分析以及KEGG通路分析,发现CD133表达相关基因涉及多个肿瘤生物过程。

GO及KEGG分析均提示CD133表达相关基因与O型多聚糖生物合成通路显著相关,涉及基因均与CD133表达呈正相关,且均有GALNT3、GALNT6、GALNT7、GALNT12和GCNT1基因参与。GALNT3、GALNT6、GALNT7和GALNT12基因为多肽-N-乙酞氨基半乳糖转移酶(ppGalNAc-T)基因家族成员,此酶催化黏蛋白中O-聚糖合成的第一步,将UDP-GaINAc上的Ga1NAc基团转移至蛋白质多肽链上特定序列中的Thr或Ser,从而合成Ga1NAca1-O-Thr/Ser多肽。KEGG通路分析发现,与CD133表达最为相关通路为鞘糖脂生物合成、黏蛋白和O聚糖生物合成。黏蛋白在肿瘤细胞中肽链和糖链表达发生改变被认为是恶性转化的表观分子标志[11]。所有黏蛋白的结构共性是O-型糖基化,即N-乙酰半乳糖胺残基与丝氨酸、苏氨酸相连接。多项研究表明,黏蛋白家族与肿瘤的发生、演进和预后均具有密切联系,并且肿瘤细胞表面糖基异常化与肿瘤细胞的侵袭和转移有密切关系[12]。而上述鞘糖脂、黏蛋白及O聚糖均属于聚糖类,肿瘤细胞及其周围基质中的多种聚糖类物质参与肿瘤发展的重要环节, 包括细胞信号途径改变、细胞周期调节障碍、增生能力提高、获得侵袭能力、促进形成新生血管、产生免疫逃逸等。

综上所述,CD133在结肠癌中普遍表达,分析130个结肠癌标本后发现,598个与CD133表达相关的基因,这些基因参与了O聚糖合成、鞘糖脂合成等多个肿瘤相关生物过程,为深入研究结肠癌干细胞分子标志物相关基因及其参与的生物过程提供了一定参考。

参考文献
[1] O'Brien CA, Pollett A, Gallinger S, et al. A human colon cancer cell capable of initiating tumor growth in immunodeficient mice[J]. Nature, 2007, 445: 106-110. DOI: 10.1038/nature05372.
[2] Shi CJ, Cao J, Wang M, et al. CD133(+) gallbladder carcinoma cells, exhibit self-renewal ability and tumorigenicity[J]. World J Gastroenterol, 2011, 17(24): 2965-2971. DOI: 10.3748/wjg.v17.i24.2965.
[3] Bozzi F, Tamborini E, Pilotti S. The CD133 expression levels and its role as potential cancer stem cells marker in gastrointestinal stromal tumor[J]. Int J Cancer, 2012, 131: e849-e850. DOI: 10.1002/ijc.v131.5.
[4] Zhang J, Guo X, Chang DY, et al. CD133 expression associated with poor prognosis in ovarian cancer[J]. Mod Pathol, 2012, 25: 456-464. DOI: 10.1038/modpathol.2011.170.
[5] Yu L, Zhou L, Wu S, et al. Clinicopathological significance of cancer stem cells marked by CD133 and KAI1/CD82 expression in laryngeal squamous cell carcinoma[J]. World J Surg Oncol, 2014, 12: 118. DOI: 10.1186/1477-7819-12-118.
[6] Granelli P, Cattaneo M, Ferrero S, et al. SEL1L and squamous cell carcinoma of the esophagus[J]. Clin Cancer Res, 2004, 10: 5857-5861. DOI: 10.1158/1078-0432.CCR-04-0075.
[7] Colomba A, Courilleau D, Ramel D, et al. Activation of Rac1 and the exchange factor Vav3 are involved in NPM-ALK signaling in anaplastic large cell lymphomas[J]. Oncogene, 2008, 27: 2728-2736. DOI: 10.1038/sj.onc.1210921.
[8] Sada K, Takano T, Yanagi S, et al. Structure and function of Syk protein-tyrosine kinase[J]. Biochem, 2001, 130(2): 177-186. DOI: 10.1093/oxfordjournals.jbchem.a002970.
[9] Liang C, Feng P, Ku B, et al. Autophagic and tumour suppressor activity of anovel Beclinl-binding proteinUVRAG[J]. Nat Cell Biol, 2006, 8: 688-699. DOI: 10.1038/ncb1426.
[10] Jhawer M, Goel S, Wilson AJ, et al. PIK3CA mutation/PTEN expression status predicts response of colon cancer cells to the epidermal growth factor receptor inhibitor cetuximab[J]. Cancer Res, 2008, 68: 1953-1960. DOI: 10.1158/0008-5472.CAN-07-5659.
[11] Kufe DW. Mucins in cancer: function, prognosis and therapy[J]. Nat Rev Cancer, 2009, 9: 874-885. DOI: 10.1038/nrc2761.
[12] Shan SW, Fang L, Shatseva T, et al. Mature miR-17-5p and passenger miR-17-3p induce hepatocellular carcinoma by targeting PTEN, GalNT7 and vimentin in different signal pathways[J]. J Cell Sci, 2013, 126: 1517-1530. DOI: 10.1242/jcs.122895.