吉林大学学报(医学版)  2016, Vol. 42 Issue (06): 1263-1266

扩展功能

文章信息

鲁有望, 王昆华
二代测序技术在结直肠癌基因组测序中应用的研究进展
Progress research on application of next-generation sequencing techniques in colorectal cancer genome
吉林大学学报(医学版), 2016, 42(06): 1263-1266
Journal of Jilin University (Medicine Edition), 2016, 42(06): 1263-1266
10.13481/j.1671-587x.20160642

文章历史

收稿日期: 2016-05-01
二代测序技术在结直肠癌基因组测序中应用的研究进展
鲁有望1, 王昆华1,2,3     
1. 昆明理工大学医学院疾病与药物遗传实验室, 云南 昆明 650500;
2. 昆明医科大学第一附属医院胃肠与疝外科, 云南 昆明 650500;
3. 昆明医科大学第一附属医院消化病研究所, 云南 昆明 650500
[摘要]: 二代测序技术在结直肠癌(CRC)领域中的应用已经越来越广泛。根据测序目的的不同,二代测序技术主要分为全基因组测序、全外显子测序、转录组测序和靶向深度测序等。本文简要概述了这几种二代测序技术在CRC基因组研究中的应用。
关键词二代测序     结直肠肿瘤     基因组     体细胞突变    
Progress research on application of next-generation sequencing techniques in colorectal cancer genome

结直肠癌(colorectal cancer,CRC)是全球第3位最常见的肿瘤,第4位致死肿瘤[1]。CRC的发生发展是一个遗传和表观遗传改变积累的过程[2],CRC中经常出现APC、BRAF、KRAS、PIK3CA和TP53等基因的体细胞突变,可驱动CRC的发生发展。此外,有些抑癌基因启动子区的CpG岛超甲基化能够导致自身失活,与遗传机制共同作用引起CRC发生的主要信号通路发生改变。全面了解CRC发生发展过程中出现的遗传和表观遗传变异,对于CRC的预防和治疗具有重要意义。2006年Sjöblom等[3]采用一代测序技术对11份CRC样本的120 839个外显子进行测序,发现了1 307个体细胞突变,该研究结果对进一步研究CRC基因组具有非常重要的意义。然而,CRC基因组研究真正的突破来自于二代测序技术。利用二代测序读取初始人类基因组的时间从最初的13年降低至2周。测序技术的这场革命翻开了CRC研究的新篇章。

1 二代测序技术分析CRC基因组

二代测序仪能以一个高度平行的方式同时检测数十亿条片段化的DNA,采用多次读取DNA片段的方式以弥补读取大量碱基测序中出现的高错误率,可准确测定体细胞突变及等位基因在二倍体序列中的多态性。多次读取也是因为多数感兴趣的突变等位基因频率较低。理想状态下,给定测序错误率,能检测的突变频率与测序深度之间呈二项分布关系[4]。肿瘤样本几乎均含有正常组织,同时单个肿瘤中可能存在多个携带不同遗传变异的肿瘤亚克隆[5],这些因素均会导致检测肿瘤组织中低频突变时需要更高的测序深度。此外,即使在相同的组织类型中,肿瘤的发病机制也是异质的。了解致病突变的全谱可能需要对多个肿瘤样本进行测序。

CRC的发病机制存在差异,而这种差异会反映在其突变谱上。因此有必要对大量CRC样本进行测序以找到更多与CRC相关的基因突变。由于目前二代测序成本相对较高,同时CRC临床样本获取困难,导致进行测序研究的样本量有限,而未来二代测序数据的共享和测序成本的降低将有效解决这个问题。

1.1 全基因组测序技术分析CRC基因组

全基因组测序是通过PCR扩增出片段化基因组DNA,最低限度处理后直接进行二代测序。这种方法尽管操作简单却能提供全部的遗传信息。与其他的测序方法比较,该方法主要的缺陷是数据分析成本高、时间长和占用更多的计算机资源。

除富含GC序列外,全基因组测序能均匀覆盖所有的基因组区域,并捕获发生在编码和非编码区的突变,包括启动子、增强子、内含子和非编码RNA及基因间序列。这些基因调控序列通常具有重要的生物学功能[6]。全基因组测序可以检测肿瘤基因组中所有类型的变异,包括点突变、小片段缺失和插入、拷贝数改变以及染色体结构变异。一些由染色体易位引起的基因融合在CRC的发生发展过程中具有重要作用,但是目前除全基因组测序外,尚无其他方法可用于系统性检测染色体易位。Bass等[7]对9例CRC患者进行全基因组测序发现了VTI1A-TCF7L2基因融合。另外,Yu等[8]也利用该技术发现了LACTB2-NCOA2基因融合。

全基因组测序也可用在全基因组范围内筛选病因未明的家族性CRC的致病突变。Palles等[9]对15例家族性CRC患者的研究发现:与DNA聚合酶相关的2个基因POLE和POLD1种系突变与CRC的易感性相关。Yamaguchi等[10]对家族性腺瘤性息肉病患者外周血进行全基因组测序,检测到APC基因上存在非同义突变c.3175G>T。

90%CRC患者死于肿瘤转移,故全基因组测序也被用于CRC转移研究。Xie等[11]对原发与相应转移肿瘤进行全基因测序发现:ESR1、FBXW7、DCLK1、PHF6和FAT2可能参与CRC细胞转移过程。Shanmugam等[12]对CRC转移灶进行全基因测序发现INPPL1可作为潜在的药物靶标。

1.2 全外显子测序技术分析CRC基因组

由于全基因组测序成本相对较高,靶向总的基因组 < 1.3%的整个编码序列的全外显子测序现已广泛用于肿瘤基因组测序。其通过将目标序列的范围降低到整个基因组的百分之一,用相当少的序列数据能获得更高的序列覆盖度,从而提高测序的准确率。

与全基因组测序比较,全外显子测序需要对外显子区域进行靶向富集,该步骤会增加额外费用。同时,由于仅检测外显子区域,在全基因组上覆盖不均,无法检测融合基因并且导致检测其他结构变异的灵敏度下降。另一方面,全外显子测序覆盖度高、成本低,高通量分析多个样品时检测低频突变的灵敏度高。全外显子测序为全基因组测序提供了合理的替代方案,更加受到研究者的青睐并被多项CRC测序研究所采用。

全外显子测序在CRC研究中主要用于确定一些回复性突变。Cancer Genome Atlas N[13]对276份CRC样本进行外显子组测序发现了ARID1A、SOX9和FAM123B等高频突变。除了用于CRC中高频突变研究,该技术也被用于与CRC相关低频突变的鉴定。

在家族性CRC研究中,Esteban-Jurado等[14]对43例家族性CRC患者全外显子测序结果显示:CDKN1B、XRCC4、EPHX1、NFKBIZ、SMARCA4和BARD1这些低频突变(0~0.1%)可能与CRC易感性相关。Weren等[15]对51例家族性CRC患者测序发现碱基切除修复基因NTHL1种系突变与CRC易感性相关。Gylfe等[16]对96例家族性CRC患者行全外显子测序研究发现11个基因上的截断突变与CRC易感性相关。

散发性CRC全外显子测序中,Hansen等[17]对14例CRC患者测序发现POLE突变与CRC的发生相关。Nikolaev等[18]对24例结肠癌患者测序发现:APC、CTNNB1或BRAF基因突变是结肠癌发生的早期事件。Smith等[19]对50例CRC患者测序发现:抑癌基因FANCM、LAMB4、LAMC3、PTCHD3和TREX2突变与CRC易感性相关。Gala等[20]对20例无蒂锯齿状腺瘤患者测序发现:5例患者中调节衰老相关基因存在突变。Yu等[21]对22例结直肠患者测序发现:CDH10、COL6A3、SMAD4、TMEM132D和VCAN基因突变可作为CRC的预后标记。

1.3 转录组测序技术分析CRC基因组

转录组测序(RNA sequencing,RNA-seq)能定量基因表达谱,检测选择性剪切变体、RNA编辑及新的融合转录本。全外显子测序的主要缺点是不能检测基因融合,而低成本的转录组测序可以部分弥补该不足。转录组测序能有效检测生物相关融合基因并且可以直接确定表达融合转录物的精确序列。Seshagiri等[22]对CRC样本进行RNA测序,确定了R-spondin基因融合。Wu等[23]对3例CRC患者测序,鉴定出PRTEN-NOTCH2基因融合。Nome等[24]则采用该技术在7个CRC细胞系中确定了AKAP13-PDE8A、COMMD10-AP3S1和CTB-35F21.1-PSD2基因融合。此外RNA-seq也可用于检测CRC体细胞突变及检测基因表达量和鉴定差异表达基因,采用RNA-seq已发现了肿瘤中一些重要的回复性突变如BCL6[25]。Slattery等[26]分析144例结肠癌的RNA-seq数据发现:结肠组织基因差异表达与饮食、生活方式及氧化应激相关,其又对另外一组175例结肠癌患者的RNA-seq数据分析发现1 138个基因表达上调,695个基因表达下调。Liu等[25]对Wu等[23]的测序数据进行再分析发现:胞外基质受体反应通路和黏着斑信号通路在CRC和癌旁组织中有差异表达,而细胞程序性死亡负调控相关基因差异表达只出现在肿瘤组织中。

1.4 靶向深度测序技术分析CRC基因组

靶向深度测序的目的片段一般较短,所以可以得到很高的测序深度。尽管化学测序固有的背景错误率会阻止进一步检测更低频率的突变,但靶向深度测序能够灵敏地检测到1%的低频突变。对于CRC的靶向深度测序研究根据研究对象不同分为两个方向:原发肿瘤的深度测序和转移肿瘤的深度测序。

原发肿瘤深度测序主要是通过二代测序技术检测这些突变的效应和这些突变与疾病预后之间的关系,其靶标基因一般是与临床相关的生物标记,常用KRAS或者联合检测该信号通路中多个基因KRAS、BRAF和PIK3CA[27]。Lipson等[28]对40份CRC样本中145个肿瘤相关基因外显子和15份CRC样本中常发生重排的基因内含子深度测序发现:C2orf44-ALK基因融合。此外,还发现了21个基因存在突变,其中TP53和APC突变在80.0 %及67.5%的患者中可以被检测到。Kraus等[29]采用二代测序技术在152例CRC患者中对18个CRC相关基因进行测序发现:在23例患者中存在基因种系突变,证明该技术可很好地用于家族性CRC的筛查和鉴定。Bai等[30]在91例直肠癌样本中对45个肿瘤相关基因的737个突变热点区域测序发现:75例患者中存在KRAS (58.2%)、TP53(28.6%)、APC (16.5%)、PIK3CA (14.3%)、FBXW7(9.9%)和NRAS (9.9%)的突变以及SMAD4(3.3%)、BRAF (2.2%)、CTNNB1(1.1%)和ERBB2 (1.1%)上的低频突变。Zhang等[31]在22例直肠癌样本中对46个肿瘤相关基因进行AmpliSeq发现:KRAS、TP53、APC、KIT、MET、ATM、SMAD4、BRAF、FBXW7、NRAS和PTEN等基因突变。Ciardiello等[32]对182例CRC转移患者中22个肿瘤相关基因测序发现:TP53(39.6%)、KRAS exons 3/4(8.8%)、NRAS exons 2/3 (7.1%)、PIK3CA exons 9/20 (13.2%)和BRAF (8.2%)等基因突变。

在临床中,肿瘤一旦发生转移,可能患者将不进行手术,导致转移样本很难获取,一般采用原发肿瘤进行测序。因而对比这些生物标记在原发与转移肿瘤之间的突变谱具有重要意义,这也是转移肿瘤深度测序的重要研究方向。这些生物标记物在两者间的一致性程度在不同的研究[33]中得到的结论不尽一致。研究者采用专门设计的基因panel对原发与转移肿瘤进行测序比较二者之间差异。Vignot等[34]对13例CRC组织和其相应转移组织中189个肿瘤相关基因测序发现:原发和转移肿瘤上有78%的突变一致,而在12个已知回复突变上一致性达到90%。Brannon等[35]对69例CRC及其相应转移组织中230个肿瘤相关基因进行深度测序(平均深度为692X),发现原发肿瘤与相应转移灶之间突变谱高度相似。Kogita等[36]在2例CRC患者中采取多区域取样方法,对799个肿瘤相关基因进行深度测序,发现了类似结果。因此,用原发肿瘤可以预测转移肿瘤上的突变谱。然而对原发肿瘤和相应转移灶中的333个基因进行深度测序(平均深度为250X)发现:原发肿瘤与相应转移肿瘤之间突变谱存在很大差异[37]

1.5 其他测序技术技术分析CRC基因组

CRC的发生除遗传因素外,表观遗传因素也参与其中。研究者针对CRC基因组甲基化异常,对二代测序技术做出改进,开发出了亚硫酸氢盐测序。该技术采用亚硫酸氢盐处理DNA样本后再进行测序。由于亚硫酸氢盐处理以后,DNA上无甲基化的C碱基会被转化成U碱基,而甲基化的C碱基不会发生改变。将测序结果与参考基因组比对即可得到基因组中的甲基化相关信息。Ashktorab等[38]采用该技术对6例CRC样本的甲基化进行分析发现:在肿瘤组织中ATXN7L1、BMP3、EID3、GAS7、GPR75和TNFAIP2甲基化水平明显高于正常组织。Hansen等[39]则在CRC中鉴定出肿瘤特异性DNA差异甲基化区域。

微小RNA (microRNA,miRNA)是由19-23nt核苷酸所组成的单链非编码RNA,能在转录后水平调控基因表达,进而参与CRC发生发展的多个过程,成为新近研究的热点。sRNA测序(sRNA-seq)技术先对总RNA中的小RNA进行扩增,对扩增产物纯化后测序。测序结果在MirBASE数据库中进行比对,找出差异表达的sRNA。

2 展望

随着测序成本的不断降低,在未来几年内二代测序技术将普遍应用于CRC研究。研究者将会发现更多与CRC疾病进程相关的基因突变,这些新发现的突变在肿瘤发生发展中的分子机制及其生物学和临床意义尚待进一步研究。目前二代测序技术集中于研究原发肿瘤,未来将会更多地运用于转移肿瘤的研究。瘤内异质性是肿瘤治疗过程中必须面对的问题,采用二代测序技术分析CRC瘤内异质性将成为未来研究的热点。二代测序会产生巨大的数据,对于数据处理提出了极高的要求,越来越多的数据处理软件将会涌现。由于二代测序读长较短导致后续生物信息学分析困难,第3代单细胞测序技术读长更长并且能在单细胞水平分析基因之间的相互作用,这将是未来CRC研究的有力工具。

参考文献
[1] Siegel R, DeSantis C, Jemal A. Colorectal cancer statistics, 2014[J]. CA, 2014, 64(2): 104–117.
[2] Fearon ER, Vogelstein B. A genetic model for colorectal tumorigenesis[J]. Cell, 1990, 61(5): 759–767. DOI:10.1016/0092-8674(90)90186-I
[3] Sjǒblom T, Jones S, Wood LD, et al. The consensus coding sequences of human breast and colorectal cancers[J]. Science, 2006, 314(5797): 268–274. DOI:10.1126/science.1133427
[4] Cibulskis K, Lawrence MS, Carter SL, et al. Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples[J]. Nat Biotechnol, 2013, 31(3): 213–219. DOI:10.1038/nbt.2514
[5] Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing[J]. N Engl J Med, 2012, 366(10): 883–892. DOI:10.1056/NEJMoa1113205
[6] Consortium EP. An integrated encyclopedia of DNA elements in the human genome[J]. Nature, 2012, 489(7414): 57–74. DOI:10.1038/nature11247
[7] Bass AJ, Lawrence MS, Brace LE, et al. Genomic sequencing of colorectal adenocarcinomas identifies a recurrent VTI1A-TCF7L2 fusion[J]. Nat Genet, 2011, 43(10): 964–968. DOI:10.1038/ng.936
[8] Yu J, Wu WK, Liang Q, et al. Disruption of NCOA2 by recurrent fusion with LACTB2 in colorectal cancer[J]. Oncogene, 2016, 35(2): 187–195. DOI:10.1038/onc.2015.72
[9] Palles C, Cazier JB, Howarth KM, et al. Germline mutations affecting the proofreading domains of POLE and POLD1 predispose to colorectal adenomas and carcinomas[J]. Nat Genet, 2013, 45(2): 136–144.
[10] Yamaguchi K, Komura M, Yamaguchi R, et al. Detection of APC mosaicism by next-generation sequencing in an FAP patient[J]. J Hum Genet, 2015, 60(5): 227–231. DOI:10.1038/jhg.2015.14
[11] Xie T, Cho YB, Wang K, et al. Patterns of somatic alterations between matched primary and metastatic colorectal tumors characterized by whole-genome sequencing[J]. Genomics, 2014, 104(4): 234–241. DOI:10.1016/j.ygeno.2014.07.012
[12] Shanmugam V, Ramanathan RK, Lavender NA, et al. Whole genome sequencing reveals potential targets for therapy in patients with refractory KRAS mutated metastatic colorectal cancer[J]. BMC Med Genomics, 2014, 7: 36. DOI:10.1186/1755-8794-7-36
[13] Cancer Genome Atlas N. Comprehensive molecular characterization of human colon and rectal cancer[J]. Nature, 2012, 487(7407): 330–337. DOI:10.1038/nature11252
[14] Esteban-Jurado C, Vila-Casadesus M, Garre P, et al. Whole-exome sequencing identifies rare pathogenic variants in new predisposition genes for familial colorectal cancer[J]. Genet Med, 2015, 17(2): 131–142. DOI:10.1038/gim.2014.89
[15] Weren RD, Ligtenberg MJ, Kets CM, et al. A germline homozygous mutation in the base-excision repair gene NTHL1 causes adenomatous polyposis and colorectal cancer[J]. Nat Genet, 2015, 47(6): 668–671. DOI:10.1038/ng.3287
[16] Gylfe AE, Katainen R, Kondelin J, et al. Eleven candidate susceptibility genes for common familial colorectal cancer[J]. PLoS Genet, 2013, 9(10): e1003876. DOI:10.1371/journal.pgen.1003876
[17] Hansen MF, Johansen J, Bjornevoll I, et al. A novel POLE mutation associated with cancers of colon, pancreas, ovaries and small intestine[J]. Fam Cancer, 2015, 14(3): 437–448. DOI:10.1007/s10689-015-9803-2
[18] Nikolaev SI, Sotiriou SK, Pateras IS, et al. A single-nucleotide substitution mutator phenotype revealed by exome sequencing of human colon adenomas[J]. Cancer Res, 2012, 72(23): 6279–6289. DOI:10.1158/0008-5472.CAN-12-3869
[19] Smith CG, Naven M, Harris R, et al. Exome resequencing identifies potential tumor-suppressor genes that predispose to colorectal cancer[J]. Hum Mutat, 2013, 34(7): 1026–1034. DOI:10.1002/humu.22333
[20] Gala MK, Mizukami Y, Le LP, et al. Germline mutations in oncogene-induced senescence pathways are associated with multiple sessile serrated adenomas[J]. Gastroenterology, 2014, 146(2): 520–529. DOI:10.1053/j.gastro.2013.10.045
[21] Yu J, Wu WK, Li X, et al. Novel recurrently mutated genes and a prognostic mutation signature in colorectal cancer[J]. Gut, 2015, 64(4): 636–645. DOI:10.1136/gutjnl-2013-306620
[22] Seshagiri S, Stawiski EW, Durinck S, et al. Recurrent R-spondin fusions in colon cancer[J]. Nature, 2012, 488(7413): 660–664. DOI:10.1038/nature11282
[23] Wu Y, Wang X, Wu F, et al. Transcriptome profiling of the cancer, adjacent non-tumor and distant normal tissues from a colorectal cancer patient by deep sequencing[J]. PLoS One, 2012, 7(8): e41001. DOI:10.1371/journal.pone.0041001
[24] Nome T, Thomassen GOS, Bruun J, et al. Common fusion transcripts identified in colorectal cancer cell lines by high-throughput RNA Sequencing[J]. Translat Oncol, 2013, 6(5): 546–553. DOI:10.1593/tlo.13457
[25] Liu F, Ji F, Ji Y, et al. Dissecting the mechanism of colorectal tumorigenesis based on RNA-sequencing data[J]. Exp Mol Pathol, 2015, 98(2): 246–253. DOI:10.1016/j.yexmp.2015.01.004
[26] Slattery ML, Pellatt DF, Mullany LE, et al. Differential gene expression in colon tissue associated with diet, lifestyle, and related oxidative Stress[J]. PLoS One, 2015, 10(7): e0134406. DOI:10.1371/journal.pone.0134406
[27] De Roock W, De Vriendt V, Normanno N, et al. KRAS, BRAF, PIK3CA, and PTEN mutations:implications for targeted therapies in metastatic colorectal cancer[J]. Lancet Oncol, 2011, 12(6): 594–603. DOI:10.1016/S1470-2045(10)70209-6
[28] Lipson D, Capelletti M, Yelensky R, et al. Identification of new ALK and RET gene fusions from colorectal and lung cancer biopsies[J]. Nature Med, 2012, 18(3): 382–384. DOI:10.1038/nm.2673
[29] Kraus C, Rau TT, Lux P, et al. Comprehensive screening for mutations associated with colorectal cancer in unselected cases reveals penetrant and nonpenetrant mutations[J]. Int J Cancer, 2015, 136(6): E559–568. DOI:10.1002/ijc.29149
[30] Bai J, Gao J, Mao Z, et al. Genetic mutations in human rectal cancers detected by targeted sequencing[J]. J Hum Genet, 2015, 60(10): 589–596. DOI:10.1038/jhg.2015.71
[31] Zhang L, Chen L, Sah S, et al. Profiling cancer gene mutations in clinical formalin-fixed, paraffin-embedded colorectal tumor specimens using targeted next-generation sequencing[J]. Oncologist, 2014, 19(4): 336–343. DOI:10.1634/theoncologist.2013-0180
[32] Ciardiello F, Normanno N, Maiello E, et al. Clinical activity of FOLFIRI plus cetuximab according to extended gene mutation status by next-generation sequencing:findings from the CAPRI-GOIM trial[J]. Ann Oncol, 2014, 25(9): 1756–1761. DOI:10.1093/annonc/mdu230
[33] Mao C, Wu XY, Yang ZY, et al. Concordant analysis of KRAS, BRAF, PIK3CA mutations, and PTEN expression between primary colorectal cancer and matched metastases[J]. Sci Rep, 2015, 5: 8065. DOI:10.1038/srep08065
[34] Vignot S, Lefebvre C, Frampton GM, et al. Comparative analysis of primary tumour and matched metastases in colorectal cancer patients:evaluation of concordance between genomic and transcriptional profiles[J]. Eur J Cancer, 2015, 51(7): 791–799. DOI:10.1016/j.ejca.2015.02.012
[35] Brannon AR, Vakiani E, Sylvester BE, et al. Comparative sequencing analysis reveals high genomic concordance between matched primary and metastatic colorectal cancer lesions[J]. Genome Biol, 2014, 15(8): 454. DOI:10.1186/s13059-014-0454-7
[36] Kogita A, Yoshioka Y, Sakai K, et al. Inter-and intra-tumor profiling of multi-regional colon cancer and metastasis[J]. Biochem Biophys Res Commun, 2015, 458(1): 52–56. DOI:10.1016/j.bbrc.2015.01.064
[37] Lu YW, Zhang HF, Liang R, et al. Colorectal cancer genetic heterogeneity delineated by multi-region sequencing[J]. PLoS One, 2016, 11(3): e0152673. DOI:10.1371/journal.pone.0152673
[38] Ashktorab H, Daremipouran M, Goel A, et al. DNA methylome profiling identifies novel methylated genes in African American patients with colorectal neoplasia[J]. Epigenetics, 2014, 9(4): 503–512. DOI:10.4161/epi.27644
[39] Hansen KD, Timp W, Bravo HC, et al. Increased methylation variation in epigenetic domains across cancer types[J]. Nat Genet, 2011, 43(8): 768–775. DOI:10.1038/ng.865