中国公共卫生  2009, Vol. 25 Issue (2): 250-252   PDF    
单核苷酸多态性检测技术及其应用研究进展
李晓婷, 詹思延     
北京大学医学部公共卫生学院流行病与卫生统计学系, 北京 100191

DNA水平遗传多态性标记的研究与应用至今已经历了3个阶段:限制性酶切片段长度多态性标记(RFLP)、DNA重复序列的多态性标记(包括小卫星、微卫星DNA重复序列)、单核苷酸多态性标记(single nucleotide polymorphisms, SNPs).SNP是人类基因组中物理图谱的理想遗传标记, 能满足对代谢、生长和疾病相关基因的定位.SNP在人类基因组中出现的频率非常高, 平均每500~1 000个碱基对中就有一个SNP, 估计其总数在300万个以上1.人类的许多疾病如血友病、苯丙酮尿症等直接和SNP相关, 还有许多疾病是多个SNP和环境因素共同作用造成的, SNP进而决定人类疾病的易感性和药物反应的差异性.因此, SNP在分子诊断、临床检验、法医学、病原检测、遗传疾病和新药研发等方面具有重要应用研究进展价值.本文就目前常用的几种高通量SNP检测技术及其应用研究进展作一综述.

1 基因芯片(Microarray, DNA chip)技术 1.1 原理及特点

基因芯片技术是近10年左右才发展起来的一种高新技术, 是指在面积不大的基片(玻璃片或硅片)表面有序地固定大量的基因探针, 从而形成的DNA微阵列, 在1 cm2的固相表面上可以固定10 000个寡核苷酸探针分子.DNA芯片常与等位特异性杂交和酶法2种原理结合起来对SNP进行检测.杂交型芯片是利用等位特异性杂交来对SNP位点进行区分2.将等位基因特异性寡核苷酸(ASO)共价固定于玻璃载片上, 用荧光素标记的引物对基因组DNA扩增, 然后将产生的荧光素标记DNA链与微阵列杂交, 用计算机控制的高分辨荧光扫描仪可获得结合于芯片上的目的基因的荧光信号, 通过计算机处理即可给出目的基因SNP位点的信息.电促核酸杂交芯片(电子芯片)3, 4也是利用等位特异性杂交来对SNP位点进行区分, 但与其不同的是这种芯片不是用化学的方法将探针固定在芯片上, 其为带有阳电荷的硅芯片、芯片经热氧化, 制成1 mm×1 mm的阵列, 每个阵列含多个微电极, 在每个电极上通过氧化硅沉积和蚀刻制备出样品池.将连接链亲和素的琼脂糖覆盖在电极上, 在电场作用下生物素标记的探针即可结合在特定电极上.在电子芯片上的杂交过程也是在电场的作用下完成的, 样品DNA在电场的作用下以极快的速度移往测试点, 电促杂交, 反应加速, 在数分钟内可完成全过程.杂交结束后, 改变电场方向, 并配合升温, 使异常体结合不稳定, 用负电荷将异常结合物排走, 从而保留了正确的杂交体, 因而大大提高了检测的精确度.具有杂交速度快, 可大大缩短分析时间的特点, 但制备复杂、成本高是其不足.利用酶的特异性来区分多态性位点, 其特异性要比等位特异性杂交高得多, 在其和DNA芯片的联用中已经报道的有Invader assay5等.

基因芯片技术一次可以对大量的生物分子进行检测分析, 从而解决了传统核酸印迹杂交技术复杂、自动化程度低、检测目的分子数量少、效率低等问题, 能更快速准确地获取样品中的生物信息, 是一种新兴的高通量、微型化和自动化的检测手段.利用DNA芯片对SNP位点进行检测, 基因组DNA因其复杂性和低浓度而不能直接作为检测的对象, 因此, 必须对基因组DNA进行预扩增, 小于200 bp长度的PCR产物会有较好的杂交效果.为满足DNA芯片的高平行性分析要求, 常用多重PCR来对基因组扩增, 但多重PCR的条件较难控制, 且对PCR产物小的扩增具有倾向性.目前, 有效制备多位点SNP的样品是该方法大规模应用的瓶颈.此外, 当检测的位点多时, 其假阳性率会大幅度增高, 且芯片设计制造昂贵, 约有20%的SNP不能证实.

1.2 基因芯片技术在人群研究中的应用

随着1996年7月第1块有关人类免疫缺陷病毒(HIV)酶的基因芯片问世, 近年来基因芯片技术在疾病易感基因定位、预防和诊断方面的应用越来越广.Laura D Wood等6使用基因芯片技术进行乳腺癌和结直肠癌基因组扫描, 发现有80余种突变与疾病发生和进展无关, 不到15种突变可能与疾病发生与进展有关.Douglas F等7则应用此技术和SNP关联研究定位了4种乳腺癌易感基因:FGFR2、TNRC9、MAP3K和LSP1.用基因芯片技术对美国15个医学中心的352例患冠状动脉疾病者和418名未患该疾病个体的62个基因进行评估8, 鉴定出3种SNP (TSP-1、TSP-2、TSP-4), 携带TSP-4(杂合子或纯合子)变异体的个体患心肌梗塞的危险性高达89%以上; 携带的TSP-2变异体为纯合子者发生心肌梗塞的危险性大为降低; 携带的TSP-1变异体为杂合子者冠状动脉疾病过早发生的危险性增加9倍以上.基因芯片技术与SNP关联研究相结合, 将发现大量的遗传易感性标志物, 使通过基因分析来筛选易感个体、重点保护高危人群成为可能, 这种可预示危险性增加的遗传学证据的发现对疾病预防是一种进步.

2 多元焦磷酸测序(Multiplex pyrosequencing) 2.1 原理及特点

多元焦磷酸测序是在焦磷酸测序的基础上发展起来的一种检测SNP的方法.焦磷酸测序的原理:PCR扩增DNA, 扩增产物变性成单链后与一小段测序引物结合; 测序时顺序加入dNTP; DNA链合成过程中, 如果三磷酸脱氧核苷酸结合到DNA链上, 则释放焦磷酸, 反应系统内的硫酸化酶将焦磷酸转化成ATP, 荧光素酶利用ATP产生可检测的荧光; 如果dNTP未能结合在DNA链上, 则被反应体系内的三磷酸腺苷双磷酸酶降解, 不产生荧光.DNA测序法是检测SNP最直接且信息量最多的方法.通过DNA测序技术, 直接获取目的片段的碱基序列, 通过序列间的比较直观有效地获得SNP, 检出率高达100%.该方法还可以直接确定SNP的种类及其准确位置, 因此是最常规的检测方法.但它也存在着一些问题, 如步骤多、测序峰值会产生误差、成本较高等, 目前该方法已实现自动化, 检测时间短、适合于高通量的SNP精确检测, 还可以对突变点定量检测9.

2.2 多元焦磷酸测序在人群研究中的应用

多元焦磷酸测序广泛应用于人群研究的复杂疾病易感基因定位和等位基因频率测定.Gruber等10首先建立了用焦磷酸测序技术测定等位基因频率的方法, 他们测定了141例糖尿病患者和141例正常对照15个SNP间的等位基因频率, 确定等位基因频率相差的2组样本, 用于复杂疾病的连锁不平衡分析.Garsa等11则用焦磷酸测序技术对欧洲和非洲正常人群的P4503A基因进行了序列分析, 发现2个人种间CYP3A4*1B、CYP3A4*3分布频率有差异, 均未发现CYP3A4*2.Ma12等用该技术分析了432例Ⅰ型糖尿病患者ICAM-1基因型和频率, 探讨了ICAM-1基因多态性在I型糖尿病和糖尿病肾病发展过程中的遗传影响.

3 质谱法(mass spectrometry) 3.1 原理及特点

质谱技术的基本原理是样品分子离子化后, 根据不同离子间的荷质比(m/e)的差异来分离并确定分子量.质谱分析对质量的灵敏度特别高, 很容易将仅含有一个不同碱基的2段基因序列区别开.质谱检测无需荧光标记, 样品来源可以是PCR产物、引物延伸反应、等位基因特异终止、invader酶切产物等, 通过质谱可直接检测样品或探针的不同质量, 推导出样品的SNP, 可用于SNP的发现和已知SNP的分型.

基质辅助激光解吸附电离飞行时间质谱(MALDI-TOF-MS)在SNP的检测中已得到较广泛的应用.引物延伸法结合MALDI-TOF-MS是利用质谱技术检测SNP中常用的一种形式, 和一般性的引物延伸反应相比, 其在引物的5'端引入生物素, 使延伸的产物能被固相结合从而达到纯化的目的.利用质谱分析一个样品只需几秒钟, 一天可以分析数千个样品, 具有快速、准确、自动化程度高和高通量等特点, 由于其没有分子量的限制且高效准确, 目前已经成为蛋白组计划中的重要检测工具.近年来, 随着与引物延伸法、测序法、肽核酸探针杂交法以及侵袭探针切割法等技术的结合, MALDI-TOF-MS技术被越来越多地应用到SNP的检测中.该法最大的问题在于对分析样品的分离纯化程度要求很高, Sauser等人开发的"GOOD分析系统"在反应中涉及到使用化学修饰引物, 然后酶解去掉未延伸的引物以及修饰产物烷化, 这样使得用于质谱检测的样品制备简单、经济和有效5.

3.2 质谱法在人群研究中的应用

MALDI-TOF-MS技术结合DNA pooling技术的应用, 能快速地对大规模标本进行基因扫描, 可用于人群中SNP频率调查及疾病相关性研究, 特别是在复杂疾病的研究中起着非常重要的作用.ZHAO等13用此技术成功地进行了6种常见葡萄糖6磷酸脱氢酶缺乏症突变型快速检测的研究, 为该疾病的人群调查和产前诊断提供了有效的工具.Brown J等14应用该技术在非洲人种中探索瘢痕增生的易感基因, 他们采用病例对照研究, 对SMAD-3、SMAD-6和SMAD-7附近的35个SNP位点进行检测.结果发现, 这些疤痕增长症的可疑易感基因并未显著增加该病的发生风险.

4 变性高效液相色谱法(DHPLC)

变性高效液相色谱是用于筛选基因突变与单核苷酸多态性的一门高通量技术, 其原理是:将扩增形成各种纯合双链和杂合双链DNA吸附到固定相上, 再加温变性, 有错配的杂合双链DNA熔点低, 解链早于完全配对的纯合双链, 在合适的温度条件下, 纯合双链和杂合双链解链程度的差异而导致不同的电荷分布, 使它们和层析柱的结合能力产生差异, 分别在不同的洗脱条件下被洗脱.DHPLC检测一个样品仅需几分钟, 为全自动化操作, 其优点在于能够快速、经济、可靠地检测出单核苷酸多态性, 且无放射污染, 不足之处在于不能鉴定出碱基突变的具体位置, 在筛选新的突变或多态性时需要进行测序才能获得结论15-17.目前该技术主要用来检测500bp以下的DNA片断.由于其筛检SNP的效率优于各种电泳法, 因此, 可以先通过DHPLC对PCR产物进行粗筛, 再对其中峰型特异者测序确认, 这样可以降低成本、提高检测SNP的效率.谭家驹等人用DHPLC对食管癌高发区患者进行P53基因突变筛查, 然后对突变标本纯化测序, 发现了15种突变类型, 共计59个突变位点, 在p53基因第2~8外显子与内含子交界的非编码区有大量的基因突变18.

5 结语

总之, 一个理想的SNP检测方法应具备简便快速、准确可靠、费用低廉、对仪器、试剂和样品要求不高、通量大且数据分析简单等优点.随着计算机程序化分析的发展, 各种检测技术的优化组合及新技术的应运而生, 可以预测在不远的将来, 必会有更加快速、简洁和有效的SNP检测方法出现, 进而推动SNP在人群研究等多个领域更广泛的应用.

参考文献
[1] Sherry ST, Ward MH, Kholodov M, et al. dbSNP:the NCBI database of genetic variation[J]. Nucleic Acids Res, 2001, 29 : 308–311. DOI:10.1093/nar/29.1.308
[2] Gilles PN, Wu DJ, Foster CB, et al. Single nucleotide polymorphic discrimination by an electric dot blot assay on semiconductor microchips[J]. Nature Biotechnology, 1999, 17 : 365–370. DOI:10.1038/7921
[3] Pastinen T, Raitio M, Lindroos K, et al. A system for specific, high-throughput genotyping by allele-specific primer extension on microarrays[J]. Genome Res, 2000, 10 : 1031–1042. DOI:10.1101/gr.10.7.1031
[4] Pastinen T, Kurg A, Metspalu A, et al. Minisequencing:a specific tool for DNA analysis and diagnostics on oligonucleotide arrays[J]. Genome Res, 1997, 7 : 606–614.
[5] Sauser S, Lechner D, Berlin K, et al. A novel procedure for efficient genotyping of single nucleotide polymorphisms[J]. Nucleic Acids Res, 2000, 28 : 13. DOI:10.1093/nar/28.5.e13
[6] Wood LD, Parsons DW, Jones S, et al. The Genomic landscapes of human breast and colorectal cancers[J]. Science, 2007, 318 : 1108–1113. DOI:10.1126/science.1145720
[7] Easton DF, Pooley KA, Dunning AM, et al. Genome-wide association study identifies novel breast cancer susceptibility loci[J]. Nature, 2007, 447 : 1087–1093. DOI:10.1038/nature05887
[8] Chew DP, Bhatt DL, Robbins MA, et al. Incremental prognostic value of elevated baseline C-reactive protein among established markers of risk in percutaneous coronary intervention[J]. Circulation, 2001, 104 : 992. DOI:10.1161/hc3401.095074
[9] Jureen P, Engstrand L, Eriksson S, et al. Rapid detection of rifampin resistance in mycobacterium tuberculosis by pyrosequencing technology[J]. J Clin Microbiol, 2006, 44(6) : 1925–1929. DOI:10.1128/JCM.02210-05
[10] Gruber JD, Colligan PB, Wolford JK, et al. Estimation of single nucleotide polymorphism allele frequency in DNA pools by using Pyrosequencing[J]. Hum Genet, 2002, 110(5) : 395–401. DOI:10.1007/s00439-002-0722-6
[11] Garsa AA, McLeod HL, Marsh S, et al. CYP3A4 and CYP3A5 genotyping by Pyrosequencing[J]. BMC Med Genet, 2005, 9(5) : 6–19.
[12] Ma J, Mollsten A, Prazny M, et al. Genetic influences of the intercellular adhesion molecular 1(ICAM-1) gene polymorphisms in development of type Ⅰ diabetes and diabetic nephropathy[J]. Diabet Med, 2006, 23(10) : 1093–1099. DOI:10.1111/j.1464-5491.2006.01948.x
[13] Zhao F, Ou XL, Xu CC, et al. Rapid detection of six common Chinese G6PD mutation by MALDI-TOF MS[J]. Blood Cells Mol Dis, 2004, 32 : 315–318. DOI:10.1016/j.bcmd.2003.11.002
[14] Brown JJ, Ollier W, Arscott G, et al. Genetic susceptibility to Keloid scarring:SMAD gene SNP frequencies in Afro-Caribbeans[J]. Experimental Dermatology, 2008, 17(7) : 610–613. DOI:10.1111/j.1600-0625.2007.00654.x
[15] 刘雅诚, 郝金萍, 严江伟, 等. 用DHPLC技术检测线粒体DNA编码区单核苷酸多态性[J]. 中国法医学杂志, 2006, 21(3) : 142–146.
[16] 秦效英, 李国选, 江滨, 等. 应用变性高效液相色谱检测CD31563位点单核苷酸多态性[J]. 中华检验医学杂志, 2006, 29(7) : 627–630.
[17] Han W, Yip S P, Wang J, et al. Using denaturing HPLC for SNP discovery and establishing the linkage disequilibrium pattern for the all-trans-retinol dehydrogenase (RDH8) gene[J]. Journal of Human Genetics, 2004, 49 : 16–23. DOI:10.1007/s10038-003-0100-9
[18] 杨胜利, 谭家驹, 徐致祥, 等. DHPLC检测林州市高龄组和低龄组居民食管癌p53基因外显子突变谱的比较研究[J]. 中华肿瘤防治杂志, 2007, 12(14) : 1846–1850.