文章信息
- 尤元海, 何利华, 彭贤慧, 孙路, 张建中 .
- You Yuanhai, He Lihua, Peng Xianhui, Sun Lu, Zhang Jianzhong .
- 中国幽门螺杆菌基因组多样性与种群结构分析
- Genomic diversity and population structure of Helicobacter pylori isolates in China
- 中华流行病学杂志, 2016, 37(10): 1397-1403
- CHINESE JOURNAL OF EPIDEMIOLOGY, 2016, 37(10): 1397-1403
- http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2016.10.016
-
文章历史
收稿日期: 2016-05-12
幽门螺杆菌(Helicobacter pylori,HP)是一种寄居于人体胃部的致病菌,与胃炎、胃溃疡、胃癌的发生密切相关。流行病学数据显示,东亚国家人群中具有较高的胃癌发生率,且东亚人群携带的菌株中90%以上携带cagPAI致病岛及cagA毒力基因。HP菌株间基因组变异度可高达15%,高突变率和重组率是造成这种遗传多样性的主要原因[1-2]。
据推算,HP已寄居在人体并随人体共进化超过6万年,因此HP的保守基因序列常被用于推测人类历史上的群体迁移事件和规律,根据HP 7个管家基因序列多态性,从地理分布上可以将其分为7个群(groups),分别为hpEurope、hpWestAfrica、hpAfrica1、hpAfrica2、hpEastAsia、hpAsia2、hpSahul。其中hpEastAsia又可进一步分成hspEAsia、hspMaori、 hspAmerind三个亚群[3-5]。随着二代基因组测序技术的飞速进步,基于全基因组及大数据的分析已成为当前生命科学领域研究的主流手段。2016年1月,一项由欧美地区14家研究机构联合开展的研究,利用宏基因组技术对一具冰冻了5 300年之久的欧洲冰川期的木乃伊进行了消化道微生物宏基因组分析,并从中成功拼接出一株HP基因组序列,该研究提示直到5 300年前欧洲人所携带的HP仍以AE1型(亚洲起源)为主,此后开始混入AE2型菌株(东北非起源)。利用全基因组数据研究HP致病与进化机制、分析其种群结构已成为大势所趋[6]。自1997年第一株HP完成基因组测序至今已近20年[7-8],GenBank中记录的已经完成的和正在进行测序的HP基因组数据超过400株,其中63株为基因组完成图,均分离自浅表性胃炎、萎缩性胃炎、胃溃疡、十二指肠溃疡、胃癌、胃MALT淋巴瘤等HP相关消化道疾病[9]。中国已有10株HP完成基因组测序,HP基因组的整体特征及基于全基因组序列多样性的种群结构尚未见报道。
本研究利用课题组前期递交到GenBank数据库中的中国HP及数据库中背景清楚的世界其他地区的HP基因组完成图[10-13],通过比较基因组分析及基于核心基因组单核苷酸多态性(SNP)的聚类分析,获得中国HP的基因组特征及其在世界范围内、在东亚地区范围内的种群结构信息,为进一步深入认识中国HP在不同消化道疾病中的致病分子机制提供基础数据。
材料与方法1. 数据来源:自GenBank中提取国际上已经报道的HP基因组完成图序列,共获得71株菌的基因组序列(截止2015年12月),其中包括10株中国菌株序列,分别分离自黑龙江、山东、浙江、云南、西藏、台湾(其中8株均为本研究前期公布的序列)。其他国家或地区的菌株序列还包括韩国、日本、印度、马来西亚等亚洲国家;冈比亚、南非等非洲国家;北美洲的加拿大和美国;南美洲的萨尔瓦多、委内瑞拉、秘鲁;欧洲的瑞典、英国、法国、德国、西班牙、意大利、立陶宛。菌株地理位置分布如图 1所示。10株中国分离HP中有3株分离自胃癌,3株分离自慢性胃炎,1株分离自胃溃疡,1株分离自胃MALT淋巴瘤,2株分离自慢性萎缩性胃炎。这些菌株主要分离自汉族,还包括1株藏族、1株纳西族菌株(表 1)。分离自2002-2012年。所有菌株序列均提取GenBank和FASTA两种格式。
2. HP基因组:以HP测序株P12为参考序列,利用MAUVE等对中国10株HP进行全基因组比较,用GVIEW、BLASTATLAS、MUMMER等进行核心基因组、菌株特异基因及核心基因组SNP分析[14]。比对相似性阈值设为85%。
3. 中国HP中的前噬菌体结构预测:用PHAST (http://phast.wishartlab.com)对中国HP进行前噬菌体结构预测。该软件基于前噬菌体的结构特征建立了一套评分标准,可对菌株中潜在的前噬菌体结构及其完整性进行预测。如匹配区域得分<70则定义为不完整前噬菌体,如得分为70~90定义为疑似前噬菌体,如得分>90定义为完整噬菌体[15]。
4. HP种群结构:分别构建了71株全部国际测序株、东亚测序株、中国测序株3个基因组数据集,将MUMMER得到数据集分析的核心基因组SNP用Mega 5.0软件等构建(Neighbor Joining,NJ)系统发育树[16]。用不同颜色标示不同HP亚群或同一亚群中存在的不同聚类关系。
结 果1. 中国HP基因组基本信息:中国HP基因组长度在1.55~1.64 Mbp之间,最短为HLJ193株,长度1 552 322 bp,最长为XZ274株,长度1 634 138 bp。CDS数目在1 406~1 687个之间,HLJ256 CDS最少,为1 406个;最多的为XZ274株,1 654个。GC含量在38.5%~39.0%之间。所有菌株均带有完整的cagPAI致病岛。cagA羧基端EPIYA基序均为A/B/D/型。10株HP中有3株鉴定出含有前噬菌体序列。其中浙江胃炎分离株wls-5-18和云南纳西族YN4-84株携带完整的前噬菌体,HLJ271株携带不完整噬菌体。见表 2。
2. 中国HP的基因组特征:对10株中国HP的比较基因组分析显示,基因组变异度较高的区域(plasticity zone,PZ)主要集中在3个位置,分别标为PZ1、PZ2和PZ3。PZ1和PZ3主要是编码与DNA转移相关的2个四型分泌系统(TFS4和TFS3)的基因簇。PZ2主要编码丝氨酸苏氨酸激酶、C样蛋白等。全基因组范围内散在分布的多变序列主要是编码限制修饰(R-M)系统的基因。所有菌株都具有完整的cagPAI结构,且序列保守。见图 2。10株中国HP共有的基因(核心基因)为1 203个。菌株特异基因数目相差不多,每株菌特有的基因数量在19~30个不等。大多编码假想蛋白。见图 3。
3. 中国HP的种群结构:基于71株全球HP核心基因组序列多态性构建的NJ树(图 4A)显示菌株主要归属于三大类,即hpEurope、hspAmerind、hspEAsia,分别以蓝、红、黄显示。可以初步发现中国菌株在hspEAsia中存在地域聚集性特点。进一步单独用东亚群的菌株核心基因组SNP序列构建的NJ树(图 4B)显示:中国东北和山东菌株聚在一起(橘黄色);云南、西藏菌株距离更近(红色);粉色为中国浙江、中国台湾菌株及马来西亚菌株及一株日本冲绳分离株;紫色为日本韩国菌株;绿色为日本冲绳菌株单独聚为一类;深红色为美洲印第安亚群菌株单独聚为一类;藏蓝色为一株马来西亚菌株和两株冲绳菌株,位于最下端分支。再进一步用中国10株HP核心基因组SNP构建的NJ树(图 5)显示出更清晰的地域聚集性特点。
4. 中国HP中的前噬菌体结构:经PHAST分析,在浙江(wls-5-18)和云南胃炎(YN4-84)患者分离株中均发现带有完整前噬菌体基因组。在黑龙江胃溃疡患者分离株HLJ271中发现带有不完整前噬菌体序列。见图 6。wls-5-18前噬菌体基因组长25 kb,GC含量36.3%,31个CDSs中与已知PHAGE基因组数据库中的PHAGE_Helico_KHP40_NC_019931有29个序列一致,与PHAGE_Helico_ KHP30_NC_019928有28个序列一致,与PHAGE_Helico_1961P_NC_019512有27个序列一致,与PHAGE_Helico_ phiHP33_NC_016568有23个序列一致。HLJ271的不完整前噬菌体基因组长13 kb,GC含量34.04%,21个CDS中有9个与PHAGE_ Helico_1961P_NC_019512、PHAGE_ Helico_KHP30_NC_019928、PHAGE_ Helico_KHP40_NC_019931中的CDS序列一致。有6个CDS与PHAGE_Helico_ phiHP33_NC_016568中的序列一致。YN4-84的前噬菌体基因组长32.5 kb,GC含量38.43%,33个CDS中有28个与PHAGE_Helico_KHP30_NC_019928、PHAGE_Helico_KHP40_NC_019931一致、27个与PHAGE_Helico_1961P_NC_019512一致、21个与PHAGE_Helico_phiHP33_NC_016568一致。wls-5-18和YN4-84的前噬菌体均带有编码整合酶、终止酶、噬菌体结构蛋白、尾丝、裂解酶(holin)、转座酶、孔蛋白等噬菌体相关的特异结构基因。HLJ271带有holin和转座酶基因,但缺乏噬菌体组装所需的必要结构蛋白。
讨 论本研究首次对中国HP的基因组序列特征进行了比较基因组分析,从基因组可塑区(plasticity zone,PZ)的分布来看,中国HP的基因组高变区与国际上其他地区菌株基本一致[17-20]。说明TFS4和TFS3这两个DNA转移相关的四型分泌系统在HP基因水平转移及HP在中国不同个体胃部微环境中的适应性定植和进化过程中发挥重要作用。国际报道HP群体的核心基因数量估算约为1 000个[13, 21],本研究中国HP菌株共有1 203个核心基因,主要因为测序菌株数量比较少,随着测序菌株数量的增加,中国HP核心基因也会相应减少。菌株特异基因数量分布较均一,主要编码假想蛋白,功能尚不清楚。中国菌株中cagPAI的高阳性率和完整度及cagA羧基端EPIYA基序的特点均符合典型东亚型菌株特征[21]。
本研究在进化分析中从3个不同规模的群体尺度上进行了分析。首先对71株全球HP基因组序列的核心基因组SNP分析显示东亚群菌株均独立成簇(图 4A),同时可见东亚亚群簇内菌株仍呈现一定的聚类关系,提示有必要对东亚群菌株单独进行聚类分析。图 4B展示了东亚群内部的聚类关系,除2株日本菌株和1株马来西亚菌株外,4株美洲印第安菌株及4株日本冲绳菌株均单独成簇,提示这两个地域的HP群体仍保持较高的独特的遗传特征。据此可以将东亚群菌株再进行细分类。东亚群HP的剩余部分(左上方扇形)包括了中国、韩国、日本、马来西亚4个国家的菌株,从扇形内根部的分支构成来看,该簇菌株仍可进一步分类。中国云南菌株YN1-91、YN4-84与西藏分离株XZ274较近,5株日本菌株(83、F30、F16、F57、35A)与1株韩国菌株(HP51)在同一进化支。4株黑龙江菌株(HLJ)与1株山东菌株(YTC5)分属同一进化支。而中国浙江分离株wls-5-18与1株中国台湾菌株Hp238及4株马来西亚华裔菌株位于同一进化支。这些结果提示中国大陆、中国台湾、韩国、日本、马来西亚等东南亚国家和地区菌株遗传背景高度相似,东亚亚群内部的进一步细分可以反映出东南亚地区历史上的人群迁徙特点。对10株中国HP的NJ分析显示,黑龙江与山东菌株、浙江与台湾菌株、云南与西藏菌株彼此更为接近,提示中国HP也具有地域聚集性,这可能与近代国内移民事件有关。为进一步扩大菌株数量分析中国HP群体结构及其与群体历史迁移、分布变化的关联提供初步线索。
自1983年Marshall报道发现HP至今已三十多年,实际上Marshall最初在镜下也发现了类噬菌体样的物质,但没有分离纯化到HP噬菌体,此后二十年里有关HP噬菌体的研究一度停滞,直到2012年以前人们普遍认为HP可能不带有噬菌体。随着高通量基因组测序技术的迅速发展,越来越多的HP基因组序列被测定,HP噬菌体序列被不断发现,由于HP日益严重的耐药性问题,其噬菌体相关研究也成为备受关注的研究热点。目前已从HP分离到的噬菌体并已知其基因组序列的共有4株,其中3株分离自东亚菌株,包括1株中国台湾分离的溶源性噬菌体1961P[22]及2株日本分离的溶源性噬菌体KHP30和KHP40[23-24],另1株为欧洲地区分离株phiHP33[25]。本研究从中国菌株序列中发现的噬菌体序列所包含的cds均不同程度地与这4株序列相匹配,特别是与东亚地区分离的具有更高的相似性,提示HP噬菌体侵染宿主菌可能也具有地域特异性。在革兰阳性菌和某些革兰阴性菌中噬菌体常可携带毒素基因和耐药基因,改变细菌表型并引起爆发流行。目前在HP这些噬菌体序列中并未发现毒力相关基因,提示噬菌体在与HP共进化过程中具有不同的作用机制。欧洲地区一个研究团队基于整合酶基因分析推测HP菌株大约10%带有前噬菌体,本研究提示中国菌株及东亚亚群菌株可能带有更高比例的前噬菌体序列。关于HP噬菌体的研究仍有诸多未解之谜,例如HP噬菌体序列是否同样可以用于推算其进入HP种群的时间和迁移规律,以及HP与噬菌体和人类三者之间的相互作用与协同进化机制是怎样的。
HP如何引起胃癌等严重消化道疾病以及胃癌分离菌株有无相关分子标识仍是有待深入研究的热点问题,大量分离自胃癌等不同疾病的菌株基因组序列已经获得,这使得针对HP群体的大规模GWAS研究成为可能。但HP具有显著的地域多样性,在进行GWAS研究时,需要确定菌株的群体结构归属,应选择遗传背景接近的不同疾病的菌株,以排除地域多样性带来的基因组背景差异。本研究初步对中国现有的HP菌株基因组序列进行了比较基因组分析,确定了中国HP的群体结构特征,并初步分析了中国HP中存在的前噬菌体基因组特征,结果有助于进一步分析中国HP菌株的致病机制及寻找相关分子标识。
[1] | Suerbaum S, Michetti P. Helicobacter pylori infection[J]. New Engl J Med , 2002, 347 (15) : 1175–1186 DOI:10.1056/NEJMra020542 |
[2] | Kusters JG, van Vliet AHM, Kuipers EJ. Pathogenesis of Helicobacter pylori infection[J]. Clin Microbiol Rev , 2006, 19 (3) : 449–490 DOI:10.1128/CMR.00054-05 |
[3] | Falush D, Wirth T, Linz B, et al. Traces of human migrations in Helicobacter pylori populations[J]. Science , 2003, 299 (5612) : 1582–1585 DOI:10.1126/science.1080857 |
[4] | Moodley Y, Linz B, Yamaoka Y, et al. The peopling of the Pacific from a bacterial perspective[J]. Science , 2009, 323 (5913) : 527–530 DOI:10.1126/science.1166083 |
[5] | Yahara K, Furuta Y, Oshima K, et al. Chromosome painting in silico in a bacterial species reveals fine population structure[J]. Mol Biol Evol , 2013, 30 (6) : 1454–1464 DOI:10.1093/molbev/mst055 |
[6] | Maixner F, Krause-Kyora B, Turaev D, et al. The 5300-year-old Helicobacter pylori genome of the Iceman[J]. Science , 2016, 351 (6269) : 162–165 DOI:10.1126/science.aad2545 |
[7] | Tomb JF, White O, Kerlavage AR, et al. The complete genome sequence of the gastric pathogen Helicobacter pylori[J]. Nature , 1997, 388 (6642) : 539–547 DOI:10.1038/41483 |
[8] | Alm RA, Ling LSL, Moir DT, et al. Genomic-sequence comparison of two unrelated isolates of the human gastric pathogen Helicobacter pylori[J]. Nature , 1999, 397 (6715) : 176–180 DOI:10.1038/16495 |
[9] | Ahmed N, Loke MF, Kumar N, et al. Helicobacter pylori in 2013:multiplying genomes,emerging insights[J]. Helicobacter , 2013, 18 (Suppl 1) : S1–4 DOI:10.1111/hel.12069 |
[10] | You YH, Liu L, Zhang MJ, et al. Genomic characterization of a Helicobacter pylori isolate from a patient with gastric cancer in China[J]. Gut Pathog , 2014, 6 (1) : 5 DOI:10.1186/1757-4749-6-5 |
[11] | You YH, Liu L, Zhang MJ, et al. Genome sequences of three Helicobacter pylori strains isolated from atrophic gastritis and gastric ulcer patients in China[J]. J Bacteriol , 2012, 194 (22) : 6314–6315 DOI:10.1128/JB.01399-12 |
[12] | You YH, He LH, Zhang MJ, et al. Comparative genomics of Helicobacter pylori strains of China associated with different clinical outcome[J]. PLoS One , 2012, 7 (6) : e38528 DOI:10.1371/journal.pone.0038528 |
[13] | Cao QZ, Didelot X, Wu ZB, et al. Progressive genomic convergence of two Helicobacter pylori strains during mixed infection of a patient with chronic gastritis[J]. Gut , 2015, 64 (4) : 554–561 DOI:10.1136/gutjnl-2014-307345 |
[14] | Petkau A, Stuart-Edwards M, Stothard P, et al. Interactive microbial genome visualization with GView[J]. Bioinformatics , 2010, 26 (24) : 3125–3126 DOI:10.1093/bioinformatics/btq588 |
[15] | Zhou Y, Liang YJ, Lynch KH, et al. PHAST:a fast phage search tool[J]. Nucleic Acids Res , 2011, 39 (Suppl 2) : W347–352 DOI:10.1093/nar/gkr485 |
[16] | Tamura K, Peterson D, Peterson N, et al. MEGA5:molecular genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods[J]. Mol Biol Evol , 2011, 28 (10) : 2731–2739 DOI:10.1093/molbev/msr121 |
[17] | Kersulyte D, Lee W, Subramaniam D, et al. Helicobacter pylori's plasticity zones are novel transposable elements[J]. PLoS One , 2009, 4 (9) : e6859 DOI:10.1371/journal.pone.0006859 |
[18] | Janssen PJ, Audit B, Ouzounis CA. Strain-specific genes of Helicobacter pylori:distribution,function and dynamics[J]. Nucleic Acids Res , 2001, 29 (21) : 4395–4404 DOI:10.1093/nar/29.21.4395 |
[19] | Kersulyte D, Velapatiño B, Mukhopadhyay AK, et al. Cluster of type Ⅳ secretion genes in Helicobacter pylori's plasticity zone[J]. J Bacteriol , 2003, 185 (13) : 3764–3772 DOI:10.1128/JB.185.13.3764-3772.2003 |
[20] | Fischer W, Windhager L, Rohrer S, et al. Strain-specific genes of Helicobacter pylori:genome evolution driven by a novel type Ⅳ secretion system and genomic island transfer[J]. Nucleic Acids Res , 2010, 38 (18) : 6089–6101 DOI:10.1093/nar/gkq378 |
[21] | You YH, He LH, Zhang MJ, et al. Comparative genomics of a Helicobacter pylori isolate from a Chinese Yunnan Naxi ethnic aborigine suggests high genetic divergence and phage insertion[J]. PLoS One , 2015, 10 (3) : e0120659 DOI:10.1371/journal.pone.0120659 |
[22] | Luo CH, Chiou PY, Yang CY, et al. Genome,integration,and transduction of a novel temperate phage of Helicobacter pylori[J]. J Virol , 2012, 86 (16) : 8781–8792 DOI:10.1128/JVI.00446-12 |
[23] | Uchiyama J, Takeuchi H, Kato S, et al. Characterization of Helicobacter pylori bacteriophage KHP30[J]. Appl Environ Microbiol , 2013, 79 (10) : 3176–3184 DOI:10.1128/AEM.03530-12 |
[24] | Uchiyama J, Takeuchi H, Kato S, et al. Complete genome sequences of two Helicobacter pylori bacteriophages isolated from Japanese patients[J]. J Virol , 2012, 86 (20) : 11400–11401 DOI:10.1128/JVI.01767-12 |
[25] | Lehours P, Vale FF, Bjursell MK, et al. Genome sequencing reveals a phage in Helicobacter pylori[J]. mBio , 2011, 2 (6) : e00239–11 DOI:10.1128/mBio.00239-11 |