中国公共卫生  2018, Vol. 34 Issue (3): 396-400   PDF    
基于全基因组序列对新型H7N9禽流感病毒进化率评估
黄萍1, 王美霞2, 袁满琼2    
1. 山东大学齐鲁医院,山东 济南 250012;
2. 厦门大学公共卫生学院
摘要目的 基于新型H7N9禽流感病毒的全基因组序列,估算该病毒8个基因结构区及整体的进化率,为进一步探索H7N9的进化机制提供理论支持。方法 选取全球共享禽流感数据倡议组织(GISAID)中以人类为宿主的H7N9病毒基因序列,同时合并与新型H7N9的6个内部基因结构区具有高度同源性的H9N2序列;采用Bio Edit 7.0软件进行多序列比对,MEGA 6.06建立系统发育树;利用Path-o-gen软件初步估算进化率,并以此作为先验信息,基于分子时钟和蒙特卡罗马尔科夫链(MCMC)模型进一步估算H7N9各基因结构区的进化率。结果 进化率结果表明H7N9禽流感病毒进化快,全基因进化率为4.60 × 10–3次/位点/年(95 % CI = 3.94 × 10–3~5.40 × 10–3),血凝素(HA)和神经氨酸酶(NA)具有较快的进化率,分别为7.43 × 10–3 和5.92 × 10–3次/位点/年,聚合酶A(PA)、聚合酶B1(PB1)和聚合酶B2(PB2)进化速度也相对较其他基因片段快。结论 H7N9病毒进化速度快,急需建立一个有效长期的流感病毒监测制度。
关键词H7N9     分子时钟     蒙特卡罗马尔科夫链(MCMC)模型     进化率    
Evolutionary rate of novel influenza A H7N9 virus based on full-length sequences
HUANG Ping, WANG Mei-xia, YUAN Man-qiong     
Qilu Hospital of Shandong University, Ji'nan, Shandong Province 250012, China
Abstract: Objective To assess the evolutionary rate of novel influenza A H7N9 virus based on the full length sequences and to provide a theoretical guidance for making prevention and control strategies. Methods The sequences of the influenza A H7N9 virus from The Global Initiative on Sharing Avian Influenza Data (GISAID) were used to construct phylogenetic trees using programs BioEdit 7.0 and MEGA 6.06. Preliminary evolutionary rates were estimated with Path-o-gen; then using the preliminary rates as prior information, we further estimated the rates with BEAST 1.8.2 based on molecular clock and Monte Carlo Markov Chain (MCMC) model. Results High evolutionary rates of the novel influenza A H7N9 virus were observed. The mean evolutionary rate for full-length genomic sequences is 4.60 × 10–3 (95% highest probability density [HPD]: 3.94 × 10–3, 5.40 × 10–3) subs/site/year. The evolutionary rate of nucleotide substitution of haemagglutinin and neuraminidase (7.43 and 5.92 × 10–3 subs/site/year) are higher than the evolutionary rate of the H7N9 and higher evolutionary rates of polymerase A (PA), polymerase B1 (PB1), and polymerase B2 (PB2) genes were also observed. Conclusion The novel influenza A H7N9 virus evolves at a high rate, suggesting that effective and long-term surveillance should be carried out.
Key words: influenza A H7N9 virus     molecular clock     Monte Carlo Markov Chain model     evolutionary rate    

H7N9是一种甲型流感病毒,原属于低致病性感冒病毒,仅在禽间发现。然而,在2013年初人类感染H7N9病毒的病例在上海和安徽两地率先发现,首次跨越了种族屏障。H7N9病毒内部的高频率基因突变预警着该病毒进一步引发人群间大流行的风险不容忽视。为更好地适应宿主,病毒的进化速度远远高于其宿主[1],了解病毒的进化率是探索病毒进化机制的基础。研究表明感染人类的H7N9是一种新型RNA重组病毒,该病毒外壳是H7N9,内部却是H9N2[2]。H7N9的8个结构基因面临不同选择压力使其进化速度有所不同,而不同的进化速度将直接影病毒致病性的高低及其对人的亲和力大小。目前对病毒的进化率估算主要基于可变的分子时钟模型和蒙特卡罗马尔科夫链(Monte Carlo Markov Chain,MCMC)模型。可变的分子时钟模型允许病毒在不同时间、不同分支的进化速度具有不同的分布。在贝叶斯理论框架下,设定病毒进化速度的先验分布,采用MCMC模型估算其后验分布[34]。目前,已有研究通过该方法估算出了多种RNA病毒的进化率[56]。本研究基于H7N9病毒的全基因组序列,结合H9N2基因片段,估算其8个基因结构区及全基因组的进化速度,为探索H7N9病毒的进化与传播提供理论基础。

1 资料与方法 1.1 资料来源

本研究选取全球共享禽流感数据倡议组织(The Global Initiative on Sharing Avian Influenza Data,GISAID,http://platform.gisaid.org/epi3/frontend)发布的中国大陆、以人类为宿主的H7N9全基因组序列数据。研究表明新型H7N9病毒除外部结构基因片段血凝素(haemagglutinin,HA)和神经氨酸酶(neuraminidase,NA)来自H7N9外,其余6个内部结构基因片段均来自于H9N2[2]。为此,本研究还收集了中国大陆禽类宿主H9N2序列数据,剔除不完整的或重复的序列,共保留155条全基因组核苷酸序列。

1.2 构建系统发育树

采用Bio Edit 7.0软件对收集的核苷酸序列进行Clustal W多序列比对,并对H7N9和H9N2序列除NA和HA基因片段外的其他6个基因片段进化合并。比对后,通过MEGA 6.06软件,采用最大似然法构建系统发育树,并运用模型优化指数AICc从软件自带的24种备选碱基替换模型中获得最佳模型。运用bootstrap检验验证系统发育树的可靠性,重复次数为1 000次。

1.3 进化率估算

首先利用Path-o-gen软件进行root-to-tip线性回归,初步估算H7N9病毒不同基因结构片段及全基因组进化率,为下一步的贝叶斯估算进化率提供先验信息。使用BEAST 1.8.2软件分析3种分子时钟模型(即lognormal、strict、exponential分子时钟模型)下的进化率。其中,使用的碱基替换模型为上述MEGA分析中获得的最佳模型,链长为100个百万步长。采用Tracer 1.6软件(http://tree.bio.ed.ac.uk)对进化速率计算结果进行分析,运用ACIM值筛选出最佳分子时钟模型;若结果分析中统计量的有效抽样大小(effective sample size,ESS) < 200时,将马尔科夫链长增加到300个百万步长。

1.4 统计分析

进化率数据采用SPSS 20.0软件进行分析和处理,进化率均数比较采用多个独立样本比较的Kruskal-Wallis H检验,合并H9N2病毒数据前后各基因片段是否存在差异采用Mann-Whitney U检验,检验水准为α = 0.05。

2 结 果 2.1 H7N9疫情基本情况

据国家疾病与预防控制中心2016年12月发表的H7N9禽流感流行分布数据,至2016年8月31日,共有775例实验室确诊的人感染H7N9禽流感病例,出现4次流行高峰,其中春季为高发季节。在第一波疫情阶段共报道了134例H7N9病例,其中有96 % 的病例集中发生在2013年的4和5月,80 % 的病例集中在江苏、浙江及东南沿海城市。在第二波疫情阶段共有306例H7N9病例和128例死亡,疫情较第一波明显严重,其中发病高峰聚集在2014年1 — 2月,疫情进一步南移至广东。在第三波疫情阶段共有219例H7N9病例和98例死亡,广东和浙江为病例数最多的2个省份,占54 %。虽然相对第二波疫情,第三波疫情病例数有所减少,但死亡率却由42 % 上升至45 %。

2.2 数据基本情况

本研究共收集155条全基因组序列,含13 103个碱基。结合H9N2序列数据后,共有290条含982碱基的基质蛋白(matrixprotein,MP)基因,338条含1 497个碱基的核蛋白(nucleoprotein,NP)基因,298条含838个碱基的非结构蛋白(nonstructrual,NS)基因,357条含2 151个碱基的聚合酶A(polymerase A,PA)基因,357条含2 273个碱基的聚合酶B1(polymerase B1,PB1)基因,374条含2 280个碱基的聚合酶B2(polymerase B2,PB2)基因。

2.3 系统发育树(图13

比对24种备选碱基替换模型下所得的AICc值,得出GRT + G + I为最佳碱基替换模型。基于该模型采用最大似然方法构建H7N9人类宿主病毒序列样本的系统发育树,结果显示,H7N9病毒的HA、NA基因片段及全基因组序列的系统发育树具有相似的结构。提示感染人类的H7N9禽流感病毒同源性较高。第二波疫情及之后的散发疫情较第一次疫情有些病毒进化分支不同,同一时间同一地点进化关系较强。

图 1 H7N9病毒的HA片段系统发育树

图 2 H7N9病毒的NA片段系统发育树

注:图中未标注代表第一波H7N9禽流感疫情(2013年2月1日—6月30日);空心正方形代表第二波H7N9禽流感疫情(2013年7月1日 — 2014年7月31日);实心正方形第二波疫情之后的散发病例。 图 3 H7N9病毒的全基因组系统发育树

2.4 进化率分析 2.4.1 root-to-tip进化率(表1

运用root-to-tip线性回归方法初步估算H7N9禽流感病毒的进化率,结果显示,H7N9禽流感病毒不同基因结构片段的进化率为10–2~10–5次/位点/年,其中主要集中在10–3次/位点/年水平,合并H9N2序列数据后估算的进化速度较未合并前小。

表 1 H7N9病毒线性回归进化率(× 10–3次/位点/年)

2.4.2 BEAST进化率(表2

H7N9在最佳分子时钟模型下的进化率估算结果,其中最佳模型采用AICM指标筛选。在未合并H9N2序列分析中,全基因组序列进化速度为 4.60 × 10–3次/位点/年;8个基因结构区中PA、HA和NA的进化速度较快,PB1、PB2次之,NS、NP和MP进化率较低。在合并H9N2序列估算的进化率中,PB1、PB2和PA进化率较高。根据进化率均数可看出大多数合并后估算的H7N9 进化速度会相对慢些,但总体来说H7N9 病毒除HA和NA外的 6 个基因结构片段进化率普遍在3 × 10–3~5 × 10–3次/位点/年。其中,合并H9N2 序列数据前后的PA基因片段的进化率差距最大,但PA基因片段合并H9N2 数据前的抽样误差(5.36 × 10–5次/位点/年)大于合并后的抽样误差(2.13 × 10–5次/位点/年)。Kruskal-Wallis H检验表明无论是否合并H9N2碱基序列,基因结构区之间的进化率差异有统计学意义(P < 0.001)。进一步两两比较,发现结构基因片段两两之间差异有统计学意义( P < 0.001)。提示H7N9禽流感病毒不同基因结构区的进化速度不同。

表 2 H7N9分子时钟最佳模型估算进化率(× 10– 3次/位点/年)

3 讨 论

尽管已有研究通过人类及禽类宿主的H7N9禽流感碱基序列探索H7N9病毒的进化率[78],但本研究考虑到新型重组的H7N9病毒不是由经典的H7N9病毒进化而来[9],故首先独立探索人类宿主H7N9病毒进化率,继而联合禽类H9N2病毒的6个基因结构片段进一步估算H7N9病毒进化率。通过收集来自不同地点、不同时间的人类宿主的H7N9禽流感病毒,构建全基因组及各基因结构片段的系统发育树,表明感染人类的H7N9禽流感毒具有高度同源性。此外,与Lam等[10]研究发现HA基因片段在第二波疫情中具有更多的进化分支结论类似,本研究发现第二波疫情及之后的散发疫情的H7N9禽流感病毒相对于第一波疫情病毒有所进化,表明禽流感病毒为适应宿主不断地进化[11],以逐渐适应宿主的免疫压力[12]

经由分子时钟模型估算的H7N9病毒进化率结果显示,H7N9禽流感病毒的进化速度较快,不同基因片段的进化速度不同,这与其所承担的选择压力不同有关。全基因进化率为4.60 × 10–3次/位点/年,HA和NA基因的进化率分别为7.43 × 10–3和5.92 × 10–3次/位点/年,分别比H5N1禽流感病毒HA和甲型N9亚型流感病毒进化快[1314]。表明HA和NA基因片段特别是HA可能具有更高的选择压力。HA与NA作为H7N9禽流感病毒表面主要的2种糖蛋白,其抗原变异性大[2],可能是导致其进化速度快于其他基因结构片段的主要原因。同时,有研究表明HA在氨基酸位点的进化使其与人体的亲合力增加[1516],NA分子水平的进化使H7N9禽流感病毒产生神经酰胺酶抑制剂耐药性的出现[17];这2种糖蛋白的快速进化很可能是H7N9禽流感流行的主要原因之一。除HA和NA基因片段外,H7N9病毒的其余6个基因结构片段进化率普遍在3 × 10–3~5 × 10– 3次/位点/年,PB1、PB2、PA基因片段进化速度相对较快,这与各基因片段发挥的不同结构功能以及其所受的选择压力有关。如有研究表明PB1与H7N9的高致病性有关[1819],PB1基因片段的进化促进了H7N9病毒从禽类宿主低致病性到人类宿主的高致病性的转变。此外,由于目前人类宿主的H7N9病毒碱基序列较少、年度跨越较短,故合并H9N2病毒序列估算的进化率更可能反映H7N9病毒的进化速度。

国内禽流感病毒从最初H5N1甲型禽流感的发生,到H9N2禽流感病毒的暴发,再到如今新型H7N9禽流感病毒的流行,均暗示着对活禽市场与人群缺乏有效流感病毒系统监测手段。H7N9禽流感病毒是否会在未来进一步在人类中发生大规模流行,仍需提高警惕。

参考文献
[1] Drummond A, Pybus OG, Rambaut A. Inference of viral evolutionary rates from molecular sequences[J]. Advances in Parasitology, 2003, 54(54): 331–358.
[2] Husain M. Avian influenza A (H7N9) virus infection in humans: epidemiology, evolution, and pathogenesis[J]. Infection Genetics and Evolution:Journal of Molecular Epidemiology and EvolutionaryGenetics in Infectious Diseases, 2014, 28: 304–312. DOI:10.1016/j.meegid.2014.10.016
[3] Fridley BL. Bayesian variable and model selection methods for genetic association studies[J]. Genetic Epidemiology, 2009, 33(1): 27–37. DOI:10.1002/gepi.v33:1
[4] Ho SYW, Duchêne S. Molecular-clock methods for estimating evolutionary rates and timescales[J]. Molecular Ecology, 2014, 23(24): 5947–5965. DOI:10.1111/mec.12953
[5] Berry IM, Ribeiro R, Kothari M, et al. Unequal evolutionary rates in the human immunodeficiency virus type 1 (HIV-1) pandemic: the evolutionary rate of HIV-1 slows down when the epidemic rate increases[J]. Journal of Virology, 2007, 81(19): 10625–10635. DOI:10.1128/JVI.00985-07
[6] Yuan M, Lu T, Li C, et al. The evolutionary rates of HCV estimated with subtype 1a and 1b sequences over the ORF length and in different genomic regions[J]. PLoS One, 2013, 8(6): e64698. DOI:10.1371/journal.pone.0064698
[7] Lam TT, Wang J, Shen Y, et al. The genesis and source of the H7N9 influenza viruses causing human infections in China[J]. Nature, 2013, 502(7470): 241–244. DOI:10.1038/nature12515
[8] Liu W, Fan H, Raghwani J, et al. Occurrence and reassortment of avian influenza A (H7N9) viruses derived from coinfected birds in China[J]. Virology, 2014, 88: 13344–13351. DOI:10.1128/JVI.01777-14
[9] He J, Ning L, Tong Y. Origins and evolutionary genomics of the novel 2013 avian-origin H7N9 influenza A virus in China: early findings [J/OL]. [2013 – 04 – 09]. http://arxiv. org/abs/1304.1985.
[10] Lam TT, Zhou B, Wang J, et al. Dissemination, divergence and establishment of H7N9 influenza viruses in China[J]. Nature, 2015, 522: 102–105. DOI:10.1038/nature14348
[11] Zhu W, Shu Y. Genetic tuning of avian influenza A (H7N9) virus promotes viral fitness within different species[J]. Microbes and Infection / Institut Pasteur, 2015, 17(2): 118–122. DOI:10.1016/j.micinf.2014.11.010
[12] Liu M, Song T, Hua S, et al. Computational analysis of antigenic epitopes of avian influenza A (H7N9) viruses[J]. Science China Life Sciences, 2015, 58(7): 687–693. DOI:10.1007/s11427-015-4886-4
[13] Rejmanek D, Hosseini PR, Mazet JA, et al. Evolutionary dynamics and global diversity of influenza A virus[J]. Journal of Virology, 2015, 89(21): 10993–11001. DOI:10.1128/JVI.01573-15
[14] 万勇汤. 甲型N9亚型流感病毒神经氨酸酶基因进化分析[J]. 病毒学报, 2015, 31(2): 139–144.
[15] Gao R, Cao B, Hu Y, et al. Human infection with a novel avian-origin influenza A (H7N9) virus[J]. The New England Journal of Medicine, 2013, 368(20): 1888–1897. DOI:10.1056/NEJMoa1304459
[16] Schrauwen EJ, Richard M, Burke DF, et al. Amino acid substitutions that affect receptor binding and stability of the hemagglutinin of influenza A/H7N9 virus[J]. Journal of Virology, 2016, 90(7): 3794–3799. DOI:10.1128/JVI.03052-15
[17] Gillman A, Nykvist M, Muradrasoli S, et al. Influenza A(H7N9) virus acquires resistance-related neuraminidase I222T substitution when infected mallards are exposed to low levels of oseltamivir in water[J]. Antimicrobial Agents and Chemotherapy, 2015, 59(9): 5196–5202. DOI:10.1128/AAC.00886-15
[18] Chen L, Sun L, Li R, et al. Is a highly pathogenic avian influenza virus H5N1 fragment recombined in PB1 the key for the epidemic of the novel AIV H7N9 in China, 2013?[J]. International Journal of Infectious Diseases, 2016, 43: 85–89. DOI:10.1016/j.ijid.2016.01.002
[19] Su W, Wang C, Luo J, et al. Testing the effect of internal genes derived from a wild-bird-origin H9N2 influenza A virus on the pathogenicity of an A/H7N9 virus[J]. Cell Reports, 2015, 12(11): 1831–1841. DOI:10.1016/j.celrep.2015.08.029