中国公共卫生  2017, Vol. 33 Issue (4): 607-610   PDF    
细粒棘球绦虫延伸因子1生物信息学分析
李超群1, 樊海宁2, 张耀刚1, 曹得萍1,2     
1. 青海大学医学院病原生物学教研室,西宁 810001;
2. 青海大学包虫病重点实验室
摘要目的 利用生物信息学技术对细粒棘球绦虫的延伸因子1(EF-1) 进行分析,探讨其诊断价值。 方法 通过Expasy系统预测EF-1的理化性质,使用DNAStar软件分析蛋白亲水性、柔性区域、抗原指数及表面可及性,利用ABCpred与IEDB软件综合预测B细胞线性抗原表位,通过DNAStar软件预测T细胞表位,使用SOPMA软件预测二级结构,SWISS-MODEL网站构建EF-1的三级结构,使用MEGA软件选择neighbor joining法构建EF-1氨基酸序列的系统发育树。 结果 EF-1基因序列全长1 412 bp,含有2个内含子;EF-1亲水性得分较高的区域为35~45、52~70、126~140、158~183、301~322、357~380、424~448;柔性区域为26~45、54~71、162~176、300~318、357~381、432~448;抗原性指数得分较高的区域分布与柔性区域一致;表面可及性得分较高的区域较少,主要分布在39~54、62~76、128~132、161~170、220~234、315~329、354~372、424~448;可能的B细胞线性表位的氨基酸序列为120~130、286~295、306~320、365~378;可能的优势性T细胞表位区域为34~48、164~177、222~244、280~290、321~330、396~407;EF-1的二级结构中α螺旋占32.81%、β折叠占22.54%、β转角占10.94%、无规则卷曲占33.71%;系统发育树结果表明多房棘球绦虫为一枝,其余聚于一枝,且内部形成许多梳齿状分枝。 结论 得到4个可能形成B细胞表位的区域、6个优势性T细胞表位区域,EF-1具有较高的保守性,可作为免疫诊断和药物治疗靶点。
关键词细粒棘球绦虫     延伸因子1(EF-1)     生物信息学    
Property and structure of elongation factor 1 in Echinococcus granulous, a bioinformatics analysis
LI Chao-qun, FAN Hai-ning, ZHANG Yao-gang, et al     
Department of Pathogenic Biology, Medical College, Qinghai University, Xining, Qinghai Province 810001, China
Abstract: Objective To analyze the property and structure of elongation factor 1 (EF-1) in Echinococcus granulous with bioinformatics technology and to explore its value in diagnosis of echinococcosis. Methods Physicochemical property of EF-1 was predicted using Expasy system.Hydrophiloity plot, flexible regions, antigenic index, and surface accessibility were analyzed with DNAStar software.B cell linear antigen epitopes were forecasted with ABCpred and IEDB software.T cell antigen epitopes were forecasted with DNAStar software.The secondary and three-dimensional structure of EF-1 were determined using SOPMA software and SWISS-MODEL website separately.The phylogenetic tree for amino acid sequences of EF-1 was built with neighbor joining method of MEGA software. Results The whole gene of EF-1 was 1 412 bp in length, containing two introns.The high score areas of hydrophiloity plot were 35-45, 52-70, 126-140, 158-183, 301-322, 357-380, and 424-448.The flexible regions were 26-45, 54-71, 162-176, 300-318, 357-381, and 432-448.The regions with high score of antigenic index were similar to the flexible regions.There were a few regions with the high score of surface accessibility, mainly locating at 39-54, 62-76, 128-132, 161-170, 220-234, 315-329, 354-372, and 424-448.The potential amino acids sequences of B cell linear epitopes were 120-130, 286-295, 306-320, and 365-378.The potential advantaged T cell epitope areas were 34-48, 164-177, 222-244, 280-290, 321-330, and 396-407.The proportions of secondary structure of EF-1 were 32.81% for α-helix, 22.54% for β-sheet, accounted 10.94% for β-corner, and 33.71% for random coil, respectively.The constructed phylogenetic tree of EF-1 demonstrates a branch of Echinococcus multilocularis had its own branch and another branch with many internal dentate branches. Conclusion Four B cell epitopes and six advanted T cell epiopes of EF-1 were identified with the bioinformatics analysis and phylogenetic tree reveals that EF-1 is high conservative.These findings suggest that the epitopes of EF-1 in Echinococcus granulous could be adopted as targets for immunological diagnosis and drug treatment of echinococcosis.
Key words: Echinococcus granulous     elongation factor 1     bioinformatics analysis    

棘球蚴病(echinococcosis)又称包虫病,是一种危害严重、呈世界性分布的人兽共患性寄生虫病,中国属高发地区之一。目前对于包虫病的免疫学诊断所用抗原是通过粗提原头节、囊液蛋白而获得,虽具有较高的敏感性和特异性[1],但抗原成分复杂,易发生过敏反应,且抗原来源困难,不利于大规模生产,限制其在临床应用。从棘球蚴原头节、囊液中筛选出具有特异性的抗原,通过基因工程技术大规模合成有望成为今后的发展方向。而抗原表位是抗原分子抗原性的基础,因此预测抗原分子的抗原表位,是寻找特异性抗原分子有效的方法。确定抗原表位常用的技术有X射线衍射与核磁共振分析、实验技术、生物信息学技术[2-3],前两者具有很高的准确性但成本昂贵,技术要求高,而通过生物信息学技术预测抗原表位,不仅可节省大量经费及时间,其预测准确性也随着生物信息学的发展而不断提高。有研究发现,延伸因子1(elongation factor 1,EF-1) 是一种具有潜在诊断价值的抗原[4-5],本研究通过生物信息学技术对其进行分析,旨在了解EF-1在细粒棘球绦虫的免疫学诊断价值。

1 材料与方法 1.1 基因及氨基酸序列

查询GenBank并经BLAST比对确定EF-1基因序列,采用网站自动翻译的氨基酸序列用来后续分析。

1.2 理化性质推测

EF-1的理化性质预测使用Expasy系统的protparam数据库(http://www.expasy.org/tools/protparam.html)。使用DNAStar软件Kyte-Doolittle法,预测EF-1亲水性;Karplus-Schulz法预测EF-1柔性区域;Jameson-Wolf法预测EF-1抗原性指数;Plot-Emini法预测EF-1表面可及性。

1.3 B、T细胞表位预测

利用ABCpred在线软件(http://www.imtech.res.in/raghava/abcpred/)及IEDB软件(http://tools.immuneepitope.org/main/html/tcell_tools.html)综合预测EF-1 B表位,选取2者重叠部分中可能形成B细胞表位的部分。为提高预测准确性,ABCpred只保留得分≥0.8的结果,IEDB软件预测结果中只保留长度 > 7的结果。应用DNAStar软件AMPHI法预测Th细胞抗原表位、Rothbard-Taylor预测含特定基序(motif)的T淋巴细胞抗原表位,综合2种预测结果推测优势性T细胞表位。

1.4 二、三级结构预测

二级结构预测使用SOPMA在线软件(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_ automat.pl?page=/NPSA/npsa_sopma.html),三级结构预测运用SWISS-MODEL网站(http://swissmodel.expasy.org/)同源建模方法,进行自动建模。

1.5 EF-1氨基酸序列同源性分析

从GenBank中下载部分绦虫EF-1的氨基酸序列、使用MEGA软件选择neighbor joining法构建系统发育树。

2 结果 2.1 EF-1基因及氨基酸序列

EF-1基因序列(No.AB306934) 全长1 412 bp,含有2个内含子(1~144、745~776),网站自动翻译的氨基酸序列(No.BAF63675) 由448个氨基酸残基组成。通过protparam数据库预测得到EF-1相对分子量为48 856.7 kDa,等电点pI为9.23,半衰期为30 h(mammalian)、 > 20 h(yeast)、 > 10 h(E.coli),不稳定指数为28.32(为稳定蛋白)。

2.2 EF-1蛋白亲水性、柔性区域、抗原指数及表面可及性(图 1)
图 1 DNAStar软件预测的EF-1蛋白亲水性、柔性区域、抗原指数及表面可及性

Kyte-Doolittle法预测的EF-1亲水性得分较高的区域为35~45、52~70、126~140、158~183、301~322、357~380、424~448;Karplus-Schulz法预测的柔性区域散在分布,较大的几个区域为26~45、54~71、162~176、300~318、357~381、432~448;Jameson-Wolf法预测的抗原性指数得分较高的区域分布与Karplus-Schulz法预测的柔性区域一致;Plot-Emini法预测的表面可及性得分较高的区域较少,主要分布在39~54、62~76、128~132、161~170、220~234、315~329、354~372、424~448。

2.3 B细胞表位预测(图 2)
图 2 IEDB软件预测的EF-1 B细胞表位

通过ABCpred软件,得到的可能形成B细胞线性表位的氨基酸序列区域为87~103、114~130、146~162、187~203、253~269、279~295、304~320、330~346、336~352、362~378、377~393,IEDB软件预测的区域为17~24、41~52、120~134、198~210、221~231、286~296、306~325、365~383,两者重叠区域中可能形成B细胞线性表位的氨基酸序列为:120~130、286~295、306~320、365~378。

2.4 T细胞表位预测

AMPHI法预测可能形成T细胞表位的区域为15~22、34~49、82~92、97~106、163~175、212~251、258~266、280~290、367~378、397~408;Rothbard-Taylor法预测可能的T淋巴细胞抗原表位为36~51、94~101、155~162、172~179、181~188、217~224、236~242、281~291、321~330、349~355、356~362、398~405、420~428,取两者重叠部分,得到可能的优势性T细胞表位区域为34~48、164~177、222~244、280~290、321~330、396~407。

2.5 二、三级结构(图 3)
图 3 SWISS-MODEL网站构建的EF-1三级结构

SOPMA在线软件预测的EF-1二级结构中α螺旋占32.81%、β折叠占22.54%、β转角占10.94%、无规则卷曲占33.71%,SWISS-MODEL网站预测的EF-1的三级结构见图 3

2.6 EF-1基因同源性分析(图 4)
图 4 MEGA软件构建的EF-1的neighbor joining系统发育树

从构建的系统发育树来看,EF-1具有较高的保守性,除多房棘球绦虫外,其他聚于一枝,并且在这枝内部形成梳齿状分枝,人作为外类群单独处于一枝。

3 讨论

EF-1是一种多聚体核糖体蛋白质,在细胞内普遍存在且大量表达,真核细胞可能有α、β、γ、δ 4个亚基。其中α亚基属G蛋白家族,与鸟苷酸结合调节蛋白(guanine nucleotide-binding regulatoryprotein,GTP)、氨基酰-tRNA组成复合体,促进氨基酰-tRNA进入氨基酰位,EF-1β具有GTP酶活性,在EF-1α从核糖体脱落构象由GDP变为GTP准备结合新氨基酰-tRNA的过程中起催化作用,γ亚基常与β亚基形成复合物,可提高β亚基的GTP酶活性[6-7]。有研究发现,在脊椎动物中还有δ亚基,其C端与β亚基具有同源性,但N端没有,提示,它们可能执行着不同功能[8]

生物信息学是由生物学、计算机和信息论等融合而成的一门学科,组织和存储了海量由基因遗传学、分子生物学和生物技术推动的生物信息[9]。已在药物设计、蛋白结构预测,表位疫苗预测等方面得到广泛应用。随着理论和技术的积累,大量蛋白、抗原表位数据库得以建立,如MHC配体和多肽基序的数据库SYFPEITHI、欧洲蛋白序列数据库(Swiss-Prot Protein Sequence Database,SWISS-PROT)、免疫表位数据库(immune epitope database,IEDB)、B细胞表位预测数据库(prediction of linear B-cell epitopes,Bcepred)等,预测结果精确度不断提高,使得通过生物信息学技术预测蛋白结构、抗原表位成为及时高效的手段。

抗原表位是指免疫应答过程中被特异的效应分子或B、T淋巴细胞识别的抗原分子中具有特殊结构与免疫活性的化学基团,根据所结合细胞的不同,分为B细胞表位和T细胞表位[10-11]。B细胞表位多为亲水性氨基酸或单糖残基,常位于抗原分子表面,而T细胞表位常为隐藏于抗原内部的疏水性肽段[2]。抗原表位决定着抗原分子的抗原性,研究抗原分子的抗原表位,对诊断试剂的制备、多肽疫苗的合成、单克隆抗体的筛选具有重要意义[12]

对于B细胞线性表位的预测主要通过蛋白亲水性、柔性区域、抗原指数、表面可及性、二级结构综合来推测可能形成结合抗原的区域[13-16],亲水性区域位于抗原表面与B细胞表位关系密切。本研究结果显示,EF-1蛋白亲水性区域占50%以上,柔性区域的分布与抗原指数的分布区域一致,占60%以上,这为EF-1形成B细胞抗原表位提供了有利条件;表面可及性分布的区域较少提示,EF-1也可能形成构象表位。结合ABCpred和IEDB软件分析的结果得到可能形成B细胞抗原表位区域为:120~130、286~295、306~320、365~378,与抗原指数得分较高的区域分布有较大的重叠区域。研究表明二级结构中,α螺旋、β折叠常位于抗原内部,形态固定,结构规则,不利于抗体结合,而β转角和无规则卷曲位于抗原的表面,利于抗体结合,易于形成抗原表位[17]。SOPMA在线软件预测的EF-1二级结构中β转角占10.94%、无规则卷曲33.71%,为形成B细胞抗原表位提供了有利条件;EF-1三级结构中有较多的无规则卷曲,为形成B细胞线性表位提供了可能。

T细胞表位常位于抗原内部的疏水性区域。本研究结合AMPHI与Rothbard-Taylor的预测结果,得到EF-1可能的优势性T细胞表位区域为34~48、164~177、222~244、280~290、321~330、396~407,由亲水性预测结果来看,这些区域多分布在得分为负值的疏水性区域,结果较为准确。从构建的系统发育树来看,EF-1具有较高的保守性,除多房棘球绦虫外,其他均聚在一枝,并在这枝内部呈现梳齿状分枝。提示,EF-1在棘球绦虫与其他绦虫之间存在种属差异,利用这种差异,寻找细粒棘球绦虫EF-1特有表位,可为设计表位抗原疫苗提供新的选择[18-19]

参考文献
[1] Zhang W, Wang S, McManus DP. Echinococcus granulosus genomics:a new dawn for improved diagnosis, treatment, and control of echinococcosis[J]. Parasite, 2014, 21: 66. DOI:10.1051/parasite/2014066
[2] 宋帅, 李春玲, 贾爱卿, 等. 抗原表位研究方法进展[J]. 动物医学进展, 2010, 12: 87–91. DOI:10.3969/j.issn.1007-5038.2010.01.021
[3] Dall′Antonia F, Pavkov-Keller T, Zangger K, et al. Structure of allergens and structure based epitope predictions[J]. Methods, 2014, 66(1): 3–21. DOI:10.1016/j.ymeth.2013.07.024
[4] Matsubayashi M, Teramoto-Kimata I, Uni S, et al. Elongation factor-1α is a novel protein associated with host cell invasion and a potential protective antigen of Cryptosporidium parvum[J]. J Biol Chem, 2013, 288(47): 34111–34120. DOI:10.1074/jbc.M113.515544
[5] 刘玉江, 戴佳琳, 黄江, 等. 猪带绦虫成虫EF-1基因生物信息分析及原核表达[J]. 中国公共卫生, 2011, 27(1): 83–84. DOI:10.11847/zgggws2011-27-01-40
[6] 庞建新, 黄江, 胡旭初, 等. 亚洲带绦虫成虫延伸因子-1基因的克隆和分析[J]. 热带医学杂志, 2007, 06: 513–515. DOI:10.3969/j.issn.1672-3619.2007.06.003
[7] Sasikumar AN, Perez WB, Kinzy TG. The many roles of the eukaryotic elongation factor 1 complex[J]. Wiley Interdiscip Rev RNA, 2012, 3(4): 543–555. DOI:10.1002/wrna.1118
[8] Cao Y, Portela M, Janikiewicz J, et al. Characterisation of translation elongation factor eEF1B subunit expression in mammalian cells and tissues and colocalisation with eEF1A2[J]. PLoS One, 2014, 9(12): e114117. DOI:10.1371/journal.pone.0114117
[9] Soria-Guerra RE, Nieto-Gomez R, Govea-Alonso DO, et al. An overview of bioinformatics tools for epitope prediction:implications on vaccine development[J]. J Biomed Inform, 2015, 53: 405–414. DOI:10.1016/j.jbi.2014.11.003
[10] Zhang C, Li Y, Tang W, et al. The relationship between B-cell epitope and mimotope sequences[J]. Protein Pept Lett, 2016, 23(2): 132–141. DOI:10.2174/0929866523666151230124538
[11] Backert L, Kohlbacher O. Immunoinformatics and epitope prediction in the age of genomic medicine[J]. Genome Med, 2015, 7: 119. DOI:10.1186/s13073-015-0245-0
[12] Saravanan V, Gautham N. Harnessing computational biology for exact linear B-cell epitope prediction:a novel amino acid composition-based feature descriptor[J]. OMICS, 2015, 19(10): 648–658. DOI:10.1089/omi.2015.0095
[13] 梁瑾, 王靖飞. B细胞表位预测方法研究进展[J]. 生命科学, 2009, 2: 320–323.
[14] Lian Y, Ge M, Pan XM. EPMLR:sequence-based linear B-cell epitope prediction method using multiple linear regression[J]. BMC Bioinformatics, 2014, 15: 414. DOI:10.1186/s12859-014-0414-y
[15] Hu YJ, Lin SC, Lin YL, et al. A meta-learning approach for B-cell conformational epitope prediction[J]. BMC Bioinformatics, 2014, 15: 378. DOI:10.1186/s12859-014-0378-y
[16] Huang JH, Wen M, Tang LJ, et al. Using random forest to classify linear B-cell epitopes based on amino acid properties and molecularfeatures[J]. Biochimie, 2014, 103: 1–6. DOI:10.1016/j.biochi.2014.03.016
[17] Nasrul Islam M, Iqbal S, Katebi AR, et al. A balanced secondary structure predictor[J]. J Theor Biol, 2016, 389: 60–71. DOI:10.1016/j.jtbi.2015.10.015
[18] 彭传林, 魏川川, 吴建伟, 等. 家蝇溶菌酶MDLZM基因克隆、表达和序列分析[J]. 中国公共卫生, 2015, 31(6): 764–766. DOI:10.11847/zgggws2015-31-06-20
[19] 赵学军, 国果, 修江帆, 等. 家蝇伴侣蛋白CCTη基因序列分析与表达模式[J]. 中国公共卫生, 2015, 31(8): 1043–1046. DOI:10.11847/zgggws2015-31-08-18