中国公共卫生  2009, Vol. 25 Issue (10): 1214-1215   PDF    
猪带绦虫腺苷酸激酶基因及蛋白结构特性分析
戴佳琳1, 黄江1, 廖兴江1, 周灵贵1, 申萍香1, 刘玉江1, 郎书源2     
1. 贵阳医学院多媒体形态学实验室, 贵阳 550004;
2. 贵阳医学院寄生虫学教研室
摘要: 目的 分析和预测猪带绦虫腺苷酸激酶(ADK)基因及其编码的蛋白结构和特性。 方法 利用各种在线生物信息网站及其它分析软件包,分析从猪带绦虫成虫cDNA质粒文库中识别的腺苷酸激酶基因的结构和编码区序列,分析、预测编码的蛋白质的理化特性、抗原表位、翻译后的修饰、功能域、亚细胞定位、拓扑结构、二级结构、三维空间构象等。 结果 该基因全长864 bp,编码区为110~758,编码215个氨基酸,为全长基因。理论分子量、等电点分别为23771.4 Da和6.86;没有跨膜区;三维结构建模图显示其线性表位的部位。 结论 应用生物信息方法从猪带绦虫成虫cDNA文库中筛选出了腺苷酸激酶基因的cDNA全长序列并预测得到其结构与功能方面的信息。
关键词猪带绦虫     腺苷酸激酶     cDNA     生物信息学    
Prediction and analysis for structure and function of adenylate kinase gene from Taenia solium by bioinformatics
DAI Jia-lin, HUANG Jiang, LIAO Xin-jiang, et al     
The Basic Medical Morphology Experimental Center, Guiyang Medical College (Guiyang 550004, China)
Abstract: Objective To analyze and predict the structure and characteristics of adenylate kinase gene from Taenia solium by bioinformatics for its biological function and application research. Methods With analyzing tools of bioinformatics in webs site and bioinformatics software package, adenylate kinase was recognized from the Taenia solium full-length cDNA plasmid libratory andits gene structure and coding region sequence was analyzed andits physical-chemical characteristics, topo logical structure and 3 Dstructure were predicted. Results The full gene is 864 bp in length and its coding region is 110-758, coding 215 amino acids.It is a complete full-length gene comparing with the homologues in Gen Bank.The prote in has no transmem brane region.The molecular weight of adeny late kinase gene is predicted to be 23771.4Da.The proe in contains no transmem brane region and subcellular location sequecce.The predicted amino acid sequence shows 66% identity and 84% smiilarity with that of ADK form Schisto somaja ponicum. Conclusion The cDNA sequence encoded adenylate kinase gene was screened from cDNA library of adult Taenia solium by bioinformatical method.The gene and prote in structure and characteristics of Taenia soliumadeny late kinase were obtained.
Key words: Taenia solium     adenylate kinase     cDNA     bioinformatics    

带绦虫是常见的人兽共患寄生虫,人是这3种带绦虫唯一的终宿主,牛和猪是其主要的中间宿主,猪带绦虫感染人也可引起后果严重的囊尾蚴病(囊虫病)。本课题组先后构建了3种人体带绦虫的cDNA质粒文库,获得猪带绦虫1 171条Uni Gene。这些基因的功能涉及了虫体的结构、代谢、运动、致病、物质转运、免疫等多个方面,为药物筛选和疫苗研究提供了丰富的基因资源1。本研究从猪带绦虫成虫cDNA质粒文库中筛选出与日本血吸虫同源较高的腺苷酸激酶(ADK)基因,通过生物信息学的方法预测该基因编码蛋白的结构和功能特性,为实验研究和应用前景提供科学依据。

1 材料与方法 1.1 材料

猪带绦虫成虫cDNA质粒文库构建、大规模标签(EST)测序及Unigene归并由本课题组与北京华大基因公司合作完成,Unigene通过WU-blastx方法进行识别3

1.2 方法 1.2.1 基因序列对比

通过NCBI网站的BLASTx程序4 (http://www.ncb.inlm.nih.gov/BLAST/)将目的基因与GeneBank中的序列进行比对,分析该基因的翻译序列与其他蛋白质氨基酸序列的一致性,判断其是否为全长基因,目的基因序列测序是否正确。

1.2.2 综合性蛋白核酸分析

利用综合性蛋白核酸分析工具包(vector NTI suite))中的开放读码框(ORF Finder)确定其完整的编码序列(completecoding sequence,CDS),然后用Translation程序推导并输出其氨基酸序列。

1.2.3 蛋白分析

运用瑞士生物信息学研究所的蛋白分析专家系统(Expert Protein Analysis System,ExPASy,http://ca.expasy.prg/) 5,对目的基因及其产物进行生物信息学分析,预测ADK基因的理化性质,例如:蛋白质理化性质、功能域、跨膜区和拓扑结构、疏水性分析等。

1.2.4 蛋白质空间

构想利用SWISS-MODEL (http://swissmode.lexpasy.org/)6分别通过二级结构比对和折叠,模拟或构建蛋白质的空间构想,并利用vectorNTI suite 8.0软件包中的3 Dmolecu leviewer看图软件显示。

2 结果 2.1 BLASTX分析结果

BLASTX分析结果可见,该基因是ADK的同源基因,与GeneBank中日本血吸虫的同源基因adeny late kinase基因的一致性为66%,相似性为84%。从比对结果分析,该基因的5'端序列长于日本血吸虫adeny late kinase的完整编码序列,所以该基因应该是猪带绦虫ADK全长基因序列。该基因全长586 bp,编码区为110~758 bp,编码216个氨基酸,在5′端和3′端都有非翻译区。其最大ORF为其完整编码区。

2.2 蛋白质的理化性质

猪带绦虫ADK基因的理论分子量和等电点分别是23771.4 Da和6.86。假设形成2对二硫键时,280 nm处的摩尔消光系数为7575 mol/cm,0.1%浓度(1 g/L)的Abs为0.319;假设二硫键全部打开时,280 nm处的摩尔消光系数为7 450 mol/cm,0.1%浓度(1 g/L)的Abs为0.313。当成熟肽N端的一个氨基酸为蛋氨酸时,在哺乳动物网状红细胞体外表达的半衰期为30 h,在酵母和大肠埃希菌中体内表达的半衰期分别 > 20和10 h。在溶液中的不稳定指数为21.72,低于域值40,在溶液中性质稳定,疏水指数为88.37,总亲水性为-0.321。

2.3 亚细胞扫描定位

未发现线粒体、过氧化酶体、溶酶体和细胞核等亚细胞定位序列。扫描一级结构中包含的结构和功能域特征序列该氨基酸序列中含有7个腺苷酸激酶(ADK)的结构域。

2.4 蛋白质的拓扑结构、二级结构和亲水性特征

预测结果显示:腺苷酸激酶为非跨膜蛋白。Sec预测α螺旋(H)、β折叠(E)和无规卷曲(L)的比例分别是49.24:9.64:41.12。预测每个氨基酸的溶剂可及性(A cc),超过16%的表面暴露的定义为暴露氨基酸(e),其余氨基酸则为包埋氨基酸(b)。分析结果表明,大部分氨基酸残基包埋在蛋白质外部,在水溶性中,蛋白质分子为一伸展结构。

2.5 亲水性和免疫学特性分

通过B细胞表位在线分析工具,预测该蛋白含有10个潜在的B细胞抗原线性表位。

2.6 ADK的三维结构图线性表位和酶活性中心氨基酸的位置(图 1)
图 1 ADK的3D结构和催化中心氨基酸的空间位置

Swiss-model将猪带绦虫ADK与蛋白结构数据库中的蛋白质三维结构进行匹配,输回模拟的ADK三维结构图文件,在vector NTI suite软件包中打开该蛋白质结构文件,主要线性表位位于膜外。

3 讨论

本课题组获得的大量猪带绦虫的Unigene通过生物信息学分析所得到的结果,可以指导进行猪带绦虫的生理生化、代谢的深入研究。通过BLASTX分析我们发现在Genebank中有腺苷酸激酶(ADK)其同源序列,经过多个生物信息学分析软件预测,该基因与日本血吸虫同源较高,一致性为66%,相似性为84%,且具有ADK的特征性氨基酸序列和保守功能域,因此我们推测该基因为猪带绦虫为ADK基因。基于此分析结构,认为可以在以后的实验中验证该基因编码的蛋白是否具有ADK的功能特点。

研究发现,ADK广泛存在于有机体中,维持腺苷酸组成成分的体内平衡,是有机体中一种重要的酶类,在维持能量代谢及酶活性中起着重要的作用。在大肠埃希菌细胞中ADK酶结构基因的损伤可产生条件致死突变。在脊椎动物中,ADK酶至少有2种类型的同工酶且组织分布和在细胞内的定位不同,及彼此间在催化和免疫特性方面也不尽相同7-8;此外,ADK还可能参与了细胞凋亡9。因此,对该基因的研究可以帮助探讨猪带绦虫的运动及寄生等过程。本研究对猪带绦虫的ADK基因及其编码的蛋白的结构和功能进行全面的生物信息学预测分析,包括基因的编码区的完整性分析,编码蛋白质的理化性质、一级结构,二级结构以及空间结构等,并通过同源基因的比对排列,分析保守的氨基酸残基位点及其在维持蛋白结构和功能方面的重要作用,得到了一些有价值的信息,未发现该蛋白有跨膜区(M),推测不是膜蛋白;没有信号肽,提示它一般不会分泌到细胞外;还不具有线粒体、过氧化酶体、质体、溶酶体等亚细胞定位序列,提示可能是胞浆蛋白,具有10个主要的B细胞抗原表位等等,以上均可确定该基因在分子分类学上的应用潜力。

参考文献
[1] 戴鹏, 戴佳琳, 黄江, 等. 亚洲牛带绦虫T aCRISP基因的克隆、表达和序列分析[J]. 中国公共卫生, 2009, 25(4) : 398–400.
[2] 黄江, 胡旭初, 徐劲, 等. 亚洲牛带绦虫26kDa GST基因表达及免疫学分析[J]. 中国公共卫生, 2008, 24(8) : 970–972.
[3] 黄江, 胡旭初, 包怀恩, 等. 亚洲带绦虫成虫全长cDNA质粒文库的构建及EST测序[J]. 热带医学杂志, 2007, 7(2) : 116–118.
[4] Vullo A, Frasconi P. Disulfide connectivity prediction using recursive neural networks and evolutionary information[J]. Bioin form atics, 2004, 20 : 653–659.
[5] 尚丹, 国强华, 景霞. 常用医学生物信息学[M]. 北京: 北京大学医学出版社, 2003: 148-258.
[6] Schwede T, Kopp J, Guex N, et al. SWISS-MODEL:an automated protein homology-modeling server[J]. Nucleic ACIDS Research, 2003, 31(13) : 3381–3385. DOI:10.1093/nar/gkg520
[7] Fujisawa K, Murakami R, Horiguchi T, et al. Adenylate kinaseisozyme 2 isessential for growth and development of Drosophila melanoga ster[J]. Comparative Biochem istry and Physio logy, 2008, 63(6) : 29–38.
[8] 彭鸿娟, 陈晓光, 卢晓昭, 等. 日本血吸虫新基因-腺苷酸激酶基因的发现与克隆[J]. 第一军医大学学报, 2002, 22(8) : 693–696.
[9] 赖秋安, 胡建军, 孙久荣. 腺苷酸激酶与细胞凋亡[J]. 生物化学与生物物理进展, 2001, 28(4) : 444–446.