中国公共卫生  2009, Vol. 25 Issue (9): 1094-1096   PDF    
亚洲带绦虫膜联蛋白B3基因生物信息学分析
黄映康1, 戴佳琳1, 黄江2, 廖兴江2, 申萍香2, 郎书源2, 周灵贵2     
1. 贵阳医学院法医学教研室, 贵阳 550004;
2. 贵阳医学院多媒体形态学实验室及寄生虫学教研室
摘要: 目的 识别亚洲带绦虫新基因, 分析和预测该基因及其编码蛋白的结构和特性, 为其生物学功能研究提供依据. 方法 利用在线生物信息学网站及工具进行序列分析、预测其编码的膜联蛋白B3的理化特性、抗原表位、翻译后的修饰、功能域、亚细胞定位、拓扑结构、二级结构、三维空间构象、进化树等. 结果 该基因全长1176 bp, 编码区为70~588 bp, 编码173个氨基酸, 为全长基因; 无跨膜区; 具有多个磷酸化位点和B细胞线性表位; 蛋白的理化性质稳定, 理论分子量为19339.7;没有质体、线粒体定位序列; 氨基酸序列高度保守. 结论 运用生物信息学方法从亚洲牛带绦虫成虫cDNA文库中识别出了亚洲牛带绦虫成虫膜联蛋白B3基因, 并对其所编码的蛋白质的结构与功能进行预测.
关键词亚洲牛带绦虫     膜联蛋白B3     cDNA     生物信息学    
Bioinformatics analysis for structure and function of annexins B3 from Taenia saginata asiatica
HUANG Ying-kang, DAI Jia-lin, HUANG Jiang, et al     
Department of Forensic, Guiyang Medical College, Guiyang 550004, China
Abstract: Objective To identify novel gene by screening the cDNA library of adult Taenia saginata a siatica (Ta), so as to predict the structure and function of the gene. Methods By on line analysis at bioinformatics websites and employing software package, the physical chemical characteristics, modification sitesafter translation, domains, subcelluar location, to pological structure, second structure, and 3d miension structure of annex in sB3 were predicted. Results Taannexins B 3 possesses a molecular mass of 19211.0, pI 6.44 and the sequence contains 1176bp with coding region from 70 to 588, encoding for 173 amino acid.The amino acid sequence shows 58% identity and 78% positives with that of Taenia solium.The prote in contains notransmem brane region and subcellular location sequence. Conclusion Annex in sB3 gene was screened from the cDNA library of adult Taenia saginata a siatica by bioinformatical method.
Key words: Taenia saginata asiatica     annexins B3     cDNA     bioinformatics    

膜联蛋白(Annexins)存在于各种真核生物的细胞内, 它独有的广泛性、稳定性及表达丰富性的特点, 表明膜联蛋白在机体的生命活动中有十分重要作用1。有研究表明, 膜联蛋白B3是扁形动物门Annexins家族新成员, 因此, 对该基因的研究有助于进一步了解其生物学功能及开辟预防治疗寄生虫病的新途径。本课题组于2006年开始进行亚洲带绦虫功能基因组学的研究", 并且在亚洲牛带绦虫成虫cDNA质粒文库中筛选出与猪带绦虫同源较高的Annexins B3基因, 通过生物信息学方法预测该基因编码蛋白的结构和功能特性, 为进一步研究提供基础依据。

1 对象与方法 1.1 材料

虫体标本采自亚洲牛带绦虫流行区贵州省都匀市米秀乡患者, 成虫全长cDNA质粒文库构建, 大规模构建和标签(EST)测序及Unigene归并由本课题组与上海联合基因公司合作完成, Unigene通过Wublastx方法进行识别5。编码亚洲牛带绦虫成虫膜联蛋白B 3基因的文库质粒编号为HC8一F10。

1.2 方法

通过NCBI网站的BLASTx程序6(http:// WWW.ncbi.nlm.nih.gov/BLAST/)将文库质粒编号为HC8一F10的插入序列与GeneBank中的序列进行比对, 分析该基因的翻译序列与其他蛋白质氨基酸序列的一致性, 判断其是否为全长基因。利用rpsblast分析其保守功能域。利用综合性蛋白核酸分析工具包(vector NTI suite)中的开放读码框架(ORF) Finder确定其完整的编码序列(complete coding se-quence, CDS), 然后用Translation程序推导并输出其氨基酸序列; 运用瑞士生物信息学研究所的蛋白分析专家系统(Expert Protein Analysis System, ExPASy, http://ca.expasy. pr), 对目基因及其产物进行生物信息学分析, 预测Ta.an-nexins B3基因的理化性质6

2 结果 2.1 BLASTX分析(图 1)
图 1 Ta. Annexins B3全长cDNA序列及其ORF编码的氨基酸序列图

分析结果显示, 该基因是An-nexins B3的同源基因, 与GeneBank中猪带绦虫(Taeniasoli. nm) Annexins B3基因同源性最高, 其一致性为58%, 相似性为78%。从比对结果分析, 该克隆基因的5'端序列长于猪带绦虫Annexins B3的完整编码序列, 所以该基因应该是亚洲牛带绦虫Annexins B3全长基因序列, 该基因全长1176 bp, 编码区为69~588 bp, 编码173个氨基酸, 在5'端和3'端都有非翻译区。其最大ORF为其完~整编码区; 且该基因序列具有Annexins超家族的完整的保守功能域。

2.2 蛋白质的理化性质

亚洲牛带绦虫Annexins B3的理论分子量(Mr)和等电点分别为19 339.7 Da和6.44。假设形成个二硫键时, 则其在水溶液中280 m处摩尔消光系数为7 115 M/cm, 0.1%浓度(1g/L)的吸光度(A280)为0.368;假设二硫键全部打开时, 280 nm出的摩尔消光系数为6 990 M/cm, 0.1%浓度(1g/L)的吸光度(A280)为0.361。若其成熟肽N端为蛋氨酸时, 在哺乳动物网状红细胞体外表达的半衰期为30 h, 在酵母和大肠埃希菌中表达的半衰期分别> 20和10 h。在溶液中的不稳定指数为44.59, 高于阈值40, 在溶液中性质不稳定。脂肪族指数93.70, 总亲水性为一0.264, 蛋白质总体疏水性较高。

2.3 翻译后修饰、亚细胞定位的预测

用Motif scanning (Motifscan)分析Ta.Annexins B3特定位点结果显示, Ta.An nexins B3含有1个潜在的天冬氨酸糖基化位点:167~170, 1个潜在cAM P磷酸化位点:132-135, 3个潜在的酪蛋白激酶Ⅱ(CK2)磷酸化位点:79-82, 113-116, 148-151;1个潜在的N-肉豆蔻酰位点:27-32;2个潜在的蛋白激酶C (PKC)磷酸化位点:43-45, 69-71;4个膜联蛋白激活位点:14-77、86-159、14-79、86-159;该蛋白不具有分泌性信号肽, 未发现线粒体、过氧化酶体、溶酶体、质体和细胞核等亚细胞定位序列。

2.4 亚洲牛带绦虫B3蛋白结构和功能域特征序列

该氨基酸序列中含有8个ANNEXIN保守的催化位点motif, 1个AN NEXIN XIII结构域, 其结构域分为N端和C端2部分, 推测其可能是ANNEXIN蛋白家族中的一员, 参与细胞骨架运动、胞吞与胞吐、形成膜离子通道、调节细胞内钙离子浓度、抑制磷脂酶A2活性等。

2.5 蛋白质的拓扑结构、二级结构和亲水性特性

Htm预测Annexins B3蛋白是一个胞浆内蛋白, 无跨膜区。Sec预测α螺旋(H)、β折叠(E)和无规卷曲(L)的比例分别为70.53: 0:29.48, 二级结构以α螺旋(H)和无规卷曲(L)为主。属于全α型。预测每个氨基酸的溶剂可及性(Acc), 超过16%的表面暴露的定义为暴露氨基酸(e), 其余氨基酸则为包埋氨基酸(b), 从分析结果来看, e为72.25%, b为27.75%, 提示大部分氨基酸残基暴露在蛋白质外部, 在水溶液中, 蛋白质分子打开成一个伸展的结构。

2.6 亲水性和免疫学特性分析

通过B细胞表位在线分析工具http://tools.immuneepitope.org/main/jsp/menu.jsp预测亚洲牛带绦虫Annexins B3含有3个主要的B细胞抗原线性表位:aa24-aa29(KGFGSD), aa41-aa47(SSSQRRE), aa141 -aa151(EADVRDDTSGD)。

2.7 三维结构图及线性表位的位置

Swiss-model将Ta. Annexins B3与蛋白结构数据库中的蛋白质三维结构进行匹配, 输回模拟的Ta.Annexins B3三维结构图〔9-10〕, 文件在vector NTI suite软件包中打开该蛋白质结构文件, 2个关键的线性表位均位于膜外。

2.8 Ta.Annexins B3分子进化树的构建(图 2)
图 2 亚洲牛带绦虫Annexins B3与其他物种Annexins B3的分子进化树

3 讨论

对亚洲牛带绦虫Annexins B3的结构和功能进行生物信息学预测分析后, 获得了一些重要的信息:(1)通过Blastx从亚洲带绦虫成虫cDNA质粒文库中识别出一个编码Annexins B3的全长基因, 且该基因的二级结构基本上以螺旋为主, 提示该蛋白结构紧密而稳定, 未发现有跨膜区(M), 超过一半的氨基酸残基暴露在蛋白质外部, 推测不是膜蛋白; (2) Annexins B3的分子中没有信号肽, 提示它一般不会分泌到细胞外, 但是从很多文献看, 该基因却具有许多细胞外的功能, 此外它还不具有线粒体、过氧化酶体、质体、溶酶体等亚细胞定位序列, 提示可能是胞浆蛋白; (3)利用Vector NTI suite软件包中的AlignX程序对多种处于不同进化阶元的典型物种的Annexins B3序列的比对分析, 构建分子进化树, 得知不同进化阶元物种的Annexins B3分子在某些位置的氨基酸高度保守, 是一个研究物种进化的理想的分子指标, 可以对那些形态学难以鉴别的物种进行分类; (4)根据多重序列比对图及三维结构图, 看到该基因2个关键的线性表位均位于膜外, 这对以后的免疫定位及研究这2个表位对该基因的功能有着一定的指导作用。

迄今为止, 大量的膜联蛋白实验主要针对猪带绦虫囊尾蚴的研究, 但是作为与猪带绦虫有一定区别的亚洲牛带绦虫, 该基因的研究却较少。因此, 利用生物信息学工具和软件所得到的结果有助于更好地针对目的基因进行研究, 避免实验的盲目性。还可以利用生物信息学分析得到的信息, 通过实验进一步验证其生物学活性, 为亚洲带绦虫在诊断、药物及疫苗研究中的研究提供线索。

参考文献
[1] Moss SE, Morgan RO. The annexins[J]. Genome Biol, 2004(5) : 219–221.
[2] 黄江, 胡旭初, 包怀恩, 等. 亚洲带绦虫成虫全长cDNA质粒文库的构建及EST测序[J]. 热带医学杂志, 2007, 7(2) : 116–118.
[3] 黄江, 胡旭初, 徐劲, 等. 亚洲牛带绦虫26kDaGST基因表达及免疫学分析[J]. 中国公共卫生, 2008, 24(8) : 970–972.
[4] 尚丹, 国强华, 景霞. 常用医学生物信息学[M]. 北京: 北京大学医学出版社, 2003: 148-258.
[5] 乔纳森·佩夫斯纳. 生物信息学与功能基因组学[M]. 北京: 化学工业出版社, 2008: 80-213.
[6] Gerke V, Moss SE. Annexins: from structure to function[J]. Physiol Rev, 2002, 82 : 331–371. DOI:10.1152/physrev.00030.2001