林业科学  2014, Vol. 50 Issue (8): 108-118   PDF    
DOI: 10.11707/j.1001-7488.20140816
0

文章信息

宋传生, 胡佳续, 林彩丽, 任争光, 耿显胜, 田国忠
Song Chuansheng, Hu Jiaxu, Lin Caili, Ren Zhengguang, Geng Xiansheng, Tian Guozhong
泡桐丛枝植原体河北平山和江西吉安株系胸苷酸激酶基因多态性分析
Thymidylate Kinase Gene Polymorphism of Two Strains of Paulownia Witches’-Broom Phytoplasma
林业科学, 2014, 50(8): 108-118
Scientia Silvae Sinicae, 2014, 50(8): 108-118.
DOI: 10.11707/j.1001-7488.20140816

文章历史

收稿日期:2014-02-17
修回日期:2014-04-07

作者相关文章

宋传生
胡佳续
林彩丽
任争光
耿显胜
田国忠

泡桐丛枝植原体河北平山和江西吉安株系胸苷酸激酶基因多态性分析
宋传生1, 胡佳续2, 林彩丽1, 任争光1, 耿显胜3, 田国忠1     
1. 中国林业科学研究院森林生态环境与保护研究所 国家林业局森林保护学重点实验室 北京 100091;
2. 天津出入境检验检疫局 天津 300457;
3. 中国林业科学研究院亚热带林业研究所 富阳 311400
摘要:设计引物并PCR扩增河北平山株系PaWBPs和江西吉安株系PaWBJan的tmk基因,直接和克隆测定tmk序列,利用DNAMAN,MEGA等软件进行序列多样性、序列变异、蛋白功能域、系统进化等比较分析。结果表明:从PaWBPs和PaWBJan中克隆测序的93条和41条tmk-a中,分别有52和24种不同的序列,tmk-a ORF可被划分为2类,tmk-a -1 为639 bp,tmk-a -2 为627 bp,PaWBPs株系tmk-a -1 与tmk-a -2 序列条数的比值约为2.5,而PaWBJan株系为3.3;PaWBPs有5个相同的tmk-a -1 序列与PaWBJan的一个tmk-a -1 序列及枣疯植原体tmk-Y序列完全一致。因多位点突变,PaWBPs含假基因比例达48.1%,PaWBJan的为41.7%;tmk-b基因为单一序列,两株系的tmk-b核酸序列相似性为99.8%,编码蛋白仅有一个氨基酸差异。TMK-a和TMK-b中都具有胸苷酸激酶的3个保守功能域。系统进化分析显示,泡桐丛枝植原体的2个株系的所有tmk-a序列都与枣疯植原体tmk-Xtmk-Y等聚为一个进化枝Ⅰ中;而tmk-b与小麦蓝矮tmk -2 等聚为另一进化枝Ⅲ,基于tmk-b序列和基于16S rDNA序列构建的系统进化树一致,tmk-b有助于植原体16Sr组水平的分类,而tmk-a可用于植原体株系变异和遗传多样性分析。
关键词泡桐丛枝植原体    胸苷酸激酶基因    假基因    功能域    变异    系统进化    
Thymidylate Kinase Gene Polymorphism of Two Strains of Paulownia Witches’-Broom Phytoplasma
Song Chuansheng1, Hu Jiaxu2, Lin Caili1, Ren Zhengguang1, Geng Xiansheng3, Tian Guozhong1     
1. Key Laboratory of Forest Protection of State Forestry Administration Research Institute of Forest Ecology, Environment and Protection, CAF Beijing 100091;
2. Tianjin Entry-Exit Inspection and Quarantine Bureau Tianjin 300457;
3. Research Institute of Subtropical Forestry, CAF Fuyang 311400
Abstract: The diversity, variation, predicted protein function domains and evolution of thymidylate kinase gene (tmk),which was obtained by cloning DNA sequencing of PCR products with designed primer from paulownia witches'-broom phytoplasmas Pingshan strain (PaWBPs) in Hebei Province and Ji'an strain (PaWBJan) in Jiangxi Province were comparatively analyzed by DNAMAN and MEGA software. The 52 and 24 different tmk-a homologues respectively from the cloned 93 sequences of PaWBPs and 41 of PaWBJan in total were identified, whereas the tmk-b gene sequence was relatively conserved, with 99.8% similarity and only one amino acid variation of the predicted proteins between the two strains. All tmk-a ORFs were classified into tmk-a-1 (639 bp) and tmk-a-2 (627 bp). The ratio of tmk-a-1/tmk-a-2 in PaWBPs and PaWBJan was 2.5 and 3.3, respectively. Five cloned tmk-a-1 sequences of PaWBPs were the same as one in PaWBJan as well as tmk-Y of jujube witches' broom phytoplasma. In addition, PaWBPs and PaWBJan respectivety contained up to 48.1% and 41.7% of predicted tmk-a pesudogenes in total tmk-a due to the multiple locus mutation. Rich sequence variability was found in tmk-a homologues of PaWBPs and PaWBJan and there existed three functional domains in amino acid sequences of both tmk-a and b which are necessary for thymidylate kinase activity. The phylogenetic analysis showed that all the tmk-a homologues of both strains with tmk-X and Y were clustered into clade I, while tmk-b with wheat blue dwarf tmk-2 into clade Ⅲ, suggesting that tmk-b nucleotide sequences consistent with highly conserved 16S rDNA could be used for the classification of phytoplasmas on 16Sr group levels whereas diverse tmk-a might be helpful for analyzing the genetic variation and diversity of different phytoplasma strains.
Key words: paulownia witches’-broom phytoplasma    thymidylate kinase gene    pesudogene    functional domain    variation    phylogenesis    

泡桐(Paulownia sp.)丛枝病(paulownia witches’-broom,PaWB)是由植原体引起的一种重要林木病害。植原体隶属柔膜菌纲,不具细胞壁,专性寄生于寄主植物韧皮部的筛管及介体昆虫的唾液腺、血淋巴、肠道等组织细胞内,能够引起植物丛枝、矮化、黄化、花变绿及花变叶等症状,是一类重要的植物病原原核生物。依据16 SrRNA和核糖体蛋白基因(rp)序列分析结果,我国泡桐丛枝植原体被归为16SrI组(aster yellows group,翠菊黄化组)D亚组,也是该亚组的唯一成员。泡桐丛枝病在我国发生和分布于北至山海关、南至长江流域的广大范围内(Tian et al., 1996),是国内极具代表性的植原体病害,具有重要的研究价值。

胸苷酸激酶[thymidylate kinase,TMP kinase(TMK); EC 2.4.7.9]广泛存在于各种生物中,可催化磷酰基从ATP转移到dTMP形成dTDP,是dTTP从头合成和补救途径的关键酶,在DNA复制和生物的生存中不可或缺。该酶提供DNA合成和修复所必需的dTTP,对植物合子的第1次分裂、早期种子的萌发具有至关重要的作用(Ronceret et al., 2008); 酿酒酵母(Saccharomyces cervisiae)和拟南芥(Arabidopsis thaliana)胸苷酸激酶基因的表达会受到细胞周期的调节(Ronceret et al., 2008Sclafani et al., 1984White et al., 1987)。Miyata等(2003)首次对日本洋葱黄化植原体的tmk基因进行了克隆、测序、原核表达和体外酶活性测定,并发现了序列多样性。之后的研究发现,已测序的翠菊黄化丛枝(AYWB)、洋葱黄化(OY-M)、苹果丛簇(C and idatus phytoplasma mali strain AT)及澳大利亚葡萄黄化(C and idatus phytoplasma australiense)等植原体的基因组中存在着多拷贝的潜在移动单元PMUs(potential mobile units),PMUs是由一系列包括tmk基因在内的与DNA的合成、修复及重组、核苷酸的合成及转运相关的基因形成的基因簇,并推断类似转座的机制是不同植原体中存在多个tmk基因拷贝的原因(Tran-Nguyen et al., 2009Bai et al., 2006)。徐启聪(2009)发现了与不同地区枣树品种相关的枣疯植原体不同tmk基因型。尽管洋葱黄化和小麦蓝矮植原体的tmk基因已被原核表达、纯化及体外酶活性测定(Miyata et al., 2003李蓓等,2008),然而,tmk基因的功能以及tmk多拷贝的存在对植原体的生存、繁殖、致病性等方面的深层意义依然未知(Hogenhout et al., 2010)。

本研究选取分布于我国地区环境条件明显不同的河北平山和江西吉安2个泡桐丛枝植原体株系PaWBPs和PaWBJan为材料,首次从中克隆了许多不同类型的tmk基因,预测了TMK功能域并对基因序列进行了变异位点及系统进化分析比较,以便明确该植原体的tmk基因特征和株系间变异规律,为进一步开展泡桐丛枝植原体TMK原核表达、纯化、酶活性测定及功能研究奠定了基础,并为植原体的分子分类、鉴定、遗传多样性及植原体基因的同源重组研究提供新的线索。

1 材料与方法 1.1 材料 1.1.1 供试样品

泡桐丛枝植原体河北平山株系和江西吉安株系保存在本实验室发病组培苗中,编号分别为PaWBPs和PaWBJan; 前者来自于华北地区的河北省石家庄市平山县,为泡桐丛枝重病区,后者来自长江流域的江西省吉安市吉安县,为零星病区。健康泡桐材料为本实验室组培苗9501。

1.1.2 主要试剂和仪器

2×Taq Mix、DNA凝胶回收试剂盒、植物基因组DNA提取试剂盒、DNA Marker、大肠杆菌(Escherichia coli)DH5α感受态购自天根生化科技有限公司; pMD18-T载体购自Takara公司; 其他化学试剂为国产分析纯。

1.2 植物基因组DNA的提取

参照天根生化科技有限公司植物基因组DNA提取试剂盒说明书(DP305-02)提取PaWBPs,PaWBJan及健康泡桐9501总DNA,取样量为0.1 g叶片,DNA用100 μL TE溶解。

1.3 PCR扩增及序列测定

利用引物tmka-N(5’-TTG AAT TCC ATA TGA AAT TAA TCG TTT TTG AAG GAC T-3’)/tmka-C(5’-TGA GCT CGA GTT AGT TAT GAT CGC CAT TTG ATA GTA CT-3’)扩增PaWBPs和PaWBJan tmk-a基因(Miyata et al., 2003); 根据已报道植原体OY,AYWB的tmk-b基因序列,设计引物PaWBtmkbF(5’-ATG TTT ATT TCT TTT GAA GGT-3’)/PaWBtmkbR(5’-TCA TAA TTC TAT TTG AAA GAC-3’)扩增PaWBPs和PaWBJan tmk-b基因。

利用引物rp(I)F1A(5’-TTT TCC CCT ACA CGT ACT TA-3’)/rp(I)R1A(5’-GTT CTT TTT GGC ATT AAC AT-3’)及rp(V)F1A(5’-AGG CGA TAA AAA AGT TTC AAA A-3’)/rp(V)R1A(5’-GGC ATT AAC ATA ATA TAT TAT G-3’)验证泡桐丛枝组培苗PaWBPs和PaWBJan不含枣疯植原体(JWB)(Martini et al., 2007)。

PCR反应体系: 25 μL反应体系中含有2×Taq Mix 12.5 μL,DNA 1 μL,10 mmol·L-1正反向引物各0.5 μL,ddH2O 10.5 μL。

PCR反应条件: 94 ℃预变性4 min; 94 ℃变性30 s,55 ℃(tmk-atmk-b)/50 ℃(rp)退火30 s,72 ℃延伸45 s(tmk-atmk-b)/80 s(rp),35个循环; 72 ℃ 10 min; 4 ℃保温。

将PCR产物送北京华大基因公司测序,当PCR产物直接测序不成功时,将切胶纯化的tmk-atmk-b基因克隆到pMD18-T载体上,转化到DH5α感受态大肠杆菌中,分别挑取约100个单菌落送华大基因公司测序。

1.4 序列分析

利用DNAMAN进行序列的拼接、比对,利用MEGA5.1分析序列变异位点及构建进化树。

2 结果与分析 2.1 tmk-atmk-b基因的PCR扩增

分别利用引物对tmka-N/tmka-C和PaWBtmkbF/PaWBtmkbR,从PaWBPs和PaWBJan 基因组DNA中扩增到了大小分别约为640 bp和620 bp的tmk-atmk-b基因; 健康泡桐9501基因组未扩增到特异性片段。

2.2 tmk-atmk-b的序列多样性

PaWBPs和PaWBJan 的tmk-a PCR产物送北京华大基因公司测序,测序峰图都表现为杂峰,可能是由于PCR产物中存在着多种不同的tmk-a序列,因此将tmk-a基因进行克隆测序。

在挑取的所有单菌落中,成功测得93个PaWBPs tmk-a克隆,其中共有52种不同的序列,序列彼此间完全相同的为PaWBPs tmk-a clone 5,13,41,72,80(占PaWBPs tmk-a克隆数的5.4%); PaWBPs tmk-a clone 1,8,10,12,17,24,28,34,35,36,38,43,53,54,56,57,60,65,66,68,70,81,89,90(25.8%),为优势序列; PaWBPs tmk-a clone 33,69(2.2%)。成功测定的41个PaWBJan tmk-a 克隆中,共有24种不同的序列,序列完全一致的为PaWBJan tmk-a clone 1,19(占PaWBJan tmk-a克隆数的4.9%); PaWBJan tmk-a clone 14,20(4.9%); PaWBJan tmk-a clone 2,4,5,6,8,9,10,16,18,21,22,25,31(31.7%),为优势序列; PaWBJan tmk-a clone 29,35(4.9%); PaWBJan tmk-a clone 30,36,37(7.3%)。PaWBPs与PaWBJan之间,占优势PaWBPs tmk-a clone 5序列和PaWBJan tmk-a clone 12序列完全一致。

对PaWBPs和PaWBJan tmk-a 所有序列的开放性阅读框(ORF)预测后发现,能够编码完整ORF的序列可以被划分为tmk-a-1(639 bp)和tmk-a-2(627 bp)2大类,tmk-a-1在225位碱基后比tmk-a-2多了GTTCTTCAATTA的一段序列(226~237 bp)。52种不同的PaWBPs tmk-a序列中,tmk-a-1共11个,为PaWBPs tmk-a clone 5,23,25,26,27,31,45,49,55,61,67; tmk-a-2共16个,为PaWBPs tmk-a clone 1,9,32,37,42,44,46,48,52,59,62,66,73,77,82,88。24种PaWBJan tmk-a序列中,tmk-a-1共6个,为PaWBJan tmk-a clone 3,12,13,24,34,41; tmk-a-2共8个,为PaWBJan tmk-a clone 7,11,15,17,20,21,23,39。另外,PaWBPs株系tmk-a-1与tmk-a-2序列条数的比值为2.5,而PaWBJan株系为3.3。

测定的所有序列中,除了上述能编码完整ORF的tmk-a 基因外,PaWBPs,PaWBJan tmk-a 中分别有25和10个因碱基插入、缺失及突变形成的tmk-a预测假基因(表 1),占PaWBPs和PaWBJan tmk-a克隆序列的比例分别为48.1%和41.7%。

表1 从PaWBPs和PaWBJan株系中克隆到的不同tmk序列 Tab. 1 All cloned different sequences of tmk-a and tmk-b from PaWBPs and PaWBJan strains

PaWBPs和PaWBJan tmk-b基因PCR产物直接测序峰图表现为单峰,基因序列单一。

2.3 tmk基因序列位点变异分析

tmk-a-1和tmk-a-2序列中出现频率较高(易变位点)的单碱基突变(碱基替换)位点为第39(A/G),71(A/T),72(A/C),102(T/C),128(A/G),166(T/G),169(A/T),175(C/T),202(T/G),223(A/T),244(A/C),303(T/C),309(C/T),330(C/A),351(A/G),352(T/A),354(G/A),379(A/C),402(T/C),412(A/C)及426(T/C)位,在以上碱基替换中,碱基转换的概率为47.6%,碱基颠换的概率为52.4%。另外序列中还存在出现频率很低的碱基替换位点为,第40(A/T),41(A/T),80(C/T),107(G/T),120(T/C),136(G/A),157(C/G),161(T/C),209(T/A),210(C/A),240(A/G),241(A/G),242(A/G),262(G/A),286(G/A),314(A/T),343(A/G),350(A/G),373(A/G),391(A/C),396(T/C),401(A/G),432(G/A),507(A/G),537(T/G),579(A/G),592(C/A),599(T/C)及639(A/T)位,在以上碱基替换中,碱基转换的概率为65.5%,碱基颠换的概率为34.5%。对所有碱基替换的类型统计后发现,tmk序列中碱基转换的概率为58.0%,碱基颠换的概率为42.0%; A与G、T与C、A与C、T与G、A与T、G与C之间替换的概率分别为36%,22%,16%,8%,16%和2%。

对序列的变异位点比较后发现,除了无规律的单个或几个碱基的变异之外,多条tmk-a序列表现出有规律的变异,这些序列中的突变碱基都位于易变位点,并且突变的碱基不是随机地分布在易变碱基的位点上,而是在连续的多个易变位点上发生碱基的突变,比如在表 2中,相对于a类型的序列,d类型的序列仅在303 bp后面的每个易变位点都发生突变,而g类型的序列仅在303 bp前面的每个易变位点全部发生突变(表 2)。对PaWBPs和PaWBJan tmk-a变异类型统计后发现,a,b,c,d,e,f,g,h各类型在tmk-a中的比例分别为7.3%,2.4%,2.4%,24.4%,2.4%,4.9%,51.2%和2.4%。

表2 PaWBPs,PaWBJan tmk-a基因序列易变位点 Tab. 2 Mutable nucleotide sites in PaWBPs and PaWBJan tmk-a genes

对35条tmk-a假基因序列分析后发现,共9个位点的碱基突变导致了tmk-a的编码提前终止并形成了与功能基因序列相似但丧失了原有功能的假基因(表 1)。tmk-a序列易在第46和47位之间插入碱基T(PaWBPs tmk-a clone 20,33,58,79,93,PaWBJan tmk-a clone 32,33,35)、第167和168位之间插入碱基A(PaWBPs tmk-a clone 7,11,16,19,39,63,76,84,85,PaWBJan tmk-a clone 28,30)、第367位缺失碱基A(PaWBPs tmk-a clone 2,3,14,18,22及PaWBJan tmk-a clone19,27)、第434位缺失碱基A(PaWBPs tmk-a clone 6及PaWBJan tmk-a clone 26)、第583和584位之间插入碱基A(PaWBPs tmk-a clone 15)、第439位碱基C突变为T(PaWBPs tmk-a clone 40)、第145位缺失碱基T(PaWBPs tmk-a clone 64)、第18和19位碱基之间插入T(PaWBJan tmk-a clone 38)、第83和84位碱基之间插入C(PaWBJan tmk-a clone 40)。在35条tmk-a假基因中,以上突变类型出现的概率分别为22.9%,31.4%,20.0%,5.7%,2.9%,2.9%,2.9%,2.9%和2.9%。

2.4 TMK功能域预测

所有生物TMK氨基酸序列中都含有3个保守功能域,即位于N端的磷酸基供体结合区(the phosphate-binding motif,P-loop),序列特征为N’-GXXGXGKT-C’(X代表多种氨基酸); 核苷单磷酸结合区(TMP binding motif)N’-DRXXXSXXAYQ-C’以及位于C端的磷酸供体结合位点(the LID domain)。

将PaWBPs、PaWBJan与OY、AYWB、枣疯植原体(JWB)、小麦蓝矮植原体(WBD)、大肠杆菌BL21、Canarypox virus、拟南芥、Acholeplasma laidiawii等的TMK氨基酸序列比对后发现(图 1),PaWBPs和PaWBJan TMK中都具有上述3个保守功能域,并且PaWBPs,PaWBJan,OY,WBD及JWB 的TMK-a和TMK-b 功能域序列分别完全一致。PaWBPs,PaWBJan TMK-a的P-loop,TMP binding motif及LID分别为 N’-GLDGSGKT-C’,N’-DRWLPSTAYQ-C’,N’-IGRTRKK-C’; TMK-b则分别为: N’-GCEGTGKT-C’,N’-DRYLDSTIAYQ-C’,N’-IGRQRVK-C’。因此可推断PaWBPs,PaWBJan TMK可能具有与其他植原体TMK相同的催化功能(Miyata et al., 2003李蓓等,2008)。然而比对结果还显示,在核苷单磷酸结合区前端(N端)9个氨基酸处,Ps TMK-a-2,Jan TMK-a-2,OY PAM_521(OY TMK-a),WBD TMK-1比Ps TMK-a-1,Jan TMK-a-1,JWB TMK-x,JWB TMK-y少了4个氨基酸IVPQ; 比Ps TMK-b,Jan TMK-b,AYWB_492,OY PAM_230(OY TMK-b),WBD TMK-2少了4个氨基酸IIFA。

图1 植原体及其他生物TMK氨基酸序列中的3个保守功能区 Fig.1 Three functional domains in phytoplasmal TMK amino acid sequences and other organisms 图中的框表示在PaWBPs和PaWBJan TMK-2,OY PAM521,WBD TMK-2,JWBTMK-x氨基酸序列中缺失DXPX 4个氨基酸。Boxed residues indicate the deletion of DXPX sites in PaWBPs&PaWBJan TMK-a-2,OY PAM521,WBD TMK-2 and JWB TMK-x.

二级结构、信号肽及跨膜结构预测结果表明,α-螺旋(α-helix)和不规则卷曲(R and om coil)是PaWBPs,PaWBJan TMK-a和TMK-b的主要结构元件,延伸链(Extend str and )和β-转角(β-turn)散布于整个肽链中; PaWBPs,PaWBJan的TMK不含有信号肽和跨膜结构,在植原体的细胞质中发挥功能。

2.5 tmk基因序列相似性及系统进化分析

利用MEGA5.1对植原体以及其他物种的tmk基因进行了系统进化分析,构建了系统进化树,该进化树可被划分为5个大的分支Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ(图 2A)。由于植原体tmk基因多而杂,为了便于描述,把与PaWBPs tmk-b,PaWBJan tmk-b聚为一支(图 2E)的植原体tmk以及其他物种的tmk归为一大类型IV,统称为tmk-b,该类型的tmk在每种植原体中序列单一; 其余Ⅰ,Ⅱ,Ⅲ,Ⅴ分枝的tmk归为另一大类型,统称为tmk-a,该类型的特点是tmk拷贝数多。

图2 利用MEGA5.1基于植原体tmk基因核苷酸序列构建的进化树 Fig.2 Phylogenetic tree based on phytoplasmal tmk nucleotide sequences with MEGA5.1 using the Neighbor-Joining method A.基于tmk基因核苷酸序列的进化树分支 Branches of phylogenetic tree based on phytoplasmal tmk nucleotide sequences; B.分支ⅠBranch Ⅰ; C.分支ⅡBranch Ⅱ; D.分支ⅢBranch Ⅲ; E.分支ⅣBranchⅣ; F.分支ⅤBranch Ⅴ.
2.5.1 泡桐丛枝植原体中含有和枣疯植原体相同的tmk-a基因序列

在进化树(图 2)中,PaWBPs,PaWBJan的所有tmk-a基因和JWB tmk-X(GU196274),JWB tmk-Y(GU196274),WBD tmk-1(EU183350),OY-M tmk4(PAM_521/AP006628.2)以及loofah witches’-broom phytoplasma tmk(AF251151.1)

聚为一个大的分支Ⅰ(图 2B),该分支中除了JWB隶属16SrV组外,其余全为16SrI组植原体。分支I中PaWBPs与PaWBJan 的tmk-a核苷酸序列相似性为94.2%~99.8%; PaWBPs,PaWBJan tmk-a基因与JWB tmk-Y,WBD tmk-1,OY-M tmk4以及loofah witches’-broom phytoplasma tmk的核苷酸序列相似性分别为93.0%~97.8%,90.7%~93.3%,87.2%~88.8%和71.8%~73.4%。而引人注意的是,进化树中PaWBPs tmk-a clone 5和JWB(隶属16SrV组)tmk-Y 完全一致(徐启聪,2009)。为了排除提取的PaWBPs和PaWBJan DNA中JWB DNA的污染,利用植原体核糖体蛋白基因rp的16SrI和16SrV组特异性引物rp(Ⅰ)F1A/rp(Ⅰ)R1A和rp(Ⅴ)F1A/rp(Ⅴ)R1A对PaWBPs和PaWBJan进行了PCR检测(Martini et al., 2007),引物rp(Ⅰ)F1A/rp(Ⅰ)R1A从PaWBPs和aWBJan基因组DNA中扩增到了大小为1 200 bp的目的条带(图 3A),而rp(Ⅴ)F1A/rp(Ⅴ)R1A则未扩增到该条带(图 3B),因此可以断定PaWBPs和PaWBJan基因组DNA中未有JWB DNA的污染,PaWBPs中的确含有和JWB tmk-Y完全一致的序列。

图3 利用16Sr组特异性的rp引物进行的PCR扩增结果 Fig.3 PCR amplification with 16Sr group-specific rp-based primers A.利用引物rp(I)F1A/rp(I)R1A进行的PCR扩增结果PCR amplification with 16SrI group-specific rp-based primers rp(I)F1A/rp(I)R1A; B.利用引物rp(V)F1A/rp(V)R1A进行的PCR扩增结果PCR amplification with 16SrV group-specific rp-based primers rp(V)F1A/rp(V)R1A. 1. PaWBPs; 2. PaWBPs; 3. 健康泡桐Healthy paulownia; 4. JWB; 5. 健康枣树Healthy jujube.
2.5.2 植原体tmk-a序列多样性丰富而tmk-b序列单一

同种植原体中存在着序列差异较大的tmk-a,各种植原体都具有tmk-a序列多样性。例如,大部分Ca. Phytoplasma australiense tmk序列和部分SLY(strawberry lethal yellows phytoplasma)tmk序列聚为一个大的分支Ⅱ(图 2C),而Ca. Phytoplasma australiense tmk6tmk8则分布在进化树的分支Ⅲ中(图 2D),部分SLY tmk序列被聚在第Ⅴ分支中(图 2F)。分支Ⅱ中,Ca. Phytoplasma australiense和SLY之间的 tmk基因核苷酸序列相似性为90.8%~93.7%。分支Ⅱ和分支Ⅲ中的Ca. Phytoplasma australiense tmk序列差异较大,核苷酸序列相似性为57.2%~59.1%; 分支Ⅱ和分支Ⅴ中的SLY tmk序列间相似性仅为47.9%~49.3%。JWB tmk-X,JWB tmk-Y与PaWBPs及PaWBJan的 tmk-a关系最近,被聚在分支Ⅰ中; 而JWB tmk-Z被聚类在分支Ⅲ中,JWB tmk-Z与JWB tmk-X,JWB tmk-Y的核苷酸序列相似性仅为62.3%,62.9%。另外,进化树的分支Ⅲ中还分布着OY-M tmk2tmk5,AYWB tmk1tmk3tmk4

目前,已有许多物种的全基因组序列被测定,在收集这些物种的tmk基因序列时发现,它们仅存在着单拷贝的tmk基因(植原体除外),并且和单拷贝的植原体OY-M tmk1(PAM_230/AP006628.2),AYWB tmk5(AYWB_492/CP000061.2),Ca.Phytoplasma australiense tmk3(PA0169/NC_010544.1),Ca. Phytoplasma mali strain AT tmk-b(CU469464.1),SLY tmk28(NC_021236.1),Peanut witches’-broom phytoplasma tmk(NZ_AMWZ01000013.1)以及本试验测定的PaWBPs tmk-b(序列号),PaWBJan tmk-b(序列号)聚为一个大的分支Ⅳ(图 2E)。由此可推断,分支Ⅳ中所有植原体的tmk基因可能和其他物种tmk基因属于同一类型,发挥着相同的功能,即编码的蛋白可催化dTMP形成dTDP。分支Ⅳ中所有tmk基因之间核苷酸序列的相似性为36.7%~68.8%; 不同植原体tmk之间的相似性为45.6%~99.8%。PaWBPs与PaWBJan 的tmk-b核苷酸序列相似性为99.8%,氨基酸序列相似性为99.5%,仅有1个氨基酸的差异(PaWBPs第22位的氨基酸为E,而PaWBJan为G)。PaWBPs tmk-b与OY-M tmk1,WBD tmk-2,AYWB tmk5,Phytoplasma mali strain AT tmk-b,Ca. Phytoplasma australiense tmk3,SLY tmk28,Peanut witches’-broom phytoplasma tmk核苷酸序列相似性分别为99.7%,95.6 %,95.4%,67.0%,64.1%,63.9%和61.9%。

虽然氨基酸序列中都含有P-loop,TMP binding motif及LID功能域,但本试验测定的PaWBPs,PaWBJan的 tmk-atmk-b核苷酸序列相似性仅为 50.3%~52.5%,氨基酸序列相似性为25.1%~27.1%。

由于植原体 tmk-a基因序列拷贝多,序列丰富多样,同种植原体tmk-a基因可分布在不同的分支Ⅰ,Ⅱ,Ⅲ和Ⅳ中,因此tmk-a序列不能作为植原体分类的参考基因。而分支Ⅳ中的所有植原体tmk-b基因以及其他物种的tmk基因都是单拷贝的,为了确定这些单拷贝的tmk基因能否较好地用于植原体分类,把植原体tmk-b基因以及其他物种的tmk基因进行系统进化分析,结果表明,基于植原体tmk-b及其他物种tmk基因核苷酸序列构建的系统进化树与基于植原体16S rDNA序列构建的系统进化树结果一致(图 4)。

图4 基于植原体tmk-b及其他物种tmk基因核苷酸序列构建的系统进化树 Fig.4 Phylogenetic tree based on phytoplasmal tmk-b and many other species’ tmk genes constructed with MEGA 5.1 using the Neighbor-Joining method
3 结论与讨论

由于植原体高度专性寄生的特点,其生长、繁殖、变异等与寄主环境的变化密切相关。寄主环境的变化可能会导致植原体不断的变异以确保自己正常的生存繁衍。tmk是DNA合成、生物生存过程中必不可少的基因,tmk基因的多态性可能是植原体适应寄主生境变化导致的。本研究选取气候等生境条件明显不同的河北平山和江西吉安泡桐丛枝病株系为材料,对于植原体tmk基因多态性的研究具有很强的代表性。

虽然已有多种植原体tmk基因序列被公布,但本研究发现泡桐丛枝植原体比其他植原体含有更丰富的tmk基因型。本研究首次从2个泡桐丛枝植原体中克隆了大量tmk基因,了解了不同植原体株系间的差异,揭示了tmk-a基因多拷贝性和丰富的序列多样性。在已测序的植原体基因组中,与DNA复制、重组、修复等相关的基因聚集在一块,两端为转座酶插入序列,形成一个被称为PMU的基因簇,大部分的PMUs中都含有tmk基因。通常,植原体基因组中的PMU为多拷贝,tmk基因多拷贝可能是由PMU复制型转座形成的(Tran-Nguyen et al., 2009Bai et al., 2006)。在DNA复制过程中,DNA重组、碱基的突变可能是植原体tmk序列多样性形成的原因。要明确泡桐丛枝植原体基因组是否有类似的PMU,全基因组测序尤为必要。

PaWBPs和PaWBJan的tmk序列中存在着多种变异。所有的tmk-a-1tmk-a-2序列多了一段序列GTTCTTCAATTA(226-239位)。许多tmk序列中存在着单个或几个碱基的突变。另外多条tmk-a序列表现出有规律的变异,这些序列中的突变碱基都位于易变位点,并且突变的碱基不是随机地分布在易变位点上,而是在连续的多个易变位点上发生碱基的突变(表 2),对表 2中的不同类型序列比较后推测,或许是同源重组形成了这些类型的序列。同源重组需要在一些蛋白的催化下完成,在基因组已测序的4个植原体中存在着这些蛋白,如Ca. Phytoplasma mali中的ruvAB,RecU、重组酶A、类似RecG的解螺旋酶、重组DNA修复蛋白O和R; OY-M,AYWB,Ca. Phytoplasma australiense中的RecA,RecU,ruvA及ruvB等(Kube et al., 2012)。目前,泡桐丛枝植原体基因组序列未被测定,但其中很可能也含有这些蛋白。虽然本研究未能揭示tmk-a序列有规律变异的原因,但可能会为植原体基因同源重组研究提供很重要的线索。

Davis等(2003)第一个报道了推测不执行功能的植原体假基因ψfolPψfolK,OY-M基因组也含有7个预测的tmk假基因。本研究从PaWBPs和PaWBJan中克隆到了许多预测的tmk假基因序列。有研究发现,假基因也可能存在功能,也许是产生基因多样性的源泉,还常常与同源功能的基因重组产生抗原多样性(吴昊等,2005); 又如人类病菌Neisseria menigitidis的纤毛蛋白由pilE/pilS基因座编码,它包含一个表达基因pilE和8个同源的沉默基因片段,这些沉默基因可能与对寄主的免疫反应有关(Andrews et al., 2004)。迄今,还没有关于植原体假基因功能的报道,植原体tmk假基因有待于进一步的深入研究。

由同一祖先基因重复和变异产生的一系列基因称为基因家族(gene family)。重复和趋异是产生基因家族的原因,一个完整的基因被加倍重复,并在一些拷贝中积累突变而使自然选择向有利的方向进行,然后该突变的拷贝可以进化形成新的功能,可能在不同时期或地点表达,并获得不同的活性。家族成员可以成簇存在,或分散在不同染色体中。虽然一个结构基因家族的成员可以在不同时期或不同类型的细胞中表达,但他们通常相互关联甚至具有相同的功能; 而且大多数基因家族都有一些成员是假基因(李明刚,2005)。根据已知植原体的tmk基因特征的分析,笔者认为泡桐丛枝植原体tmk-atmk-b及其他可能未被鉴定的具有相同结构域和功能域的众多同源基因构成了一个tmk基因家族。

Miyata等(2003)李蓓等(2008)分别对洋葱黄化植原体OY-M和小麦蓝矮植原体WBD的TMK进行原核表达、纯化及体外酶活性测定后发现,OY-M PAM_230和WBD TMK-2都具有非常明显的TMK活性,而OY-M PAM_521和WBD TMK-1几乎没有酶活性。本研究中的PaWBPs tmk-b,PaWBJan tmk-b与编码OY-M PAM_230,WBD TMK-2的基因聚为一个大的分支(图 2E),并且PaWBPs TMK-b,PaWBJan TMK-b都具有胸苷酸激酶必需的P-loop,TMP binding motif及LID功能域(图 1),据此可推断PaWBPs TMK-b,PaWBJan TMK-b在体外具有TMK酶活性。但仅仅根据原核表达蛋白进行的体外活性测定结果判断tmk-a基因表达和功能尚需谨慎。比如,拟南芥过氧化氢酶基因家族编码三种蛋白,CAT1-3,其中不同蛋白的表达分别受氧应力、水杨酸等不同因子的特异性诱导,CAT2表达受干旱和寒冷激活,而CAT3受脱落酸和衰老状态的刺激(Du et al., 2008)。蛋白的三级结构通常会影响酶活性,而蛋白的三级结构是由一级序列决定的,在TMP binding motif前端(N端)9个氨基酸处(图 1),具有胸苷酸激酶活性的OY-M PAM_230,WBD TMK-2比没有活性的PAM_521和WBD TMK-1多了4个氨基酸,在此位置,PaWBPs TMK-a-1,PaWBJan TMK-a-1比PaWBPs TMK-a-2,PaWBJan TMK-a-2也多了4个氨基酸,这4个氨基酸是否能影响酶活性还需进一步在侵染植物体内和体外试验验证。因在植原体中,补救途径是提供dTTP的唯一方式,对繁殖极其重要的tmk多态性的产生和作用机制、与植原体的致病性是否相关、在植原体侵染植物后的不同时期以及症状轻重程度不同的材料中不同TMK蛋白的表达和作用状况都是值得深入研究的问题。

目前,16 SrRNA基因是植原体分类的首要依据,根据16 SrRNA基因将植原体划分为许多个不同的组(Lee et al., 1993Lee et al., 1998Wei et al., 2007)。相对于16 SrRNA基因,核糖体蛋白rp基因保守性稍差,变异性更大。Martini等(2007)对87种植原体进行了基于rp基因序列的聚类分析,结果显示基于rp基因和16 SrRNA基因构建的进化树结构是一致的,但基于rp基因的进化树能够揭示出植原体之间更为细微的遗传进化关系,因此,根据rp基因可以将16Sr组中的植原体进一步划分为不同的亚组。多基因分类会令结果更准确细致,蛋白延伸因子基因tuf及分泌蛋白基因secY也成为植原体分类的重要依据(Koui et al., 2003Lee et al., 2006)。基于单拷贝的tmk-b基因序列构建的进化树与基于16 SrRNA构建的进化树具有较好的一致性(图 4),但tmk-b基因能否作为植原体16Sr组或亚组水平的分类鉴定依据,有待于更多不同组植原体和同一植原体不同株系的tmk-b基因序列分析结果的支持。从已知的泡桐丛枝及之前的枣疯植原体tmk-a型基因多样性特征来看,虽然它们不适于作为植原体的分组指标,但有可能是划分同一植原体不同株系或基因型的重要依据(徐启聪,2009)。Rocha等(2002)对支原体Mycoplasma pulmoni的2个不同来源寄主上分离的株系UAB CTIP和KD735-15的编码高变异性表面脂蛋白抗原基因簇vsa的研究发现,二者在基因顺序、数目和重复单元数目上都有非常大的差异,前者含有7个vsa而后者含有11个,其中4个在前者中不存在; 而且前者表达基因为vsaI,后者表达基因为vsaA。本研究选用的PaWBPs和PaWBJan株系分别来自地理相隔遥远、气候和寄主迥异的环境,二者出现明显的tmk-a基因序列的趋异性变异,可能是植原体对环境的适应性。通过对大量收集的我国不同地区不同泡桐品系上的泡桐丛枝植原体株系的tmk-a型序列的分析,有可能鉴定和划分不同株系或不同基因型。而且由于植原体PMU的复制和转座作用及随后发生的基因组重组过程可能导致植原体不同株系致病性的分化(Arashida et al., 2008)。所以对tmk等多基因簇的深入研究可为植原体致病机制研究提供新的思路。

参考文献(References)
[1] 李蓓, 纪玲玲, 吴云峰, 等. 2008. 小麦蓝矮病植原体胸苷酸激酶基因的分离、原核表达及酶活性分析. 微生物学报, 48(6): 739-744.(3)
[2] 李明刚. 2005. 高级分子遗传学. 北京:科学出版社.(1)
[3] 吴昊, 曹明富. 2005. 假基因. 生物学通报, 40(5): 20.(1)
[4] 徐启聪. 2009. 中国不同地区不同枣树品种上枣疯病植原体的分子鉴定及变异分析. 北京:中国林业科学研究院硕士学位论文.(3)
[5] Andrews T D, Gojobori T. 2004. Strong positive selection and recombination drive the antigenic variation of the pilE protein of the human pathogen Neisseria meningitides. Genetics, 166(1):25-32.(1)
[6] Arashida R, Kakizawa S, Hoshi A, et al. 2008. Heterogeneic dynamics of the structures of multiple gene clusters in two pathogenetically different lines originating from the same phytoplasma. DNA and Cell Biology, 27(4): 209-217.(1)
[7] Bai X D, Zhang J H, Ewing A, et al. 2006. Living with genome instability: the adaptation of phytoplasmas to diverse environments of their insect and plant hosts. Journal of Bacteriology, 188(10): 3682-3696.(2)
[8] Davis R E, Jomantiene R, Zhao Y, et al. 2003. Folate biosynthesis pseudogenes ΨfolP and Ψfolk, and an O-Sialoglycoprotein endopeptidase gene homoloy in the phytoplasma genome. DNA and Cell Biology, 22(11): 697-706.(1)
[9] Du YY, Wang P C, Chen J, et al. 2008. Comprehensive functional analysis of the catalase gene family in Arabidopsis thaliana. Journal of Integrative Plant Biology, 50(10): 1318-1326.(1)
[10] Hogenhout S A, Music M S. 2010. Phytoplasma genomics, from sequencing to compararative and functional genomics-what have we learnt? Phytoplasmas:Genomes, Plant Hosts and Vectors, CAB International UK, 19-36.(1)
[11] Koui T, Natsuaki T, Okuda S. 2003. Phylogenetic analysis of elongation factor Tu gene of phytoplasmas from Japan. Journal of General Plant Pathology, 69(5): 316-319.(1)
[12] Kube M, Mitrovic J, Duduk B, et al. 2012. Current view on phytoplasma genomes and encoded metabolism. The Scientific World Journal, doi: 10.1100/2012/185942.(1)
[13] Lee I M, Gundersen D E, Davis R E, et al. 1998. Revised classification scheme of phytoplasma based on FRLP analysis of 16S rRNA and ribosomal protein gene sequences. International Journal of Systematic Bacteriology, 48(4): 1153-1169.(1)
[14] Lee I M, Hammond R W, Davis R E, et al. 1993. Universal amplification and analysis of pathogen 16S rDNA for classification and identification of mycoplasma like organism. Phytopathology, 83(8): 834-842.(1)
[15] Lee I M, Zhao Y, Bottne KD. 2006. SecY gene sequence analysis for finer differentiation of diverse strains in the aster yellows phytoplasma a group. Molecular and Cellcular Probe, 20(6): 87-91.(1)
[16] Martini M, Lee I M, Bottner K D, et al. 2007. Ribosomal protein gene-based phylogeny for finer differentiation and classification of phytoplasmas. International Journal of Systematic and Evolutionary Microbiology, 57(Pt9): 2037-2051.(3)
[17] Miyata S, Oshima K, Kakizawa S, et al. 2003. Two different thymidylate kinase gene homologues, including one that has catalytic activity, are encoded iin the onion yellows phytoplasma genome. Microbiology, 149(Pt8): 2243-2250.(5)
[18] Rocha E P, Blanchard A. 2002. Genomic repeats, genome plasticity and the dynamics of Mycoplasma evolution. Nucleic Acid Research, 30(9): 2031-2042.(1)
[19] Ronceret A, Gadea-Vacas J, Guilleminot J, et al. 2008. The first zygotic division in Arabidopsis requires de novo transcription of thymidylate kinase. The Plant Journal, 53(5): 776-789.(1)
[20] Sclafani R A, Fangman W L. 1984. Yeast gene CDC8 encodes thymidylate kinase and is complemented by herpes thymidine kinase gene TK. Proceedings of the National Academy of the Sciences of the United States of America, 81(18): 5821-5825.(1)
[21] Tian G Z, Raychauduri S P. 1996. Paulownia witches'-broom disease in China: present status. In Forest Trees and Palms: Diseases and Control, Oxford, IBH, 227-251.(1)
[22] Tran-Nguyen L T T, Kube M, Schneider B, et al. 2009. Comparative Genome analysis of "Candidatus Phytoplasma australiense" (Subgroup tuf-Australia I; rp-A) and "Ca. Phytoplasma asteris" strains OY-M and AY-WB. Journal of Bacteriology, 190(11): 3979-3991.(2)
[23] Wei W, Davis R E, Lee I M, et al. 2007. Computer-simulated RFLP analysis of 16S rRNA genes: identification of ten new phytoplasma groups. International Journal of Systematic and Evolutionary Microbiology, 57(Pt8): 1855-1867.(1)
[24] White J H, Green S R, Barker D G, et al. 1987. The CDC8 transcript is cell cycle regulated in yeast and is expressed coordinately with CDC9 and CDC21 at a point preceding histone transcription. Experimental Cell Research, 171(1): 223-231.(1)