林业科学  2009, Vol. 45 Issue (4): 19-27   PDF    
0

文章信息

卫尊征, 郭琦, 李百炼, 张金凤, 张德强.
Wei Zunzheng, Guo Qi, Li Bailian, Zhang Jinfeng, Zhang Deqiang
小叶杨GA20氧化酶基因的克隆、表达及单核苷酸多态性分析
Isolation, Expression and Single Nucleotide Polymorphisms (SNPs) Analysis of GA20Ox Gene in Populus simonii
林业科学, 2009, 45(4): 19-27.
Scientia Silvae Sinicae, 2009, 45(4): 19-27.

文章历史

收稿日期:2008-11-14

作者相关文章

卫尊征
郭琦
李百炼
张金凤
张德强

小叶杨GA20氧化酶基因的克隆、表达及单核苷酸多态性分析
卫尊征1,2, 郭琦1,2, 李百炼1,2,3, 张金凤1,2, 张德强1,2     
1. 北京林业大学林木花卉遗传育种教育部重点实验室 北京 100083;
2. 北京林业大学林木育种国家工程实验室 北京 100083;
3. 美国北卡罗莱纳州立大学林学系 北卡罗莱纳州 NC27695-8203
摘要: 利用RT-PCR方法,首次从小叶杨未成熟木质部cDNA中分离出PsGA20Ox cDNA全长及其基因组DNA,并进行测序和序列分析。结果表明:克隆的小叶杨PsGA20Ox cDNA片段总长为1 403 bp,基因内部含有完整的开放阅读框架,大小为1 155 bp,编码区可编码长度为385个AA残基,所推导的蛋白质氨基酸序列与拟南芥和水稻GA20Ox蛋白的同源性分别为66.0%和57.0%。组织特异性RT-PCR结果显示, PsGA20Ox基因在杨树茎、叶片和顶端分生组织中均有表达,但其表达模式却不同:PsGA20Ox在成熟木质部中表达丰度最高,在未成熟木质部和嫩叶中表达丰度较高,在顶端分生组织中有少量表达,在形成层组织中表达丰度极低。在此基础上,组合利用MEGA4.0和DnaSP4.50.4软件对小叶杨36株基因型个体的PsGA20Ox基因组DNA序列进行比对和分析,检测到49个单核苷酸多态性(SNP)位点,频率为1/35 bp。其中,15个是常见SNPs,34个为罕见SNPs。在这些SNPs中,37个属于转换,12个属于颠换。在外显子区域,共检测到26个SNP位点,其中23个为同义突变,3个为错义突变。对PsGA20Ox基因内SNPs进行的连锁不平衡分析表明,随着核苷酸序列长度的增加,SNPs的连锁不平衡在基因内部就迅速衰退,因此,在小叶杨中,基于候选基因的连锁不平衡作图是可行的,而基于整个杨树基因组的连锁不平衡作图是不可行的,也是不必要的。
关键词:小叶杨    赤霉素20氧化酶基因    组织特异性反转录PCR表达    单核苷酸多态性    
Isolation, Expression and Single Nucleotide Polymorphisms (SNPs) Analysis of GA20Ox Gene in Populus simonii
Wei Zunzheng1,2, Guo Qi1,2, Li Bailian1,2,3, Zhang Jinfeng1,2, Zhang Deqiang1,2    
1. Key Laboratory of Genetics and Breeding in Forest Trees and Ornamental Plants of Ministry of Education, Beijing Forestry University Beijing 100083;
2. National Engineering Laboratory of Forest Tree Breeding, Beijing Forestry University Beijing 100083;
3. Department of Forestry, North Carolina State University North Carolina State 27695-8203
Abstract: In this study, a full-length cDNA clone encoding GA20Ox was isolated from the cDNA prepared from immature xylem zone of Populus simonii by the RT-PCR method. The cDNA is 1 403 bp in length with an open reading frame (ORF) which is capable of encoding a protein of 385 AA. The deduced aa sequence of the PsGA20Ox proteins shares 66.0% and 57.0% identity with those of Arabidopsis thaliana and Oryza sativa, respectively. Tissue differential expression indicated that PsGA20Ox transcripts had their mRNA products in stems, leaves and apical shoot meristems, with different abundant in them. The PsGA20Ox transcripts were the most abundant in mature xylem, followed by in the immaturity xylem and young leaf, and then in apical shoot meristems and the lowest transcripts were found in cambium. The genomic sequences of PsGA20Ox in 36 individuals were aligned, compared and analyzed using the software MEGA4.0 and DnaSP4.50.4. A total of 49 SNPs were detected and the frequency was 1/35 bp. Of the 49 SNPs, there were 15 common SNPs and 34 rare SNPs. There were 37 transition and 12 transversion mutation types. A total of 26 SNPs were detected in the coding regions of PsGA20Ox, of which 23 were silent mutations and 3 were missense mutations. The linkage disequilibrium of SNPs in the PsGA20Ox was detected and the result showed that LD declined rapidly within the gene regions of PsGA20Ox with the nucleotide length. It suggests that in Populus genome wide LD mapping may not be feasible and not be necessary, but candidate gene based LD mapping could be particularly useful in breeding programs of forest trees. The results, therefore, provided the important knowledge for the associated genetics of PsGA20Ox gene and the gene-assisted breeding in terms of growth and development in P. simonii.
Key words: Populus simonii    GA20 Oxidase    tissue differential expression with RT-PCR    single nucleotide polymorphisms    

赤霉素(gibberellins, 简称GAs)在化学结构上属于一类四环二萜类化合物,是5类植物激素之一,至今已发现有130余种(Israelsson et al., 2004)。有研究认为,大多数GAs是植物体内主要的生长调节剂,可影响植物整个生命周期中的生长和发育过程,主要包括促进种子发芽、嫩芽和茎的伸长、叶片扩展、毛状体发育、花和果实发育等过程(Kende et al., 1997Singh et al., 2002; Lievens et al., 2005)。阐述GAs在调控嫩芽伸长方面重要性的最好例证是GAs缺陷的拟南芥(Arabidopsis thaliana)、玉米(Zea mays)和豌豆(Pisum sativum)突变体的发现和鉴定,可运用相应的GAs来恢复突变,并且认为GAs在细胞水平上具有可加速细胞分裂和延长之功能(Hedden et al., 1999)。

植物体内的GAs水平主要可通过转录调控GAs生物合成酶基因的表达来实现。据报道,GA20氧化酶是GA生物合成过程中的关键酶,它催化转化GA12/GA53生成GA9/GA20, 而后者是具有活性的GA4和GA1的前体, 认为它是GAs合成过程中的限速酶(Xu et al., 1995; Isabel et al., 2008)。因此,深入研究GA20氧化酶的生物合成过程,克隆调控这一过程的关键基因,并对其表达产物进行分析就显得尤为必要。为此,在模式植物拟南芥和主要农作物如水稻(Oryza sativa)、小麦(Triticum aestivum)、玉米和陆地棉(Gossypium hirsutum)等中进行了该基因的分离和功能鉴定,发现它参与了从种子发芽、节间伸长直到开花结实等整个生长发育过程(Spielmeyer et al., 2002; Appleford et al., 2006)。通过有效操纵GA20氧化酶基因的表达可实现植物株型的改变,培育出矮化或半矮化的农作物新品种,如水稻、莴苣(Lactuca sativa)等,解决了高产和倒伏的矛盾(Sakamoto et al., 2003; Tomoya et al., 2001)。有研究者认为,若将该策略应用于树木中则可能会产生更大的应用价值。为此,Eriksson等(2000)将拟南芥的GA20氧化酶基因正义转化到受体欧洲山杨(Populus tremula)与美洲山杨(P. tremuloides)的杂种中,结果可使转基因杨树体内的GA水平提高20倍,而植株表型表现出叶片变大、植株主干和直径均有明显提高,并且可使木质部纤维细胞的数量增多、纤维变长,最终增加了转基因植株的生物量。

最近在林木中产生的基于候选基因内单核苷酸多态性(single nucleotide poplymorphisms, SNPs)的连锁不平衡(linkage disequilibrium, LD)作图为基因辅助树木育种提供了另一新的育种策略(Zhang et al., 2005)。与先前的数量性状位点(quantitative trait loci, QTL)作图相比,LD作图是利用自然群体中的连锁不平衡来直接分析SNP标记与目标性状的关联,它是利用种内进化史上的重组事件,可利用的重组是无限的,得到的信息可应用于整个群体的遗传改良。若SNPs发生在基因的编码区,就可能导致产生新的蛋白质和mRNA的结构折叠,造成质量上的不同;若检测的SNPs位于调控区或内含子区,就可能影响基因表达水平、RNA的稳定性而导致数量上的变化(Shen et al., 1999; Schaeffer et al., 2001)。这2种变异可以产生蛋白质功能上的改变而影响所研究物种的表型性状。如澳大利亚联邦科学与工业研究组织Thurmma等以亮果桉(Eucalyptus nitens)自然群体为试材,对木质素生物合成过程中的一个关键酶基因(cinnamoyl CoA reductase, CCR)进行了SNPs分析,结果表明在该基因内部(包括部分启动子区域)发现有25个常见SNPs,并对自然群体中290株亮果桉进行了这些SNPs的基因型分析,最后经SNP基因型与表型连锁分析后,发现2个SNPs(SNP20和SNP21)与微纤丝角(microfibril angle, MFA)相连锁,每一SNP可解释表型变异的4.6%,且这2个SNPs与附近的SNP19形成了2种单体型(haplotype),单体型1可解释表型变异的5.9%(Thumma et al., 2005)。这一结果在2个全同胞杂交群体中得到了验证。该研究结果表明,基于候选基因的LD作图在林木遗传改良中是可行的,能被用来检测与目标性状相连锁的等位基因位点,并且可以分析其在整个群体中的变异情况。

小叶杨(Populus simonii)具有抗干旱、耐瘠薄、适应性广、寿命长和能耐极端温度等特性,是我国北方地区重要的乡土树种资源,在北方林业生态建设和经济发展中发挥了重要作用(梁胜发等,2002)。而目前大多数研究主要集中在用材树种如毛白杨(P. tomentosa)、美洲黑杨(P. deltoides)和欧美杨(P. euramericana)等速生杨树的生长量、木材品质和抗病虫等方面,对小叶杨没有进行系统研究(王燕等,2000),特别是对植物生长发育具有重要调控作用的GA20氧化酶基因的分离和单核苷酸研究还未见报道。为此,本研究在对不同气候区域的小叶杨资源收集的基础上,利用基因特异的PCR扩增,从小叶杨未成熟木质部cDNA中分离得到GA20氧化酶基因,并进行了该基因的单核苷酸多态性和连锁不平衡分析。研究结果将为该基因的连锁不平衡作图及其基因辅助小叶杨生长性状的分子育种提供了重要的理论依据,具有重要的应用价值。

1 材料与方法 1.1 植物材料

2007年秋季课题组由吉林、辽宁、内蒙古、河北、北京、山东、河南、山西、陕西、青海、甘肃、四川12个省(市、自治区)的小叶杨自然分布区域,收集保存了共560个基因型个体。为分析小叶杨GA20氧化酶基因的单核苷酸多态性,从建立的基因库中按省份、种源挑取了36株个体的新鲜叶片用于基因组DNA提取。提取RNA的材料取自青海互助种源的嫩枝扦插苗。

1.2 总DNA的提取

小叶杨总DNA提取按DNeasy Plant Mini Kits (Qiagen, Inc., Valencia, CA, USA)描述的方法进行。

1.3 RNA提取和cDNA合成

小叶杨根部组织、韧皮部、形成层、未成熟木质部、成熟木质部、嫩叶、成熟叶和顶端分生组织材料总RNA的提取和cDNA的合成分别按RNeasy Plant Mini Kits (Qiagen, Inc., Valencia, CA, USA)和Clonetech试剂盒描述的方法进行。

1.4 RT-PCR扩增目的基因

依据欧洲山杨和美洲山杨杂种PttGA20氧化酶基因(AJ001326)的核苷酸序列设计并合成了扩增该基因特异的引物,序列如下:PsGA20F: 5'-GTA, CCA, ACT, CTC, CCT, CCC, T-3';PsGA20R: 5'-TCC, CTT, TCG, TCT, CCT, CTC, CT-3'。

应用25 μL DNA聚合酶链反应(PCR)体系, 以小叶杨形成层cDNA为模板, 加入2.5 μL 10 × buffer, 1.8 μL 25 mmol·L-1 MgCl2, 1 μL 10 mmol·L-1 dNTP,Taq DNA聚合酶1.0 U(以上试剂购自Promega公司), 100 nmol·L-1引物各1 μL, 加适量双蒸水至25 μL。于94 ℃, 3 min→(93 ℃, 30 s→56 ℃, 30 s→72 ℃, 1 min),35个循环→72 ℃, 5 min热循环条件下, 扩增出长约1 400 bp的cDNA片段。

1.5 PCR产物的克隆、测序及计算机分析

将PCR扩增得到的目的基因片段回收后连接于pGEM-T上。连接产物转化大肠杆菌DH5ɑ,筛选阳性克隆,送公司测序。应用DNAMAN6.0软件和CLUSTALX软件包程序推导出氨基酸序列并进行NCBI检索分析, 然后分别估算和预测推导蛋白质的分子质量和等电点。

1.6 小叶杨GA20氧化酶基因的SNP检测

利用1.4中的引物,以小叶杨基因库中按省份、种源挑取的36株个体的总DNA为模板进行PCR扩增;将PCR扩增产物进行琼脂糖凝胶电泳分离,回收、纯化目的片段后与PGEM-T载体连接,转化后挑取阳性单克隆进行序列测定,然后将每一基因片段的核苷酸序列拼接成完整的基因序列。

1.7 GA20氧化酶基因的SNP多样性分析和连锁不平衡检测

组合利用MEGA4.0和DnaSP4.50.4软件对每一基因的36个序列进行分析,标出SNP位点,计算SNP频率、转换和颠换的SNP数量;计算SNP多样性指数、在基因不同区域的分布模式;分析同义突变、错义突变和无义突变以及发生在剪切位点(GT-AG)的突变情况;分析LD在不同基因中的延伸模式。

1.8 RT-PCR反应检测GA20氧化酶基因在小叶杨不同组织和器官中的表达模式

依据PsGA20氧化酶基因的编码区,设计1对能够扩增出337 bp左右cDNA片段的引物,RT-PCR引物序列如下:PsGA20RTF:5'-ATG, CCA, TCC, ATA, ACC, ACC, CCT-3';PsGA20RTR:5'-AGG, TGT, CCA, TGT, AAT, TAT, GAG, C-3'。

以逆转录合成的cDNA第1链为模板。样品经94 ℃预变性3 min;后进行94 ℃ 30 s, 54 ℃ 30 s, 72℃ 1 min, 28个循环;72 ℃延伸5 min进行PCR反应。

2 结果与讨论 2.1 小叶杨GA20氧化酶基因cDNA的克隆及其结构特征分析

利用PsGA20F和PsGA20R为引物,以小叶杨未成熟木质部总cDNA为模板,进行引物特异的PCR扩增。扩增产物经0.8%的琼脂糖凝胶电泳分离(图 1)。由图 1可见,在大小约为1 400 bp处扩增出1条明亮的特异条带。将扩增的特异片段回收、纯化并与pGEM-T载体连接后转化大肠杆菌。在此基础上,将得到的重组质粒进行PCR扩增和限制性酶切来验证扩增的片段是否确已被克隆到pGEM-T载体上。结果显示,从形成层cDNA中扩增出的这一片段与其被克隆后质粒的PCR扩增和限制性酶切后的片段大小相符,这初步表明所扩增的片段已被克隆到T载体上。将其菌液送Invitrogen公司测序。利用DNAMAN6.0软件将获得的小叶杨PsGA20Ox cDNA片段的核苷酸序列转移成蛋白质序列(图 2)。由图 2可见,克隆的这一GA20Ox cDNA总长为1 403 bp,其核苷酸序列与欧洲山杨和美洲山杨杂种PttGA20Ox基因的同源性高达97.3%,故将其命名为PsGA20Ox基因。在PsGA20Ox序列中, 基因内部含有完整的开放阅读框架,大小为1 155 bp,编码区起始于ATG密码子(位于第130个碱基处),终止于TGA密码子(位于第1 287个碱基处),可编码长度为385个氨基酸残基的蛋白质,并将其进行GenBank提交和注册,其序列接收号为FJ422146。在此基础上,运用DNAMAN6.0软件估算推导的PsGA20Ox蛋白质的分子质量约为44.1 ku, 其等电点为6.36。

图 1 从小叶杨未成熟木质部cDNA中扩增出的PsGA20Ox cDNA电泳图 Figure 1 The cDNA fragment of PsGA20Ox amplified from immature xylem cDNA in P. simonii by RT-PCR M. 1 kb DNA ladder; 1.PsGA20Ox cDNA片段The cDNA fragment of PsGA20Ox.
图 2 小叶杨PsGA20Ox cDNA核苷酸及其推测的蛋白质序列 Figure 2 Nucleotide and deduced amino acid sequence of PsGA20Ox fragment in P. simonii
2.2 cDNA序列查新及系统进化分析

PsGA20Ox基因序列与已公开的拟南芥、水稻基因序列进行同源性比较, 发现它们与拟南芥AtGA20Ox和水稻的OsGA20Ox (GenBank注册号分别为NM_118674和NM_001058486)的同源性分别为65.0%和57.9%。NCBI检索结果初步表明,PsGA20Ox是杨属(Populus)青杨派(Section Tacamahaca)树种中首次克隆的GA20氧化酶基因。为了分析小叶杨PsGA20Ox与其他植物GA20Ox蛋白的系统发育进化关系,通过Internet进入NCBI,利用BLAST-P程序将推测蛋白质产物的氨基酸序列与数据库NCBI中注册的拟南芥(AtGA20Ox)、水稻(OsGA20Ox)、玉米(ZmGA20Ox)、小麦(TaGA20Ox)、大麦(Hordeum vulgare)(HvGA20Ox)、黑麦草(Lolium perenne)(LpGA20Ox)、陆地棉(GhGA20Ox)、苹果(Malus domestica)(MdGA20Ox)、欧洲山毛榉(Fagus sylvatica)(FsGA20Ox)、银白杨(Populus alba)(PaGA20Ox)、欧洲山杨(PtGA20Ox)和欧洲黑杨(P. nigra)(PnGA20Ox)共13个物种的GA20Ox蛋白氨基酸序列进行了ClustalX(Thompson et al., 1997)序列排列,后利用Treeview软件(Page, 1996)得到了这些GA20Ox蛋白的系统进化树(图 3)。由图 3可见,在有花植物中,GA20Ox蛋白由极点向2个方向发生了进化,分为双子叶植物和单子叶植物。在双子叶植物这一分支中,包括8个GA20Ox蛋白,该分支在进化过程的起始阶段就分成了2个小分支,一为草本双子叶植物,包括拟南芥和棉花GA20Ox蛋白,另一为木本双子叶植物,主要包括苹果、欧洲山毛榉和杨属中4个种。在杨属中,又进一步进化为白杨派(Section Leuce)树种如银白杨和欧洲山杨,黑杨派(Section Aigeiros)树种如欧洲黑杨及青杨派树种如小叶杨。小叶杨与其他植物GA20Ox基因蛋白的系统进化结果与有花植物表型分类系统的结果相一致。

图 3 PsGA20Ox蛋白质的系统发育进化树 Figure 3 The rooted phylogenetic tree of PsGA20Ox protein AtGA20Ox:拟南芥Arabidopsis thaliana GA20Ox;GhGA20Ox:陆地棉Gossypium hirsutum GA20Ox;MdGA20Ox:苹果Malus domestica GA20Ox;FsGA20Ox:欧洲山毛榉Fagus sylvatica GA20Ox;PaGA20Ox:银白杨Populus alba GA20Ox;PtGA20Ox:毛白杨Populus tomentosa GA20Ox;PnGA20Ox:欧洲黑杨Populus nigra GA20Ox;PsGA20Ox:小叶杨Populus simonii GA20Ox;LpGA20Ox:黑麦草Lolium perenne GA20Ox;HvGA20Ox:大麦Hordeum vulgare GA20Ox;TaGA20Ox:小麦Triticum aestivum GA20Ox;OsGA20Ox:水稻Oryza sativa GA20Ox;ZmGA20Ox:玉米Zea mays GA20Ox.
2.3 PsGA20Ox基因的组织表达谱分析

采用RNeasy Plant Mini Kits试剂盒分别提取杨树根部、韧皮部、形成层、未成熟木质部、成熟木质部、嫩叶、成熟叶和顶端分生组织的总RNA并用紫外分光光度计定量分析提取的各个组织的RNA含量。在此基础上,用2 μg总RNA为模板(图 4C),按照Clonetech试剂盒描述的方法进行RNA反转录反应, 分别得到各个组织部分的第1链cDNA。为了检测转录的cDNA的浓度和质量情况,利用在植物体内广泛存在的杨树泛素结合酶(ubiquitin conjunction enzyme)基因序列设计的引物来扩增cDNA模板(图 4B)。以这8个组织材料的cDNA模板扩增的杨树泛素结合酶基因片段的丰度基本一致,可用于PsGA20Ox基因的组织表达谱分析。

图 4 PsGA20Ox基因的组织表达谱分析 Figure 4 Relative transcript abundance of PsGA20Ox in tissues A. PsGA20Ox在杨树不同组织中的RT-PCR扩增结果The cDNA fragment of PsGA20Ox amplified from different tissue by RT-PCR;B.泛素结合酶在杨树不同组织中的RT-PCR扩增结果The cDNA fragment of Ubiquitin amplified from different tissue by RT-PCR;C.不同组织的总RNA Total RNA in different tissues. 1.根Root; 2.韧皮部Phloem;3.形成层Cambium;4.未成熟木质部Immature xylem;5.成熟木质部Mature xylem;6.嫩叶Young leaf;7.成熟叶Mature leaf;8.顶端分生组织Apical shoot meristem.

依据PsGA20Ox基因的编码区,设计1对能够扩增出337 bp左右的cDNA片段的引物(PsGA20RTF和PsGA20RTR),以逆转录合成的cDNA第1链为模板。样品经94℃预变性3 min, 后进行94℃ 30 s, 54℃ 30 s, 72 ℃ 1 min, 28个循环, 72℃延伸5 min作PCR反应。反应产物经0.8%琼脂糖凝胶电泳分离后,用EB染色后得到如图 4A所示的结果。PsGA20Ox基因在杨树茎、叶片和顶端分生组织中均有表达,但其表达模式却不同:PsGA20Ox在成熟木质部中表达丰度最高,在未成熟木质部和嫩叶中则表达丰度中等,而在顶端分生组织中有少量表达,在形成层组织中表达丰度极低。由于GA20Ox基因在成熟木质部中的高丰度表达,有先前研究者将拟南芥的GA20氧化酶基因正义转化到受体欧洲山杨与美洲山杨的杂种中,结果可使转基因杨树体内的GA水平提高20倍,植株表现出叶片肥大,主干和直径均有明显提高,并且可使木质部纤维细胞的数量增多、纤维变长,最终增加了转基因植株的生物量(Eriksson et al., 2000)。这一结果显示了若对GA20Ox基因进行遗传操作并将其应用于树木遗传改良中将会产生更大的经济效益。

2.4 PsGA20Ox基因的SNP多样性分析

若欲对PsGA20Ox基因进行基于SNP的连锁遗传学(association genetics)研究,就需首先检测在小叶杨物种进化过程中PsGA20Ox基因内部发生的插入、缺失和单核苷酸突变位点。为此,在分析其cDNA序列的基础上,对小叶杨PsGA20Ox基因进行了序列多态性分析,测序结果表明,克隆的小叶杨PsGA20Ox基因的基因组DNA长度为1 716 bp(表 1),其中包含145 bp的5'未转录区域(5'un-translated region, 5'UTR)和118 bp的3'UTR。与模式植物拟南芥一样,小叶杨PsGA20Ox基因的DNA序列也含有3个外显子和2个内含子,外显子长度分别为569,322和267 bp,而内含子长度分别为112,183 bp。因此,对于小叶杨PsGA20Ox基因,共对其基因组1 716个核苷酸序列进行了单核苷酸多态性分析(表 1)。

表 1 小叶杨PsGA20Ox的基因组DNA结构 Tab.1 Genomic DNA structure of PsGA20Ox

在DNA序列分析的基础上,利用DnaSP4.50.4软件对PsGA20Ox基因进行了SNP多样性分析,结果表明,在小叶杨物种演化过程中PsGA20Ox基因共发生了6次插入、3次缺失和49个单核苷酸突变,插入和缺失长度范围为1~9 bp。因此,对于PsGA20Ox基因,在长度为1 716 bp的区域内共检测到49个SNPs,即SNP的频率为1/35 bp。在此基础上,分析了SNPs在群体中的频率,结果显示,在检测到的49个SNPs中,有15个属于常见SNPs,即其出现频率超过10%,而34个属于罕见SNPs。在这些SNPs中,有4, 12, 9, 5, 4, 9和6个分别位于PsGA20Ox基因的5'UTR、外显子1、外显子2、外显子3、内含子1、内含子2和3'UTR区域(表 2)。为了深入了解SNP在PsGA20Ox基因内部不同区域的频率分布,对其各部分进行了统计分析(图 5)。由图 5可见,SNP在PsGA20Ox基因的5'UTR、外显子、内含子和3'UTR的频率分布差异极其明显,每kb DNA区域SNP的频率分布分别为28,22,44,51个,即在PsGA20Ox基因区域的频率分布高低顺序为3'UTR>内含子>5'UTR>外显子。本研究中检测到的基因内部SNP的分布模式与先前对人类3 393个基因的SNPs的研究结果相一致(Suha et al., 2005),但在杨树中SNP发生的频率显著高于人类中。这主要由于树木野生性强、高度杂合,在其物种长期演化过程中,为了适应自然界多变的高温、寒冷、干湿等非生物胁迫和抵御病虫等生物胁迫,在自然选择压作用下形成了许多变异类型。与人类一样,PsGA20Ox基因的编码区域比其他部位如3'UTR、内含子和5'UTR的变异程度低,这一结果可以推测,对于PsGA20Ox蛋白基因,在物种进化过程中所受的自然选择压作用下,编码区比其他部位具有更高的保守性。

表 2 检测的SNP数量及分布 Tab.2 Number and distribution of SNPs detected in this study
图 5 PsGA20Ox基因的频率分布 Figure 5 SNPs distribution per kb of PsGA20Ox
2.5 PsGA20Ox基因的SNP替代类型及编码区内SNP变化对相应氨基酸的影响

在SNP检测的基础上,对PsGA20Ox基因区域的49个SNPs进行了单核苷酸突变替代类型的统计分析(表 3)。由表 3可见,在这些SNPs中,有37个属于转换类型,分别包含16个G⇔A和21个C⇔T。对于颠换替代类型,共检测到12个,分别包括2个C⇔A、1个G⇔T、7个A⇔T和2个C⇔G。因此,转换与颠换的比例为3:1,说明碱基突变的主要类型是转换。先前在人类基因组中的研究表明,SNP作为一种碱基的替换,大多数为转换,转换与颠换之比约2:1。主要原因可能是,SNP在CG序列上出现最为频繁,而且多是C→T,原因是CG中C即胞嘧啶常为甲基化的、自发地脱氨后即成为胸嘧啶(Suha et al., 2005)。

表 3 小叶杨PsGA20Ox基因内部SNP的变异类型 Tab.3 The substitution type of SNPs for PsGA20Ox

为了检测PsGA20Ox基因编码区内核苷酸位点的改变是否影响了其编码的氨基酸序列,在分析SNP多样性的基础上进行了氨基酸的多态性分析。对PsGA20Ox基因编码区内的26个SNPs进行了同义突变、错义突变和无义突变分析(表 4)。由表 4可见,在PsGA20Ox编码区内的26个SNPs中,有23个属于同义突变,它们均位于密码子的第3个核苷酸上,有3个属于错义突变,而没有检测到无义突变。在错义突变中,有1个位于外显子1中,且在密码子的第3个核苷酸位置上发生了A⇔T替代,由原来的CAA突变为CAT,从而导致氨基酸由谷氨酰胺(Gln)变为组氨酸(His);有2个位于外显子2中,其中第1个发生在密码子的第3个核苷酸位置上,由原来的CAG突变为CAC,导致由谷氨酰胺(Gln)变为组氨酸(His),而另一个位于密码子的第1个核苷酸位置上,发生了T⇔C突变,由原来的TAT突变为CAT,导致酪氨酸(Tyr)变为组氨酸(His)。同义突变和错义突变的频率分别为88.5%和11.5%,非同义突变与同义突变的比率为0.13。因此,对于PsGA20Ox蛋白基因,由其编码区内部发生的非同义突变与同义突变的比率0.13 < 1来看,初步表明在PsGA20Ox基因的进化过程中,纯化选择对其编码区域起了非常重要的作用。

表 4 PsGA20Ox编码区内SNP的突变类型 Tab.4 Mutation types of SNPs located in coding regions of PsGA20Ox
2.6 PsGA20Ox基因内SNPs的单体型和连锁不平衡结构分析

为了提高基于候选基因内SNP的连锁不平衡作图的效率就需要获知候选基因内SNP的单体型(haplotype,简称H)和连锁不平衡(linkage disequilibrium,简称LD)结构。因此,在对PsGA20Ox进行SNP多样性分析的基础上,利用DnaSP4.50.4软件中的Hap和LD程序对该基因内SNP位点进行了单体型和连锁不平衡分析。小叶杨PsGA20Ox内的49个SNPs分属于30个单体型(图 6),单体型的多样性为0.984 ± 0.012,其中单体型H2由4个SNPs组成,即SNP2,3,4和22组成了H2,单体型H6由SNP8,18和35组成,单体型H20由SNP24和25组成,其余的27种单体型均有单个SNP组成(图 6)。造成单个SNP组成大部分单体型的主要原因是小叶杨PsGA20Ox内多数SNPs是稀有SNP。

图 6 PsGA20Ox基因内SNP的单体型分布模式 Figure 6 Patterns of SNP based haplotype in PsGA20Ox

在先前进行的人类、动物和植物的LD作图策略中,大体上可分为2类:一是全基因组范围内进行LD作图,另一则是基于候选基因的LD作图(Zhang et al., 2005)。究竟应采用何种方法进行作图则需取决于LD在目标物种基因组中延伸的长度。为此,分析了小叶杨PsGA20Ox内SNPs的延伸长度(图 7)。由图 7可见,对于小叶杨PsGA20Ox基因,在36株基因型个体中,随着PsGA20Ox基因核苷酸序列长度的增加,SNPs的连锁不平衡程度逐渐消弱,当长度达1 300 bp时,即R2 < 0.1,连锁不平衡迅速消失。这一结果表明,在小叶杨中,SNP的连锁不平衡在候选基因内部就已衰退。这与在人类、拟南芥和大麦中LD的延伸长度相差很大,如LD在人类中可从5 kb延伸到500 kb,这使得在人类中进行全基因组范围的LD作图是可行的(Reich et al., 2001)。然而,在植物中LD的延伸范围变异很大,一般来说,在自交物种如在拟南芥中可延伸至250 kb(Nordborg et al., 2002),在大麦中甚至可延伸至10 cM(Kraakman et al., 2004)。相反,在异交物种如玉米中LD延伸仅在1 kb之内就已消失(Remington et al., 2001)。一般认为,交配系统、强的方向性选择和群体进化史可严重影响LD在目标物种中的延伸长度(Nachman,2002)。因此,从上述研究结果可知,对于异交物种小叶杨来说,基于候选基因内SNP的连锁不平衡作图是可行的,而基于整个杨树基因组的连锁不平衡作图是不可行的,也是不必要的。

图 7 小叶杨PsGA20Ox基因内SNPs的连锁不平衡 Figure 7 Linkage disequilibrium (LD) of SNPs in PsGA20Ox
参考文献(References)
梁胜发, 奥小平, 郝向春, 等. 2002. 小叶杨资源现状与发展前景. 山西林业科技, (1): 6-8. DOI:10.3969/j.issn.1007-726X.2002.01.003
王燕, 吕文, 张卫东, 等. 2000. 国内外小叶杨研究进展分析初报. 防护林科技, (3): 66-69. DOI:10.3969/j.issn.1005-5215.2000.03.014
Appleford N E, Evans D J, Lenton J R, et al. 2006. Function and transcript analysis of gibberellin-biosynthetic enzymes in wheat. Planta, 223: 568-582. DOI:10.1007/s00425-005-0104-0
Eriksson M E, Israelsson M, Olsson O, et al. 2000. Increased gibberellin biosynthesis in transgenic trees promotes growth, biomass production and xylem fiber length. Nature Biotechnology, 18: 784-788. DOI:10.1038/77355
Hedden P, Proebsting W M. 1999. Genetic analysis of gibberellin biosynthesis. Plant Physiol, 119: 365-370. DOI:10.1104/pp.119.2.365
Isabel D P, Sponsel V M. 2008. Expression of gibberellin 20-oxidase1 (AtGA20Ox1) in Arabidopsis seedlings with altered auxin status is regulated at multiple levels. Journal of Experimental Botany, 59: 2057-2070. DOI:10.1093/jxb/ern063
Israelsson M, Mellerowicz E, Chono M, et al. 2004. Cloning and overproduction of gibberellin 3-oxidase in hybrid aspen trees: effects on gibberellin homeostasis and development. Plant Physiol, 135: 221-230. DOI:10.1104/pp.104.038935
Kende H, Zeevaart J A D. 1997. The five "classical" plant hormones. Plant Cell, 9: 1197-1210. DOI:10.1105/tpc.9.7.1197
Kraakman A T W, Niks W R E, Van den Berg P M M M, et al. 2004. Linkage disequilibrium mapping of yield and yield stability in modern spring barley cultivars. Genetics, 168: 435-446. DOI:10.1534/genetics.104.026831
Lievens S, Goormachtig S, Herder J D, et al. 2005. Gibberellins are involved in nodulation of sesbania rostrata. Plant Physiol, 139: 1366-1379. DOI:10.1104/pp.105.066944
Nachman M W. 2002. Variation in recombination rate across the genome: evidence and implications. Curr Opin Genet Dev, 12: 657-663. DOI:10.1016/S0959-437X(02)00358-1
Nordborg M, Borevitz J O, Bergelson J, et al. 2002. The extent of linkage disequilibrium in Arabidopsis thaliana. Nat Genet, 30: 190-193. DOI:10.1038/ng813
Page R D. 1996. TreeView: an application to display phylogenetic trees on personal computers. Comput Appl Biosci, 12: 357-358.
Reich D E, Cargill M, Bolk S, et al. 2001. Linkage disequilibrium in the human genome. Nature, 411: 199-204. DOI:10.1038/35075590
Remington D L, Thornsberry J M, Matsuoka Y, et al. 2001. Structure of linkage disequilibrium and phenotypic associations in the maize genome. PNAS, 98: 11479-11484. DOI:10.1073/pnas.201394398
Sakamoto T, Morinaka Y, Ishiyama K, et al. 2003. Genetic manipulation of gibberellin metabolism in transgenic rice. Nat Biotechnol, 21: 909-913. DOI:10.1038/nbt847
Schaeffer S W, Walthour C S, Toleno D M, et al. 2001. Protein variation in ADH and ADH-RELATED in Drosophila pseudoobscura: linkage disequilibrium between single nucleotide polymorphisms and protein alleles. Genetics, 159: 673-687.
Shen L X, Basilion J P, Stanton Jr V P. 1999. Single nucleotide polymorphisms can cause different structural folds of mRNA. PNAS, 96: 7871-7876. DOI:10.1073/pnas.96.14.7871
Singh D P, Jermakow A M, Swain S M. 2002. Gibberellins are required for seed development and pollen tube growth in Arabidopsis. Plant Cell, 14: 3133-3147. DOI:10.1105/tpc.003046
Spielmeyer W, Ellis M H, Chandler P M. 2002. Semidwarf (sd-1), "green revolution" rice, contains a defective gibberellin 20-oxidase gene. PNAS, 99: 9043-9048. DOI:10.1073/pnas.132266399
Suha Y, Vijg J. 2005. SNP discovery in associating genetic variation with human disease phenotypes. Mutation Research, 573: 41-53. DOI:10.1016/j.mrfmmm.2005.01.005
Tomoya N, Takaaki N, Masayoshi N, et al. 2001. Production of dwarf lettuce by overexpressioning a pumpkin gibberellin 20-oxidase gene. Plant Physiol, 126: 965-972. DOI:10.1104/pp.126.3.965
Thompson J D, Gibson T J, Plewniak F, et al. 1997. The CLUSTAL X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Res, 25: 4876-4882. DOI:10.1093/nar/25.24.4876
Thumma B R, Nolan M F, Evans R, et al. 2005. Polymorphisms in cinnamoyl coA reductase (CCR) are associated with variation in microfibril angle in Eucalyptus spp. Genetics, 171: 1257-1265. DOI:10.1534/genetics.105.042028
Xu Yunling, Li Li, Wu Keqiang, et al. 1995. The GA5 locus of Arabidopsis thaliana encodes a multifunctional gibberellin 20-oxidase: molecular cloning and functional expression. PNAS, 92: 6640-6644. DOI:10.1073/pnas.92.14.6640
Zhang Deqiang, Zhang Zhiyi. 2005. Single nucleotide polymorphisms discovery and linkage disequilibrium. Forestry Studies in China, 7: 1-14.