林业科学  2011, Vol. 47 Issue (7): 82-90   PDF    
0

文章信息

赵杏, 郭琦, 陈清清, 李百炼, 张德强
Zhao Xing, Guo Qi, Chen Qingqing, Li Bailian, Zhang Deqiang
杨树热激转录因子HsfA1d的克隆、表达及单核苷酸多态性分析
Isolation, Expression and Single Nucleotide Polymorphisms Analysis of Heat Shock Transcription Factor HsfA1d in Populus
林业科学, 2011, 47(7): 82-90.
Scientia Silvae Sinicae, 2011, 47(7): 82-90.

文章历史

收稿日期:2011-02-14
修回日期:2011-05-06

作者相关文章

赵杏
郭琦
陈清清
李百炼
张德强

杨树热激转录因子HsfA1d的克隆、表达及单核苷酸多态性分析
赵杏, 郭琦, 陈清清, 李百炼, 张德强    
北京林业大学 林木育种国家工程实验室 林木花卉遗传育种教育部重点实验室 北京 100083
摘要: 利用RT-PCR方法,首次由小叶杨受热激胁迫后构建的cDNA文库中扩增获得一热激转录因子HsfA1d cDNA克隆,测序结果表明克隆的PsHsfA1d cDNA片段总长为2 036 bp,基因内部含有完整的开放阅读框架,大小为1 449 bp,可编码长度为482个氨基酸残基的蛋白质,所推导的蛋白质氨基酸序列在HSF DBD结构功能域与拟南芥AtHsfA1d和水稻OsHsfA1蛋白的相似性分别为86.3%和87.4%。组织特异性Realtime-PCR结果显示,PsHsfA1d主要在杨树叶片和根部组织中高丰度表达。非生物胁迫、激素及糖诱导表达表明,PsHsfA1d不仅受高温、干旱与盐诱导表达,还受到激素中GA3与ABA,及葡萄糖与蔗糖信号的上调表达。组合利用MEGA4.0和DnaSP4.50.7软件对小叶杨36株基因型个体的PsHsfA1d序列进行比对和分析,共检测到207个单核苷酸多态性(SNP)位点,SNP频率为1/16 bp,多样性指数π为0.007 72。在编码区域,共检测到69个SNP位点,其中37个为同义突变,31个为错义突变,1个为无义突变; 非同义突变与同义突变的比率0.132<1,推测在小叶杨物种演化过程中,纯化选择是该基因内同义SNP位点主要的进化驱动力。
关键词:小叶杨    HsfA1d基因    热胁迫    诱导表达    单核苷酸多样性    
Isolation, Expression and Single Nucleotide Polymorphisms Analysis of Heat Shock Transcription Factor HsfA1d in Populus
Zhao Xing, Guo Qi, Chen Qingqing, Li Bailian, Zhang Deqiang    
National Engineering Laboratory for Tree Breeding Key Laboratory of Genetics and Breeding in Forest Trees and Ornamental Plants of Ministry of Education Beijing Forestry University Beijing 100083
Abstract: A cDNA clone encoding HsfA1d was isolated from a cDNA library prepared under heat shock stress in Populus simonii by the RT-PCR method. The cDNA of PsHsfA1d is 2 036 bp in length with an open reading frame (ORF, 1 449 bp in length) which is capable of encoding a protein of 482 amino acids. The deduced protein sequence of the PsHsfA1d shares 86.3%, and 87.4% identity with functional domain of HSF DBD of Arabidopsis thaliana AtHsfA1d, and Oryza sativa OsHsfA1, respectively. Tissue differential expression with realtime-PCR indicated that PsHsfA1d was expressed predominantly in the leaves and roots. We analyzed the expression patterns of PsHsfA1d under abiotic stress conditions and phytohormone treatment, and the result revealed that expression of PsHsfA1d was induced not only by heat-shock, drought and high-salt stress, but also up regulated by GA3, and ABA, and glucose and sucrose signals. The genomic sequences of PsHsfA1d in 36 individuals were aligned, compared and analyzed using the software MEGA4.0 and DnaSP4.50.7. A total of 207 single nucleotide polymorphisms (SNPs) were detected and the frequency and diversity of SNPs were 1/16 bp and 0.007 72, respectively. In total, 69 SNPs were detected in the coding regions of PsHsfA1d, of which 37, 31 and 1 were silent, missense, and nonsense mutations, respectively; the nonsynonymous nucleotide substitutions (πnonsyn) was markedly lower than πsyn, with the πnonsyn/πsyn ratio 0.132 < 1, suggesting that diversity at the synonymous sites of exon regions would have resulted from strong purifying selection.
Key words: Populus simonii    HsfA1d gene    heat shock stress    inducible expression    single nucleotide polymorphisms    

干旱、高盐及极端温度胁迫是影响森林生产力和制约生态环境建设的主要非生物胁迫因素,也是实施困难立地造林的主要限制因子。随着全球气候迅速变暖,温室效应日益加剧,研究植物抵御高温热害的分子遗传调控机制就成为国际研究热点。在热胁迫下,生物体会产生一系列的应激反应,启动热激基因表达,导致热激蛋白(heat shock protein,HSP)在体内迅速积累,并以分子伴侣的形式帮助相关蛋白重新折叠、稳定、组装、胞内运输与降解,从而使植物在热逆境中得以存活与生长(Hartl et al., 2002)。而热激蛋白的表达主要受一类热激转录因子(heat shock transcription factors,Hsfs)特异性结合其启动子区域的热激元件,在转录水平上调控热激蛋白基因的开启与关闭,最终促使热激蛋白高效表达(Nover et al., 2001)。

Hsfs是在真菌、植物和动物等真核细胞体内普遍存在的一类转录因子基因家族。第1个Hsf基因由Wiederrecht等(1988)在酵母(Saccharomyces cerevisiae)中克隆得到,随后又相继在果蝇(Drosophila melanogaster)和哺乳动物中分离出相应的Hsfs基因(Clos et al., 1990; Rabindran et al., 1991; Sarge et al., 1991)。借助酵母的Hsf序列,首先在秘鲁番茄(Lycopersicon peruvianum)中分离出植物Hsfs基因成员(Scharf et al., 1990)。与酵母、果蝇及动物相比,植物Hsfs是一数量庞大的多基因家族,全基因组检测表明,模式植物拟南芥(Arabidopsis thaliana)及水稻(Oryza sativa)基因组分别含有25及21个Hsf成员,且分属于3个亚类(Guo et al., 2008; Nover et al., 2001)。通过将Hsfs基因分别转入模式植物如拟南芥以及主要农作物如水稻、番茄和小麦(Triticum aestivum)等的大量研究充分证明了Hsfs的过量表达可有效激活并影响热激蛋白基因的表达水平,并能显著提高转化植株对高温及其他逆境的忍耐程度,为植物抗逆性状的分子育种奠定了重要的基础(Koskull-Döring et al., 2007)。

Hsfs基因成员虽已从真菌、植物和动物中分离出来并进行了功能性检测,但对于高度杂合、世代周期较长、树体高大,对经济建设和环境保护具有重要作用的用材及生态型树种来说还未见关于该基因分离和检测的报道。因此,在林木,特别是在抗逆树种中分离Hsfs基因家族成员以及深入研究它们对高温及其他非生物胁迫的分子遗传学调控机制,就显得尤为必要。为此,本研究以我国北方小叶杨(Populus simonii)为材料,从经热激胁迫后构建的cDNA文库中分离得到一PsHsfA1d基因的cDNA序列,并对其进行了组织特异性及调控表达分析。在此基础上,检测了该基因在小叶杨自然群体中的单核苷酸(single nucleotide polymorphisms,简称SNPs)多样性及连锁不平衡(linkage disequilibrium,LD)结构。本研究为分离其他树种Hsfs成员以及阐明该基因的功能奠定了重要的基础。

1 材料与方法 1.1 植物材料

2007年秋季,课题组由吉林、辽宁、内蒙古、河北、北京市、山东、河南、山西、陕西、青海、甘肃、四川等12个省(市、自治区)的小叶杨自然分布区域,收集保存了共560个基因型个体。本研究为分析小叶杨PsHsfA1d基因的单核苷酸多态性,从建立的基因库中按省份、种源选取了36株个体的新鲜叶片用于基因组DNA提取; 而用于不同组织RNA提取的材料取自1年生小叶杨无性系。

1.2 杨树苗木胁迫处理及植物激素和糖信号诱导

在前期大量预试验的基础上,确定了较为合理的非生物胁迫及激素诱导试验系统,即,对于非生物胁迫处理,每一处理均将经过无性系化的苗龄4个月的小叶杨盆栽苗3株,分别经过高温(42 ℃,6 h)、干旱(1天)与盐(250 mmol·L-1,5 h); 对于激素诱导则分别将质量浓度为10 mg·L-1,0.175 mg·L-1与50 mg· L-1的脱落酸(abscissic acid,ABA)、吲哚乙酸(indole-3-acetic acid,IAA)及赤霉素(gibberellin,GA3)溶液喷施后6 h进行叶片采集。而对于糖信号诱导处理则分别用20 g·L-1的蔗糖与60 g·L-1的葡萄糖溶液喷施后2天进行叶片采集。而对照则为相同苗龄的小叶杨盆栽苗置于培养箱中进行正常的光照培养。同时将上述所有处理后及对照植株上采集的嫩叶组织置于液氮中冻存备用。

1.3 总DNA的提取

总DNA的提取按DNeasy Plant Mini Kits (Qiagen,Inc.,Valencia,CA,USA)描述的方法进行。

1.4 RNA提取和cDNA合成

经胁迫处理、植物激素与糖信号诱导和其他组织材料总RNA的提取及cDNA合成依照Zhang等(2010a)描述的方法进行。

1.5 PsHsfA1d基因检测

为了分离在热激条件下差异表达的基因,作者所在课题组构建了小叶杨热激诱导的cDNA文库,并对ESTs克隆进行了随机测序与比对,检测到了一编码区全长的PsHsfA1d基因的cDNA序列。

1.6 引物设计和PCR扩增

根据检测的PsHsfA1d cDNA序列,设计1对寡聚核苷酸引物。PsHsfA1dF: 5'-CCTGTTTCCCTCCGTCGCGTCTGCCTT-3'; PsHsfA1dR: 5'-GGACAATCGGATCTATGGACCTAAGGACAA-3'。

应用25 μL DNA聚合酶链式反应(PCR)体系,以小叶杨热激诱导的cDNA文库为模板,加入2.5 μL 10 × buffer,1.8 μL 25 mmol·L-1 MgCl2,1 μL 10 mmol·L-1 dNTP,Taq DNA聚合酶1.0 U(以上试剂购自Promega公司),10 μmol·L-1正向和反向引物各1 μL,加适量双蒸水至25 μL。PCR扩增程序如下: 94 ℃ 3 min; 94 ℃ 30 s,68 ℃ 30 s,72 ℃ 60 s,35个循环; 72 ℃ 5 min,4 ℃保存,最后将反应产物由PCR仪取出置于冰箱中冻存。

1.7 PCR产物的克隆、测序及计算机分析

将PCR扩增得到的目的基因片段回收后连接于pGEM-T Easy上。连接产物转化大肠杆菌(Escherichia coli) DH5ɑ,筛选阳性克隆,送公司测序。应用DNAMAN6.0软件和CLUSTALX软件包程序推导出氨基酸序列并进行NCBI检索分析,然后分别估算和预测推导蛋白质的分子量和等电点。

1.8 Realtime PCR检测PsHsfA1d基因的组织器官及调控表达模式

采用ABI Primer Express 3.0软件在PsHsfA1d基因内设计能够扩增长度约为63 bp cDNA片段的Realtime PCR引物。PsHsfA1dRTF: 5'-AAATGATGTGCAGCCGAATG-3'; PsHsfA1dRTR: 5'-TCTG TCAGCTGATCCACATGCT-3'。

以肌动蛋白基因Actin作为内参,引物序列为ActF: 5'-CTC,CAT,CAT,GAA,ATG,CGA,TG-3'; ActR: 5'-TTG,GGG,CTA,GTG,CTG,AGA,TT-3'。定量PCR反应按照Zhang等(2010b)描述的方法进行,最后用该基因在待测样品中的扩增量与内参Actin基因扩增量的比值,即相对表达量分析其表达模式。

1.9 PsHsfA1d基因的SNP多样性分析

依据已克隆的PsHsfA1d基因的核苷酸序列,设计能扩增出该基因的3对特异的引物序列如下:

F1: 5'-CCTGTTTCCCTCCGTCGCGTCTGCCTTT-3',

R1: 5'-TCTTGGAGTTTGTCAAGGAGAGCATAATGT-3';

F2: 5'-CCTGGTATTGCTAGCTTACTGTCTACATT-3',

R2: 5'-CTGGTATATGTGCGGATTGCCCTGAAGTT-3';

F3: 5'-CGAGCCACACATCAGGAGTGACTCTTCAA-3',

R3: 5'-GGACAATCGGATCTATGGACCTAAGGACAA-3'。

以选取的36株基因型个体的总DNA分别为模板进行PCR扩增; 将PCR扩增产物进行琼脂糖凝胶电泳分离,回收、纯化目的片段后与PGEM-T Easy载体连接,转化后挑取阳性单克隆进行3次序列测定,然后将每一基因片段的核苷酸序列拼接成完整的基因序列。在此基础上,组合利用MEGA4.0和DnaSP4.50.7软件对每一基因的36个序列进行分析,标出SNP位点、计算SNP频率及多样性指数; 分析同义突变、错义突变和无义突变情况。

2 结果与讨论 2.1 小叶杨PsHsfA1d同源cDNA的克隆及序列分析

在前期获得小叶杨HsfA1d ESTs序列的基础上设计基因特异的引物,以热激诱导后构建的cDNA文库为模板进行PCR扩增,测序结果表明,克隆的PsHsfA1d cDNA片段总长度为2 036 bp,分别包含长度为319 bp与268 bp的5'未翻译区域(5' untranslated region,5' UTR)及3' UTR (图 1); 在PsHsfA1d序列中,基因内部含有完整的开放阅读框架,大小为1 449 bp,可编码长度为482个氨基酸残基的蛋白质(基因注册号为JF905565)。估算推导的该蛋白质的分子量约为53.4 ku,等电点为4.76。鉴于植物Hsf是一结构复杂、数量庞大的基因家族,模式植物拟南芥及水稻全基因组分别含有25及21个Hsf成员,且分属于3个亚类(Guo et al., 2008; Nover et al., 2001)。为了确定克隆的小叶杨PsHsfA1d属于哪一亚类Hsf成员,对拟南芥及水稻中所有Hsf基因共36个成员与小叶杨PsHsfA1d蛋白进行了同源性进化分析(图 2)。由图 2可见:克隆的PsHsfA1d与拟南芥AtHsfA1d和水稻OsHsfA1成员属于同一亚类,即HsfA1型,故命名为小叶杨PsHsfA1d

图 1 小叶杨PsHsfA1d基因核苷酸及其推测的蛋白质序列 Figure 1 Nucleotide and deduced amino acid sequences of PsHsfA1d
图 2 PsHsfA1d与拟南芥及水稻Hsf蛋白的系统进化关系 Figure 2 The phylogenetic relationship between PsHsfA1d and Hsfs from Arabidopsis and rice At:拟南芥Arabidopsis thaliana; Os:水稻Oryza sativa.参考Refer to: Guo et al., 2008; Nover et al., 2001.

为了进行木本植物与草本植物HsfA1d基因组结构的比较基因组学研究,以小叶杨基因组总DNA为模板进行了PCR扩增和序列测定,并将其与拟南芥和水稻的直源同源基因(orthologous gene),即AtHsfA1dOsHsfA1基因的5' UTR、外显子、内含子和3' UTR进行了同源性比较(图 3表 1)。由图 3可见: HsfA1d基因结构与序列长度在杨树、拟南芥和水稻中显示了不同的模式,如对于杨树与水稻,该基因的编码区均由1个内含子所分割,其长度分别为1216 bp和1 386 bp,而在拟南芥中则包含长度分别为1 420 bp和92 bp的2个内含子。与PsHsfA1d相比,内含子在草本植物AtHsfA1dOsHsfA1基因内的位置相同(位于+ 288核苷酸处),长度也相近。但比较HsfA1编码区的长度,则显示PsHsfA1dAtHsfA1d相差较小(9 bp),而比水稻该基因的编码区短了72 bp(图 3)。在此基础上,将PsHsfA1dAtHsfA1dOsHsfA1基因的5' UTR、外显子、内含子和3' UTR进行了同源性比较(表 1)。由表 1可见: PsHsfA1dAtHsfA1dOsHsfA1基因不同区域的同源性均不相同,其同源性由大到小的顺序为外显子>5' UTR>内含子>3' UTR。这一结果显示,HsfA1d基因在进化过程中,基因不同区域所受的选择压不同,与基因的其他区域相比,外显子区域则较为保守,同源性均高于57.3%。

图 3 比较PsHsfA1dAtHsfA1dOsHsfA1基因的结构 Figure 3 Comparison of schematic structures of PsHsfA1d, AtHsfA1d and OsHsfA1
表 1 PsHsfA1dAtHsfA1dOsHsfA1基因序列同源性比较 Tab.1 Comparison of sequence identity between PsHsfA1d and AtHsfA1d and OsHsfA1
2.2 预测的蛋白质一级结构及其氨基酸序列保守性分析

为了分析PsHsfA1d蛋白的一级结构特征,将PsHsfA1d推导的氨基酸序列与研究较为广泛的番茄LpHsfA1及模式植物拟南芥AtHsfA1d及水稻OsHsfA1蛋白质序列进行了同源比较和结构分析(图 4)。由图 4可见:与报道的其他草本植物HsfA1相似,PsHsfA1d含有典型植物所具有的一切热激转录因子保守结构域,如在PsHsfA1d氨基酸序列N端第10—104氨基酸残基位置含有高度保守的HSF DNA结合结构域(DNA-binding domain,DBD),与其他草本植物氨基酸序列的同源性均超过86.3%。DBD通过结合于热激蛋白基因Hsps的热激元件上,来募集其他转录因子结合于这些Hsps基因,形成转录复合体,从而促进Hsps基因的表达(Nover et al., 2001); 除了高度保守的DBD结构域外,在N端还存在另一保守的寡聚化结构域(位于氨基酸序列的第124—189位),其主要功能被认为是在热逆境条件下,通过寡聚化作用使得Hsf单体形成三聚体,提高DBD的结合能力(Nover et al., 2001); 在氨基酸序列的中部(氨基酸序列的第206—220位)与C端(氨基酸序列的第469—476位)分别含有核输入信号与核输出信号,主要与Hsf蛋白输入核内及由核内运输到细胞质有关(Nover et al., 2001)。此外,C端含有转录活动所必需的AHA激活结构域(氨基酸序列的第458—476位) (图 4)。

图 4 PsHsfA1d与其他植物HsfA1蛋白质一级结构比较 Figure 4 Comparison of the primary structure of PsHsfA1d between P. simonii and other plants HSF DBD:热激转录因子DNA结合结构域Heat shock factor DNA-binding domain; HR-A/B:寡聚化结构域Oligomerization domain; NLS:核定位信号Nuclear localization signal; AHA:以芳族、大的疏水和酸性氨基酸为特征的激活结构域Activation domains rich in aromatic,hydrophobic and acidic amino acids; NES:核输出信号Nuclear export signal.
2.3 PsHsfA1d基因的组织器官及调控表达分析

为了检测PsHsfA1d基因在杨树不同组织与器官中的表达模式,利用设计的Realtime-PCR引物,对该基因进行了杨树组织器官特异性表达分析(图 5)。由图 5可见: PsHsfA1d基因在杨树根、茎、叶片和顶端分生组织中均有表达,但其表达模式却不同: PsHsfA1d在成熟叶片中表达丰度最高(3.509 ± 0.09),在根部组织表达量较高,约为内参肌动蛋白表达量的1.4倍(1.384 ± 0.04),而在嫩叶、树干皮层及成熟木质部组织表达量中等,在顶端分生组织及主干韧皮部、形成层与正在发育的木质部组织表达丰度最低。比较分析显示,PsHsfA1d基因在杨树成熟组织如成熟木质部和成熟叶片的表达量约为在幼嫩组织的5倍以上。在杨树不同组织与器官中的表达可知,PsHsfA1d基因具有组织器官及发育阶段特异性表达。在逆境状态下,叶片是感知极端温度、脱水及高盐等抗逆信号较为敏感的器官,而根部则是在非生物胁迫下直接遭受逆境伤害的组织,因此由该基因在杨树叶片与根部组织的高丰度表达可推测PsHsfA1d可能与逆境胁迫有关。

图 5 PsHsfA1d基因的组织表达谱分析 Figure 5 Expression profile of PsHsfA1d in root, stem, leaf and apex tissues R:根Root; B:树皮Bark of stem; P:树干韧皮部Phloem of stem; C:树干形成层Cambium of stem; DX:树干正在发育的木质部Developing xylem of stem; MX:树干成熟木质部Mature xylem of stem; YL:嫩叶Young leaf; ML:成熟叶Mature leaf; A:顶端分生组织Apex.

虽然克隆的PsHsfA1d基因在蛋白质一级结构上具备了植物HsfA1类型的一切结构特征,但不同物种在进化过程中形成了其特异的抗逆机制,特别是多年生树木与1年生草本植物可能具有不同的基因调控机制。因此,很有必要在转录水平上检测PsHsfA1d基因对各种非生物胁迫是否具有调控表达作用。为此,利用Realtime-PCR技术检测了小叶杨PsHsfA1d在不同逆境条件、激素处理及糖信号诱导下的RNA转录水平,并用PsHsfA1d基因的扩增量与内参Actin基因扩增量的比值,即相对表达量来表示(图 6)。由图 6可见:在逆境如高温、干旱及高盐条件下,PsHsfA1d基因在转录水平均有不同程度的上调表达,表达量分别是对照的1.8~3.9倍,其中该基因对干旱胁迫的响应最为明显。因此,Realtime-PCR检测结果显示,所分离的PsHsfA1d是受高温、干旱及高盐(NaCl)胁迫上调表达的基因。

图 6 PsHsfA1d的非生物胁迫、激素及糖诱导差异表达分析 Figure 6 Regulation of PsHsfA1d expression induced by abiotic stress, hormone, and sugars feeding CK:对照Control; HT:高温High temperature; D:干旱Drought; S:盐Salt; IAA:吲哚乙酸Indole-3-acetic acid; GA3 :赤霉素Gibberellin 3; ABA:脱落酸Abscissic acid; Su:蔗糖Sucrose; Gl:葡萄糖Glucose.

植物激素,如IAA,GA3与ABA等是植物生长发育及抵御逆境胁迫的重要调节剂,可能参与调控抗逆基因的表达。而本文克隆的PsHsfA1d基因是否受外源激素诱导表达?为了回答这一问题,作者同样采用Realtime-PCR技术检测了该基因在这些外源激素诱导下的mRNA转录水平(图 6)。由图 6可见:外源激素如赤霉素GA3及脱落酸ABA的施加均显著诱导了PsHsfA1d基因的上调表达,而在IAA的诱导下为下调表达。糖类如葡萄糖、蔗糖不仅是重要的渗透调节剂,也是基因表达的信号,因此,很有必要研究PsHsfA1d对葡萄糖与蔗糖信号的诱导是否具有响应。研究结果初步表明,蔗糖与葡萄糖信号均能诱导PsHsfA1d基因的上调表达,表达量至少是对照的1.7倍(图 6)。

2.4 PsHsfA1d基因内SNP的多样性检测

基因的遗传多样性是伴随物种长期进化过程中形成的种内核苷酸位点的微小变异,而研究基因内SNP的多样性是对该基因进行群体遗传学和“基于候选基因内SNP连锁不平衡作图”的基础。为此,在分析PsHsfA1d cDNA序列的基础上,以取自小叶杨自然分布区中能够最大范围覆盖其生长区域的36株基因型个体为材料,对包含315 bp的5' UTR、1 449 bp的外显子区、1 257 bp的内含子区和266 bp的3' UTR等共3 287 bp的核苷酸序列进行了单核苷酸多态性分析(表 2)。由表 2可见:在小叶杨物种演化过程中PsHsfA1d基因内分别发生了4次插入、8次缺失及207个单核苷酸突变,插入和缺失长度范围为1~6 bp。其中,插入和缺失均发生在基因的非编码区。因此,对于PsHsfA1d基因,在长度为3 287 bp的区域内SNP发生的频率为1/16 bp,SNP多样性,即,任意两序列之间核苷酸差异的平均数πT = 0.007 72。由表 2显示的结果可见:该基因的不同区域在进化过程中形成的SNP多样性不同,其在5' UTR、外显子区、内含子区和3' UTR的SNP多样性分别为0.006 32,0.005 99,0.010 44和0.008 26。由此可推测,在小叶杨自然繁衍过程中,该基因不同区域的保守性不同,而在编码区域,其核苷酸变异程度最低,显示了PsHsfA1d基因在进化过程中编码区域受到了较强的选择压(Suha et al., 2005)。

表 2 PsHsfA1d基因内SNP多样性 Tab.2 SNPs diversity in PsHsfA1d

为了检测PsHsfA1d基因编码区内SNP位点变异的发生是否影响了相应密码子编码的氨基酸序列,在分析SNP多态性位点的基础上进行了氨基酸的多样性分析。对PsHsfA1d基因编码区内的69个SNPs进行了同义突变、错义突变和无义突变分析(表 3)。由表 3可见:在PsHsfA1d编码区内的69个SNPs中,有37个属于同义突变、31个为错义突变,而仅有1个属于无义突变。鉴于非同义突变中常见SNP(在群体中出现频率超过10.0%)对于候选基因内SNP连锁不平衡作图的重要性,需要对这些突变中的常见SNP进行详细分析。在32个非同义突变中,有8个属于常见SNPs。其中,有4,3,1个分别位于密码子的第1,2,3个核苷酸位置上。如,在编码区的第892及第1096位置上均发生了第1位密码子的突变,分别由原来的密码子GCA与CCT突变成新的密码子ACA与TCT,从而分别导致其编码的氨基酸由原来的丙氨酸(Ala)与脯氨酸(Pro)突变成苏氨酸(Thr)与丝氨酸(Ser)。在编码区中,同义突变与非同义突变的核苷酸多样性分别为πsyn = 0.014 16,πnonsyn = 0.003 74,非同义突变与同义突变的比率为0.132。因此,对于PsHsfA1d基因,由其编码区内部发生的非同义突变与同义突变的比率0.132<1,显示了在小叶杨物种演化过程中,是纯化选择,而不是自然选择对PsHsfA1d基因内同义SNP位点起了主要的进化驱动力。

表 3 PsHsfA1d编码区内SNP的突变类型 Tab.3 Mutation types of SNPs located in coding regions in PsHsfA1d

为了分析小叶杨PsHsfA1d基因内核苷酸突变的替代类型,对检测到的207个SNPs进行了变异类型统计(表 4)。由表 4可见:在这些SNPs中,有153个属于转换类型,分别包含73个G⇔A和80个C⇔T。对于颠换替代类型,共检测到54个,分别包括9个C⇔A、11个G⇔T、26个A⇔T和8个C⇔G。因此,转换/颠换为2.83>2.0,造成这一结果可能是,SNP在CG序列上出现最为频繁,而且多是C→T,原因是CG中C即胞嘧啶常为甲基化地、自发地脱氨后即成为胸腺嘧啶(Suha et al., 2005)。

表 4 毛白杨PsHsfA1d基因内部SNP的变异类型 Tab.4 The substitution type of SNPs for PsHsfA1d
2.5 PsHsfA1d基因内SNPs的单体型和LD分析

在人类遗传学中,对控制疾病性状候选基因内SNP的LD作图主要利用的是群体中罕见SNP位点(Suha et al., 2005),与此不同,在树木中则应该选用常见SNP位点开展联合遗传学研究。为了提高基于候选基因内SNP的连锁不平衡作图的效率就需要获知候选基因内SNP的单体型。为此,作者选取了PsHsfA1d基因内检测到的48个常见SNPs,并利用DnaSP4.50.7软件中的Hap程序对这些位点进行了单体型分析(图 7)。由图 7可见: PsHsfA1d内的48个SNPs在小叶杨自然群体中组成了21种单体型,单体型的多样性为0.947 6,其中Hap1,Hap2和Hap3分别由5个特异的SNPs组成,而单体型Hap5,Hap7和Hap15则分别由2个特异的SNPs组成,其余单体型均有单个特异的SNP组成(图 7)。该结果建议应选取前3种单体型进一步在群体中对每一单株开展SNP分型,为小叶杨PsHsfA1d基因的连锁不平衡作图提供理想的SNP基因型数据。

图 7 PsHsfA1d基因内常见SNP的单体型分布模式 Figure 7 Patterns of common SNP based haplotype in PsHsfA1d

为了理解PsHsfA1d基因内SNP位点间在小叶杨自然群体内36株基因型个体间LD的延伸长度及程度,利用DnaSP4.50.7软件中的LD程序分析了该基因内SNPs的LD水平(图 8)。由图 8可见:对于小叶杨PsHsfA1d基因,在36株基因型个体中,随着PsHsfA1d基因核苷酸序列长度的增加,SNPs的连锁不平衡程度逐渐消弱,当长度达1 000 bp时,即R2<0.2,连锁不平衡迅速消失。这一结果表明:在小叶杨中,SNP的连锁不平衡在候选基因内部就已衰退。这与在人类、拟南芥和大麦(Hordeum vulgare)中LD的延伸长度相差很大,如LD在人类中可从5 kb延伸到500 kb这样一个大的范围,这使得在人类中进行全基因组范围的LD作图是可行的(Reich et al., 2001)。然而,在植物中LD的延伸范围变异很大,一般来说,在自交物种如在拟南芥中可延伸至250 kb (Nordborg et al., 2002)。相反,在异交物种如玉米(Zea mays)中LD延伸仅在1 kb之内就已消失(Remington et al., 2001)。一般认为,交配系统、强的方向性选择和群体的进化史可严重影响LD在目标物种中的延伸长度(Nachman,2002)。因此,从上述研究结果可知,对于异交物种小叶杨来说,基于候选基因内SNP的连锁不平衡作图是可行的。

图 8 PsHsfA1d基因内SNPs的连锁不平衡 Figure 8 Linkage disequilibrium (LD) of SNPs in PsHsfA1d
3 结论

1) 以小叶杨为模式,首次由抗逆林木中分离获得一HsfA1d型基因,推导的蛋白质一级结构在双子叶植物与单子叶植物中具有较高的保守性,如含有Hsf DNA结合结构域、寡聚化结构域、核输入信号与核输出信号,及AHA激活结构域等典型植物HsfA1所具有的一切保守结构域。

2) PsHsfA1d基因的组织器官及调控表达分析表明,该基因在杨树成熟叶片与根部组织中表达丰度最高,且具有发育阶段特异性表达; 在逆境包括高温、干旱及高盐条件下,PsHsfA1d基因在转录水平上均有不同程度的上调表达,表达量分别是对照的1.8~3.9倍,其中对干旱胁迫的响应最为明显。植物激素诱导表达显示,外源激素如ABA及GA3的施加显著提高了PsHsfA1d基因的表达; 蔗糖与葡萄糖信号均能诱导PsHsfA1d基因的上调表达,表达量是对照的1.7倍。

3) 在小叶杨自然群体内,PsHsfA1d基因内存在丰富的SNP变异,多样性水平π高达0.007 72,SNP频率为1/16 bp; 对于编码区域,在小叶杨自然群体物种演化过程中,纯化选择是该基因内同义SNP位点主要进化驱动力; 对该基因内SNPs位点进行的连锁不平衡分析表明,随着核苷酸序列长度的增加,SNPs的连锁不平衡在基因内部就迅速衰退,因此,在小叶杨中,基于候选基因的连锁不平衡作图是可行的。

参考文献(References)
Clos J, Westwood J T, Becker P B, et al. 1990. Molecular cloning and expression of a hexameric Drosophila heat shock factor subject to negative regulation[J]. Cell, 63(5): 1085-1097. DOI:10.1016/0092-8674(90)90511-C
Guo Jingkang, Wu Jian, Ji Qian, et al. 2008. Genome-wide analysis of heat shock transcription factor families in rice and Arabidopsis[J]. J Genet Genomics, 35(2): 105-118. DOI:10.1016/S1673-8527(08)60016-8
Hartl F U, Hayer-Hartl M. 2002. Molecular chaperones in the cytosol: from nascent chain to folded protein[J]. Science, 295(5561): 1852-1858. DOI:10.1126/science.1068408
Koskull-Döring P, Scharf K D, Nover L. 2007. The diversity of plant heat stress transcription factors[J]. Trends in Plant Science, 12(10): 452-457. DOI:10.1016/j.tplants.2007.08.014
Nachman M W. 2002. Variation in recombination rate across the genome: evidence and implications[J]. Curr Opin Genet Dev, 12(6): 657-663. DOI:10.1016/S0959-437X(02)00358-1
Nordborg M, Borevitz J O, Bergelson J, et al. 2002. The extent of linkage disequilibrium in Arabidopsis thaliana[J]. Nat Genet, 30(2): 190-193. DOI:10.1038/ng813
Nover L, Bharti K, Döring P, et al. 2001. Arabidopsis and the heat stress transcription factor world: how many heat stress transcription factors do we need?[J]. Cell Stress Chaperones, 6(3): 177-189. DOI:10.1379/1466-1268(2001)006<0177:AATHST>2.0.CO;2
Rabindran S K, Giorgi G, Clos J, et al. 1991. Molecular cloning and expression of a human heat stress factor[J]. PNAS, 88(16): 6906-6910. DOI:10.1073/pnas.88.16.6906
Reich D E, Cargill M, Bolk S, et al. 2001. Linkage disequilibrium in the human genome[J]. Nature, 411(6834): 199-204. DOI:10.1038/35075590
Remington D L, Thornsberry J M, Matsuoka Y, et al. 2001. Structure of linkage disequilibrium and phenotypic associations in the maize genome[J]. PNAS, 98(20): 11479-11484. DOI:10.1073/pnas.201394398
Sarge K D, Zimarino V, Holm K, et al. 1991. Cloning and characterization of two mouse heat stress factors with distinct inducible and constitutive DNA binding ability[J]. Genes Dev, 5(10): 1902-1911. DOI:10.1101/gad.5.10.1902
Scharf K D, Rose S, Zott W, et al. 1990. Three tomato genes code for heat stress transcription factors with a region of remarkable homology to the DNA-binding domain of the yeast HSF[J]. EMBO J, 9(13): 4495-4501.
Suha Y, Vijg J. 2005. SNP discovery in associating genetic variation with human disease phenotypes[J]. Mutation Research, 573(1/2): 41-53.
Wiederrecht G, Seto D, Parker C S. 1988. Isolation of the gene encoding the S. cerevisiae heat shock transcription factor[J]. Cell, 54(6): 841-853. DOI:10.1016/S0092-8674(88)91197-X
Zhang Deqiang, Du Qingzhang, Xu Baohua, et al. 2010a. The actin multigene family in Populus: organization, expression and phylogenetic analysis[J]. Mol Genet Genomics, 284(2): 105-119. DOI:10.1007/s00438-010-0552-5
Zhang Deqiang, Yang Xiaohui, Zhang Zhiyi, et al. 2010b. Expression and nucleotide diversity of the poplar COBL gene[J]. Tree Genetics and Genomes, 6(2): 331-344. DOI:10.1007/s11295-009-0252-7