林业科学  2013, Vol. 49 Issue (11): 67-76   PDF    
DOI: 10.11707/j.1001-7488.20131109
0

文章信息

巩琛锐, 王璐, 杜庆章, 张德强
Gong Chenrui, Wang Lu, Du Qingzhang, Zhang Deqiang
毛白杨S-腺苷高半胱氨酸水解酶基因PtSAHHA的克隆、表达及SNP关联分析
Isolation, Expression, and Association Genetics of the S-Adenosyl-L-Homocysteine Hydrolase Gene A (PtSAHHA) in Populus tomentosa
林业科学, 2013, 49(11): 67-76
Scientia Silvae Sinicae, 2013, 49(11): 67-76.
DOI: 10.11707/j.1001-7488.20131109

文章历史

收稿日期:2013-06-06
修回日期:2013-08-21

作者相关文章

巩琛锐
王璐
杜庆章
张德强

毛白杨S-腺苷高半胱氨酸水解酶基因PtSAHHA的克隆、表达及SNP关联分析
巩琛锐, 王璐, 杜庆章, 张德强    
北京林业大学 林木花卉遗传育种教育部重点实验室 林木育种国家工程实验室 北京 100083
摘要:组合运用分子生物学及生物信息学方法,首次从毛白杨成熟木质部中分离出编码S-腺苷高半胱氨酸水解酶基因PtSAHHA的cDNA克隆。序列分析表明,毛白杨PtSAHHA cDNA片段全长为1 935 bp,其内部含有大小为1 458 bp的完整开放阅读框架,可编码含有485个氨基酸残基的蛋白质。组织特异性Realtime-PCR结果显示,PtSAHHA在木质部中表达丰度最高,在形成层和老叶中表达丰度中等,在嫩叶中表达丰度最低。在此基础上,组合利用MAGE5.0和DnaSP5软件对毛白杨自然群体中45株基因型个体的PtSAHHA序列进行对比和分析,共检测到166个单核苷酸多态性(SNP)位点,SNP频率为1/15 bp,多样性指数πT为0.010 58。在外显子区域共检测到88个SNP位点,其中同义突变位点34个,错义突变位点53个及1个无义突变位点;同义突变的核苷酸多样性πSynonymous= 0.024 91,是非同义突变核苷酸多样性πNonsynonymous=0.002 33的10倍,推测毛白杨PtSAHHA基因编码区在毛白杨物种演化过程中受到较强的纯化选择压力。对PtSAHHA基因内的SNPs连锁不平衡分析结果表明,随着核苷酸序列长度增加至800 bp,即r2 < 0.1,SNPs的连锁不平衡水平已衰退至不明显。在此基础上,在由426株毛白杨基因型个体组成的关联作图群体内,对频率大于10%的42个常见SNP标记位点与6个木材品质性状进行关联分析,检测到3个SNP标记与3个表型性状显著关联。研究结果为基于分子标记的毛白杨优良木材品质性状定向辅助育种提供理论依据。
关键词毛白杨    S-腺苷高半胱氨酸水解酶    单核苷酸多态性    连锁不平衡    木材品质性状    
Isolation, Expression, and Association Genetics of the S-Adenosyl-L-Homocysteine Hydrolase Gene A (PtSAHHA) in Populus tomentosa
Gong Chenrui, Wang Lu, Du Qingzhang, Zhang Deqiang     
Key Laboratory of Genetics and Breeding in Forest Trees and Ornamental Plants of Ministry of Education National Engineering Laboratory for Tree Breeding Beijing Forestry University Beijing 100083
Abstract: In this study, a full-length cDNA clone encoding PtSAHHA was isolated from the cDNA library prepared from mature xylem zone of Populus tomentosa by the bioinformatics and molecular biology. The PtSAHHA cDNA had 1 935 bp length with a corresponding open reading frame (ORF) of 1 458 bp that could encode a protein of 485 amino acids. Tissue-specific expression analysis indicated that the PtSAHHA transcripts were the most abundant mRNA products in stem xylem, intermediate in stem cambium and mature leaf, and the lowest abundant in young leaf. By aligning,comparing and analyzing the genomic sequences of PtSAHHA in 45 random individuals of P.tomentosa with the software of MEGA5.0 and DnaSP5, a total of 166 single nucleotide polymorphisms (SNPs) were detected, with the SNP frequency of 1/15 bp and the diversity (πT) of 0.010 58. There were 88 SNPs detected in the coding regions of PtSAHHA, of which 34 were synonymous nucleotide substitutions, and 53 were missense mutations and 1 was nonsense mutation. The diversity level of synonymous nucleotide substitutions (πSynonymous=0.024 91) was tenfold of nonsynonymous nucleotide substitutions (πNonsynonymous=0.002 33), suggesting that the gene might be evolved under purifying selection at the synonoymous sites of the coding region in P. tomentosa. Linkage disequilibrium test in the PtSAHHA showed that LD declined rapidly within the regions of PtSAHHA with the length increase to 800 bp(r2 < 0.1). On this basis, candidate gene-based association analysis of 42 common single-SNPs (frequency > 10%) with six wood traits in an association population of 426 unrelated individuals showed 3 SNPs that were significantly associated with 3 wood traits, respectively. This study provides an important genetic foundation for molecular marker-assisted selection breeding programs with the goals of improving the quality and quantity of wood products of P. tomentosa.
Key words: Populus tomentosa    S-adenosyl-L-homocysteine hydrolase (SAHH)    single nucleotide polymorphisms    linkage disequilibrium (LD)    wood property    

为解决和改善日益严重的全球性能源危机及温室效应问题,世界各国已开始重视发展可持续再生新能源。有研究表明,通过将生物质能源,尤其是含量最为丰富的木质纤维素转化为乙醇替代石油等化工原料的途径有望解决上述危机(Demirbas,2005)。此外,纸张消费的增长及现代造纸工业的迅猛发展导致木质纤维原料缺乏,而木材中纤维素的含量直接影响到乙醇的转化率和制浆造纸过程中纸浆的得率,并和造纸所产生的环境污染有密切关系(Chiang et al.,1988 ; Sassner et al.,2005)。因此,对木材纤维素生物合成机制的深入研究,特别是对木材纤维素的生物合成过程及对参与其中的关键基因进行遗传学研究,将对林木种质的分子遗传改良具有深远的意义。为此,先前的研究者利用分子生物学与分子遗传学手段发现并解析了部分基因的功能,显著提高了林木分子遗传改良的进程(Déjardin et al.,2010 ; Ingvarsson et al.,2011 ; Li et al.,2006)。

S-腺苷高半胱氨酸水解酶(S-adenosy-L-homocysteine hydrolase,SAHH)是生物体内广泛存在的调节细胞内甲基化反应的一个关键酶。其可逆的催化 S-腺苷-L-高半胱氨酸(SAH)水解生成腺苷(Ado)和高半胱氨酸(Hcy),是真核生物中水解AdoHcy 代谢的唯一途径(Lloyd et al.,1993)。通过该途径,将甲基供体 S-腺苷甲硫氨酸(SAM)转甲基之后产生的 SAH 代谢掉。 SAHH 的催化活性受 SAM 与 SAH 含量的比率调节,SAH 含量过高会抑制 SAHH 的催化活性,从而降低基因甲基化的程度,进而调控基因的表达(Kloor et al.,2004 ; Li et al.,2008)。自1954年,Cantoni和Scarano(1954)首次发现 S-腺苷高半胱氨酸以来,已经从人类及多种微生物如酵母菌(Saccharomyces cerevisiae)、枯氏锥虫(Trypanosoma cruzi)、南极冰藻(Chlamydomonas sp. ICE-L)等生物体内克隆得到了 SAHH 基因的全长序列(Parker et al.,2003 ; Tehlivets et al.,2004 ; 王金慧等,2011)。此外,在植物中已获得陆地棉(Gossypium hirsutum)、黄瓜(Cucumis sativus)等作物的 SAHH 基因全长(佘义斌等,2008 ; 金晓霞等,2012)。目前,关于该基因的研究多集中在介导DNA 甲基化机制方面,尤其是人类医学领域中对各种病毒及肿瘤的新疗法探究以及以 SAHH 基因作为靶位点设计药物的研究(Turner et al.,2000 ; Clercq,2002 ; Ji et al.,2005)。S-腺苷高半胱氨酸水解酶广泛存在于生物体内,其在植物次生微管组织木质部发育过程中具有重要的调控作用(Rocha et al.,2005 ; 佘义斌等,2008)。鉴于树木纤维素对林产工业经济价值的重要性,分离 S-腺苷高半胱氨酸水解酶基因并对其进行分析,对于探究纤维素的合成过程以及木材纤维品质的研究具有重要意义。特别是近几年,基于分子标记辅助育种策略的提出,为研究基因功能及其遗传变异位点的遗传效应提供了新方向。基于候选基因内单核苷酸多态性(single nucleotide polymorphisms,简称 SNPs)的遗传学研究已成为研究林木育种的一种有效的手段(Zhang et al.,2005); 大量研究表明该方法在挖掘与表型性状显著关联的功能标记位点,并用于探索候选基因分子遗传机制方面具有重要意义(Andersen et al.,2005 ; Gonzalez-Martinez et al.,2007 ; Tian et al.,2012)。但在树体高大、生长周期较长且在生态环境建设中占有重要地位的用材树种中还未见关于该基因克隆与功能分析的报道。为此,本文以我国北方地区重要的用材树种毛白杨(Populus tomentosa)为材料,从该树种的成熟木质部中成功分离出一个SAHH 基因,并对该基因进行组织特异性分析及单核苷酸多态性分型。在此基础上,运用连锁不平衡分析手段研究了该基因内的 SNP 标记位点与木材品质性状的关系,为选择优良用材种质为目标的毛白杨 SNP 标记辅助育种奠定了理论基础,具有重要的应用价值。

1 材料与方法 1.1 植物材料

20世纪80年代初,全国毛白杨协作组从毛白杨天然分布区100多万km2的范围内选取了1 047株优良的毛白杨基因型个体,在山东省冠县建立了毛白杨种质资源基因库。 Huang(1992)依据光、热、水等16个气象因子,运用主分量分析,将毛白杨分布区划分为3个气候区。在上述毛白杨种质资源基因库中选取能够最大程度反映毛白杨天然分布范围的45株基因型个体用于 SNP 的发现; 用于 SNP 与木材品质性状关联分析的群体为选自于该基因库的426株基因型个体。提取 RNA 的材料为1年生的毛白杨无性系‘鲁毛50 ’。

1.2 总 DNA 的提取

植物材料总 DNA 的提取按照 DNeasy PlantMini Kits(Qiagen,Inc.,Valencia,CA,USA)描述的方法进行。

1.3 总RNA提取以及cDNA的合成

毛白杨不同组织材料(顶端分生组织、嫩叶、成熟叶、韧皮部、形成层、未成熟木质部、成熟木质部及根部组织)总 RNA 的提取及 cDNA 的合成按照 RNeasy Plant Mini Kits(Qiagen)和Clonetech 试剂盒描述的方法进行。

1.4 设计引物及PCR 扩增

利用 Affymetrix 表达谱芯片技术构建了插入片段为1.0~4.0 kb、大小为5.06 × 106 pfu 的毛白杨木质部 cDNA 转录组数据库,随机选择5 000条 EST片段进行测序,与所有的拟南芥(Arabidopsis thaliana)AtSAHH 基因比对,最终在毛白杨中确定了一个与AtSAHH 序列相似度达83 % 的 EST 片段,在毛白杨 EST 序列两端设计1对寡聚核苷酸引物:

PtSAHHAF: 5 '-CCATGTACACTCCACCAACTCCCTGAAA-3 ';

PtSAHHAR: 5 '-GAGAAAACTCATTCTACTAGCCGTTACAA-3 '(Tm= 65 ℃)。

以毛白杨成熟木质部 cDNA 为模板,采用25 μLDNA 聚合酶链式反应(PCR)体系,反应体系按照潘炜等(2011)描述的方法进行。最终扩增出长约2 000 bp的 cDNA 片段。

1.5 PCR 产物的克隆、测序及生物信息学分析

回收 PCR 扩增后得到目的基因片段,将其与 PMD-18 T 载体连接。连接产物转化大肠杆菌(Escherichia coli)DH5 α并筛选阳性克隆进行 PCR扩增,将扩增后的阳性克隆进行测序,获取该基因的 cDNA 序列。应用 DNAMAN6.0软件推导出该基因所编码的氨基酸序列,分别估算该蛋白的分子质量和等电点并进行跨膜结构分析; 同时,对其同源蛋白序列进行 NCBI 检索,并利用 MAGE5软件对不同物种间同源蛋白序列的系统进化进行分析。

1.6 Realtime PCR 检测不同组织和器官中PtSAHHA 基因的表达模式

利用 ABI Primer Express3.0软件设计2条Realtime PCR 的扩增引物,引物序列如下:

PtSAHHARTF: 5 '-ATGATCTGCGATCTCGGA GAA-3 ';

PtSAHHARTR: 5 '-CACCCCCATCCAAAACCTTATTA-3 '(Tm= 58 ℃)。

以在杨树不同组织与器官中表达相对稳定的肌动蛋白基因Actin 作为内参,引物序列为:

ActRTF:5 '-CTCCATGAAATGCGATG-3 ';

ActRTR:5 '-TTGGGGCTAGTGCTGAGATT-3 '(Tm= 58 ℃)。

定量 PCR 反应操作按照 SYBR© Premix Ex TaqTM(TaKaRa)试剂盒描述的方法进行。每个样品和对照分别重复3次。反应总体系为: cDNA 2 μL,SYBR© Premix Ex TaqTM 12.5 μL(2 ×),定量PCR 上游和下游引物各0.5 μL(10 μmol·L-1),加水补足25 μL。轻微离心,将反应体系收集到管底。在 MJ Research Opticon 2荧光检测系统上进行 Real-time PCR 反应,扩增程序为: 94 ℃,5 min →(94 ℃,30 s→58 ℃,30 s→72 ℃,1 min),40个循环→ 72 ℃,10 min。扩增完成后用MJ Research Opticon 2 SYSTEM 软件对结果进行分析。

1.7 PtSAHHA 基因内SNP多样性分析

分析已得到的 PtSAHHA 基因核苷酸序列,在其两端设计基因特异的引物,以45株毛白杨个体的总 DNA 为模板分别进行扩增。将扩增产物经琼脂糖凝胶电泳分离、回收、纯化后与 pMD-18 T 载体进行连接、转化,选取阳性克隆送公司测序。运用MEGA5软件对45株基因型个体 PtSAHHA 基因片段的核苷酸序列进行比对,标出 SNP 位点; 在此基础上,运用 Dnasp5软件计算 SNP 频率及多样性指数,对其中存在的同义突变、错义突变和无义突变情况进行分析,并对 SNP 位点进行连锁不平衡分析。

1.8 毛白杨关联作图群体 SNP 基因型分型及木材品质性状的测定

对于 SNP 位点基因型分析,以能够最大程度地反映毛白杨天然分布范围的426株基因型个体作为关联作图群体,利用锁核酸技术(Koshkin et al.,1998)对1.7中确定的频率大于5 % 的常见 SNP 标记进行 PCR 扩增、基因型分型,建立 SNP 基因型数据库; 对于木材纤维品质性状,利用 Near Infrared Reflectance Spectroscopy(NIRS)仪器(MPA 傅里叶型)测定每个基因型个体的木材化学成分如木质素含量、综纤维素含量及α-纤维素含量; 采用纤维测定仪测定木材物理性质如纤维长和纤维宽,利用 X-衍射仪测定微纤丝角; 数量性状指标的具体测定方法见 Du等(2013 b)

1.9 PtSAHHA 基因内 SNPs 标记位点与木材品质性状的关联分析

利用 TASSEL2.1软件将 SNP 位点基因型分别与木材物理及化学性状进行混合线性模型(MLM)分析(Yu et al.,2006 ; Stich et al.,2009)。其中,该模型以群体结构系数(Q)和亲缘关系系数(K)作为协变量,其中 Q 矩阵数据来自于 Du等(2012)K 矩阵则由 SPAGeDi 软件计算获得(Ritland,1996)。获取 P≤ 0.05的关联结果,随后利用 Q-value 软件进行 Fasle Discovery Rate(FDR)假阳性检验(Q <0.01)(Storey et al.,2003),最终确定与木材品质性状显著关联的 PtSAHHA 基因内 SNP 位点。

2 结果与讨论 2.1 PtSAHHA 基因的克隆与结构特征分析

在毛白杨木质部 cDNA 转录组数据库中随机选取5 000条 EST 片段进行测序并与拟南芥 AtSAHH 基因进行比对,最终获得一个与 AtSAHH 高度相似的EST 片段(83%)。以毛白杨成熟木质部的 cDNA 第1链作为模板进行 PCR 扩增,产物经0.8% 琼脂糖凝胶电泳后,在大约2 000 bp 处显示出1条清晰明亮的特异性条带(图 1)。将该目标片段经回收、纯化后与pMD-18T 载体进行连接,选取阳性克隆测序。测序结果表明,克隆得到的 PtSAHHA 基因的 cDNA 克隆总长为1 935 bp,分别包含长度为248 bp和229 bp 的3'UTR(3' un-translated region)和5'UTR(5' un-translated region); 分析结果表明,PtSAHHA 基因内含有大小为1 458 bp 的完整开放阅读框架,可编码含有485个氨基酸残基的蛋白质。将该序列提交 GenBank 数据库,接收序列号为 KF293294。运用 DNAMAN6.0软件估算得到 PtSAHHA 蛋白质的分子质量约为53 171.4 Da,其等电点为5.79。

图 1 PtSAHHA 基因的 cDNA 片段 Fig. 1 The cDNA fragment of PtSAHHA M: 1 kb DNA 分子量标准 ; 1 : PtSAHHA 的 cDNA 片段。
M: 1 kb DNA ladder marker; 1: The cDNA fragment of PtSAHHA

为分析该基因的结构,以毛白杨基因组总 DNA为模板进行了 PCR 扩增和测序,获得了长度为2 445 bp的 PtSAHHA 基因组 DNA 序列。并与 cDNA比较显示,该基因内仅含有1个内含子,长度为510 bp。将PtSAHHA 基因序列进行 NCBI 检索,结果初步表明 SAHHA 在毛白杨中的克隆尚属首次。将其与之前从模式植物及农作物中克隆的SAHH基因的蛋白质序列进行同源性比较(图 2)。结果显示,PtSAHHA 与模式植物如拟南芥、毛果杨(Populus trichocarpa)、蓖麻(Ricinus communis)、烟草(Nicotiana tabacum)及主要农作物如玉米(Zea mays)、水稻(Oryza sativa)的 SAHH 核苷酸序列及氨基酸序列具有很高的相似性,同源性在91.75%~98.14% 之间,其中与毛果杨 PtrSAHHA 蛋白的同源性最高,因此将本研究克隆得到的这一毛白杨 SAHH 基因命名为 PtSAHHA 是合理的。Rocha等(2005)的研究也证明,植物 SAHH 基因编码的蛋白质高度保守,都具有长度相同的485个氨基酸且同源性高于87% 。

图 2 PtSAHHA 与其他物种 SAHH 蛋白质序列比较 Fig. 2 The protein sequences alignment of SAHH from different species Ptr: 毛果杨 Populus trichocarpa; Rc: 蓖麻 Ricinus communis; Nt: 烟草 Nicotiana tabacum; Os: 水稻 Oryza sativa; Zm: 玉米 Zea mays; At: 拟南芥 Arabidopsis thaliana。黑色方框表示2个跨膜蛋白结构域。下划线表示 AdoHcyase_NAD 结构域。 The two black boxes show the transmembrane domains,and the underline shows AdoHcyase_NAD domain.

蛋白质一级结构分析表明,PtSAHHA 编码的蛋白与其他植物的 SAHH 蛋白都具有典型的 AdoHcyase_NAD 结构域,表明 SAH 水解酶是一种十分保守的蛋白质。运用 DNAMAN6.0软件对氨基酸序列进行跨膜结构分析显示,这7个物种的 SAHH基因编码的蛋白两端分别具有1个跨膜蛋白结构域,位于氨基酸序列63 —86和251 —271处。运用在线软件 ExPASy-PROSITE(http:∥www.expasy.org/prosite/)预测到在这2个跨膜区域附近分别具有1个 S-腺苷-L-高半胱氨酸水解酶信号,分别位于85 —99和262 —279氨基酸序列处,推测其具有催化水解 SAH 的功能。

2.2 PtSAHHA 基因的组织特异性 Realtime-PCR检测

为了检测杨树不同组织与器官中 PtSAHHA 基因的表达模式,以 Actin 基因为内参进行 Realtime-PCR 扩增,获得该基因在杨树不同组织器官内的相对表达量(图 3)。由图 3可见,PtSAHHA 基因在杨树的根、茎、叶等组织中均有表达,但相对表达水平差异较大。PtSAHHA 基因主要在木质部中表达,其在成熟木质部中具有最高的表达水平(13.51),而未成熟木质部中表达丰度次之(9.97)。此外,在形成层和成熟叶片中也有中等丰度的表达,而在根、韧皮部、顶端分生组织中表达量较低,在未成熟叶片中的表达量极低,仅为0.114 3。从 PtSAHHA 表达模式可以看出,该基因主要在杨树的木质部中表达,且成熟木质部的表达量远远高于其他组织器官。佘义斌等(2008)在陆地棉中克隆得到的GhSAHH 基因在根、下胚轴和纤维早期发育时期较高丰度的表达也证明了该基因具有组织特异性表达。结合本研究结果,初步推断 PtSAHHA 基因参与了次生木质部细胞壁的加厚过程,并通过影响 DNA 甲基化水平来调控木材纤维的合成,对木材的形成过程具有重要的调控作用。

图 3 PtSAHHA 基因在不同组织中的特异性表达水平 Fig. 3 Relative transcript abundance level of PtSAHHAin different tissues R: 根 ; P: 树干韧皮部 ; C: 树干形成层 ; DX: 树干未成熟木质部 ; MX: 树干成熟木质部 ; YL: 嫩叶 ; ML: 成熟叶 ; A: 顶端分生组织。
R: Root; P: Phloem of stem; C: Cambium ofstem; DX: Developing xylem of stem; MX: Mature xylem ofstem; YL: Young leaf; ML: Mature leaf; A: Apical meristem.
2.3 PtSAHHA 基因内SNP 多样性分析

为检测 PtSAHHA 基因在毛白杨自然群体内SNP 多样性水平,获知该基因在种内演化过程中的分子进化特点,在全国毛白杨基因库内选取能够最大范围反映毛白杨生长分布区域的45株基因型个体为试验材料,对全长为2 445 bp 的 PtSAHHA 基因组序列的不同区域进行了序列克隆、比对及其SNP 多态性分析(表 1)。这45株毛白杨个体的 SAHHA 序列已上传至 NCBI,其 GenBank 登录号为 KF467170 —KF467214 。经序列比对分析,共检测到166个SNPs,出现频率为1 /15 bp。在该基因的5 'UTR、3 ' UTR、外显子及内含子中分别检测到18,15,88及45个 SNPs,其出现频率分别为1 /13 bp,1 /17 bp,1 /17 bp和1 /11 bp(表 1)。其中在内含子区域 SNP 出现的频率最高,而在外显子及3 ' UTR 区域 SNP 出现的频率最低(表 1)。经 Dnasp5软件推算得出 PtSAHHA 内具有8个相对保守的 DNA 区域,其中7个位于外显子区域,1个位于3 ' UTR 区域。这表明在进化过程中,PtSAHHA 基因的编码区域受到了较强的选择压力(Suh et al.,2005)。此外,5 'UTR和3 'UTR 也显示出较低的变异程度,推测是由于5 'UTR 区域内存在一些调控基因表达的位点(赵谨等,2005),且3 ' UTR 区域具有转录水平上调节细胞的发育和分化的功能(Moor et al.,2005)。因此这些区域的保守性有利于维持基因的表达水平,进而保证个体的生存和种群的繁衍。

表 1 PtSAHHA 内不同区域的 SNP 多态性 Tab.1 Nucleotide polymorphisms at the PtSAHHA locus

运用 Dnasp5软件对核苷酸多样性指数 π 分析(表 1)显示,外显子区域的核苷酸多样性指数(πExon 1 = 0.007 10和πExon 2 = 0.007 58)明显低于其他区域,其次是内含子区域(πIntron = 0.014 01)、3'UTR(π3 'UTR = 0.016 20),且在5' UTR 区域表现出最高的核苷酸多样性指数(π5 'UTR= 0.017 66)(Tajima,1989; Watterson,1975)。编码区域内,同义突变的核苷酸多样性指数(πSynonymous = 0.024 91)是非同义突变核苷酸多样性指数(πNonsynonymous = 0.002 33)的10倍,说明纯化选择对基因编码区域的非同义位点起了重要作用(Fu et al.,1993)。对 PtSAHHA 基因内166个 SNP 位点进行突变类型分析显示,135个 SNP 位点发生转换,31个位点发生颠换,转换与颠换的比值约为4.35 > 0.5,且其中大部分为 C 突变为 T。该模式与毛白杨、小叶杨(Populus simonii)部分候选基因的研究结果一致(潘炜等,2011; 卫尊征等,2009)。

在编码区域检测到的88个 SNPs 中包含同义突变34个、错义突变53个以及无义突变1个。对其编码的氨基酸变异情况进一步分析发现,外显子1中含有29个错义突变,其中罕见的 SNP 的密码子由原来的 TGC 突变为 AGC,导致对应的半胱氨酸(Cys)突变为丝氨酸(Ser); 外显子2中突变的密码子由原来的 ACC 突变为 ATC,导致编码的相应氨基酸由苏氨酸(Thr)突变为异亮氨酸(Ile)。中性检测结果(表 2)显示,这3个毛白杨群体在进化的过程中都受到了相似的选择压力,且均存在过剩的罕见 SNP 位点。在3个群体中均显示出非同义突变单核苷酸多样性指数(πn)与同义突变单核苷酸多样性指数(πs)的比率 < 1,说明在毛白杨演化过程中,主要是纯化选择驱动了 PtSAHHA 基因内非同义 SNP位点的变异。

表 2 PtSAHHA 在毛白杨3个群体内的核苷酸变异水平 Tab.2 Summary of nucleotide variation in 3 populations for PtSAHHA
2.4 PtSAHHA 基因内 SNP 的连锁不平衡分析

为了解毛白杨自然群体中PtSAHHA 基因内SNP 位点间的连锁不平衡的延伸长度及程度,运用 DnaSP5软件中的 LD 程序分析了 PtSAHHA 基因内79个常见SNP 位点连锁不平衡水平(图 4)。 图 4表明,LD 并没有延伸至 PtSAHHA 基因的整个区域,其基因内部的 SNPs 连锁不平衡程度随着核苷酸序列长度的增加而迅速降低,随着核苷酸序列长度增加至800 bp,即 r2 < 0.1,PtSAHHA 基因内 SNPs 的连锁不平衡水平已衰退至不明显。计算 PtSAHHA 基因内常见SNPs 位点间的 LD 值(平均 r2 = 0.134 5)表明,PtSAHHA 基因内的 LD 衰减极为迅速。这一结果表明,在候选基因 PtSAHHA 内进行 SNP 标记位点与表型变异的关联分析是可行的。

图 4 PtSAHHA 基因内 SNP 的连锁不平衡衰退水平 Fig. 4 Linkage disequilibrium of SNPs in PtSAHHA r2:PtSAHHA 基因内SNP 间连锁不平衡程度
Degree of LD between SNPs within PtSAHHA

在植物中,LD 延伸范围变异很大。比如,在异交物种玉米中,LD 水平急剧衰退,在1 kb 之内已衰退至不明显(Remington et al.,2001)。但在自交物种拟南芥中,LD 可延伸至250 kb(Nordborg et al.,2002)。在杨属近缘树种间,LD 的延伸长度也有所差异。 Ingvarsson等(2005)在对欧洲山杨(Populus tremula)的多个基因的研究中发现,LD 的衰退非常迅速,在500 bp 以内 LD 就已经衰退消失;Chu等(2009)在欧洲黑杨(Populus nigra)中的研究则显示,不同基因内 LD 的衰减速度差异很大,延伸长度20~1 300 bp(r2 < 0.1)。最近对毛果杨基因组范围内广泛LD 的研究表明,LD 的延伸可以达到3~6 kb(Slavov et al.,2012),打破了先前研究认为的林木具有较低的连锁不平衡水平,为进行林木全基因组水平的关联分析提供了重要的理论依据。

2.5 SNPs 位点与木材品质性状的关联分析

运用混合线性模型(MLM)共检测到6个SNP位点与6个木材品质性状显著连锁(P < 0.05),经 Fasle Discovery Rate(FDR)多重检测筛选后,最终获得3个 SNPs 位点分别与3个木材性状显著连锁,每一位点可解释表型遗传变异的2.83 %~16.4 %(表 3)。本研究获得的3个SNPs 位点分别位于 PtSAHHA 基因内的不同区域,并与不同木材品质性状显著关联。SNP1位于 PtSAHHA 基因的5 ' UTR 区域,与纤维长度性状极显著关联,遗传贡献率为16.4 % ; Guerra等(2012)的研究发现,5 ' UTR 区域的 SNP 标记与木材化学性状存在关联。有研究表明,5 'UTR 区域虽然不直接编码氨基酸序列,但对基因的表达调控尤其是转录过程具有重要调控作用(Miyamoto et al.,2007 ; 赵谨等,2005 ; Lin et al.,2012)。mRNA 是指导蛋白质翻译的重要信使,mRNA 的形成过程有多重因子参与,而5 ' UTR 区域含有内部核糖体进入的位点,因此具有介导内部翻译起始的功能并影响基因的表达(Cullen,2000)。在毛白杨 PtSAHHA 基因5 'UTR 区域发现的 SNP1位点,可能调控了 PtSAHH 基因的表达,进而影响了纤维长度的变异。位于 PtSAHHA 基因内含子区域的 SNP15位点,分别与纤维长度及微纤丝角显著连锁,分别可解释表型遗传变异的3.86 % 与15.47 %(表 3)。内含子区域虽然不参与蛋白质的翻译过程,但基因组 DNA 转录 mRNA 过程中需将内含子剪切,从而形成成熟的mRNA。因此,内含子序列变异会影响 RNA 翻译前的剪接过程,从而影响蛋白的表达(Sontheimer et al.,1999 ; Chalamcharla et al.,2010)。SNP32标记位于 PtSAHHA 基因的第2个外显子区域,并与α-纤维素含量显著关联,遗传贡献率为2.83 % 。该位点为同义突变位点,虽然没有导致氨基酸序列的改变,但与纤维素含量显著关联。在 Thumma等(2009)的研究中也发现同义突变的 SNP 位点与纤维素含量及纸浆得率存在显著关联,并可顺式作用调控基因的表达。

表 3 SNP 位点基因型分型与表型性状的关联结果 Tab.3 The SNPs locus associated with phenotypic traits

在关联分析中发现,SNP1位点和SNP15位点同时与纤维长度相关联,该模式与目前在林木关联研究中证明的木材品质由多个 SNP 位点协同调控的模式相一致(Beaulieu et al.,2011 ; Du et al.,201 a)。然而 SNP1位点和SNP15位点分别对纤维长度和微纤丝角的遗传贡献率(16.4 %和15.47 %)远远高于一些关联研究中获得的遗传贡献率(1.5 %~6.5 %)(Thumma et al.,2009 ; Dillon et al.,2010 ; 2012)。但是,在毛白杨 PtGA20 Ox 基因和UDP-葡萄糖醛酸脱羧酶基因与木材品质的关联研究中同样发现了较高的遗传贡献率(14.47 %和12.37 %),推测虽然林木性状是由微效多基因控制的,但其中有主效 SNP 位点,对表型性状的遗传贡献率较高(Tian et al.,2012 ; Du et al.,2013 a)。为了研究这3个 SNP 位点的基因型效应,将其与所对应的木材品质性状进行方差分析(表 3)。结果显示,在位于5 ' UTR 区域的 SNP1位点检测到3种基因型 CC,CT和TT,纤维长度平均值分别为1.166,1.170,1.276 mm,但在纤维长度上3种基因型的差异并不显著。而位于内含子区域的 SNP15位点同时与微纤丝角和纤维长度2个性状相关联,在该位点检测到3种基因型 AA,AT和TT,纤维长度平均值分别为0.884,1.170,1.218 mm ; 微纤丝角则分别为51.78 °,17.76 °,16.02 °。在纤维长度和微纤丝角上,该位点的3种基因型差异达到显著水平。 SNP32标记位点位于第2个外显子区域,其密码子上的第3个碱基发生改变,由 CCC 突变为CCG,属于同义突变。该位点检测到2种基因型为 CC和CG,未检测到 GG 基因型。 CC和CG 基因型的α-纤维素含量分别为41.22 %和39.74 %,CC 基因型的α-纤维素含量与 CG 基因型并无显著差异。在对拟南芥突变体的研究中发现SAHH 基因的一个突变导致了拟南芥生长缓慢且生殖力和发芽率都有所降低(Rocha et al.,2005)。从海岸松(Pinus pinaster)发现,参与合成 S-腺苷甲硫胺酸的基因在转录水平的上调会提高木质素的合成量(Villalobos et al.,2012)。以上研究结论进一步表明 PtSAHHA 基因可以通过影响甲基化水平进而影响毛白杨纤维素的形成。本研究在 PtSAHHA 基因中发现的3个与木材品质性状显著关联的SNP 位点,为基于分子标记的毛白杨优良木材品质性状定向选择育种奠定了重要的理论依据。

3 结论

本研究从毛白杨成熟木质部中分离出 S-腺苷高半胱氨酸水解酶基因 PtSAHHA 的 cDNA 克隆,其内部含有大小为1 458 bp 的完整开放阅读框架,可编码含有485个氨基酸残基的蛋白质。分析 PtSAHHA 蛋白的一级结构表明,PtSAHHA 的蛋白质十分保守,且具有跨膜结构及 S-腺苷-L-高半胱氨酸水解酶信号。组织特异性Realtime-PCR 检测显示,PtSAHHA 基因在杨树不同组织中均有表达,但在木质部中表达丰度最高,在形成层及老叶中有中等丰度表达,而在嫩叶中表达丰度最低。依据其表达模式初步推断 PtSAHHA 基因可能参与次生木质部细胞壁的加厚过程,并通过影响DNA 甲基化水平来调控木材纤维的形成。核苷酸多样性分析表明,PtSAHHA 基因内的不同区域都存在丰富的 SNP 变异位点,且基因内含子区域SNP 出现的频率最高,而在外显子及3 'UTR区域核苷酸的变异程度较低,表明在进化过程中,该基因的编码区存在较强的选择压力,其保守性有利于维持基因的蛋白质特性,进而保证个体的生存和种群的繁衍。基于 PtSAHHA 基因内的 SNPs 连锁不平衡分析推测,在基因内800 bp 左右SNPs 的连锁不平衡水平已衰退至不明显;LD 水平的迅速衰退为开展基于候选基因的关联作图提供了重要的理论依据。在由426株毛白杨基因型个体组成的关联作图群体内,对 SNPs 位点与木材品质性状进行关联分析,共检测到3个 SNPs 位点分别与3个木材性状显著连锁,分别位于 PtSAHHA 基因的5 'UTR、内含子及外显子区域,并与3个木材品质性状如纤维长、微纤丝角及α-纤维素含量显著连锁,每一标记位点可解释表型遗传变异的2.83 %~16.4 %,研究结果为基于分子标记的毛白杨优良木材品质性状定向选择育种提供了重要的理论依据。

参考文献(References)
[1] 金晓霞,秦智伟,周秀艳,等.2012.黄瓜S-腺苷-L高半胱氨酸水解酶全长cDNA的克隆及表达分析.中国农业科学,45(7): 1338-1346.(1)
[2] 潘炜,田佳星,杜庆章,等.2011.毛白杨蔗糖合酶基因PtSUS 1 的克隆、表达及单核苷酸多态性分析.林业科学,47(3): 52-58.(2)
[3] 佘义斌,朱一超,张天真,等.2008.棉花腺苷高半胱氨酸水解酶cDNA的克隆、表达及染色体定位.作物学报,34(6): 958-964.(3)
[4] 王金慧,丁燏,简纪常,等.2011.南极冰藻Chlamydomonas sp.ICE-L S-腺苷同型半胱氨酸水解酶基因的克隆及其生物信息学分析.中国水产科学, 18(6): 1234-1242.(1)
[5] 卫尊征,郭琦,李百炼,等.2009.小叶杨GA20氧化酶基因的克隆、表达及单核苷酸多态性分析.林业科学,45(4): 19-27.(1)
[6] 赵谨,杨克恭,张学.2005.一种新发现的基因表达调控机制—核糖开关.中国生物化学与分子生物学报, 21(2): 151-157.(2)
[7] Andersen J,Schrag T,Melchinger A,et al.2005.Validation of Dwarf 8 polymorphisms associated with flowering time in elite European inbred lines of maize (Zea mays L.).Theor Appl Genet, 111(2): 206-217.(1)
[8] Beaulieu J,Doerksen T,Boyle B,et al.2011.Association genetics of wood physical traits in the conifer white spruce and relationships with gene expression.Genetics, 188(1): 197-214.(1)
[9] Cantoni G,Scarano E.1954.The formation of S-adenosylhomocysteine in enzymeatic transmithylation reactions.Journal of Biological Chemistry,76(18): 4744.(1)
[10] Chalamcharla V,Curcio M J,Belfort M.2010.Nuclear expression of a group II intron is consistent with spliceosomal intron ancestry.Genes & Dev, 24: 827-836.(1)
[11] Chiang V,Puumala R,Takeuchi H,et al.1988.Comparison of softwood and hardwood kraft pulping.Tappi Journal,71: 173-176.(1)
[12] Chu Y,Su X,Huang Q,et al.2009.Patterns of DNA sequence variation at candidate gene loci in black poplar (Populus nigra L.) as revealed by single nucleotide polymorphisms.Genetica, 137(2): 141-150.(1)
[13] Clercq E.2002.Highlights in the development of new antiviral agents.Mini Rev Med Chem, 2(2): 163-175.(1)
[14] Cullen B.2000.Nuclear RNA export pathways.Molecular and Cellular Biology, 20(12): 4181-4187.(1)
[15] Déjardin A,Laurans F,Arnaud D,et al.2010.Wood formation in Angiosperms.Am Soc Plant Biol,333(4): 325-334.(1)
[16] Demirbas A.2005.Bioethanol from cellulosic materials: a renewable motor fuel from biomass.Energy Sources, 27(4): 327-337.(1)
[17] Dillon S,Brawner J,Meder R,et al.2012.Association genetics in Corymbia citriodora subsp. variegata identifies single nucleotide polymorphisms affecting wood growth and cellulosic pulp yield.New Phytol, 195(3): 596-608.(1)
[18] Dillon S,Nolan M,Li W,et al.2010.Allelic variation in cell wall candidate genes affecting solid wood properties in association populations and land races of Pinus radiata.Genetics, 185(4): 1477-1487.(1)
[19] Du Q,Pan W,Tian J,et al.2013a.The UDP-Glucuronate decarboxylase gene family in Populus: structure, expression, and association genetics.PLoS one,8(4):e60880.(2)
[20] Du Q,Pan W,Xu B,et al.2013b.Polymorphic simple sequence repeat (SSR) loci within cellulose synthase (PtoCesA) genes are associated with growth and wood properties in Populus tomentosa.New Phytol, 197(3): 763-776.(1)
[21] Du Q,Wang B,Wei Z,et al.2012.Genetic diversity and population structure of Populus tomentosa (Chinese white poplar) revealed by SSR markers.J Hered, 103(6): 853-862.(1)
[22] Fu Y,Li W.1993.Statistical tests of neutrality of mutatons.Genetics, 133(3): 693-709.(1)
[23] Gonzalez-Martinez S,Wheeler N,Ersoz E,et al.2007.Association genetics in Pinus taeda L. I. Wood property traits.Genetics, 175(1): 399-409.(1)
[24] Guerra F,Wegrzyn J,Sykes R,et al.2012.Association genetics of chemical wood properties in black poplar (Populus nigra).New Phytol, 197(1): 162-176.(1)
[25] Huang Z.1992.The study on the climatic regionalization of the distributional region of Populus tomentosa.Beijing For Univ, 14(3): 26-32.(1)
[26] Ingvarsson P.2005.Nucleotide polymorphism and linkage disequilibrium within and among natural populations of European aspen (Populus tremula L., Salicaceae).Genetics, 169(2): 945-953.(1)
[27] Ingvarsson P, Street N.2011.Association genetics of complex traits in plants.New Phytol, 189(4): 909-922.(1)
[28] Ji Y,Li Z T,Zhu Q,et al.2005.Current status in research of S-adenosylhomocysteine hydrolase and its inhibitors.Prog Pharmac Sci, 29(11): 481-486.(1)
[29] Kloor D,Osswald H.2004.S-Adenosylhomocysteine hydrolase as a target for intracellular adenosine action.Trends in Pharmacol Sci, 25(6): 294-297.(1)
[30] Koshkin A, Singh S, Nielsen P, et al. 1998. LNA (locked nucleic acids): synthesis of the adenine, cytosine, guanine, 5-methylcytosine, thymine and uracil bicyclonucleoside monomers, oligo merisation, and unprecendented nucleic acid recognition. Tetrahedron, 54: 3607-3630.(1)
[31] Li C,Yu T,Jiang S,et al.2008.Down-regulation of S-adenosyl-L-homocysteine hydrolase reveals a role of cytokinin in promoting transmethylation reactions.Planta, 228(1): 125-136.(1)
[32] Li L,Lu S, Chiang V.2006.A genomic and molecular view of wood formation.Crit Rev Plant Sci, 25: 213-233.(1)
[33] Lin Z,Li W.2012.Evolution of 5'untranslated region length and gene expression reprogramming in yeasts.Mol Biol Evol, 299(1): 81-89.(1)
[34] Lloyd H,Schrader J.1993.Adenosine metabolism in the guinea pig heart: the role of cytosolic S-adenosyl-L-homocysteine hydrolase,5'-nucleotidase and adenosine kinase.European Heart Journal, 14(Suppl Ⅰ): 27-33.(1)
[35] Miyamoto Y,Mabuchi A,Shi D,et al.2007.A functional polymorphism in the 5'UTR of GDF5 is associated with susceptibility to osteoarthritis.Nat Genet,39: 529-533.(1)
[36] Moor C,Meijer H,Lissendenet S.2005.Mechanisms of translational control by the 3'UTR in development and differentiation.Seminars in Cell & Developmental Biology, 16(1): 49-58.(1)
[37] Nordborg M,Borevitz J,Bergelson J,et al.2002.The extent of linkage disequilibrium in Arabidopsis thaliana.Nat Genet,30: 190-193.(1)
[38] Parker N,Yang X,Hanke J,et al.2003.Trypanosoma cruzi: molecular cloning and characterization of the S-adenosylhomocysteine hydrolase.Exp Parasitol, 105(2): 149-158.(1)
[39] Remington D,Thomsberry J,Matsuoka Y,et al.2001.Structure of linkage disequilibrium and phenotypic associations in the maize genome.Proc Natl Acad Sci USA,98(20): 11479-11484.(1)
[40] Ritland K.1996. Estimators for pairwise relatedness and individual inbreeding coefcients.Genet Res,67(2): 175-185.(1)
[41] Rocha P,Sheikh M,Melchiorre R,et al.2005.The Arabidopsis HOMOLOGY-DEPENDENT GENE SILENCING1 gene codes for an S-adenosyl-L-homocysteine hydrolase required for DNA methylation-dependent gene silencing.The Plant Cell, 17(2): 404-417.(3)
[42] Sassner P,Galbe M,Zacchi G.2005.Steam pretreatment of Salix with and without SO2 impregnation for production of bioethanol.Applied Biochem Biotech, 121/124: 1101-1118.(1)
[43] Slavov G,DiFazio S,Martin J,et al.2012.Genome resequencing reveals multiscale geographic structure and extensive linkage disequilibrium in the forest tree Populus trichocarpa.New Phytol, 196(3): 713-725.(1)
[44] Sontheimer E,Gordon P,Piccirilli J.1999.Metal ion catalysis during group II intron self-splicing: parallels with the spliceosome.Gene & Development, 13: 1729-1741.(1)
[45] Stich B,Melchinger A.2009.Comparison of mixed-model approaches for association mapping in rapeseed, potato, sugar beet, maize, and Arabidopsis.BMC Genomics, 10: 94.(1)
[46] Storey J,Tibshirani R.2003.Statistical signicance for genomewide studies.Proc Natl Acad Sci USA, 100(16): 9440-9445.(1)
[47] Suh Y,Vijg J.2005.SNP discovery in associating genetic variation with man disease phenotypes.Mutation Research,573(1/2): 41-53.(1)
[48] Tajima F.1989.Statistical method for testing the neutral mutation hypothesis by DNA polymorphism.Genetics, 123(3): 585-595.(1)
[49] Tehlivets O,Hasslacher M,Kohlwein S.2004.S-adenosyl-L-homocysteine hydrolase in yeast: key enzyme of methylation metabolism and coordinated regulation with phospholipid synthesis.FEBS Lett,577(3): 501-506.(1)
[50] Thumma B,Matheson B,Zhang D,et al.2009.Identification of a Cis-acting regulatory polymorphism in a eucalypt COBRA-like gene affecting cellulose content. Genetics, 183(3): 1153-1164.(1)
[51] Tian J,Du Q,Chang M,et al.2012.Allelic variation in PtGA 20 Ox associates with growth and wood properties in Populus spp.PLoS one,7(12): e53116.(2)
[52] Turner M,Yang X,Yin D,et al.2000.Structure and function of S-adenosylhomocysteine hydrolase.Cell Biochem Biophys,33(2): 101-125.(1)
[53] Villalobos D,Díaz-Moreno S,Said E,et al.2012.Reprogramming of gene expression during compression wood formation in pine: Coordinated modulation of S-adenosylmethionine, lignin and lignan related genes.BMC Plant Biology, 12: 100.(1)
[54] Watterson G.1975.On the number of segregating sites in genetical models without recombination.Theor Popul Biol, 7(2): 256-276.(1)
[55] Yu J,Pressoir G,Briggs W,et al.2006.A unified mixed-model method for association mapping that accounts for multiple levels of relatedness.Nature Genetics,38: 203-208.(1)
[56] Zhang D,Zhang Z.2005.Single nucleotide polymorphisms discovery and linkage disequilibrium.Forestry Studies in China,7(3): 1-14.(1)