药学学报  2016, Vol. 51 Issue (7): 1165-1174   PDF    
不同物候期栽培远志的数字基因表达谱分析
许晓双1,2, 薛英1,2, 张福生1, 秦雪梅1, 彭冰3 , 田洪岭4, 曾祖平3    
1. 山西大学 中医药现代研究中心, 山西 太原 030006;
2. 山西大学 化学化工学院, 山西 太原 030006;
3. 北京市中医研究所, 首都医科大学附属北京中医医院, 北京 100010;
4. 山西省农业科学院经济作物研究所, 山西 汾阳 032200
摘要: 不同物候期栽培远志中化学成分的含量变化是影响远志生产实践中最佳采收期确定的主要因素。本文采用数字基因表达谱(DGE)技术对不同物候期(花果期、枯萎期、休眠期)的栽培远志进行分析,从中找到被注释到与远志中化学成分生物合成相关的差异表达基因,并利用RT-qPCR(荧光定量PCR)技术对代表性差异表达基因进行验证,之后采用基因表达相关分析预测参与远志皂苷生物合成下游途径的关键酶(CYP450s与UGTs)。结果表明: ①在花果期→枯萎期→休眠期的发育过程中,远志中共同表达下调的基因数量要高于上调的数量;②与三萜皂苷生物合成相关的基因有6条(HMGS、PMK、FPPS、SQS、SE和β-AS),而与苯丙素类(黄酮类、木质素类)生物合成相关的基因有5条(PAL、C4H、4CL、CAD和peroxidase);③与枯萎期、休眠期相比,花果期远志中的皂苷类、口山酮类和木质素类成分的生物合成量最多;④ UGT83A1和CYP716B1、CYP98A3、CYP86B1、CYP94A1可能是参与远志皂苷生物合成下游途径的部分关键酶。本研究从转录水平上佐证了栽培远志传统采收期的正确性,并为今后远志皂苷生物合成关键酶(CYP450s与UGTs)的基因克隆及功能验证奠定了科学基础。
关键词: 远志     物候期     数字基因表达谱     皂苷     生物合成    
Analysis of digital gene expression profiles of the cultivated Polygala tenuifolia in different phenological phases
XU Xiao-shuang1,2, XUE Ying1,2, ZHANG Fu-sheng1, QIN Xue-mei1, PENG Bing3, TIAN Hong-ling4, ZENG Zu-ping3    
1. Modern Research Center for Traditional Chinese Medicine, Shanxi University, Taiyuan 030006, China;
2. College of Chemistry and Chemical Engineering, Shanxi University, Taiyuan 030006, China;
3. Beijing Institute of Traditional Chinese Medicine, Beijing Hospital of Traditional Chinese Medicine Affiliated to Capital Medical University, Beijing 100010;
4. Institute of Industrial Crop, Shanxi Academy of Agricultural Sciences, Fenyang 032200, China
Abstract: The content changes of chemical components in different phenological phase of the cultivated Polygala tenuifolia is one of the important factors for determination of the best harvest time in the production practice. In this study, the digital gene expression (DGE) profiles of the cultivated P. tenuifolia were analyzed in different phenological phase (flowering fruit bearing stage, wilting stage, dormancy stage). The differentially expressed genes were found in the biosynthesis of chemical composition in P. tenuifolia, and the representational ones were validated by RT-qPCR. Then, the key enzymes (CYP450s and UGTs) involved in the downstream of the triterpenoid saponins biosynthesis pathway in P. tenuifolia were predicted through the correlation analysis of gene expression. The number of down-regulated genes was more than that of up-regulated in P. tenuifolia from flowering fruit bearing stage to dormancy stage. Six differentially expressed genes (HMGS, PMK, FPPS, SQS, SE, β-AS) and five (PAL, C4H, 4CL, CAD, peroxidase) were annotated to the triterpenoid saponins and phenylpropanoid biosynthesis pathway in P. tenuifolia, respectively. Compared to wilting and dormancy stages, the saponins, xanthones, and lignins were largely synthesized at the flowering fruit bearing stage of P. tenuifolia. Furthermore, UGT83A1, CYP716B1, CYP98A3, CYP86B1, and CYP94A1 may be the part of key enzymes in the downstream of the triterpenoid saponins biosynthesis pathway in P. tenuifolia. This study provides evidence to support the correctness of traditional harvest time of P. tenuifolia at the level of transcription, and lays the scientific foundation for gene cloning and functional verification of CYP450s and UGTs in the downstream of the triterpenoid saponins biosynthesis pathway in P. tenuifolia in the future.
Key words: Polygala tenuifolia     phenological phase     digital gene expression     saponin     biosynthesis    

远志,是我国重要的大宗药材之一,为远志科植物远志 (Polygala tenuifolia Willd.) 或卵叶远志 (P. sibirica L.) 的干燥根,具有安神益智、交通心肾、祛痰、消肿等功效[1]。远志所含化学成分主要包括皂苷类、口山酮类、寡糖酯类及生物碱类等物质[2]。远志原多为野生,由于用量的逐年增加,导致其野生资源逐渐枯竭且再生能力下降,故从上世纪80年代起,开始了野生远志的人工驯化及规模化种植[3]。目前,由于栽培卵叶远志的产量较低,因此现有商品远志的品种主要为远志[4]

由于药材质量的优劣与药材中所含主要化学成分含量的高低紧密相关,而化学成分的积累又与药材自身的生长时期密切相关,因此有必要对不同物候期栽培远志中化学成分的积累规律进行研究,进而指导栽培远志的采收,保证药材质量。北方栽培远志的生长发育特性为: 3月底开始返青,4月中下旬展叶,5月初现蕾,5月中旬开花,花期较长,至8月中旬仍有开花,但后期的花的果实不能成熟,6月 (花果期) 中旬主枝上的果实成熟开裂,9月底地上部分停止生长,进入地上部分枯萎期,随后11月后进入休眠期[5]。滕红梅等[6]采用HPLC对不同生长时期 (于播种后的第2年第4、6、8、10月) 的远志 (山西栽培) 进行了远志皂苷元的含量检测,发现其含量在4~6月含量逐渐升高,随后随着月龄的增加而逐渐降低。赵云生等[7]对不同生长时期 (于播种后第2年的第2、5、6、7、8月) 的远志 (山西栽培) 进行了HPLC指纹图谱研究,发现不同发育时期远志的相似度较高,故认为生长时间对远志中有效化学成分的种类影响不大。由上可见,既有研究成果均属在化学水平上对不同物候期的远志中化学成分 (皂苷类为主) 进行研究,至今尚未发现在转录水平上对不同物候期远志进行研究。此外,不同物候期栽培远志中除皂苷类成分外的其余化学成分 (如口山酮类、寡糖酯类、生物碱类等) 的积累及变化规律也仍未得到阐明。

基于新一代高通量测序的数字基因表达谱 (DGE) 技术能够经济、全面、快速地检测某一组织在一定状态下的基因表达情况,从而进一步推断差异表达基因的功能,最终揭示某些特定基因的调控作用机制。目前该技术已成功运用于经济作物 (如芝麻、花生、棉花等[8, 9, 10]) 与中药材 (如人参、杜仲、丹参等[11, 12, 13]) 的相关研究中。因此,采用DGE技术研究不同物候期远志中化学成分 (如皂苷类、口山酮类等) 的基因调控规律,可揭示不同物候期远志体内化学成分、种类变化的内在分子机制,并从差异表达的基因中寻找与上述化学成分生物合成密切相关的酶基因,为后续的人工合成奠定理论基础。此外,还能从转录水平上佐证栽培远志传统采收期的正确性,即于播种后第3年的11月休眠期 (生长年限约为2年半) 之前或于第4年的3~4月返青前 (生长年限约为3年) 采收。

本文采用DGE技术对不同物候期 (花果期、枯萎期、休眠期) 的栽培远志进行分析,从中找到被注释到与远志中化学成分生物合成相关的差异表达基因,并利用RT-qPCR (荧光定量PCR) 技术对代表 性差异基因进行了验证,之后采用基因表达相关分析预测了参与远志皂苷生物合成下游途径中的关键酶—细胞色素P450单加氧酶 (CYP450s) 及糖基转移酶 (UGTs),以期从转录水平上阐释不同物候期栽培远志中有效成分的积累规律,并试图探究远志皂苷生物合成下游途径,这不仅为指导远志生产实 践 (明确采收期) 提供理论依据,而且为今后CYP450s与UGTs的基因克隆及功能验证奠定科学基础。

材料与方法 仪器与材料

稳压稳流电泳仪 (北京市六一公司,DYY-6B型),ZF-258全自动凝胶成像分析系统 (上海嘉鹏),ABI Stepone Plus实时荧光定量PCR仪、TC-XP-D基因扩增仪 (杭州博日),NanoDrop2000超微量分光光度计 (Thermo Fisher Scientific)。RNAiso Plus、Taq DNA聚合酶、dNTPs、Mg2+、DNA Marker (DL 2000)、PrimeScrip RT Master Mix、SYBR Premix Ex TaqTM II、PrimeScriptTM II 1st Strand cDNA Synthesis Kit均为TaKaRa公司,MOPS (BIO BASIC INC),琼脂糖 (BIOWEST),DEPC (Solabi o),硼酸、NaOH (北京化工厂),2×Easy Taq PCR SuperMix (TransGen)。

远志样品均采自山西省汾阳市农科院经济作物研究所,分别于2014年6月21日 (花果期,于播种后的第11月,简称11M),2014年9月21日 (枯萎期,于播种后的第14月,简称14M),2014年11月21日 (休眠期,于播种后的第16月,简称16M) 采集单株远志的新鲜根组织,以铝箔纸包裹,液氮速冻后于-80 ℃保存。临用时,随机选取5株样品混合,经液氮研磨用于后续RNA的提取。所采集样本经山西大学中医药现代研究中心的秦雪梅教授鉴定为远志 (Polygala tenuifolia),凭证标本保存于山西大学中医药现代研究中心。

cDNA文库构建及DNA测序

远志根组织 (11M、14M、16M) 总RNA的提取采用TruSeq RNA Sample Prep Kit (Illumina,美国),从40 µg总RNA中通过oligo-dT偶联珠将mRNA分离后用随机引物和Superscript Ⅱ反转录酶合成cDNA。将cDNA随机打断并加上3'-dA以后,连入Illumina paired-end接头,通过6% TBE聚丙烯酰胺凝胶纯化选择126~150 bp的片段。使用Illumina HiSeq2500 2×126 bp与NextSeq500 2×150 bp (Illumina,美国) 测序平台进行测序。

转录组数据组装和差异表达分析

测序原始数据序列经过质量分析去除低质量序列和接头序列后,使用Trinity对reads进行转录本从头拼接 (de novo assembly),得到的每一条transcript通过Blast参考蛋白质库 (Nr库),按照Blastx的命中tophit结果聚类得到unigene。然后经过KO (Kyoto Encyclopedia of Genes and Genomes Orthology)、GO (Gene Ontology)、eggNOG (evolutionary genealogy of genes: Non- supervised Orthologous Groups)、Swissprot、Nt对unigenes进行注释。通过统计比对到unigene上的数值,通过DESeq分析14M与11M(14M/11M)、16M与14M(16M/14M)、16M与11M(16M/11M) 各组表达差异unigene,通过2个样品的RPKM值标准化 后的数值比较,最后按照表达量倍数差异 (> 2倍) 和表达差异显著性 (P < 0.05),而筛选出显著差异unigenes。

荧光定量分析

远志根组织总RNA的提取采用Trizol法,cDNA合成按照反转录试剂盒说明书进行操作。利用Primer Premier 5.0软件设计差异基因的引物序列。以GAPDH为内参基因,使用ABI Stepone Plus实时荧光定量PCR仪进行SYBR实时荧光定量PCR,2-ΔΔCT法分析数据[14]

结果 1 DGE数据分析 1.1 差异表达的unigenes分析

将栽培远志的不 同物候期14M/11M、16M/14M、16M/11M 3组得到的DGE原始数据进行过滤、拼接后共得到Contig 316 703条、Transcript 141535 320条、unigene 54 594 810条。结果表明: ① 14M/11M: 共有1 140条显著差异基因,其中上调的有581条,下调的基因有559条。② 16M/14M: 共有517条显著差异基因,其中上调的有231条,下调的基因有286条。③ 16M/11M: 共有1 642条显著差异基因,其中上调的有625条,下调的基因有1 017条。

将上述每组的上调与下调差异表达的基因全部进行分类,Venny图 (图 1A、B) 显示: 3组中共同表达上调的基因4条,其中1条注释为苯醚类还原酶,其余3条未得到注释; 共同表达下调的基因有29条,其中4个β-葡萄糖苷酶、4个果胶酯酶/裂解酶、4条有机物代谢相关的蛋白、2条过氧化物酶、1条糖基转移酶 (UGT3),其余14条未知。以上结果说明,① 14M/11M组中差异表达基因的数目及种类均大于16M/14M组,提示: 从花果期→枯萎期,远志中化学成分含量的变化大于枯萎期→休眠期; ② 14M/11M、16M/1 4M、16M/11M 3组中共同表达下调的基因数量要大于上调的数量,提示: 从花果期→枯萎期→休眠期,远志中化学成分的积累量逐渐减少。

Figure 1 The Venny Plot (A: Up-regulation; B: Down-regulation) and Hotmap and Dendrogram Plot (C) of unigenes differentially expressed in 14M/11M,16M/14M and 16M/11M of P. tenuifolia; The expression degrees are shown using a color scale from the significantly low expressed (dark green) to the significantly high expressed (dark red)

将14M/11M、16M/14M、16M/11M的全部差异表达基因通过Cluster 3.0进行基因间和样品间的聚类分析 (图 1C),以期能从整体上了解差异表达基因在不同物候期远志中的表达情况。由图 1C可知,① 在11M、14M、16M远志样品中的高表达 (红色) 与低表达 (绿色) 基因基本可以分为两类,说明从花果期到休眠期,远志中的差异表达基因有明显的波动 (上调或下调); ② 11M与其他两个物候期 (14M与16M)的远志样品能够明显分为两类,且16M/14M差异表达基因数仅有520条,进一步验证了从花果期→枯萎期远志中化学成分含量的变化大于枯萎期→休眠期的结论。

1.2 差异表达unigenes的功能分类

将14M/11M、16M/14M、16M/11M的远志找到的差异表达基因通过KEGG Orthlolgy (http://www.genome.jp/kegg/tool/map_pathway2.html) 进行主要的代谢通路注释 (图 2)。KEGG分类主要分为新陈代谢、遗传信息及环境信息处理、细胞过程、有机体系统、人类疾病5个大类。图 2表明,新陈代谢主要包括植物体的正常发育代谢所涉及到的初级及次级代谢过程,如碳水化合物代谢 (6.66%)、脂质代谢 (3.25%)、氨基酸代谢 (4.26%)、聚酮类化合物与萜类化合物的生物合成 (1.20%) 等; 遗传及环境信息处理主要是植物体的遗传信息及小分子处理过程,如翻译 (6.10%)、信号转导 (7.80%) 等; 细胞过程主要集中在细胞生长与死亡 (4.08%)、运输与分解代谢 (2.96%) 等。由于远志是多年生草本植物,所以对有机体系统和人类疾病的过程暂不分析,而远志中主要活性成分为次级代谢产物,因此,本文主要关注新陈代谢类别下的“聚酮类化合物与萜类化合物的生物合成” (1.20%) 与“其他次级代谢产物的生物合成 (如苯丙素类、黄酮类、生物碱等化合物)” (1.43%)。

Figure 2 The plot of KEGG pathways of the unigenes differentially expressed in 14M/11M,16M/14M,and 16M/11M of P. tenuifolia

经过对比发现,14M/11M、16M/14M、16M/11M的显著差异表达基因主要集中注释在萜类生物合成途径以及苯丙素类生物合成途径 (图 3)。① 三萜皂苷的生物合成途径主要包括上游中间体: 3-异戊烯基焦磷酸酯 (IPP) 和γ,γ-二甲基烯丙基焦磷酸酯 (DMAPP) 的 合成、中游碳环骨架的合成和下游复杂官能化反应过程[15]图 3A结果表明,三萜皂苷的生物合成途径中,得到注释的基因为上游的甲羟戊酸 (MVA) 途径中的羟甲基戊二酰辅酶A合酶(HMGS) 与磷酸甲羟戊酸激酶 (PMK),中游的角鲨烯合酶 (SS)、鲨烯环氧酶 (SE) 以及下游的β-香树酯合酶 (β-AS),以上基因均是远志皂苷生物合成途径中的关键酶,而且与本课题组前期研究[14]结论相一致。② 苯丙素类生物合成途径从苯丙氨酸 (phenylalanine) 开始到香豆醛辅酶A (p-coumaroyl CoA) 为上游途径,然后从香豆醛辅酶A分为两个分支: 黄酮类 (flavonol) 与木质素类 (lignin) 化合物的生物合成。图 3B表明,上游途径中的关键酶苯丙氨酸氨基裂解酶 (PAL)、肉桂酸-4-羟基化 (C4H)、4-香豆酸辅酶A连接酶 (4CL) 均得到注释,黄酮类分支上暂未注释到其他基因,木质素类分支中肉桂醇脱氢酶 (CAD) 与过氧化物酶 (peroxidase) 被注释。

Figure 3 Classifications of unigenes involved in the the biosynthesis pathways of terpenoids (A) and phenylpropanoid (B) in 14M/11M,16M/14M,and 16M/11M of P. tenuifolia (Red solid line: The differentially expressed unigenes; AACT: Acetyl CoA C-acetyltransferase or acetoacetyl-CoA thiolase; HMGS: 3-Hydroxy-3-methylglutaryl CoA synthase; HMGR: 3-Hydroxy-3-methylglutaryl CoA reductase; MVK: Mevalonate kinase; PMK: Phosphomevalonate kinase; PMD: Mevalonate pyrophosphate decarboxylase; DXS: 1-Deoxy-d-xylu­lose-5-phosphateh synthase; DXR: 1-Deoxy-d-xylulose-5-phosphate reductoisomerase; MCT: 4-Diphosphoeytidyl-2-methyl-d-erytbritol synthase; CMK: 4-Diphosphoeytidyl-2-methyl-d-erythritol kinase; MDS: 2-Methyl-d-erythritol-2,4-eyelodiphosphate synthase; HDS: 1-Hydroxy-2-methyl-butenyl-4-diphosphate synthase; HDR: Isopentenyl pyrophosphate (IPP)/3,3-dimethylallyl pyrophosphate (DMAPP) synthase; IPPI: Isopentenyl pyrophosphate isomerase; GPPS: Geranyl diphosphate synthase; FPPS: Farnesyl diphosphate synthase; SQS: Squalene synthase; SE: Squalene epoxidase; CAS: Cycloartenol synthase; β-AS: β-Amyrin synthase; DS: Dammarenediol synthase; PAL: Phenylalanine ammonia lyase; C4H: Cinnamate 4-hydroxylase; 4CL: 4-Coumarate CoA ligase; CHS: Chalcone synthase; CHI: C halcone isomerase; F3'5'H: Flavonoid 3',5'-hydroxylase; F3H: Flavanone 3-hydroxylase; FLS: Flavonol synthase; HCT: Hydroxycinnamoyl- transferase; C3'H: p-Coumaryl shikimate 3' hydroxylase; CCoAoMT: Caffeoyl CoA 3-O-methyltransferse; CCR: Cinnanoyl-CoA reduce­tase; CAD: Cinnamyl alcohol dehydrogenase; CYPs: Cytochrome P450s; UGTs: Glycosyltransferases)

为了进一步了解上述在三萜皂苷与苯丙素生物合成途径中已得到注释的差异表达基因在不同物候期的具体表达情况,因此将其在11M、14M、16M的表达变化倍数进行柱状图分析 (图 4)。由于苯丙素生物合成途径中5个酶的变化倍数差距较大,因此将其分成两个图表示 (图 4B,C)。图 4纵坐标是指14M/11M、16M/14M、16M/11M 3组各自对比过程中差异表达基因变化的比值 (比值 < 1说明后者比前者表达量降低,> 1则说明后者比前者表达量升高),而且该比值与1的差值越大,说明表达差异性越大。图 4结果表明: ① 在远志皂苷生物合成途径中,PMK、FPPS、SQS、SE、β-AS的差异表达倍数比值在11M、14M、16M均< 1,说明以上5个基因在远志从花果期 → 枯萎期 → 休眠期中均表现为下调; HMGS在休眠期表现为短暂上调,但从花果期→ 休眠期整体仍表现为下调; 上述5个基因在16M/14M组的差异表达倍数比值最接近1,说明上述基因从枯萎期 → 休眠期的表达量要低于花果期 → 枯萎期,这与图 1的结论是一致的。② 在苯丙素类生物合成途径中,C4H在枯萎期短暂下调,花 果期 → 休眠期整体表现为上调; CAD在休眠期短暂上调,花果期 → 休眠期整体表现为下调; PAL、4CL、peroxidase从花果期 → 枯萎期 → 休眠期均表现为下调。以上结果表明,在远志皂苷与苯丙素生物合成途径中,除C4H在远志花果期 → 休眠期表现为上调外,其他酶均表现为下调。由此推测,与枯萎期、休眠期相比,花果期远志中的皂苷类、口山酮类、木质素类成分的生物合成量最多; 而从花果期 → 枯萎期 → 休眠期,其生物合成量逐渐减少,且从枯萎期 → 休眠期,其生物合成量最少。

Figure 4 The fold changes of differentially expressed unigenes involved in the biosynthesis pathways of terpenoids (A) and phenylpro­panoid (B,C) in 14M/11M,16M/14M,and 16M/11M of P. tenuifolia
2 DGE数据的RT-qPCR验证

既有研究[11]表明,远志皂苷生物合成上游及中游途径已经被阐明,但下游途径中因CYP450与UGT均为家族酶而尚未明确。因此,本文根据不同物候期远志的DGE数据与前期转录组数据[16]的比对,共发现134条差异表达明显的CYP450s与UGTs酶基因,其中包括92条CYP450s以及42条UGTs。在此基础上,本文筛选出随着物候期的变化而差异表达的17条CYP450s及4条UGTs酶基因 (表 1),并通过RT-qPCR进行验证 (图 5)。

Table 1 The screening results of CYP450s and UGTs in the downstream of triterpenoid saponins biosynthesis pathways in 14M/11M,16M/14M,and 16M/11M of P. tenuifolia

Figure 5 The expression level of CYP450s and UGTs (A-B) in the downstream of triterpenoid saponins biosynthesis pathways in 11M,14M and 16M of P. tenuifolia

图 5结果表明,① UGT85A2、UGT74E2和UGT83A1在远志中的表达量均是从花果期 → 枯萎期 → 休眠期而逐渐降低,UGT85A3则在枯萎期含量最高,在休眠期最低; ② CYP71A1、CYP710A1、CYP84A1、CYP86B1、CYP97C1、CYP90A1和CYP38在远志中的表达量是从花果期 → 枯萎期 → 休眠期而逐渐降低,而CYP716B1与CYP724B1则反之,表现为逐渐升高; ③ CYP89A2、CYP51G1、CYP94A1、CYP97B2、CYP704C1和CYP37在枯萎期表达量最高,而CYP98A3和CYP78A3在枯萎期表达量最低。上述21个被测基因在远志不同物候期表达量的变化趋势与DGE (图略) 数据检测的差异表达倍数变化基本一致,从而验证了DGE数据的准确性。

3 基于基因表达相关分析预测远志皂苷生物合成下游途径中的部分关键酶

本课题组前期研究结果表明[14],SQE、β-AS基因与远志的三萜皂苷生物合成相关性最大。在三萜皂苷的生物合成下游途径中,CYP450主要催化三萜骨架惰性甲基和亚甲基的氧化,而UGT主要负责三萜皂苷元的糖基化,所以CYP450s与UGTs在远志皂苷的生物合成下游途径中发挥关键作用。为了预测远志皂苷生物合成下游途径中关键的CYP450s与UGTs,故将SQE和β-AS分别与上述17个CYP450s、4个UGTs进行相关聚类分析 (图 6)。图 6A表明,UGT83A1与SQE、β-AS均呈正相关,且聚为一类。图 6B表明,CYP716B1、CYP98A3、CYP86B1和CYP94A1分别与SQE、β-AS呈明显正相关,且聚为一大类,故推测UGT83A1与CYP716B1、CYP98A3、CYP86B1和CYP94A1酶与远志皂苷的生物合成密切相关,该结果提示: UGT83A1与CYP716B1、CYP98A3、CYP86B1、CYP94A1可能是远志皂苷生物合成下游途径的部分关键酶。

Figure 6 The correlation clustering plot of SQE,β-AS,UGTs (A) and CYP450s (B). The correlation degrees are shown using a color scale from significantly negative correlation (dark blue) to significantly positive correlation (dark red)
讨论

本文通过DGE技术,研究了不同物候期 (花果期、枯萎期、休眠期) 远志中有效成分的积累规律,并采用RT-qPCR技术验证了DGE数据的准确性,而且通过基因表达相关性分析,对远志皂苷生物合成下游途径中的部分关键酶基因CYP450s、UGTs进行了预测,发现: ① 在花果期→枯萎期→休眠期的发育过程中,远 志中共同表达下调的基因数量要高于上调的数量; ② 与三萜皂苷生物合成相关的基因有6条(HMGS、PMK、FPPS、SQS、SE、β-AS),而与苯丙素类 (黄酮类、木质素类) 生物合成相关的基因有5条 (PAL、C4H、4CL、CAD、peroxidase); ③ 与枯萎期、休眠期相比,花果期远志中的皂苷类、口山酮类、木质素类成分的生物合成量最多; ④ UGT83A1和CYP716B1、CYP98A3、CYP86B1、CYP94A1,可能是远志皂苷生物合成下游途径中的部分关键酶。

关于远志中主要化学成分积累规律机制的探讨: ① 寡糖脂类作为远志科植物中独特的化学成分[17],在本文DGE数据的KEGG代谢分类中却无明显的 差异基因注释。该现象出现的原因,可能是由于糖酯类成分在化学结构上主要以蔗糖为共同母核,再以多种形式的糖苷键连接葡萄糖或鼠李糖成为寡糖,之后又与有机酸类成分形成酯类[2],所以远志中寡糖酯类成分的生物合成会涉及到多糖、脂质等初级、次级代谢产物生物合成的相互作用。② 苯丙素生物合成上游途径被注释到相关基因,但下游黄酮类分支并未注释到相关基因,而木质素的分支中则注释到相关基因。推测其原因,是由于口山酮类成分与黄酮类成分均具有相同的母核[4],因而在苯丙素的生物合成上游途径中被注释出相关基因,但口山酮与黄酮化学结构上并不是完全相同,仍存在一定的差异,故推测口山酮类化合物的生物合成途径可能在香豆醛辅酶A开始表现为与黄酮类化合物合成所不同的另外分支。③ 木质素分支被注释相应的差异表达基因,主要是因为远志的主要药用部位是远志根 (包括筒和木心),其发育的生物过程中都会涉及到细胞壁的合成。而 木质素是植物细胞壁的主要成分,填充于纤维素构架中,赋予了细胞壁坚硬的结构特征,且其疏水性使植物细胞壁具有不透水性,保证了远志在不同物候期的生长中根内长距离的水分运输[18]。④ 远志中其他化学成分也有部分基因被注释,如托品酮还原酶被注释到莨菪烷型生物碱的生物合成中,故推测远志中所含部分生物碱类成分的化学结构可能为莨菪烷型。

明确不同物候期远志中有效化学成分的积累规律,对于指导栽培远志的生产实践 (如采收时间等) 有着重要意义。由于远志根的重量会随着生长年限的增加而提高,且在春季返青时,远志中皂苷类等化学物质也会有一定的积累[6],因此,传统商品远志药材的生长周期为: 第1年的雨季 (6~8月的雨水充足,出苗率高) 播种,第3年的11月休眠期 (生长年限约为2年半) 之前或于第4年的3~4月返青前 (生长年限约为3年) 采收,随后进行土壤翻新,整地施肥准备下一轮播种。本文发现远志中的皂苷类、口山酮类和木质素类成分随着从花果期→枯萎期→休眠期,其生物合成量逐渐减少,且枯萎期到休眠期的生物合成量最少; 该结果从转录水平上佐证了远志传统采收期的正确性,也与滕红梅等[5]通过HPLC法测 定不同发育时期远志中远志皂苷元的含量变化结果保持一致。此外,本文研究结果进一步提示,可利用DGE技术发现远志中部分次生代谢物生物合成的关键酶,进而采用基因调控 (如调控HMGS、PMK、FPPS、SQS、SE、β-AS基因,使其过表达) 等方法来提高枯萎期或休眠期栽培远志中远志皂苷的生物合成量。

植物CYP450s是植物中较大的酶蛋白家族,是一类具有多种催化功能、以铁卟啉为辅基的膜结合蛋白,具有广泛的催化活性,参与萜类、苯丙素类、生菁糖苷类、生物碱和植物激素等的生物合成。UGTs也作为较大的酶蛋白家族,将催化单糖糖苷键与三萜皂苷元相连,其糖基化作用不仅可以增加水溶性和稳定性,并且参与次生代谢产物在植物中的储存、运输和生物活性[14]。目前只有少数几种植物,如: 蒺藜苜蓿 (Medicago truncatula)、王不留行 (Saponaria vaccaria) 和大豆 (Glycine max) 等[19, 20, 21]基于EST筛选 (诱导表达调节及与β-AS共表达情况分析)、SSR标记的图位克隆、简并PCR和RACE-PCR、酵母表达文库筛选等方法证实了10个UGTs参与了皂苷的生物合成[14]。因此,对于植物中庞大的CYP450s、UGTs家族酶而言,本文所预测出的5个酶基因 (UGT83A1、CYP716B1、CYP98A3、CYP86B1、CYP94A1),对于阐明远志皂苷生物合成的下游途径有着非常重要的意义。此外,由于上述5个酶基因具有相同或相似的变化趋势,故每个酶基因的具体功能仍需进行具体的功能验证,以便于进一步分析其作用规律。因此,本课题组后续将继续针对栽培远志的根与叶 (因为皂苷在远志根中的积累,要远高于其在叶中的积累[14]) 进行DGE分析,进一步扩大CYP450s与UGTs的筛选范围,并对上述5个酶基因做进一步验证,以期最终阐明远志皂苷生物合成的下游途径,为远志皂苷生物合成下游途径中的关键酶 (CYP450s、UGTs) 基因克隆、功能验证和后期利用代谢工程的方法生物合成远志皂苷奠定科学基础。

参考文献
[1] Chinese Pharmacopoeia Commission. Pharmacopoeia of the People's Republic of China (中华人民共和国药典)[S]. 2015ed. Part I. Beijing:China Medical Science Press, 2015:156.
[2] Liu DW, Kang LP, Ma BP. Chemical constituents and pharmacological activities of Polygala tenuifolia Willd.:research advances[J]. J Int Pharm Res (国际药学研究杂志), 2012, 39:32-36.
[3] Liu HZ, Zhang SJ. Studies on Polygala tenuifolia's domestication and cultivation technology[J]. Chin Wild Plant Resour (中国野生植物资源), 2003, 22:55-57.
[4] Han LL, Li Z, Guan RW, et al. Progress in studies on medicinal crop of Polygala[J]. Chin Wild Plant Resour (中国野生植物资源), 2010, 29:1-4.
[5] Teng HM, Hu HZ. Progress on biological and chemical constituents of Polygala tenuifolia[J]. Chin Tradit Herb Drugs (中草药), 2007, 38:1276.
[6] Teng HM, Fang MF, Hu HZ. Comparison of structure and senegenin content of roots in Polygala tenuifolia Willd and P. sibirica L.[J]. Acta Bot Boreal-Occid Sin (西北植物学报), 2008, 28:2359-2367.
[7] Zhao YS, Wan DG, Pei J, et al. Study on some influence factors of polygalacic acid content in Polygala tenuifolia Willd and P. sibirica L.[J]. Nat Prod Res Dev (天然产物研究与开发), 2010, 22:634-638.
[8] Wei LB, Miao HM, Zhang HY. Transcriptomic analysis of sesame development[J]. Sci Agric Sin (中国农业科学), 2012, 45:1246-1256.
[9] Sun AQ, Zhang JD, Wan SY, et al. In silico expression profile of genes in response to drought in peanut[J]. Acta Agron Sin (作物学报), 2013, 39:1045-1053.
[10] Li YL, Yu JW, Zhai HH, et al. Comparative analysis of cotton fiber development related gene expression profiling[J]. Mol Plant Breeding (分子植物育种), 2010, 8:488-496.
[11] Li JP, He X, Jiang R, et al. Effect of ginseng polysaccharide on gene expression profile of K562 cells[J]. Chin Tradit Herb Drugs (中草药), 2011, 42:940-943.
[12] Li TZ, Du HY, Liu HM, et al. Transcriptome data assembly and gene function annotation of Eucommia mature fruits and young fruits[J]. J Cent South Univ Forest Technol (中南林业科技大学学报), 2012, 32:9-16.
[13] Zhou W, Song XG, Chen C. Study on action mechanism and material base of compound Danshen dripping pills in treatment of carotid atherosclerosis based on techniques of gene expression profile and molecular fingerprint[J]. China J Chin Mater Med (中国中药杂志), 2015, 40:3308-3313.
[14] Zhang FS, Li XW, Li ZY, et al. UPLC/Q-TOF MS-based metabolomics and qRT-PCR in enzyme gene screening with key role in triterpenoid saponin biosynthesis of Polygala tenuifolia[J]. PLoS One, 2014, 9:e105765.
[15] Xu XS, Zhang FS, Qin XM. Research advances on triterpenoid saponins biosynthesis and its key enzymes[J]. World Sci Technol Mod Tradit Chin Med (世界科学技术-中医药现代化), 2014, 16:2440-2448.
[16] Tian HL, Xu XS, Zhang FS, et al. Analysis of Polygala tenuifolia transcriptome and description of secondary metabolite biosynthetic pathways by illumina sequencing[J]. Int J Genomics, 2015, 2015:782635.
[17] Liu C, Ma HY. Overview in studies on traditional chinese medicine Polygala[J]. J Hebei Agric Sci (河北农业科学), 2014, 18:75-81.
[18] Zhan XY, Guo AP, He LK, et al. Advances in study of lignin biosynthesis and its genetic manipulation[J]. Mol Plant Breeding (分子植物育种), 2006, 4:431-437.
[19] Achnine L, Huhman DV, Farag MA, et al. Genomics-based selection and functional characterization of triterpene glycosyltransferases from the model legume Medicago truncatula[J]. Plant J, 2005, 41:875.
[20] Meesapyodsuk D, Balsevich J, Reed DW, et al. Saponin biosynthesis in Saponaria vaccaria cDNA sencoding β-amyrin synthase and a triterpene carboxylic acid glucosyltransferase[J]. Plant Physiol, 2007, 143:959-969.
[21] Shibuya M, Nishimura K, Yasuyama N, et al. Identification and characterization of glycosyltransferases involved in the biosynthesis of soyasaponin I in Glycinemax[J]. FEBS Lett, 2010, 584:2258-2264.