中国生物工程杂志  2016, Vol. 36 Issue (1): 38-46

文章信息

周茜, 赵惠新, 李萍萍, 曾卫军, 李艳红, 葛风伟, 赵君洁, 赵和平
ZHOU Qian, ZHAO Hui-xin, LI Ping-ping, ZENG Wei-jun, LI Yan-hong, GE Feng-wei, ZHAO Jun-jie, ZHAO He-ping
独行菜种子转录组的高通量测序及分析
De novo Characterization of the Seed Transcriptome of Lepidium apetalum Willd
中国生物工程杂志, 2016, 36(1): 38-46
China Biotechnology, 2016, 36(1): 38-46
http://dx.doi.org/10.13523/j.cb.20160106

文章历史

收稿日期: 2015-09-08
修回日期: 2015-11-15
独行菜种子转录组的高通量测序及分析
周茜1, 赵惠新1 , 李萍萍1, 曾卫军1, 李艳红1, 葛风伟1, 赵君洁1, 赵和平2     
1. 新疆特殊环境物种多样性应用与调控重点实验室 新疆师范大学生命科学学院 乌鲁木齐 830054;
2. 北京师范大学生命科学学院 抗性基因资源与分子发育北京市重点实验室 北京 100875
摘要: 独行菜种子为我国传统常用中药,从中已提取出多种药用活性成分,但目前尚不清楚其次级代谢过程中这些活性物质合成的遗传基础。采用Illumina HiseqTM 2000高通量测序平台对独行菜种子转录组进行测序,经de novo组装后获得40 303条unigene。进一步利用六大公共数据库进行同源比对,注释了27 935条unigene。研究发现,534个基因参与了独行菜次生物质的合成和代谢,其中在芥子苷、黄酮类和芪类化合物生物合成途径中的unigene分别有4个、19个和69个,在苯丙氨酸代谢途径中的unigene有92个。这些基因可能参与独行菜种子药性活性物质的生物合成,并分析获得了参与上述合成代谢途径的13个关键基因的同源序列。另外,从转录组序列中搜索到6 304个SSR位点,分布于5 306条unigene中,出现频率为15.64%。研究结果不仅为挖掘独行菜种子药用次生代谢物生物合成关键基因提供了基础数据信息,而且为独行菜遗传多样性研究和分子标记开发奠定了分子基础。
关键词: 独行菜     转录组     次生代谢     SSR    
De novo Characterization of the Seed Transcriptome of Lepidium apetalum Willd
ZHOU Qian1, ZHAO Hui-xin1 , LI Ping-ping1, ZENG Wei-jun1, LI Yan-hong1, GE Feng-wei1, ZHAO Jun-jie1, ZHAO He-ping2     
1. Xinjiang Key Laboratory of Special Species Diversity Application and Regulatory, College of Life Science, Xinjiang Normal University, Urumqi 830054, China;
2. Beijing Key Laboratory of Gene Resource and Molecular Development, College of Life Science, Beijing Normal University, Beijing 100875, China
Abstract: Lepidium apetalum Willd is an important traditional Chinese medicine. Various active components have been extracted from the Lepidium apetalum. However, the genetic basis for their activity is virtually unknown. The transcriptome of Lepidium apetalum was sequenced using the Illumina HiSeqTM 2000 sequencing platform. The clean reads were then de novo assembled into 40 303 unigenes. 27 935 unigene were annotated by a similarity search against SiX public databases. The results showed that 534 genes were assigned to second metabolic pathway. Among them, 4 unigenes were mapped to the glucosinolate, 19 to flavonoids, stilbenoid, diarylheptanoid, 69 to gingerol shikimate biosynthesis pathways, and 92 unigenes were respectively mapped to the phenylalanine metabolism pathways, suggesting that they are involved in these pathways of pharmaceutically important. Thirteen homologous fragments of key genes identified were referred to these pathways. In addition, a total of 6 304 SSRs were identified from the sequence of transcription, distributed in 5 306 unigenes(15.64%). This work not only provides many valuable basal data for gene cloning and molecular biology research, but also lays the foundation for genetic diversity analysis and development of molecular marker in Lepidium apetalum.
Key words: Lepidium apetalum Willd     Transcriptome     Second metabolism     Simple sequence repeat    

独行菜(Lepidium apetalum Willd)为十字花科独行菜属植物,分布非常广泛,具有药用和食用等价值[1]。独行菜干燥成熟的种子被称为北葶苈子,始载于《神农本草经》,是中医临床上常用的泻肺平喘、利水消肿药[2]。目前,还发现独行菜种子在调血脂、抗癌、抗菌、强心等方面具有显著的药理活性[3]。通过研究其药效物质基础及作用机制,现已从独行菜种子中分离出芥子苷、强心苷类、生物碱类、黄酮类、类萜类等多种成分[4]。对其转录组的研究,可能发现一些与其药效活性成分生物合成相关的候选基因,为独行菜药效资源的充分利用奠定基础。

简单重复序列(simple sequence repeat,SSR)又称为微卫星(microsatellite),是由少数几个核苷酸组成的串联重复序列,广泛分布于各类真核生物、原核生物以及病毒基因组中[5]。SSR标记因其多态性高、重复性高、覆盖面广等优点,广泛运用于遗传图谱绘制、遗传多样性分析和分子标记辅助育种等方面[6, 7]。目前药用植物中已有人参[8]、连翘[9]和黄芩[10]等借助现有测序数据开发了SSR标记。研究主要集中于遗传多样性评价、种质鉴定、标记通用性等方面。因而对独行菜转录组中的SSR位点进行分析,可为独行菜遗传多样性研究和分子标记开发提供参考和借鉴。

目前,独行菜虽然具有重要的药用价值和经济价值,但有关研究多集中在有效成分提取、鉴定及药理学方面,对其分子遗传和转录组的研究仍十分缺乏。近年来转录组高通量测序技术的快速发展极大地促进了植物基因表达研究[11, 12, 13]。利用与研究独行菜的药用价值,迫切需要它的遗传信息。前期研究中,我们发现低温层积后的独行菜种子,经高温处理后,萌发势和萌发率均显著提高[14]。由于种子萌发过程与其成熟过程有很大的相似[15, 16, 17],因此以上述处理前后的独行菜种子为研究对象,进行转录组的测序,以期分析独行菜种子转录组的特性及SSR位点分布特征。这将为发掘和鉴定独行菜种子次级代谢物生物合成相关基因和开发SSR分子标记提供研究基础。

1 材料与方法 1.1 材 料

供试材料独行菜种子采集于新疆乌鲁木齐鲤鱼山。挑选出饱满的独行菜种子,用98%浓硫酸处理45s后,用滤纸先将浓硫酸吸净干燥独行菜种子,再放入蒸馏水中清洗2次或3次。

1.2 方 法 1.2.1 种子总RNA的提取和检测

将4℃条件下层积9天的种子作为萌发初期Ⅰ,将4℃条件下层积9天后又在25℃黑暗萌发55min的种子作为萌发初期Ⅱ,每组实验重复两次。采用Trizol Reagent方法分别提取以上样品的总RNA,并用DNaseⅠ进行DNA消化处理,随后检测总RNA完整性和质量(1.2%琼脂糖凝胶电泳)、RNA的纯度(OD260/280比值),最后用Agilent 2100精确检测RNA的完整性。

1.2.2 独行菜种子转录组测序

样品检测合格后,为了减少实验操作误差使样品更具代表性,将各个样品的总RNA进行等量混合后,用带有Oligo(dT)的磁珠富集mRNA,随后将mRNA打断成短片段,以mRNA为模板,进行测序文库的构建和Illumina HiSeqTM 2000的测序。

1.2.3 数据的拼接和组装

测序得到的原始reads,去除带接头的reads、N(N表示无法确定碱基信息)的比例大于10%的reads和低质量reads后,得到clean reads。采用Trinity[18]对clean reads进行拼接。过滤和组装以后得到高质量的unigene,对这些从头组装的unigene进行后续的分析。用NCBI蛋白质数据库(NCBI non-redundant protein sequences,Nr)、非冗余核苷酸数据库(NCBI nucleotide sequences,Nt)、Swiss-Prot(a manually annotated and reviewed protein sequence database,Swiss-Prot)基因本体论(gene ontology,GO)、直系同源基因簇(eukaryotic ortholog groups,KOG)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)数据库做参考,得到unigene的功能注释信息。根据Nr注释的信息,使用Blast2GO[19]和WEGO[20]进行注释和功能分类。用ESTScan软件预测无法注释到蛋白质库的unigene编码区。

1.2.4 转录组SSR位点的分析

利用MISA软件对独行菜转录组中的unigene进行SSR位点搜索,搜索参数设置为单碱基、二碱基、三碱基、四碱基、五碱基和六碱基的最短重复分别为10、6、4、3、3、2。复合SSR序列两个位点最大间隔碱基数位:100。 SSR位点出现的频率fc=c/n×100%,c表示搜索到的SSR 数量,n表示总搜索unigene数量。

2 结果与分析 2.1 独行菜种子转录组的测序和组装

独行菜转录种子组测序总产出35 735 388条reads,去除低质量的和含有接头的reads以后,得到35 177 252条clean reads,共计4.4G个核苷酸(nucleotide,nt)。G+C含量为43.6%,Q30(测序错误率≤0.1%)为93.70%(表 1)。说明测序结果较好。

表 1 Illumina HiSeqTM 2000测序产出质量统计 Table 1 Illumina HiSeqTM 2000 sequencing data quality
Raw readsClean reads Clean basesQ20(%)Q30(%)GC(%)
35 735 38835 177 2524.4 G96.9593.7043.6

利用Trinity软件对这些reads进行组装,得到平均长度为1 262nt(N50=2 053nt)的拼接转录本序列67 045条。取每条基因中最长的转录本作为unigene,平均长度为955nt,N50为1 729nt。Unigene的长度分布显示(表 2),长度大于1 000nt的unigene有12 962条,占全部unigene的32.16%。说明本研究中转录组文库的测序和组装结果都较好,能够进行后续生物信息学分析。

表 2 独行菜种子转录组组装质量统计 Table 2 Assembly quality of Lepidium apetalum Willd seed
Sequence length(bp)TranscriptsUnigene
NumberPercentage(%)NumberPercentage(%)
<30113 53420.1912 13530.11
301~50010 38915.508 11820.14
501~1 00012 32518.407 08717.58
1 001~2 00016 90925.227 73319.19
>2 00013 88820.715 22912.97
2.2 Unigene的功能注释

通过blastx将unigene序列比对到NCBI上的蛋白质数据库Nr、Nt、Swiss-Prot、KEGG及COG和GO(E<1×10-5),得到与给定unigene具有最高序列相似性的蛋白质,从而得到该unigene的蛋白质功能注释信息。其中匹配到Nr数据库中的有25 212条,占全部unigene的62.55%。注释结果显示共有27 925(69.28%)的unigene是有注释的(表 3)。

表 3 Blast比对公共数据库结果 Table 3 Blast analysis results against five public databases
DatabaseAnnotatedPercentage(%)
All unigene40 303100
All annotated unigene27 93569.28
Nr25 21262.55
Nt 22 57456.00
Swiss-Prot18 50245.90
KEGG7 84419.46
KOG9 07122.50
GO18 35445.54

Unigene注释到Nr数据库中的E值分布图显示,比对到的物种序列值均小于1×10-5;其中E值小于1×10-100的有49.0%[图 1(a)],说明对比结果的可信度较高。相似度(similarity)分布图显示,序列比对相似度为40%~100%,其中大部分序列相似度为80%~95%;序列相似度大于80%的为77.8%[图 1(b)],说明独行菜转录组的功能注释结果较好。

注释基因同源序列的物种(species)分布情况见图 1(c),注释到拟南芥(Arabidopsis thaliala)的序列有25.0%;其次是琴叶拟南芥(Arabidopsis lyrata),有23.9%。这是因为拟南芥、琴叶拟南芥和独行菜都同属十字花科植物,且具有丰富的基因组信息,为本研究中转录组的注释提供了参考序列。

图 1 Unigene在Nr库中的E值分布(a)、相似性分布(b)及物种分布(c) Fig. 1 E-value distribution (a),similarity distribution(b)and species classification(c)for unigene
2.3 Unigene的功能分类

GO是一套国际标准化的基因功能描述的分类系统,提供一套动态更新的标准词汇表来全面描述生物体中基因和基因产物的属性。根据Nr注释信息,使用软件Blast2GO得到unigene的GO注释信息,然后用软件WEGO对所有unigene做GO功能分类统计,从宏观上认识独行菜的基因功能分布特征。对独行菜转录组unigene进行GO分析发现,有18 354条unigene注释到GO数据库,注释比例为45.54%。注释到分子功能的基因数目最多,为15 753个,其次是生物学过程14 307个,细胞组成的最少,只有11 056个。GO分析的这3个ontology又分为51个亚类。例如,在生物过程中,细胞过程和代谢过程所占比例较高,细胞和细胞器部分在细胞组成所占比例较高,连接和催化活性在分子功能中占有较高比例(图 2)。

图 2 Unigene的GO分类结果 Fig. 2 GO classification for Lepidium apetalum Willd

将独行菜转录组所得的unigene与KOG数据库进行比对,对其做了功能分类和统计,得到注释到KOG中的9 071条unigene分布于26个基因家族(图 3),如RNA加工与修饰、染色体结构和动力学、能量产生与运输、细胞周期控制、细胞分裂及染色体分裂等。在26类基因家族中,注释最多的是一般功能预测(R),其次是翻译后修饰、周转、分子伴侣(O)。分析发现,有374条unigene注释到次生代谢物的合成、运输及代谢,为后续研究独行菜种子中药用化学成分相关的基因奠定了良好基础。

图 3 Unigenes的KOG分类 Fig. 3 Classification of KOG for unigene A:RNA processing and modification; B:Chromatin structure and dynamics; C:Energy production and conversion; D:Cell cycle control,cell division,chromosome partitioning; E:Amino acid transport and metabolism; F:Nucleotide transport and metabolism; G:Carbohydrate transport and metabolism; H:Coenzyme transport and metabolism; I:Lipid transport and metabolism; J:Translation,ribosomal structure and biogcncsis; K:Transcription; L:Replication,recombination and repair; M:Cell wall/membrane/envelope biogencsis; N:Cell motility; O:Postranslational modification protein tumover,chaperones; P:Inorganic ion transport and metabolism; Q:Secondary metabolites biosynthesis,transport and catabolism; R:General function prediction only; S:Function unknown; T:Signal transduction mechanisms; U:Intracellular trafficking,secretion,and vesicular transport; V:Defense mechanisms; W:Extracellular structures; Y:Nuclear structure; Z:Cytoskeleton
2.4 Unigene的代谢通路分析

KEGG是分析基因产物在细胞中的代谢途径及这些基因产物的功能的数据库,利用它可以进一步研究基因在生物学上的复杂行为。对独行菜的转录组进行KEGG注释发现,在其种子萌发初期有7 844条编码基因参与了263条已知的通路。根据KEGG的注释信息能进一步得到unigene的pathway注释。

根据KEGG注释结果,发现与次生代谢相关的unigene共534条,可将次生代谢合成途径按代谢物分为20类。这20类次生代谢物包括油菜素内酯(brassinosteroid),咖啡因(caffeine metabolism),类胡萝卜素(carotenoid)、二萜(diterpenoid),黄酮和黄酮醇(flavone and flavonol),类黄酮(flavonoid),芥子苷(glucosinolate),吲哚生物碱(indole alkaloid),异喹啉生物碱(isoquinoline alkaloid),柠檬烯和松萜(limonene and pinene degradation),类单萜(monoterpenoid),苯丙素(phenylpropanoid),芪类化合物、二芳基庚烷和姜醇(stilbenoid,diarylheptanoid and gingerol),类萜骨架(terpenoid backbone),萜类生物碱、哌啶生物碱和嘧啶生物碱(tropane,piperidine and pyridine alkaloid),玉米素(zeatin),二萜(diterpenoid)、类萜骨架(terpenoid backbone),花青素(anthocyanin),甜菜红碱(betalain)。然而,注释到芥子苷,黄酮类,芪类化合物、二芳基庚烷和姜醇生物合成途径中的unigene分别有4个、19个、69个;注释到苯丙氨酸(phenylalanine)代谢途径中的unigene有92个。

进一步对上述代谢途径中的基因序列进行同源基因的比对分析后,获得了1条与拟南芥CYP83B1(cytochrome P450,family 83,subfamily B,polypeptide 1)基因高度同源的unigene。Yatusevich等[21]在拟南芥中发现了CYP83B1基因,是芥子苷合成中的重要结构基因。而芥子苷在独行菜种子中是主要的有效止咳成分。该基因在芥子苷合成过程中主要负责催化色氨酸、苯丙氨酸和酪氨酸的吲哚族及芳香族醛肟,对芥子苷的生物合成有重要的作用。

黄酮类化合物是重要的次生代谢产物,是很多植物的重要药用成分。查耳酮合成酶基因(chalcone synthase,CHS)、黄烷酮3-羟化酶基因(flavanone 3-hydroxylase,F3H)、黄酮合成酶基因(flavone synthase,FS)和花色素还原酶基因(anthocyanidin reductase,ANR)为黄酮类化合物生物合成途径中重要酶基因,它们在黄酮类化合物的生成过程中起着关键的催化作用[22]。分析发现,独行菜种子转录组中均有1条编码的同源基因。

苯丙氨酸代谢途径是植物的重要次生代谢途径之一,独行菜种子中的活性物质芪类和黄酮类可能来自该途径。苯丙氨酸脱氨酶(phenylalanine ammonia-lyase,PAL)、肉桂酸4-羟化酶(cinnamate 4-hydroxylase,C4H)和4-香豆酰:辅酶A连接酶(4-coumarate:CoA ligase,4CL)是该途径关键的3个酶。它们作用的产物反式香豆酸-CoA和两个丙二酰-CoA可在芪合酶催化作用下合成芪类次生代谢物;反式香豆素-CoA等也可在查耳酮合成酶的催化作用下进入黄酮类和异黄酮类合成支路,在芪类化合物和黄酮类的合成中具有关键作用[23]。在独行菜种子中,分别由4个基因编码PAL、3个基因编码4CL和1个基因编码C4H。

研究还获得了103个编码细胞色素P450(cytochrome P450,CYP450)的unigene。植物细胞色素P450在苯丙素类、生物碱、萜类、黄酮、类黄酮、植物激素、芥子苷等的合成中起着重要作用[24, 25, 26],参与大多数次生代谢物的氧化过程[27]。这些注释和分析提供了有价值的资源,有助于研究特定过程、功能和路径,也有助于识别次级代谢物合成相关的新基因。

2.5 独行菜种子转录组SSR位点分析

利用MISA软件对独行菜种子的转录组进行SSR位点多态性分析,搜索了40 304个unigene,总长度为38 487 759 bp,共检测到6 304个SSR位点,出现频率为15.64%,平均跨度为6 105bp。这些SSR位点分布在5 306个unigene中,其中834个unigene含有1个以上的SSR位点。在所有碱基重复类型中,单碱基重复单元的SSR含量最多,约占总数的48.84%。在发现的329种重复基元(motif)中,A/T、AG/CT、AAG/CTT、AAAG/CTTT、AAAAG/CTTTT和AAACAC/GTGTTT分别在单、二、三、四、五和六碱基中出现频率最多,它们在各自重复基元类型中的比例分别为99.20%、64.80%、45.40%、28.00%、40.00%和33.33%(表 4)。

表 4 独行菜转录中不同SSR重复基元出现的频率 Table 4 Occurrence frequency of different microsatellites motifs of Lepidium apetalum Willd transcriptome
Rrepeat typeNumberFrequency(%)Maximum repest motif (number and percentage )
Nucleotide3 14248.84A/T(3 177,99.20%)
Binucleotide repeat144322.89AG/CT(935,64.80%)
Trinucleotide repeat1 68326.70AAG/CTT(764,45.40%)
Tetranucleotide repeat250.40AAAG/CTTT(7,28.00%)
Pentanucleotide repeat50.08AAAAG/CTTTT(2,40.00%)
Hexnucleotide repeat60.10AAACAC/GTGTTT(2,33.33%)

独行菜转录组中所发现的6 304个SSR长度存在极显著变异,10~126个碱基,平均长度为13.57个碱基。如图 4所示,独行菜转录组SSR重复序列长度位于10~15bp的短重复序列最多,占SSR总数的78.83%。进一步利用SPSS软件Person分布进行相关性分析,结果显示SSR位点出现的频率和其长度呈显著负相关(P<0.05),相关系数为-0.378。

图 4 独行菜转录中SSR序列的长度分布 Fig. 4 Length distribution of microsatellites in Lepidium apetalum Willd transcriptome

独行菜转录组中SSR的重复次数与其数量的关系见图 5。可以看出,随着重复次数的增加,SSR数量呈明显下降趋势。其中,10次核苷酸重复的最多,为1 757个,占SSR总位点的27.87%。当单碱基的重复次数为16次,二碱基和其他碱基重复次数为12次时,SSR的下降速率降低,最终进入平台期。

图 5 独行菜转录组中SSR数量随重复次数的变化 Fig. 5 Changes with the number of Lepidium apetalum Willd transcriptome of SSR with repeat Others denote the total number of Tri-,Tetra-,Penta-,and Hex-nucleotides repeats
3 讨 论

新一代高通量测序技术的广泛应用,为非模式生物基因信息发掘提供了前所未有的机遇,已经用于中草药植物虎杖[28]、西洋参[29]和连翘等转录组的研究。该类研究有助于开发天然药物,选育具优良农艺性状的品种。为了加快药用植物独行菜分子生物学研究,促进独行菜主要天然药物成分的开发和利用,本研究利用RNA-Seq技术分析了独行菜的转录组,探讨了中药植物独行菜种子的功能基因组,基于短读序和组装的unigene进行数据挖掘,共获得40 303条质量较高的基因序列,对有效成分合成的相关基因进行了深度挖掘,并分析得到了6 304个SSR分子标记。

通过代谢通路分析显示,有534条unigenes与次生代谢物生物合成有关,它们编码的次生代谢产物包括:具有抗氧化、清除自由基、抗肿瘤等广泛的药理活性的黄酮[30, 31];具有抗病、抗氧化、抗肿瘤、抗炎症等多种生物活性的芪类次生代谢物[32];具有抗肿瘤、抗HIV、抗氧化、抗炎、抗微生物、抗凝血、抗疲劳等多种生物活性的苯丙素[33, 34];在独行菜中作为有效止咳成分的芥子苷;许多中草药和药用植物有效成分的多类植物生物碱[35]。这些次生代谢产物在独行菜种子都得到了分离,且与其药理活性相一致。分析发现独行菜中一些基因还参与咖啡因、异喹啉生物碱、花青素、甜菜红碱等药用有效成分的合成和代谢。这些基因可以作为独行菜次生代谢基因工程的靶标基因,为独行菜种子药用成分的开发和应用领域的拓展奠定了基础。

药用植物主要有效成分是次生代谢产物,然而次生物质代谢途径极其复杂,受到众多基因的调控。目前,药用植物次生代谢工程面临的最大困难是缺乏对次生代谢调控网络的了解,克隆的基因较少,而基因功能清楚的更少。本研究通过生物信息学的方法,对独行菜种子中参与重要次生代谢途径的关键基因进行了挖掘。获得了芥子油苷的结构基因CYP83B1;黄酮类生物合成途径中重要酶的编码基因CHS、F3H、FSANR,苯丙氨酸途径中关键酶的编码基因PAL、C4H和4CL。上述基因中,4个基因编码PAL、3个基因编码4CL,其余均只有1个编码基因。这些基因的注释,为今后相关功能基因的克隆和研究提供了依据。

SSR标记按来源,分为基因组SSR(genomic SSR,gSSR)和转录组来源的SSR(expressed SSR,EST-SSR)两种[36]。真核生物基因组中,转录组中SSR发生频率比基因组中SSR低。相比基因组SSR,转录组SSR多态性可能与基因功能直接相关,具有更高的通用性,能够为功能基因组学研究的应用提供重要价值[7]。本研究在独行菜转录组中共搜索到6 304个SSR序列,出现频率为15.64%,平均每6.11kb出现一个SSR序列,分布在5 306个unigene中,其中834个unigene含有1个以上的SSR位点。与其他药用植物比较,独行菜转录组中SSR序列出现的频率低于半夏[36](16.24%),高于党参[37](12.22%)和西洋参[38](7%),这表明独行菜转录组中SSR数量也很丰富。并且发现独行菜转录组中SSR序列以单碱基重复为主,这与连翘转录组中SSR序列中的优势重复类型是一致的。本研究明确了独行菜转录组中SSR序列的基本特征,为进一步开发新的独行菜功能基因SSR标记奠定了基础。同时对独行菜功能基因资源的开发利用、遗传资源评价、丰富其分子标记和比较基因组学研究都具有重要的价值。

致谢 感谢“新疆师范大学研究生创新科技基金(XSY201502010)为本研究提供的基金资助

参考文献
[1] 吴征镒. 中国植物志. 北京:科学出版社,1987:33,57. Wu Z Y. Flora of China. Beijing:Science Press, 1987:33,57.
[2] 冯志毅,王小兰,郑晓珂. 葶苈子的本草考证.世界科学技术中医药现代化,2014, 16(9): 1938-1941. Feng Z Y, Wang X L, Zheng X K, Herbal textual research on semen Lepidii seu Descurainiae. Modernization of Traditional Chinese Medicine and Materia Medica-World Science and Technology,2014, 16(9): 1938-1941.
[3] 周喜丹,唐力英,周国洪,等. 南北葶苈子的最新研究进展. 中国中药杂志,2014, 39(24): 4699-4708. Zhou X D, Tang L Y, Zhou G H, et al. Advances on Lepidii Semen and Descurainiae Semen. Chinese Journal of Chinese Materia Medica, 2014, 39(24): 4699-4708.
[4] 李红伟,郑晓珂,弓建红,等. 独行菜和播娘蒿化学成分及药理作用研究进展. 药物评价研究,2013, 36(3): 235-240. Li H W, Zheng X K, Gong J H, et al. Research progress in chemical constituents of Lepidium apetalum and Descurainia sophia and their pharmacological activities. Drug Evaluation Research, 2013, 36(3): 235-240.
[5] Kalia R K, Rai M K, Kalia S, et al. Microsatellite mark-ers:an overview of the recent progress in plants. Eu-phytica, 2011, 177(3): 309-334.
[6] Milee A, Neeta S, Harish P. Advances in molecular marker techniques and their applications in plant sciences. Plant Cell Rep, 2008, 27(4): 617-631.
[7] 李小白,向林,罗洁,等. 转录组测序(RNA-seq)策略及其数据在分子标记开发上的应用. 中国细胞生物学报,2013, 35(5): 1-8. Li X B, Xiang L, Luo J, et al. The strategy of RNA-seq, application and development of molecular marker derived form RNA-seq . Chinese Journal of Cell Biology, 2013, 35(5): 1-8.
[8] Li C, Zhu Y, Guo X, et al. Transcriptome analysis reveals ginsenosides biosynthetic genes, microRNAs and simple sequence repeats in Panax ginseng C A Meyer . BMC Genomics, 2013, 14(1): 245.
[9] 王兴春,谭河林,陈钊,等. 基于RNA-Seq技术的连翘转录组组装与分析及SSR分子标记的开发. 中国科学:生命科学,2015, 45(3): 301-310. Wang X C, Tan H L, Chen Z, et al. Assembly and characterization of the transcriptome and development of SSR markers in Forsythia suspensa based on RNA-Seq technology. Science China(Life Sciences), 2015, 45(3): 301-310.
[10] 齐琳洁,龙平,蒋超,等. 黄芩基因组SSR分子标记的开发及遗传多样性分析. 药学学报, 2015, 50(4): 500-505. Qi L J, Long P, Jiang C, et al. Development of microsatellites and genetic diversity analysis of Scutellaria baicalensis Georgi using genomic-SSR markers.Acta Pharmaceutica Sinica, 2015, 50(4): 500-505.
[11] Chen J, Hou K, Qin P, et al. RNA-Seq for gene identification and transcript profiling of three Stevia rebadiana genotypes. BMC Genomics, 2014, 15(1): 571-582.
[12] Zhang N, Zhang H J, Zhao B, et al. The RNA-seq approach to discriminate gene expression profiles in response to melatonin on cucumber lateral root formation. Journal of Pineal Research, 2014, 56(1): 39-50.
[13] Lv J, Liu P, Gao B, et al. Transcriptome analysis of the Potunus trituberculatus: de novo assembly, growth-related gene identification and marker discovery. PLoS ONE, 2014, 9(4): e94055.
[14] 赵惠新,李群,周晶,等. 短命植物独行菜种子萌发过程对低温的耐受特性. 云南植物研究,2010, 32(5): 448-454. Zhao H X, Li Q, Zhou J, et al. The characteristics of low temperature tolerance during seed germination of the ephemeral plant Lepidium apetalum (Cruciferae). Acta Botanica Yunnanica, 2010, 32(5): 448-454.
[15] Lopez-Molina L, Mongrand S, McLachlin D T, et al. ABI5 acts downstream of ABI3 to execute an ABA- dependent growth arrest during germination. Plant J, 2002, 32(3): 317-328.
[16] Rajjou L, Gallardo K, Debeaujon I, et al. The effect of α-amanitin on the Arabidopsis seed proteome highlights the distinct roles of stored and neosynthesized mRNAs during germination. Plant Physiol, 2004, 134(4): 1598-1613.
[17] Rajjou L, Belghazi M, Huguet R, et al. Proteomic investigation of the effect of salicylic acid on Arabidopsis seed germination and establishment of early defense mechanisms . Plant Physiol. 2006, 141(3): 910-923.
[18] Grabherr M G, Haas B J, Yassour M, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nature Biotechnology, 2011, 29(7): 644-652.
[19] Conesa A, Götz S, García-Gómez J M, et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics, 2005, 21(18): 3674-3676.
[20] Ye J, Fang L, Zheng H, et al. WEGO: a web tool for plotting GO annotations. Nucleic Acids Research, 2006, 34(suppl. 2): W293-W297.
[21] Yatusevich R, Mugford S G, Matthewman C, et al. Genes of primary sulfate assimilation are part of the glucosinolate biosynthetic network in Arabidopsis thaliana. Plant Journal, 2010, 62(1): 1-11.
[22] 邢文,金晓玲. 调控植物类黄酮生物合成的MYB转录因子研究进展. 分子植物育种,2015, 13(3): 689-696. Xing W, Jin X L. Recent advances of MYB transcription factors involved in the regulation of flavonoid biosynthesis. Molecular Plant Breeding, 2015, 13(3): 689-696.
[23] Hanhineva K, Kokko H, Siljanen H, et al. Stilbene synthase gene transfer caused alterations in the phenylpropanoid metabolism of transgenic strawberry (Fragaria×ananassa). Journal of Experimental Botany, 2009, 60(7): 2093-2106.
[24] Ehlting J, Hamberger B, Million-Rousseau R, et al. Cytochromes P450 in phenolic metabolism. Phytochem Rev, 2006, 5(2): 239-270.
[25] Ralston L, Yu O. Metabolons in volving plant cytochrome P450s. Phytochem Rev, 2006, 5(2): 459-472.
[26] Bourgaud F, Hehn A, Larbat R, et al. Biosynthesis of coumarins in plants: a major pathway still to be unravelled for cytochrome P450 enzymes. Phytochem Rev, 2006, 5(2): 293-308.
[27] Coon M J. Cytochrome P450: nature's most versatile biological catalyst. Annual Review of Pharmacology and Toxicology, 2005, 45(1): 1-25.
[28] Hao D C, Ma P, Mu J, et al.De novo characterization of the root transcriptome of a traditional Chinese medicinal plant Polygonum cuspidatum. Science China(Life Sciences), 2012, 55(5): 452-466.
[29] Sun C, Li Y, Wu Q, et al. De novo sequencing and analysis of the American ginseng root transcriptome using a GS FLX Titanium platform to discover putative genes involved in ginsenoside biosynthesis. BMC Genomics, 2010, 11: 262.
[30] 曹纬国,刘志勤,邵云,等. 黄酮类化合物药理作用的研究进展. 西北植物学报,2003, 23(12): 2241-2247. Cao W G, Liu Z Q, Shao Y, et al. A progress in pharmacological research of flavonoids. Acta Botanica Boreali-Occidentalia Sinica, 2003, 23(12): 2241-2247.
[31] 康亚兰,裴瑾,蔡文龙,等. 药用植物黄酮类化合物代谢合成途径及相关功能基因的研究进展. 中草药,2014, 45(9): 1336-1341. Kang Y L, Pei J, Cai W L, et al. Research progress on flavonoid metabolic synthesis pathway and related function genes in medicinal plants. Chinese Traditional and Herbal Drugs, 2014, 24(9): 1336-1341.
[32] 何水林,郑金贵,林明,等. 植物芪类次生代谢物的功能、合成调控及基因工程研究进展. 农业生物技术学报,2004, 12(1): 102-108. He S L, Zheng J G, Lin M, et al. Advances of biological function, regulatory mechanism of biosynthesia and genetic engineering of stillbenes in plants. Journal of Agricultural Biotechnology, 2004, 12(1): 102-108.
[33] 褚洪标,曾红,梁生林,等. 二岐马先蒿苯丙素类活性成分研究. 中草药, 2014, 45(9): 1223-1227. Chu H B, Zeng H, Liang S L, et al. Phenylpropanoids constituents of Pedicularis dichotoma. Chinese Traditional and Herbal Drugs, 2014, 45(9): 1223-1227.
[34] 王毓杰,谭荣,周礼仕,等. 长毛风毛菊中苯丙素类化学成分研究. 中药材, 2015, 38(1): 101-103. Wang Y J, Tan R, Zhou L S, et al. Phenylpropanoids from Saussureae hieracioides. Journal of Chinese Medicinal Material, 2015, 38(1): 101-103.
[35] Kuete V. Health Effects of Alkaloids from African Medicinal Plants. America:Toxicological Survey of African Medicinal Plants. 2014: 611-633.
[36] 张利达,唐克轩. 植物EST-SSR标记开发及其应用. 基因组学与应用生物学, 2010, 29(3): 534-541. Zhang L D, Tang K X. Development of plant EST-SSR markers and its application. Genomics and Applied Biology, 2010, 29(3): 534-541.
[37] 王森,张震,姜倪皓,等. 半夏转录组中的SSR位点信息分析. 中药材, 2014, 37(9): 1567-1570. Wang S, Zhang Z, Jiang N H, et al. SSR Informationin transcriptome of Pinellia ternate. Journal of Chinese Medicinal Materials, 2014, 37(9): 1567-1570.
[38] 王东,曹玲亚,高建平. 党参转录组中SSR位点信息分析. 中草药,2014, 45(16): 2390-2394. Wang D, Cao L Y, Gao J P. Data mining of simple sequence repeats in Codonopsis pilosula transcriptome, Chinese Traditional and Herbal Drugs, 2014, 45(16): 2390-2394.
[39] 杨维泽,金航,赵振玲,等. 西洋参EST资源的SSR信息分析. 西南农业学报,2011, 24(1): 275-278. Yang W Z, Jin H, Zhao Z L, et al. Analysis of SSR Informationin EST Resource of Panax quinquefolium L.. Southwest China Journal of Agricultural Sciences, 2011, 24(1): 275-278.