林业科学  2013, Vol. 49 Issue (6): 30-36   PDF    
DOI: 10.11707/j.1001-7488.20130605
0

文章信息

邓敏捷, 董焱鹏, 赵振利, 张晓申, 范国强
Deng Minjie, Dong Yanpeng, Zhao Zhenli, Zhang Xiaoshen, Fan Guoqiang
基于Illumina高通量测序的泡桐转录组研究
Illumina-Based de novo Sequencing and Characterization of the Transcriptome of Paulownia Plant
林业科学, 2013, 49(6): 30-36
Scientia Silvae Sinicae, 2013, 49(6): 30-36.
DOI: 10.11707/j.1001-7488.20130605

文章历史

收稿日期:2013-01-29
修回日期:2013-04-20

作者相关文章

邓敏捷
董焱鹏
赵振利
张晓申
范国强

基于Illumina高通量测序的泡桐转录组研究
邓敏捷1, 2, 董焱鹏1, 2, 赵振利1, 2, 张晓申1, 3, 范国强1, 2    
1. 河南农业大学泡桐研究所 郑州 450002;
2. 河南农业大学林学院 郑州 450002;
3. 郑州市农林科学研究所 郑州 451400
摘要:利用新一代高通量测序技术平台Illumina Solexa对泡桐进行转录组测序和数据de novo组装,并对得到的unigene进行功能注释、分类及代谢通路分析。结果表明,N50值为2 278 bp、平均长度为1 410 bp的泡桐unigene共有188 019条,将其与NCBI的Nr和Swiss-Prot数据库比对后发现,分别有120 808条和85 880条unigene与其他物种的基因具有同源性。利用COG数据库可将有关的41 914条泡桐unigene分成25类,KEGG数据库分析发现共有43 553个unigene参与215种代谢通路。找到与木质素合成相关的泡桐unigene。
关键词泡桐    转录组    Illumina高通量测序    从头组装    
Illumina-Based de novo Sequencing and Characterization of the Transcriptome of Paulownia Plant
Deng Minjie1, 2, Dong Yanpeng1, 2, Zhao Zhenli1, 2, Zhang Xiaoshen1, 3, Fan Guoqiang1, 2     
1. Institute of Paulownia, Henan Agricultural University Zhengzhou 450002;
2. College of Forestry, Henan Agricultural University Zhengzhou 450002;
3. Zhengzhou Research Institute of Agriculture and Forestry Sciences Zhengzhou 451400
Abstract: The transcriptome Paulownia plant was sequenced by using Illumina technology, and the functional annotations and metabolic pathways analyses of some unigenes were conducted in this present paper. The results indicated that 188 019 unigenes with an average length of 1 410 bp and N50 value of 2 278 bp were obtained with de novo assembly. Comparison with NCBI and Swiss-Prot protein databases showed that 120 808 and 85 880 unigenes had homology with the genes from other species, respectively. The 41 914 unigenes were able to be assigned to 25 categories with the COG (Clusters of Orthologous Groups) database. Functional annotation against KEGG (Kyoto Encyclopedia of Genes and Genomes) database identified 43 553 unigenes which were mapped to 215 metabolic pathways. Moreover, some Paulownia unigenes related to lignin biosynthesis were found using this information platform. The result provides reference for future excavations of new genes, as well as screening and identifying miRNA of Paulownia plants.
Key words: Paulownia    transcriptome    Illumina sequencing    de novo assembly    

泡桐属(Paulownia)落叶乔木,现有9种2变种,是中国重要的速生用材和绿化树种,大力发展泡桐对于改善生态环境,缓解目前中国木材短缺局面和提高农民生活水平具有重要的经济和生态意义。过去,国内外泡桐研究主要集中在其种质资源创制和新品种培育以及丛枝病发生机制与防治等方面(范国强等,2003 ; 2006 ; 2007a; 2007 b; 2007 c;2008 ; 2009 ; 2010 ; 黎明等,2008 ; 田国忠等,2010 ;翟晓巧等,2010 ; 赵振利等,2011 ; Fan et al.,1997 ;Llano-Sotelo et al.,2010 ; Akyildiz et al.,2010),而对泡桐分子生物学研究则相对较少(范国强等,2011 ;2012 ; 陈占宽等,2011)。目前,因泡桐基因组序列未知,遗传背景不清,造成了其组学研究的困难,急需了解泡桐遗传信息,加快其基因和基因组学的研究。转录组测序是基于下一代高通量测序技术建立的一种高效、快捷分子生物学研究手段,利用该手段可消除转录本研究对基因组序列的依赖,使科技工作者能在组学水平上研究基因组序列未知的非模式生物(Vera et al.,2008 ; Kristiansson et al.,2009)。开展转录组研究能够从整体水平了解植物在特定阶段的基因功能及基因结构,更加便利地揭示特定生物学过程的分子机制(祁云霞等,2011)。近年来,已有多种木本植物,如木榄(Bruguiera gymnorrhiza)(Miyama et al.,2008)、刚毛柽柳(Tamarix hispida)(Gao et al.,2008)、红豆杉(Taxus)(Hao et al.,2011)、桉树(Eucalyptus)(Mizrachi et al.,2010)、日本落叶松(Larix leptolepis)(Zhang et al.,2012)、橡胶树(Hevea brasiliensis)(Li et al.,2012)和茶树(Camellia sinensis)(Shi et al.,2011)等转录组公布于世,但至今未见有关泡桐转录组的报道。本研究利用高通量测序技术平台 Illumina Solexa 先对泡桐叶片进行转录组测序、拼接组装,再用生物信息学的方法对得到的 unigene 进行功能注释和功能分类,以期为泡桐功能基因的发掘利用、特异 miRNA 的鉴定及功能分析等奠定基础。

1 材料与方法 1.1 试验材料

试验材料为河南农业大学林木生物技术实验室培养30天的二倍体和四倍体白花泡桐(Paulownia fortunei)、二倍体和四倍体毛泡桐(P. tomentosa)、二倍体和四倍体南方泡桐(P. australis)以及二倍体和四倍体豫杂一号泡桐(P. tomentosa × P. fortunei)组织培养苗。培养温度(25 ± 2)℃,光照强度130 μmol·m-2 s-1,光照时间为16 h·d-1 。采集相同质量上述泡桐叶片,用液氮速冻后存于-80 ℃冰箱中备用。

1.2 泡桐叶片 RNA 提取

将适量上述泡桐的叶片组织混合均匀,用奥莱博植物 RNA 提取试剂盒提取泡桐 RNA,然后使用 RNeasy Plant Mini Kit(QIAGEN)对 RNA 样品进一步纯化。利用 Agilent 的 BioAnalyzer 2100检测 RNA完整性,样品 RIN≥8 。

1.3 泡桐 cDNA 文库构建

采用 TruSeq RNA Sample Preparation Kit(Illumina)进行泡桐 cDNA 文库构建。取4 μgRNA,用带有 Oligo(dT)的珠子分离纯化其中的 mRNA,然后将得到的 mRNA 处理成小片段。以mRNA 小片段为模板,用随机引物进行逆转录生成 dsDNA,末端补平后,在3 ' 末端加 A,然后连接接头,用 Agencourt AMPure XP 60 mL Kit(Beckman)对产物进行2次纯化彻底去除多余接头后,进行12个循环的 PCR 扩增,扩增产物进行琼脂糖凝胶电泳,用 MiniElute Gel Extraction Kit(QIAGEN)切胶回收长度300~350 bp 的条带,得到测序用双末端文库。

1.4 高通量测序

用 KAPA SYBR 快速 PCR 试剂盒(KAPABiosystem)对文库快速定量,得到文库样品准确浓度,取10 μL 2 nmol·L-1文库样品,在 cBot 上进行簇生成反应后,用高通量测序平台 Illumina GA Ⅱ x 进行 DNA 双末端测序,通过200 /220个循环的测序反应,得到2 × 100 /110 bp 的原始数据。

1.5 数据拼接和功能注释

碱基读取得到原始序列数据后,去掉其中低质量数据和污染接头后,将剩余的高质量数据用Velvet(Zerbino et al.,2008)和Oases(Schulz et al.,2012)软件组装得到泡桐的 unigene,接着先用 BLAST 系列软件对泡桐的 unigene 序列分别与 Nr(NCBI 非冗余蛋白数据库)、Swiss-Prot和COGs 比对,进行功能注释和分类; 再在 InterProScan4.8与数据库 InterPro 进行比对的基础上,对泡桐 unigene进行 GO 功能注释和分类,然后用 WEGO 软件(Ye et al.,2006)对 GO 注释结果分类作图。最后,将 unigene 与 KEGG 数据库进行比对,分析其相关的代谢通路。数据分析流程、使用数据库及有关参数分别见图 1表 1

图 1 泡桐转录组生物信息学分析流程 Fig. 1 The workflow of bioinformatic analysis of Paulownia transcriptome Nr: NCBI 非冗余蛋白数据库 NCBI non-redundant protein database; Swiss-Prot: 欧洲生物信息学研究所维护的蛋白数据库 The protein databasesupported by European Bioinformatics Institute; GO: 基因本体数据库 Gene Ontology; COGs: 蛋白质直系同源簇数据库 Clusters of OrthologousGroups of proteins; KEGG: 京都基因与基因组百科全书数据库 Kyoto Encyclopedia of Genes and Genomes.
表 1 泡桐 unigene 功能注释所使用的数据库和软件① Tab.1 Databases and softwares used for functional annotation of Paulownia unigenes
2 结果与分析 2.1 测序结果和de novo组装

测序共得到384 M reads,其中 Q20 ≥80 % 的高质量数据为376 M reads,平均长度为95 bp。采用 Velvet和Oases 软件,对测序得到的高质量数据进行de novo组装,共得到311 728条序列重叠群(contig),N50为289 bp,平均长度为257 bp。将这些序列 contig 进一步组装,得到 N50为2 278 bp,平均长度为1 410 bp的泡桐 unigene 188 019条(图 2)。其中,127 891条(68.02 %)unigene 长度大于500 bp,99 731条(53.04 %)长度大于1 000 bp,49 959条(26.57 %)长度大于2 000 bp,最长的 unigene 长度为17 029 bp。此外,177 107条(94.6 %)unigene 不含 N(图 3)。这些结果说明,测序和组装效果很好,可以进行基因功能分析。

图 2 泡桐 unigene 长度分布 Fig. 2 Length distribution of Paulownia unigenes
图 3 泡桐 unigene 的 gap 分布 Fig. 3 Gap distribution of Paulownia unigenes
2.2 功能注释

将组装得到的188 019条泡桐 unigene 与 Nr 数据库比对(E值≤1 e-5),有123 062条(65.5 %)与毛果杨(Populus trichocarpa)、葡萄(Vitis vinifera)和蓖麻(Ricinus communis)等植物的序列同源; 与Swiss-Prot 数据库比对(E值≤1 e-10),有85 880条(45.7 %)泡桐 unigene 找到了同源序列。此外,还有71条和19条 unigene 分别与 Nr和Swiss-Prot 数据库中白花泡桐肉桂酰辅酶 A 还原酶(CCR)基因和4-香豆酸辅酶 A 连接酶基因(4 CL)、毛泡桐烟酰胺腺嘌呤二核苷酸(NADH)脱氢酶基因、台湾泡桐(P. kawakamii)MADS-box 基因和芽形成相关基因(pksF1)及超氧化物歧化酶基因(sodCC)有一定的同源性。值得注意的是标注为 Locus _ 2536 _Transcript_3 /6的泡桐 unigene 与 Nr 数据库中肉桂酰辅酶 A 还原酶基因的 CDS 序列(gb | ACD13265.1 |)的同源性高达94 % 。

2.3 功能分类

与 COGs 数据库比对(E值≤ 1 e-10),188 019条泡桐 unigene 中,49 760条(26.50 %)比对到了同源序列,其中的41 964条泡桐 unigene 分布于25个大类(图 4)。 unigene 最多的为一般功能预测类,共有9 927条序列(23.66 %),其余依次为转录后修饰、蛋白翻转和分子伴侣类(3 829,9.12 %),翻译、核糖体结构和生物起源类(3 042,7.25 %),碳水化合物转运和代谢类(2 988,7.12 %)。此外,泡桐 unigene 的 GO 注释分类结果(图 5)表明,67 316条泡桐 unigene 被注释分类。根据其在细胞中所处位置,已注释的 unigene 可分为13类,其中,包含 unigene 最多的是细胞类和细胞组成类(19 250条,28.60 %),其次是细胞器类(6 764条,10.04 %)。根据其分子功能,可以将这些 unigene 分为12类,其中,unigene 最多的是结合相关蛋白类(44 456条,66.04 %),其次是催化相关蛋白类(34 648条,51.47 %)。依据其参与的生物学过程,可以将其分为19类,其中,代谢过程类包含 unigene 最多(34 788条,51.68 %),细胞过程类次之(30 328条,45.05 %)。

图 4 泡桐 unigene 的 COG 分类 Fig. 4 Classification of the clusters of orthologous groups (COG)for Paulownia unigenes A: 一般功能预测 General function prediction only; B: 翻译后修饰、蛋白翻转、分子伴侣 Posttranslational modification,protein turnover,chaperones; C: 翻译、核糖体结构和生物合成 Translation,ribosomalstructure and biogenesis; D: 碳水化合物转运和代谢 Carbohydratetransport and metabolism; E: 氨基酸转运和代谢 Amino acid transportand metabolism; F: 复制、重组和修复 Replication,recombination andrepair; G: 能量产生和转化 Production and conversion; H: 脂类转运和代谢 Lipid transport and metabolism; I: 转录 Transcription; J: 功能未知 Function unknown; K: 信号转导机制 Signal transductionmechanisms; L: 无机离子转运和代谢 Inorganic ion transport andmetabolism; M: 细胞壁 / 膜 / 包膜生物合成 Cell wall / membrane /envelope biogenesis; N: 次生代谢物生物合成、转运和代谢 Secondary metabolites biosynthesis,transport and catabolism; O: 辅酶转运和代谢 Coenzyme transport and metabolism; P: 细胞内运输、分泌和膜泡运输 Intracellular trafficking, secretion, and vesiculartransport; Q: 防御系统 Defense mechanisms; R: 核苷酸转运和代谢 Nucleotide transport and metabolism; S: 细胞骨架 Cytoskeleton; T: 细胞周期控制、细胞分裂和染色体分区 Cell cycle control, celldivision, chromosome partitioning; U: 染色质结构和动力学 Chromatin structure and dynamics; V: RNA 加工和修饰 RNAprocessing and modification; W: 细胞迁移 Cell motility; Y: 核结构 Nuclear structure.
图 5 泡桐转录组 GO 分类 Fig. 5 GO classification for Paulownia unigenes 细胞内定位 Cellular location: C1 .细胞 Cell; C2 .细胞部分 Cell part; C3 .包膜 Envelope; C4 .胞外区 Extracellular region; C5 .大分子复合体 Macromolecular complex; C6 .膜封闭腔 Membrane-enclosed lumen; C7 .细胞器 Organelle; C8 .细胞器部分 Organelle part.分子功能 Molecularfunction: M1 .抗氧化活性 Antioxidant activity; M2 .结合 Binding; M3 .催化活性 Catalytic activity; M4 .电子传递活性 Electron carrier activity;M5 .酶调节活性 Enzyme regulatoractivity; M6 .分子转导活性 Molecular transducer activity; M7 .结构分子活性 Structural molecule activity; M8 .转录调节活性 Transcription regulatoractivity; M9 .翻译调节活性 Translation regulatoractivity; M10 .转运活性 Transporter activity.生物学过程 Biological process: B1 .解剖结构形成 Anatomical structure formation; B2 .生物调节 Biological regulation; B3 .细胞组分生物合成 Cellularcomponent biogenesis; B4 .细胞组分组织 Cellular component organization; B5 .细胞过程 Cellular process; B6 .细胞死亡 Death; B7 .发育过程 Developmental process; B8 .胞内定位的建立 Establishment of localization; B9 .细胞内定位 Localization; B10 .代谢过程 Metabolic process; B11 .涉及多个有机体的过程 Multi-organism process; B12 .涉及多细胞有机体的过程 Multicellular organismal process; B13 .色素沉积 Pigmentation; B14 .生殖 Reproduction; B15 .生殖过程 Reproductive process; B16 .对刺激的反应 Response to stimulus.
2.4 代谢通路分析

KEGG 注释结果(表 2)表明,188 019条泡桐 unigene 中,43 553条被注释(23.16 %); 并且这43 553条泡桐 unigene 共涉及到215种代谢途径,其中 unigene 数量最多为内质网蛋白质加工途径(1 034条,2.37 %); 其余依次为核糖体(962条,2.21 %)、RNA 转运(956条,2.20 %)、植物激素信号转导(953条,2.19 %)、剪接体(922条,2.12 %)等途径。

表 2 Unigene 数量最多的10个代谢通路 Tab.2 Top ten metabolic pathways involving Paulownia unigenes

将泡桐 unigene 映射到木质素生物合成代谢途径发现,180条 unigene 参与木质素生物合成,其中:16条对应苯丙氨酸解氨酶(PAL),20条对应肉桂酸-4-羟化酶(C4 H),22条对应4 CL,6条对应 CCR,11条对应肉桂醇脱氢酶(CAD),11条对应对-羟基肉桂酰基-辅酶 A: 奎尼酸 / 莽草酸对 -羟基肉桂酰基转移酶(HCT),13条对应对-香豆酸3-羟化酶(C3 H),5条对应阿魏酸5-羟化酶(F5 H),73条对应过氧化物酶 E1.11.1.7,只有1条与过氧化物酶 PRDX6相对应。其中,对应 CCR 的6条和对应4 CL 的22条 unigene 分别有6条和7条为 Nr 数据库中泡桐的相关基因序列。但未发现咖啡酸-O-甲基转移酶(COMT)和过氧化氢-过氧化物酶(katG)相关的 unigene。

3 讨论

植物转录组数据可因不同试验目的来源于不同试验样品材料。目前,一种是不同组织材料等量混合后测序和组装的结果(Hsiao et al.,2011 ;Parchman et al.,2010 ; Huang et al.,2012),另一种是不同组织材料测序后再一起组装的结果(Garg et al.,2011 ; Wang et al.,2012)。前者可以得到更多的转录组数据,但由于不同组织间存在可变剪切,使 contig 组装变得困难,影响试验结果的精确度(Zhou et al.,2012)。因此,有研究者将同一组织测序后数据进行组装(Barrero et al.,2011)。研究表明,组织特异性的转录组能为基因表达研究提供更全面的参考数据(Barash et al.,2010),这对非模式植物转录组研究尤为重要。 Sloan等(2012)为了最大限度地找蝇子草属 Silene vulgaris 的多态性序列(SNP和SSR),将麦瓶草3个亚群混合在一起进行了转录组测序和从头组装,得到了很好的结果。因此,本研究将8个泡桐相同组织材料混匀测序,目的就是在目前几乎没有泡桐遗传信息的情况下获得准确度高、覆盖度广、信息全面的转录组数据,为泡桐分子生物学研究奠定坚实基础。众所周知,植物具有多倍性、异质性、重复序列多和基因复杂程度高等特点,其转录组从头组装较为困难(Schatz et al.,2012)。本研究也曾使用软件 Trinity 进行泡桐转录组的从头组装,但效果不能使人满意,随后转为使用 Velvet和Oases 2个软件组装,得到 unigene 的 N50值为2 278 bp,该组装方法在闭鞘姜属 Costus pictus 的转录组中也得到了应用,其 unigene N50值达到了1 353 bp(Annadurai et al.,2012)。该方法的优势在于 Oases 软件使用了复合 k-mer 算法,可消除重复序列对真正序列重叠的影响,提高组装的精确度(Zerbino et al.,2008 ; Schulz et al.,2012)。此外,利用这个信息平台,本研究将泡桐 unigene 映射到木质素合成相关途径中,发现了一些参与木质素合成的泡桐 unigene,为以后开展泡桐材质研究提供了数据支撑。尽管 BLAST 结果表明,本试验得到的unigene 并不能覆盖整个泡桐蛋白编码区,但这些数据仍是国内外迄今包含基因最多的泡桐基因表达信息平台,为以后泡桐功能基因的发掘利用、特异 miRNA 的功能分析及基因组测序、分子育种等奠定基础。

参考文献(References)
[1] 陈占宽,杨艳坤,叶金山,等. 2011.白花泡桐羟基肉桂酰辅酶A还原酶mRNA全序列克隆及序列分析.西北林学院学报,26(4): 99-103.(1)
[2] 范国强,李有,郑建伟,等. 2003.泡桐丛枝病发生相关蛋白质的电泳分析.林业科学,39(2): 119-122.(1)
[3] 范国强,杨志清,曹艳春,等. 2006.秋水仙素诱导兰考泡桐同源四倍体.核农学报,20(6): 473-476.(1)
[4] 范国强,曹艳春,赵振利,等. 2007a.白花泡桐同源四倍体的诱导.林业科学,43(4): 30-36.(1)
[5] 范国强,杨志清,曹艳春,等. 2007b.毛泡桐同源四倍体的诱导.植物生理学通讯,43(1): 109-111.(1)
[6] 范国强,张胜,翟晓巧,等. 2007c.抗生素对泡桐丛枝病植原体和发病相关蛋白质的影响.林业科学,43(3): 138-142.(1)
[7] 范国强,曾辉,翟晓巧. 2008.泡桐丛枝病发生特异相关蛋白质亚细胞定位及质谱鉴定.林业科学,44(4): 83-86.(1)
[8] 范国强,魏真真,杨志清. 2009.南方泡桐同源四倍体的诱导及其体外植株再生研究.西北农林科技大学学报:自然科学版,37(10): 83-90.(1)
[9] 范国强,翟晓巧,魏真真,等. 2010.豫杂一号泡桐体细胞同源四倍体诱导及其体外植株再生.东北林业大学学报,38(12): 22-26.(1)
[10] 范国强,赵改丽,翟晓巧,等. 2011.硫酸二甲酯处理豫杂一号泡桐丛枝病幼苗形态变化及其SSR分析.东北林业大学学报,39(5): 30-33.(1)
[11] 范国强,赵改丽,翟晓巧,等. 2012.硫酸二甲酯对毛泡桐丛枝病幼苗植原体及SSR扩增位点的影响.南京林业大学学报:自然科学版,36(3): 5-8.(1)
[12] 黎明,翟晓巧,范国强,等. 2008.土霉素对豫杂一号泡桐丛枝病幼苗形态和DNA甲基化水平的影响.林业科学,44(9): 152-156.(1)
[13] 祁云霞,刘永斌,荣威恒. 2011.转录组研究新技术: RNA-Seq及其应用.遗传, 33(11): 1191-1202.(1)
[14] 田国忠,李永,梁文星,等. 2010.丛枝病植原体侵染对泡桐组培苗组织内H2O2产生的影响.林业科学,46(9): 96-104.(1)
[15] 翟晓巧,曹喜兵,范国强. 2010.甲基磺酸甲酯处理的豫杂一号泡桐丛枝病幼苗的生长及SSR分析.林业科学,46(12): 176-181.(1)
[16] 赵振利,何佳,赵晓改,等. 2011.泡桐9501体外植株再生体系的建立及体细胞同源四倍体诱导.河南农业大学学报,45(1): 59-65.(1)
[17] Akyildiz M H, Kol H S. 2010. Some technological properties and uses of Paulownia (Paulownia tomentosa Steud.) wood. J Environ Biol, 31(3): 351-355.(1)
[18] Altschul S F, Madden T L, Schäffer A A,et al. 1997. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res, 25(17): 3389-3402.(1)
[19] Annadurai R S, Jayakumar V, Mugasimangalam R C, et al. 2012. Next generation sequencing and de novo transcriptome analysis of Costus pictus D. Don, a non-model plant with potent anti-diabetic properties. BMC Genomics, 13: 663.(1)
[20] Barash Y, Calarco J A, Gao W,et al. 2010. Deciphering the splicing code. Nature, 465(7294): 53-59.(1)
[21] Barrero R A, Chapman B, Yang Y,et al. 2011. De novo assembly of Euphorbia fischeriana root transcriptome identifies prostratin pathway related genes. BMC Genomics, 12: 600.(1)
[22] Fan G Q, Jiang J Q. 1997. Relationship between witches' broom protein and dynamic of some amino acids in Paulownia tree leaves. Journal of Forestry Research, 8(3): 164-166.(1)
[23] Gao C, Wang Y, Liu G,et al. 2008. Expression profiling of salinity-alkali stress responses by large-scale expressed sequence tag analysis in Tamarix hispida. Plant Mol Biol, 66 (3): 245-258.(1)
[24] Garg R, Patel R K, Jhanwar S,et al. 2011. Gene discovery and tissue-specific transcriptome analysis in chickpea with massively parallel pyrosequencing and web resource development. Plant Physiol, 156(4): 1661-1678.(1)
[25] Hao D C, Ge G, Xiao P,et al. 2011. The first insight into the tissue specific Taxus transcriptome via Illumina second generation sequencing. PLoS ONE, 6(6): e21220. (1)
[26] Hsiao Y Y, Chen Y W, Huang S C,et al. 2011. Gene discovery using next-generation pyrosequencing to develop ESTs for Phalaenopsis orchids. BMC Genomics, 12: 360.(1)
[27] Huang L L, Yang X, Sun P,et al. 2012. The first Illumina-based de novo transcriptome sequencing and analysis of Safflower flowers. PLoS ONE, 7(6): e38653. doi: 10.1371/journal.pone.0038653.(1)
[28] Kristiansson E, Asker N, Forlin L,et al. 2009. Characterization of the Zoarces viviparus liver transcriptome using massively parallel pyrosequencing. BMC Genomics, 10: 345.(1)
[29] Li D, Deng Z, Qin B,et al. 2012. De novo assembly and characterization of bark transcriptome using Illumina sequencing and development of EST-SSR markers in rubber tree (Hevea brasiliensis Muell. Arg.). BMC Genomics, 13: 192. (1)
[30] Llano-Sotelo J M, Alcaraz-Melendez L, Castellanos Villegas A E. 2010. Gas exchange in Paulownia species growing under different soil moisture conditions in the field. J Environ Biol, 31(4): 497-502.(1)
[31] Miyama M, Tada Y. 2008. Transcriptional and physiological study of the response of Burma mangrove (Bruguiera gymnorhiza) to salt and osmotic stress. Plant Mol Biol, 68(1-2): 119-129.(1)
[32] Mizrachi E, Hefer C A, Ranik M,et al. 2010. De novo assembled expressed gene catalog of a fast-growing Eucalyptus tree produced by Illumina mRNASeq. BMC Genomics, 11: 681.(1)
[33] Parchman T L, Geist K S, Grahnen J A,et al. 2010. Transcriptome sequencing in an ecologically important tree species: assembly, annotation, and marker discovery. BMC Genomics, 11: 180.(1)
[34] Schatz M C, Witkowski J, McCombie W R,et al. 2012. Current challenges in de novo plant genome sequencing and assembly. Genome Biol, 13: 243.(1)
[35] Schulz M H, Zerbino D R, Vingron M,et al. 2012. Oases: Robust de novo RNA-seq assembly across the dynamic range of expression levels. Bioinformatics, 28(8): 1086-1092.(2)
[36] Shi C Y, Yang H, Wei C L,et al. 2011. Deep sequencing of the Camellia sinensis transcriptome revealed candidate genes for major metabolic pathways of tea-specific compounds. BMC Genomics, 12: 131.(1)
[37] Sloan D B, Keller S R, Berardi A E,et al. 2012. De novo transcriptome assembly and polymorphism detection in the flowering plant Silene vulgaris (Caryophyllaceae). Mol Ecol Resour, 12(2): 333-43.(1)
[38] Vera J C, Wheat C W, Fescemyer H W,et al. 2008. Rapid transcriptome characterization for a nonmodel organism using 454 pyrosequencing. Molecular Ecology, 17(7): 1636-1647.(1)
[39] Wang Y, Zeng X, Iyer N J,et al. 2012. Exploring the switchgrass transcriptome using second-generation sequencing technology. PLoS ONE, 7(3): e34225. doi: 10.1371/journal.pone.0034225.(1)
[40] Ye J, Fang L, Zheng H,et al. 2006. WEGO: a web tool for plotting GO annotations. Nucleic Acids Res, 34(Web Server issue): W293-W297.(1)
[41] Zdobnov E M, Apweiler R. 2001. InterProScan: an integration platform for thesignature-recognition methods in InterPro. Bioinformatics, 17(9): 847-848.(1)
[42] Zerbino D R, Birney E. 2008. Velvet: Algorithms for de novo short read assembly using de Brujin graphs. Genome Res, 18(5): 821-829.(2)
[43] Zhang Y, Zhang S G, Han S Y,et al. 2012. Transcriptome profiling and in silico analysis of somatic embryos in Japanese larch (Larix leptolepis). Plant Cell Rep, 31(9): 1637-1657.(1)
[44] Zhou Y, Gao F, Liu R,et al. 2012. De novo sequencing and analysis of root transcriptome using 454 pyrosequencing to discover putative genes associated with drought tolerance in Ammopiptanthus mongolicus. BMC Genomics, 13: 266.(1)