文章信息
- 钮世辉, 袁虎威, 陈晓阳, 李伟
- Niu Shihui, Yuan Huwei, Chen Xiaoyang, Li Wei
- 油松雌雄球花高通量基因表达谱芯片分析
- Microarray Analysis of Large Scale Gene Expression Profiles between Male and Female Cones of Pinus tabulaeformis
- 林业科学, 2013, 49(9): 46-51
- Scientia Silvae Sinicae, 2013, 49(9): 46-51.
- DOI: 10.11707/j.1001-7488.20130907
-
文章历史
- 收稿日期:2013-01-14
- 修回日期:2013-03-07
-
作者相关文章
2. 华南农业大学林学院 广州 510642
2. College of Forestry, South China Agricultural University Guangzhou 510642
生殖调控如花期、花量与性别的调控,以及控制授粉与避免自交等操作是针叶树种遗传改良与良种生产中的重要环节。在长期的生产过程与实践中,育种工作者已经积累了很多有益的经验,如外施GA4+7可以促进雌球花花量(Ross et al.,1984),而遮荫可以促进雄球花形成而抑制雌球花形成(Ross et al.,1987)。但是对针叶树雌雄球花发育及调控的分子生物学研究却严重滞后,很重要的一个原因是它们的基因组明显比大多数其他植物基因组大(Morse et al.,2009),全基因组测序工作进展缓慢,直至2013年5月才公布了第一种针叶树———欧洲云杉(Picea abies)的全基因组草图(Nystedt et al.,2013)。另外,与被子植物显著不同,祼子植物生殖器官多是单性而且缺少花被和心皮(Wang et al.,2010),以致许多在被子植物生殖遗传学中取得的重要进展对祼子植物中的相关研究推动作用有限(Mathews et al.,2012)。
第2代测序技术的快速发展为这种困境的改变提供了契机(Neale et al.,2008),转录组测序只关注基因组中转录的部分,可以避开针叶树基因组结构复杂、多重复序列等不利因素,可以较低的费用、快速地获得大量的基因组水平上的遗传信息(Fernandez-Pozo et al.,2011; Lesser et al.,2012)。随着测序成本的降低,公共数据库中基因组信息呈现爆炸式增长,这为基因芯片技术的发展和应用提供了基础,基因芯片已经成为生命科学研究中成熟而有效的工具。目前针对拟南芥(Arabidopsis thaliana)中所有预测基因,已经建成详细的基因时空表达数据库(Schmid et al.,2005),其中数据的收集依赖于成熟的基因芯片技术与数据分析的有效应用。
转录组测序结合基因表达谱芯片分析为针叶树遗传研究提供了一种可行的、高效的研究手段。采用这种策略,本研究从油松(Pinus tabulaeformis)多个体多组织样本中获得大量的转录本信息,并以此为基础,设计并定制了油松高通量表达谱基因芯片。通过芯片杂交,比较油松雌雄球花发育后期的基因表达谱,筛选出一批稳定的在雌雄球花中表达差异极显著的基因,并对其中2个分别在雌雄球花中优势表达的基因进行Real-Time PCR分析。本研究为油松及近缘树种的雌雄球花发育以及其他生物学发育过程的分子生物学研究提供了基础和新的思路。
1 材料与方法 1.1 试验材料油松材料均取自平泉县七沟林场国家重点油松良种基地(41°02' N,118°68' E,海拔480~740 m)。油松转录组测序使用Roche 454 GS-FLX Titanium测序平台。基因芯片是基于获得的转录组信息设计、定制于Agilent公司的60 K油松表达谱芯片。
1.2 研究方法 1.2.1 样品采集与保存转录组测序样品: 2011年5月和7月分2次随机选取10株油松,采集针叶、茎干(包含正常木、应拉木及应压木的木质部、形成层、韧皮部组织)和球花(包含不同发育阶段的雌雄球花)混合样品。
芯片杂交样品: 2012年4月20日,随机选取3株成熟油松,分别采集雌雄球花样品。
基因表达分析样品: 将雌雄球花从表型可辨别到发育成熟的过程平均分为4个阶段,由于雌雄球花发育不同步,所以从2012年3月24日到4月20日每隔9天采集1次雄球花样品,从2012年4月2日到4月21日每隔7天采集1次雌球花样品; Realtime PCR分析采集的4个不同发育阶段的球花样品,取3个生物学重复,每个重复所有阶段样品均取自同一株树; 由于前期样品太小,为了提取RNA的需要,所以前2个发育阶段样品为采集于同一枝条上的3个混合花芽。
样品采集后立即放入液氮里带回实验室。在后续试验之前所有样品均保存于-80 ℃超低温冰箱。
1.2.2 RNA提取及cDNA和cRNA合成与纯化油松组织样品在液氮中研磨成粉后用TRIzol(Invitrogen)试剂提取总RNA,RNA 用电泳和紫外分光光度法检验质量,总RNA用QIAGEN RNeasyMini Kit 进行纯化。以纯化后的RNA为模板,用SMART PCR cDNA synthesis Kit(Clonetech)合成cDNA; 用Agilent公司芯片杂交系统试剂合成cRNA,用QIAGEN RNeasy Mini Kit进行纯化。试验步骤参见各试剂盒操作说明书。
1.2.3 油松转录组测序用GS FLX TitaniumGeneral Library Preparation Kit进行转录组测序文库构建; 用Roche 454高通量测序平台测序。转录组测序原始数据已经上传NCBI SRA(Sequence ReadArchive)公共数据库(登录号: SRA056887)。所分析的2个基因,MCE1在本数据库中的编号为lw_isotig04844,FCE1为lw_isotig08739。
测序原始数据经SeqClean和LUCY2软件去除接头和低质量部分(Li et al.,2004),用Newbler2.5.3软件拼接(Kumar et al.,2010),拼接好重叠群(isotig)和单一序列(singlet)用CD-HIT软件聚类分析(Huang et al.,2010),相似度大于95%的序列聚为一类,其中最长的1条序列代表1个单基因(unigene)用于芯片设计。所有单基因用GeneOntology(GO)数据库注释(Garzon-Martinez et al.,2012)。
1.2.4 油松表达谱芯片定制与杂交将序列信息提交到Agilen公司网站,利用该平台进行芯片设计与定制(https://earray.chem.agilent.com/earray)。提取油松雌雄球花总RNA并合成cRNA,每组样品取3个生物学重复。纯化后的cRNA用Agilent公司芯片杂交系统试剂片段化后加入杂交液,上芯片,65 ℃,10 r·min-1滚动杂交17 h。杂交后的芯片经洗涤后用Agilent扫描仪进行扫描,分辨率为5 μm,以100%和10% PMT各扫描1次,2次结果用Agilent软件合并。
1.2.5 基因表达分析以油松4个不同发育阶段的雌雄球花为材料,提取总RNA并合成cDNA,用SuperReal PreMix(SYBR Green)(TIANGEN)进行Real-Time PCR分析。程序为: 95 ℃15 min预变性; 95 ℃ 10 s,60 ℃ 30 s,重复40个循环; 每个阶段取3个生物学重复,每个样品做3个技术重复。基因表达分析所用引物序列信息如下: 18SrRNA-F: 5'-cggctaccacatccaaggaa-3',18S rRNA-R:5'-gctggaattaccgcggct-3'; MCE1-F: 5'-gctgcctctctacttcg-3',MCE1-R: 5'-tgctgtcttctctcccac-3'; FCE1-F: 5'-catgaaattgttgagaaggca-3',FCE1-R:5'-ggactatgacccacagga-3'。
2 结果与分析 2.1 油松转录组测序基于Roche 454/GS FLX高通量测序平台,利用1个测序反应(a run),共获得了822 891条EST序列,平均长度为358 bp,高质量的EST序列进一步拼接出46 584个单基因簇(unigenes)。
将获得的单基因簇进行GO功能注释,由于裸子植物基因功能研究不足以及与被子植物功能基因的差异,只有约1/2的基因可以预测出功能,其中21%参与生物学过程,12%属于细胞组分,17%属于分子功能基因(图 1)。
利用Agilent软件对杂交芯片扫描图进行质量分析表明,芯片样本背景信号值与噪点值都在适当范围内,芯片数据质量较高,可以用于后续分析。对雌雄球花芯片数据进行主成分分析(principal component analysis,PCA),结果显示2组样本内3个生物学重复间的重复性很好,而雌雄球花2组样本聚类差别非常明显,表明它们在各自的发育过程中基因表达差异极大(图 2A)。
比较雌雄球花组织中基因表达差异,参照FC(fold change)≥5,3个生物学重复样品间P≤0.01的标准,共筛选到2 460个基因。将这些基因进行GO功能注释,有85%的基因有预测的功能,其中29%参与生物学过程,26%属于细胞组分,30%属于分子功能基因(图 2B)。
从这2 460个基因的散点分布图(图 3A)和频度统计图(图 3B)可以看出,在取样期,雄球花组织中优势表达的基因相对较多,而且雌球花中优势表达的基因更多地集中在相对差异较低区域。有1 309个基因在雄球花中优势表达,其中有20%的基因的表达量比雌球花中高64倍(log264=6)以上;有1 151个基因在雌球花中优势表达,但只有7%的基因的表达量比雄球花中高64倍以上。如果参照更加严格的重复样品间P≤0.001的标准,表达差异大于64倍以上的基因占总数的比例分别为26%(雄球花)和10%(雌球花),共计322个。
从筛选到的2 460个基因中随机选取100个基因(图 4A),另外选取雌雄球花中表达差异最大的各50个基因(图 4B)进行可视化绘图。从热图中可以看出所得到的雌雄球花中差异表达基因的数量和表达量的差异是稳定的。推测这些基因与雌雄球花发育的进程密切相关,同时为寻找关键调控基因提供了思路。
从雌雄球花差异表达基因中,选取1个在雄球花中优势表达基因,命名为MCE1(Male Cone Expressed 1),芯片数据显示MCE1在雄球花中的表达量是雌球花中表达量的5 844倍(P=1.73×10-6),BLAST 结果显示MCE1在拟南芥、杨树及其他松树中存在同源基因,与现有数据库中白云杉(Picea glauca)的未知功能序列高度同源[NCBI登录号: DR555469; 相似性为95%(499/528)]; 选取1个在雌球花中优势表达基因,命名为FCE1(Female Cone Expressed 1),芯片数据显示FCE1在雌球花中的表达量是雄球花中表达量的849倍(P = 5.78 × 10-6),通过与公共数据库中已知序列BLAST 结果显示FCE1与现有数据库中海岸松(Pinus pinaster)的未知功能序列高度同源[NCBI登录号: CT581928; 相似性为96%(633/657)]。
为了研究MCE1和FCE1在雌雄球花发育过程中可能的生物学功能,进一步分析了它们在雌雄球花不同发育阶段的表达规律。将雌雄球花的发育过程分为4个阶段,分别标记为F1-4和M1-4,提取每一阶段不同样本的总RNA,反转录成cDNA后进行Real-time PCR分析。
分析结果表明,MCE1在不同发育阶段的雄球花中表达规律呈单峰型,在M3阶段表达量最高,比M1阶段表达量高16倍(图 5A)。MCE1在雌花中也呈单峰型表达规律,在F2阶段表达量最高,不过MCE1在任何阶段的雌球花中始终都比雄球花中的表达量低1 000倍(log21 000=10)以上(图 5A)。上述结果与芯片分析结果相一致,同时说明维持MCE1高水平表达对雄球花的发育至关重要。
FCE1在不同阶段的雌球花中一直维持在较高的表达水平,不过其中F1阶段表达量稍低,约为其他阶段表达量的1/4(图 5B)。有趣的是FCE1在雄球花M1阶段表达量比任一阶段雌球花中的表达量都高16倍以上,但在发育后期,其mRNA含量分别以29倍、221倍的速度急剧降到非常低的水平,到芯片分析阶段(F4与M4),它在雄球花中的表达水平已经只有雌球花中的1 /1 000左右(图 5B)。这些结果表明FCE1并不只在雌球花的发育过程中起作用,而对雄球花早期的发育也十分重要。推测其在雌雄球花不同发育阶段可能发挥着不同的作用。
3 结论与讨论油松是我国华北、西北及东北部分地区特有的重要针叶用材树种,分布于中国北方的14个省市自治区,生态适生区达300万km2(Li et al.,2011)。本研究基于Roche 454/GS FLX高通量测序平台,对油松多个个体、多种组织样本转录组进行了均一化混合测序,获得了822 891条EST序列,极大地丰富了公共数据库中油松基因组遗传信息(此前只有288条EST序列信息)。为油松以及近缘树种比较基因组学、基因表达谱分析及分子标记开发等研究提供了重要资料。
基于获得的转录本信息,设计并定制了60 K油松表达谱芯片。通过芯片杂交,筛选到了2 460个在雌雄球花中差异表达的基因,其中有90个差异在500倍以上。这些基因的筛选为雌雄球花发育过程的分子生物学调控机制研究提供了有益的参考。
从中选取了2个分别在雌雄球花中优势表达的基因,由于功能未知,分别命名为MCE1与FCE1;基因表达分析表明MCE1可能在雄球花发育过程中起着重要作用,而FCE1可能在雌雄球花不同发育阶段起着不用作用,它的表达对雄花的早期发育可能具有调控作用。另外由于MCE1特异地在雄花各个阶段高效表达,它的启动子可以成为以后油松及近缘树种雄球花遗传操作中重要的工具。
本研究结果表明油松雌雄球花的发育是2个极其复杂的生物过程,涉及到众多的基因,这些基因还可能在不同发育阶段起着不同的作用。对油松雌雄球花发育调控分子生物学基础解析需要针对这些基因开展更加详细和深入的研究。关于油松的生殖调控研究可以为以针叶树为代表的祼子植物与被子植物生殖调控的比较生物学研究提供基础,有助于更加深入地理解花的起源与进化进程; 生殖调控分子生物学基础的解析可以为种子园中父母本的性别调控提供理论基础和新的调控策略,为提高种子产量与品质提供技术手段; 生殖调控在用材林中的潜在应用,可以实现大幅度地降低成熟林在生殖过程中的营养消耗,提高木材增长量。因此,关于油松的生殖调控的研究具有重要的理论与实践意义,需要开展更加详细和深入的研究。
目前生殖调控的分子生物学基础研究在被子植物中,特别是在拟南芥(Drouaud et al.,2007; Giraut et al.,2011)、黄瓜(Cucumis sativus)(Kater et al.,2001)、玉米(Zea mays)(Banks,2008; Dellaporta et al.,1994; Hartwig et al.,2011)等模式植物中,取得了较大的突破。但是在祼子植物中,相关研究却相当缺乏。
在第二代测序技术快速发展的背景下,本研究中采用了转录组测序和基因芯片相组合的方法,为祼子植物生殖调控的转录组水平分子生物学基础研究提供了一种有效的可操作方案。本研究的结果与方法为油松及近缘树种生殖调控的深入研究提供了基础。
[1] | Banks J A. 2008. MicroRNA, sex determination and floral meristem determinacy in maize. Genome Biol, 9(1): 204.(1) |
[2] | Dellaporta S L, Calderon-Urrea A. 1994. The sex determination process in maize. Science, 266(5190): 1501-1505.(1) |
[3] | Drouaud J, Mercier R, Chelysheva L, et al. 2007. Sex-specific crossover distributions and variations in interference level along Arabidopsis thaliana chromosome 4. PLoS Genet, 3(6): e106.(1) |
[4] | Fernandez-Pozo N, Canales J, Guerrero-Fernandez D, et al. 2011. EuroPineDB: a high-coverage web database for maritime pine transcriptome. BMC Genomics, 12: 366.(1) |
[5] | Garzon-Martinez G A, Zhu I, Landsman D, et al. 2012. The Physalis peruviana leaf transcriptome: assembly, annotation and gene model prediction. BMC Genomics, 13(1): 151.(1) |
[6] | Giraut L, Falque M, Drouaud J, et al. 2011. Genome-wide crossover distribution in Arabidopsis thaliana meiosis reveals sex-specific patterns along chromosomes. PLoS Genet, 7(11): e1002354.(1) |
[7] | Hartwig T, Chuck G S, Fujioka S, et al. 2011. Brassinosteroid control of sex determination in maize. Proc Natl Acad Sci USA, 108(49): 19814-19819.(1) |
[8] | Huang Y, Niu B, Gao Y, et al. 2010. CD-HIT Suite: a web server for clustering and comparing biological sequences. Bioinformatics, 26(5): 680-682.(1) |
[9] | Kater M M, Franken J, Carney K J, et al. 2001. Sex determination in the monoecious species cucumber is confined to specific floral whorls. Plant Cell, 13(3): 481-493.(1) |
[10] | Kumar S, Blaxter M L. 2010. Comparing de novo assemblers for 454 transcriptome data. BMC Genomics, 11: 571.(1) |
[11] | Lesser M R, Parchman T L, Buerkle C A. 2012. Cross-species transferability of SSR loci developed from transciptome sequencing in lodgepole pine. Mol Ecol Resour, 12(3): 448-455.(1) |
[12] | Li S, Chou H H. 2004. LUCY2: an interactive DNA sequence quality trimming and vector removal tool. Bioinformatics, 20(16): 2865-2866.(1) |
[13] | Li W, Wang X, Li Y. 2011. Stability in and correlation between factors influencing genetic quality of seed lots in seed orchard of Pinus tabuliformis Carr. over a 12-year span. PLoS One, 6(8): e23544.(1) |
[14] | Mathews S, Kramer E M. 2012. The evolution of reproductive structures in seed plants: a re-examination based on insights from developmental genetics. New Phytol, 194(4): 910-923.(1) |
[15] | Morse A M, Peterson D G, Islam-Faridi M N, et al. 2009. Evolution of genome size and complexity in Pinus. PLoS One, 4(2): e4332.(1) |
[16] | Neale D B, Ingvarsson P K. 2008. Population, quantitative and comparative genomics of adaptation in forest trees. Curr Opin Plant Biol, 11(2): 149-155.(1) |
[17] | Nystedt B, Street N R, Wetterbom A, et al. 2013. The Norway spruce genome sequence and conifer genome evolution. Nature, 497(7451): 579-584.(1) |
[18] | Ross S D, Bollmann M P, Pharis R P, et al. 1984. Gibberellin A4/7 and the promotion of flowering in Pinus radiata effects on partitioning of photoassimilate within the bud during primordia diferentiation. Plant Physiology, 76(2): 326-330.(1) |
[19] | Ross S D, Pharis R P. 1987. 3. Control of sex expression in conifers. Plant Growth Regulation, 6(1): 37-60.(1) |
[20] | Schmid M, Davison T S, Henz S R, et al. 2005. A gene expression map of Arabidopsis thaliana development. Nat Genet, 37(5): 501-506.(1) |
[21] | Wang Y Q, Melzer R, Theissen G. 2010. Molecular interactions of orthologues of floral homeotic proteins from the gymnosperm Gnetum gnemon provide a clue to the evolutionary origin of 'floral quartets'. Plant J, 64(2): 177-190.(1) |