文章信息
- 张振, 张含国, 莫迟, 张磊
- Zhang Zhen, Zhang Hanguo, Mo Chi, Zhang Lei
- 红松转录组SSR分析及EST-SSR标记开发
- Transcriptome Sequencing Analysis and Development of EST-SSR Markers for Pinus koraiensis
- 林业科学, 2015, 51(8): 114-120
- Scientia Silvae Sinicae, 2015, 51(8): 114-120.
- DOI: 10.11707/j.1001-7488.20150815
-
文章历史
- 收稿日期:2014-10-09
- 修回日期:2014-12-05
-
作者相关文章
2. 中国林业科学研究院亚热带林业研究所 杭州 311400
2. Research Institute of Subtropical Forestry, CAF Hangzhou 311400
红松(Pinus koraiensis)在我国主要分布于长白山及其北部的张广才岭、老爷岭、完达山和小兴安岭(马建路等,1992),既是优良的用材树种,也是珍贵的食用干果和油料树种。红松为二倍体(2n=24)裸子植物;球果圆锥状卵形,花期6月,雌雄同株,风媒传粉,球果生长期2年,于翌年9—10月成熟。我国具有丰富的红松资源,自20世纪80年代开展红松的遗传改良工作,在分布区内陆续营建初级种子园、子代测定林及改良代种子园,但前期的遗传改良工作主要依据表型选择,生长发育、生态习性等,育种周期较长(张振等,2014;施季森,2012)。遗传标记手段在杂交育种、种质资源保存、新种质挖掘等方面优势明显(Milee et al., 2008),在红松的育种工作中围绕现代分子育种技术已开发出来的分子标记,缺乏共显性的遗传标记,尚不能满足红松分子标记辅助育种的需要。
鉴定试验材料的遗传多样性是研究物种起源进化、发现新的基因资源、改良现有育种材料的基础工作。随着高通量测序技术的发展,EST数据不断增加,不少研究者基于转录组或公共数据库挖掘EST-SSR,在品种鉴定及改良、资源分析、遗传图谱构建、功能基因发掘等方面得到了广泛应用(Yi et al., 2006;Portis et al., 2007;Zhang et al., 2013;杨秀艳等,2011)。简单序列重复(simple sequence repeats,SSRs),又称为微卫星DNA(microsatellite DNA),是一类由1~6个核苷酸串联重复组成的DNA序列(Kalia et al., 2011)。SSR标记具有多态性高、重复性好、共显性、易检测、操作简单等优点,在DNA指纹图谱的构建、遗传多样性分析、基因定位、分子标记辅助育种等方面得到广泛应用(罗冉等,2010)。SSR荧光标记毛细管电泳法是基于DNA测序仪为平台的检测方法,具有高效自动化等技术优势,冯锦霞等(2011)、李雄伟等(2013)、陈雅琼等(2011)、程本义等(2011)分别于杨树(Populus)、桃树(Prunus persica)、烟草(Nicotiana tabacum)、水稻(Oryza sativa)中比较得出,在同一检测成本上,荧光标记技术检测效率高于银染法,结果更为精确灵敏。SSR标记主要包括基因组(gSSR)和表达序列标签SSR(EST-SSR)。表达序列标签直接反映基因的表达信息,EST数据来源于基因的转录区域,其多态性可能与基因功能直接相关,因此,比gSSR标记具有更高通用性(Eujayl et al., 2002;Nicolai et al., 2012)。本实验室利用获得的红松转录组数据,开发EST-SSR标记,同时对其组成、分布及特征进行分析,进一步开发出适用于红松的SSR标记,并以4个种子园的53个自由授粉子代为材料进行EST-SSR遗传变异分析。
1 材料与方法 1.1 材料转录组测序样本为黑龙江省林口县青山林场红松种子园内无性系‘LK15’与无性系‘LK20’的针叶、嫩梢、雌花和球果,液氮速冻后送百迈克基因公司(北京)进行全转录组的Illumina高通量深度测序,共包含41 476条Unigenes。
SSR扩增用的53份红松样本分别来自1979年于黑龙江省苇河、铁力、鹤岗和林口营建的嫁接种子园(表 1),种子园亲本来源:苇河青山为鹤北优树,鹤岗为五营优树,林口青山为当地人工林优树,铁力为五营优树。造林株行距为4 m×6 m,无性系错位排列。每个无性系将采集后的球果晾干、制种,于2013年冬进行催芽处理。
1)样本DNA提取每个无性系选取1个无病虫害的单株嫩苗,采用世阳生物公司新型植物基因组提取试剂盒提取红松基因组DNA,用1%的琼脂糖凝胶电泳检测DNA的质量,-20 ℃保存备用。
2)红松转录组SSR位点的鉴别及SSR引物设计对红松的针叶、嫩梢、雌花和球果的41 476条Unigenes,利用MISA软件(Guo et al., 2010)查找SSR位点。查找标准:二、三、四、五、六核苷酸的最小重复次数分别为6,5,5,5,5次。用Primer5软件进行引物设计。
3)引物筛选与PCR扩增按照SSR引物设计原则,对含1 757个SSR位点的EST序列进行引物设计,舍去引物合成不理想的序列,最终合成101对SSR引物(北京鼎国昌盛生物技术公司),SSR位点包括2~5个核苷酸重复单元。PCR反应体系为25 μL:模板DNA(25 ng·μL-1)2.0 μL,10×PCR buffer 2.5 μL,1 U Taq酶0.5 μL,引物(10 μmol·L-1)各0.5 μL,dNTPs 0.5 μL,ddH2O 18.5 μL。PCR扩增程序: 95 ℃预变性5 min;95 ℃变性30 s,最佳退火温度30 s,72 ℃延伸30 s,35个循环;72 ℃延伸10 min。每个种子园选用1个DNA模板对101对引物进行扩增检验。PCR产物首先采用2%琼脂糖凝胶电泳进行初步检测,舍去无扩增产物的引物,之后在6%变性聚丙烯酰胺凝胶上电泳分离检测。收集扩增产物,送测序验证(上海生工生物工程有限公司)。选择出扩增反应稳定、条带清晰、具有多态性位点的6对引物,进而合成荧光标记引物。PCR扩增后,取1 μL PCR产物,加入8.5 μL去离子甲酰胺、0.5 μL ROX-500分子量内标,95 ℃变性5 min,于4 ℃保温10 min,3 000 r·min-1离心1 min,于ABI3730 DNA分析仪上进行毛细管电泳,并收集数据。
4)数据分析用GeneMapper 4.0软件对收集的原始数据进行分析,系统将各峰值的位置与其泳道中的Rox-500分子质量内标予以比较,读取SSR标记片段大小,按照大写英文字母顺序记录等位基因,即同一位点最大的等位基因记为A,其余等位基因则依次记为B,C,D等,若只有1条峰值,则按照纯合基因型处理。用POPgene1.31软件(Yeh et al., 1999;Nei,1973)统计分析等位基因数(Na)、Shannon信息指数(I),利用PowerMarkerV3.25软件(Liu et al.,2005)计算多态性信息量(PIC)。
2 结果与分析 2.1 红松转录组中SSR位点的数量与分布从红松转录组的41 476条Unigene序列中发现1 757个SSR位点,分布在1 549个Unigene中,发生频率(含有SSR的Unigene数量与总Unigene数量之比)为3.74%,其中,含2个及2个以上的SSR位点的Unigene序列有56条,1 493条序列含1个SSR位点,SSR的分布频率(SSR的个数与总Unigene的数量比)为4.24%,红松转录组序列中平均17.38 kb发现1个SSR位点。红松转录组中SSR种类包括一至五核苷酸重复类型,主要集中在一至三核苷酸重复类型上,占SSR总量的98.68%(表 2)。
红松转录组SSR位点的序列平均长度为13.94 bp,二、三、四、五核苷酸重复的平均长度分别为11.81,14.34,16.37,21.11,20 bp。如图 1所示,重复序列长度10~14 bp最多,达到52.82%,其次为15~18 bp(37.56%),19~22 bp(7.63%),>23 bp(1.94%)。SSR重复单元的重复次数分布在5~24次之间,如图 2所示,5~10次重复的最多,占75.41%。
1 757个SSR位点共包含31种重复基元,其中,一、二、三、四、五核苷酸重复基元分别有4,4,10,9,4种。从出现频率来看,频率较高的前5种重复基元分别为A/T,AT/AT,AGC/CTG,AGG/CCT,AAG/CTT,分别占总SSR位点数的46.1%,10.76%,7.63%,6.66%,6.55%,共占总SSR位点数的77.7%。
2.3 EST-SSR引物筛选与验证参试的101对引物中有21对引物扩增可检测出多态性位点,占引物总数的20.8%。然后利用检测出多态性位点的21对引物,进行PCR扩增,收集扩增产物,测序验证。通过测序验证表明,21对引物扩增出的特异条带中有16对引物(表 3)能够扩增出目标序列,成功率为76.19%。
选取具有多态性的6对引物,合成荧光标记引物,对53个红松无性系DNA进行PCR扩增,用以检测红松种子园无性系的遗传多样性,图 3、图 4为引物P92、P79分别扩增4个模板的毛细管电泳图。采用GeneMapper4.0软件进行数据分析,53个样本在6个SSR位点检测到的遗传变异见表 4,6对引物共检测到18个等位基因,平均每对引物检测到3个等位基因,多态性信息量(PIC)为0.036 3~0.667 4,平均为0.325。根据Botstein等(1980)的理论,有2个标记为低度多态位点(0<PIC<0.25),3个标记为中度多态位点(0.25<PIC<0.5),剩余1个为高度多态位点(PIC>0.5),P63位点PIC最高(0.667 4)。
红松属于基因组序列比较庞大的裸子植物,本研究从红松41 476条Unigene序列发掘出1 757个SSR位点,平均17.38 kb发现1个SSR位点,SSR的分布频率(SSR的个数与总Unigene的数量比)为4.24%,小于杨树(Populus)(14.83%)(张新叶等,2009)、油茶(Camellia)(6.7%)(温强等,2013)等树种,与火炬松(Pinus taeda)(4.32%)(林元震等,2009)、马尾松(Pinus massoniana)(3.62%)(刘公秉等,2009)、日本落叶松(Larix kaempferi)(3.85%)(杨秀艳等,2011)相当。参试的101对引物中有21对引物扩增可检测出多态性位点,占引物总数的20.8%。在对不同树种的研究中,EST中含有SSR重复序列的比例及类型有差异,本研究可扩增出多态性位点的引物重复单元以二、三核苷酸重复为主。由于密码子以三核苷酸为一个功能单位,因此,三核苷酸位移对一个表达基因的阅读框不会造成太大影响,所以在EST序列中发现三核苷酸重复的SSR类型最多,在大多数物种中均以二核苷酸和三核苷酸是最常见的转录组SSR重复单位类型(Varshoey et al., 2002),本研究结果印证了这一点;本研究以三核苷酸重复较多,占SSR总数的34.66%,二核苷酸重复占SSR总数的17.12%。同时验证了低级单元SSR的多态性普遍高于高级单元(Dreisigacker et al., 2004)的推断,因此在设计SSR引物时应侧重于含低级单元的序列。
开发出6对引物用于53个红松子代家系的多态性检测分析,结果表明平均等位基因数为3.0,Shannon信息指数为0.654,多态性信息量(PIC)平均值为0.325,检测基因多样性水平的结果与张悦等(2013)研究红松微卫星标记相似。这些结果说明基于红松转录组序列开发和筛选出的EST-SSR引物可用于红松育种资源的遗传多样性评价。
EST-SSR在构建种质资源遗传多样性评价与保护等研究中具有很大优势,但同时它也存在一定的缺陷,由于EST-SSR来自相对保守的功能基因序列,因此与Genomic SSR标记相比较,EST-SSR标记的多态性较低(Eujayl et al., 2001);SSR分子标记多态性是基于扩增片段中不同的微卫星重复数目产生的,但对于长度相同而由不同碱基重复序列组成的SSR或者长度相近的SSR不能有效加以区分。随着公共数据库中不断增加的EST序列开发新的EST-SSR标记,及基于高通量测序技术更为有效地获得EST序列,有助于增加多态性SSR引物的数量,从而弥补EST-SSR标记本身多态性较低的问题;同时,结合其他分子标记如AFLP,SNP等进行比较研究,可以提高试验的可靠性和准确性。本研究采用ABI3730 DNA分析仪对6对荧光SSR引物所扩增的PCR产物进行毛细管电泳片段分析,克服了聚丙烯酰胺凝胶电泳方法中人工估算片段大小所造成的误差,试验结果更加客观。然而更多了解红松资源之间的遗传信息和遗传关系,还需要使用更多的SSR标记。本项研究印证了利用红松转录组数据开发SSR标记的可行性,同时采用荧光标记技术检测红松自由授粉子代材料,为红松种质资源遗传多样性分析、分子标记辅助育种、遗传图谱构建和功能基因的挖掘等奠定了基础。
[1] |
陈雅琼,李凤霞,李锡坤,等.2011. 烟草SSR荧光标记与毛细管电泳检测技术研究.中国烟草科学,32(2): 66-80. (Chen Y Q,Li F X,Li X K,et al. 2011. Fluorescent detection and capillary electrophoresis in tobacco SSR. Chinese Tobacco Science,32(2): 66-80[in Chinese]).(1) |
[2] |
程本义,夏俊辉,龚俊义,等.2011. SSR荧光标记毛细管电泳检测法在水稻DNA指纹鉴定中的应用.中国水稻科学,25(6): 672-676. (Chen B Y,Xia J H,Gong J Y,et al. 2011. Application of capillary electrophoresis detection with fluorescent SSR makers in rice DNA fingerprint identification. Chin J Rice Sci,25(6): 672-676[in Chinese]).(1) |
[3] |
冯锦霞,张川红,郑勇奇,等. 2011. 利用荧光SSR标记鉴别杨树品种. 林业科学,47(6):167-174. (Feng J X,Zhang C H,Zheng Y Q,et al. 2011. Identification of poplar varieties by SSR markers using capillary electrophoresis with fluorescence detection. Scientia Silvae Sinicae,47(6): 167-174[in Chinese]).(1) |
[4] |
李雄伟,孟宪桥,贾惠娟,等. 2013. 桃品种特异性荧光SSR分子标记数据库构建. 果蔬学报,30(6): 924-932. (Li X W,Meng X Q,Jia H J,et al. 2013. Construction of peach genotype database with fluorescent-labeled SSR markers. Journal of Fruit Science,30(6): 924-932[in Chinese]).(1) |
[5] |
林元震,郭 海,刘纯鑫,等. 2009. 火炬松热胁迫cDNA文库的EST-SSR预测. 华南农业大学学报,30(3):41-44. (Lin Y Z,Guo H,Liu C X,et al. 2009. EST-SSR prediction of heat induced cDNA library of Pinus teada. Journal o f South China Agricultural University,30(3):41-44[in Chinese]).(1) |
[6] |
刘公秉,季孔庶. 2009. 基于松树EST序列的马尾松SSR引物开发. 分子植物育种,7(4): 833-838. (Liu G B,Ji K S. 2009. Designing Pinus massoniana SSR primers from Pinus EST sequences. Molecular Plant Breeding,7(4): 833-838[in Chinese]).(1) |
[7] |
罗 冉,吴委林,张 旸,等. 2010. SSR分子标记在作物遗传育种中的应用.基因组学与应用生物学,29(1): 137-143. (Luo R,Wu W L,Zhang Y,et al. 2010. SSR marker and its application to crop genetics and breeding. Genomics and Applied Biology,29(1): 137-143[in Chinese]).(1) |
[8] |
马建路,庄丽文,陈 动,等. 1992. 红松的地理分布. 东北林业大学学报, 20(5): 40-47. (Ma J L,Zhuang L W,Chen D, et al. 1992. Geographic distribution of Pinus koraiensis in the world. Journal of Northeast Forestry University, 20(5):40-47[in Chinese]).(1) |
[9] |
施季森.2012. 林木生物技术育种未来10年若干科学问题.南京林业大学学报:自然科学版,36(5): 1-13. (Shi J S. 2012. Prospection on some topics of forest genetic improvement through modern biotechnology for the next-ten-years in China. Journal of Nanjing Forestry University: Natural Science Edition,36(5): 1-13[in Chinese]).(1) |
[10] |
温 强,徐林初,江香梅,等. 2013. 基于454测序的油茶DNA序列微卫星观察与分析. 林业科学,49(8): 43-50. (Wen Q,Xu L C,Jiang X M,et al. 2013. Survey and analysis of microsatellites from DNA sequences in Camellia species using 454 pyrosequencing. Scientia Silvae Sinicae,49(8):43-50[in Chinese]).(1) |
[11] |
杨秀艳,孙晓梅,张守攻, 等. 2011. 日本落叶松EST-SSR标记开发及二代优树遗传多样性分析. 林业科学,47(11):52-58. (Yang X Y,Sun X M,Zhang S G,et al. 2011. Development of EST-SSR markers and genetic diversity analysis of the second cycle elite population in Larix kaempferi. Scientia Silvae Sinicae,47(11): 52-58[in Chinese]).(2) |
[12] |
张新叶,宋丛文,张亚东,等. 2009. 杨树EST-SSR标记的开发. 林业科学,45(9):53-59. (Zhang X Y,Song C W,Zhang Y D,et al. 2009. Development of EST-SSR in Populus deltoides and P. euramericana. Scientia Silvae Sinicae,45(9):53-59[in Chinese]).(1) |
[13] |
张 悦,易雪梅,姬兰柱. 2013. 从松属相关物种筛选红松微卫星标记及其种群遗传多样性分析. 生态学杂志,32(9): 2307-2313. (Zhang Y,Yi X M,Ji L Z. 2013. Screening of Pinus koraiensis microsatellite makers from relative species of Pinus and analysis of population genetic diversity. Chinese Journal of Ecology,32(9): 2307-2313[in Chinese]).(1) |
[14] |
张 振,张含国,张 磊,等. 2014. 铁力红松种子园无性系种子形态及营养成分变异研究. 植物研究,34 (3): 356-363. (Zhang Z,Zhang H G,Zhang L,et al. 2014. Variation in nutrition and morphology characters of pine-nut in Korean pine (Pinus koraiensis) seed orchard of Tieli. Bulletin of Botanical Research,34 (3): 356-363[in Chinese]).(1) |
[15] | Botstein D,White R L,Skolnick M,et al. 1980. Construction of a genetic linkage maps in man using restriction fragment length polymorphisms. The American Journal of Human Genetics,32(3):314-331.(1) |
[16] | Dreisigacker S,Zhang P,Warburton M L,et al.2004.SSR and pedigree analyses of genetic diversity among CIMMYT wheat lines targeted to different mega-environments.Crop Science,44(2): 381 -388.(1) |
[17] | Eujayl I,Sorrells M,Baum M,et al.2001.Assessment of genotypic variation among cultivated durum wheat based on EST-SSRs and genomic SSRs.Euphytica,119(12): 39 -43.(1) |
[18] | Eujayl I,Sorrells M,Banm M,et al. 2002. Isolation of EST-derived microsatellite markers for genotyping the A and B genomes of wheat. Theor Appl Genet,104(2): 399 -407.(1) |
[19] | Guo S,Zheng Y,Joung J G,et al. 2010. Transcriptome sequencing and comparative analysis of cucumber flowers with different sex types. BMC Genomic,11: 384 -391.(1) |
[20] | Kalia R,Rai M,Kalia S,et al. 2011. Microsatellite markers: an overview of the recent progress in plants.Euphytica,177(3): 309 -334.(1) |
[21] | Liu K J,Muse S V.2005.Powermarker: Integrated analysis environment for genetic marker data.Bioinformatics,21(9): 2121-2129.(1) |
[22] | Milee A,Neeta S,Harish P. 2008. Advances in molecular marker techniques and their applications in plant sciences. Plant Cell Rep,27(4): 617 -631.(1) |
[23] | Nei M.1973.Analysis of gene diversity in subdivided populations.Proceedings of the National Academy of Sciences of the United States of America,70(12): 3321 -3323.(1) |
[24] | Nicolai M,Pisani C,Bouchet J P,et al.2012.Discovery of a large set of SNP and SSR genetic markers by high-throughput sequencing of pepper (Capsicum annuum).Genetics and Molecular Research,11(3): 2295 -2300.(1) |
[25] | Portis E,Nagy I,Sasvri Z,et al.2007.The design of Capsicum spp. SSR assays via analysis of in silico DNA sequence,and their potential utility for genetic mapping.Plant Science,172(3): 640 -648.(1) |
[26] | Varshoey R K,Thiel T,Stein N,et al.2002.In silico analysis on frequency and distribution of microsatellites in ESTs of some cereal species.Cell Mol Biol Lett,7(2A): 537 -546.(1) |
[27] | Yeh F C,Yang R C,Boyle T.1999.POPGENE(Version 1. 31): Microsoft Window-based freeware for population genetic analysis.University of Alberta and the Centre for International Forestry Research.(1) |
[28] | Yi G,Lee J M,Lee S,et al.2006.Exploitation of pepper EST-SSRs and an SSR-based linkage map. TAG Theoretical and Applied Genetics,114(1): 113 -130.(1) |
[29] | Zhang Z,Zhang H G,Du J,et al.2013.RAPD and SSR analysis of genetic diversity of natural Larix gmelinii populations. Biotechnology & Biotechnological Equipment,27(4): 3959 -3965.(1) |