工作空间

文章信息

王平, 王春语, 张丽霞, 丛玲, 朱振兴, 陆晓春
利用重测序技术开发高粱多态性SSR分子标记
生物技术通报, 2019, 35(11): 217-223

WANG Ping, WANG Chun-yu, ZHANG Li-xia, CONG Ling, ZHU Zhen-xing, LU Xiao-chun
Development of SSR Molecular Markers with Sorghum Polymorphism Using Re-sequencing
Biotechnology Bulletin, 2019, 35(11): 217-223

文章历史

收稿日期:2019-08-02

利用重测序技术开发高粱多态性SSR分子标记
王平1,2, 王春语1, 张丽霞1, 丛玲1, 朱振兴1, 陆晓春1     
1. 辽宁省农业科学院 高粱研究所,沈阳 110161;
2. 沈阳农业大学农学院,沈阳 110161
摘要:SSR分子标记由于具有成本低廉、容易操作等特性,使其在分子标记辅助育种中广泛应用。目前高粱SSR标记多基于测序已经完成美国高粱品种BTX623基因组开发,在应用中筛选多态性标记的效率低。对不育系和恢复系组成的26个高粱材料进行了重测序,然后进行生物信息学分析,最终开发了在26份材料中至少含有2种多态型的SSR标记24 441个。这些SSR标记在26份材料中表现出的基因型多态类型在2-7种之间,2种的有16 694个,7种的仅有77个。另外本研究还进行了筛选单拷贝基因处的多态性SSR分析,共筛选到6 733个。随机挑选均匀覆盖10条染色体的单拷贝基因处SSR标记50对,利用辽宁高粱杂交种辽糯3号进行测试,其中49对能扩增出产物,成功率高达98%。其后利用2个品种和74份微核心种质资源测试表明,50对SSR标记在2个品种中有18对表现出多态性,挑选了一对引物在74份微核心种质中可见8种多态型。本研究表明利用不育系和恢复系材料进行重测序能有效开发多态性高的SSR标记。
关键词高粱    SSR    重测序    多态性引物    分子标记    
Development of SSR Molecular Markers with Sorghum Polymorphism Using Re-sequencing
WANG Ping1,2, WANG Chun-yu1, ZHANG Li-xia1, CONG Ling1, ZHU Zhen-xing1, LU Xiao-chun1     
1. Sorghum Research Institute, Liaoning Academy of Agricultural Sciences, Shenyang 110161;
2. Agronomy College, Shenyang Agricultural University, Shenyang 110161
Abstract: SSR marker is widely applied in molecule-assisted breeding due to its low cost and easy operation. Currently, sorghum SSR marker is based on sequencing, and although the genome sequence of American sorghum BTX623 is completed, the efficiency is low in screening polymorphism markers in applications. In this study, 26 sorghum materials composed of sterile lines and restorer lines were re-sequenced and analyzed by bioinformatics, and 24 441 SSR markers containing at least 2 polymorphic types in 26 materials were developed. These SSR markers generated 2-7 genotypes in 26 sorghum varieties, including 16 694 markers for 2 genotypes and only 77 markers for 7 genotypes. In addition, 6 673 polymorphic SSRs at the single-copy gene were screened. Fifty pairs of SSRs on the 10 evenly-covered sorghum chromosomes were randomly selected as bridge markers, and Liaoning sorghum hybrid Liaonuo 3 was used for test. Among them, 49 pairs of primers were amplified, the success rate of which achieved 98%. Subsequent test with 2 sorghum varieties and 74 mini-core germplasm showed that 18 pairs of SSR markers among 50 pairs of SSRs presented polymorphism between the 2 varieties. One selected SSR marker generated 8 genotypes in 74 mini-core germplasm. This study demonstrates that re-sequencing sterile lines and restorer lines may effectively develop SSR markers for Chinese sorghum breeding.
Key words: sorghum    SSR    re-sequencing    polymorphic primer    molecular marker    

高粱是世界上重要的粮食作物,是五大作物之一,在人类发展史上扮演了重要角色[1]。随着分子生物学以及生物信息学的发展,越来越多的重要基因被克隆出来,使得分子育种技术迅速发展。分子育种技术以及基因图位克隆的深入发展,都离不开分子标记的开发。分子标记技术发展至今,已经经历过几代分子标记的历程,从AFLP,SSR标记发展到今天的SNP标记[2-4]。尽管SNP标记在很多地方已经利用起来,但是SNP标记利用需要用到一些特殊仪器设备,这些设备价格不菲,如利用KASP系统,仪器昂贵[5];或是利用酶切方法开发CAPS标记或是dCAPS标记,酶切的方法成本高,分辨率低,酶切不完全等问题,经常会对实验造成一些困扰[6]。虽然还有其他检测SNP的方法,但总体操作相对复杂,核心问题是SNP标记仅有两种多态型,以上这些因素都限制了SNP的应用。而SSR标记即短序列重复微卫星标记,因其开发价格低廉,使用门槛很低,多态性好而且稳定等原因在现阶段的实践中有很大的运用空间[3]。测序技术的飞跃发展,使得高通量测序成本日益降低,在科研中发挥越来越重要的作用[7-8]。利用高通量测序技术在很多物种中进行了SSR分子标记的开发和应用,大多使用转录组测序的数据,如在芝麻、豌豆、苏丹草及马尾松等作物中都用到RNA-Seq数据开发SSR标记[9-12]。因转录组测序通量、基因时空表达以及仅限基因区域序列等因素影响造成开发的SSR标记产量小,质量不高。尽管美国高粱品种BTX623在2009年就完成了基因组测序[13],也预测了很多SSR标记[14-15],但越来越多的研究表明很多参考基因组仅能代表一部分生态型的多样性,这也是泛基因组学研究兴起的重要原因[16-17]。来源于美国种质的BTX623仅能代表部分生态型品种的序列,而且在国内高粱育种中使用的很多资源与BTX623有较大的差异,造成SSR标记的开发在基因组一些区域的多态性标记开发效率低下,极大限制了高粱SSR分子标记的应用。

为了有效开发多态性SSR标记,本研究利用26个包括不育系和恢复系的材料,然后进行重测序。测序完成后,利用生物信息分析工具开发SSR标记,进行一系列分析后最终开发了两万多个SSR标记,并部分验证了SSR标记的多态性,这些标记的成功开发,为将来基因定位、克隆、分子育种等实践提供了重要的分子标记信息。

1 材料与方法 1.1 材料

重测序实验材料:高粱生产骨干亲本:12份恢复系和14份不育系(表 1)。所有实验材料于5月上旬在沈阳实验基地种植,行长4 m,株距15 cm。

表 1 12份恢复系和14份不育系样品信息
1.2 方法 1.2.1 分子标记开发过程

生物信息学分析流程如下:对12份恢复系和14份不育系高粱材料进行了10×重测序,然后从两个途径同时进行数据分析。利用高通量测序数据中分析变异信息的软件GATK(Genome Analysis ToolKit)算法分析全基因组indel差异,另一方面利用BTX623参考基因组和简单重复序列鉴定软件MISA(MIcroSAtellite identification tool)分析全基因组SSR位点信息,然后综合比较得到全基因组SSR差异位点信息,而后进行单拷贝基因的分析,综合SSR差异位点分析,依据SSR标记重复单元碱基数进行分析,然后依据两端保守序列进行引物的设计开发。引物设计利用Primer 3软件,遵循引物设计原则设计正反向扩增引物,引物的GC含量在50%-60%之间,长度在18-23 bp左右,退火温度设在57-63℃之间,以58℃为最佳。设计时避免3'末端碱基为A,以及潜在二级结构的产生。将挑选要进行合成的引物,送往苏州金唯智公司合成(https://www.genewiz.com.cn)。

1.2.2 DNA提取

实验材料开始抽穗时剪取叶片1-2 cm到2 mL离心管中,然后加入600 μL TPS(100 mmol/L Tris-HCl(pH 8.0),10 mmol/L EDTA(pH8.0),1 mol/L KC,高压湿热灭菌后使用)提取液;放入一个不锈钢珠(直径约5 mm),在组织磨样机(Tissuelyser Ⅱ,QIAGEN,德国)上研磨,频率设定为20/s,研磨1-2 min;利用强力磁铁取出钢珠,将离心管放入65℃水浴中保温30 min;12 000 r/min离心5 min,小心吸出上清液转移至新的1.5 mL离心管,加入等体积的异丙醇,轻轻颠倒混匀,12 000 r/min离心10 min,弃上清。加入1 mL 70%乙醇洗涤沉淀,12 000 r/min离心5 min,弃上清,留沉淀,打开管盖,待沉淀完全干燥后加入50 μL包含0.2 mg/mL Rnase A(生工生物工程有限公司,上海,中国)的灭菌水或是1×TE buffer溶解沉淀。提取的高粱叶片基因组DNA在0.8%-1.0%琼脂糖电泳检测合格后保存于-20℃冰箱备用。

1.2.3 SSR电泳分析

PCR及聚丙烯酰胺凝胶电泳:高粱基因组DNA 1 µL,F/R-primer(10 µmol/L)0.2 µL,2×Taq PCR Master Mix 5 µL(北京艾德莱生物),ddH2O 3.8 µL总体积10 µL;反应在PCR仪上(T100 Thermal cycler,BIO-RAD,美国)进行扩增,PCR扩增程序如下:95℃预变性3 min;94℃ 30 s、X℃ 30 s、72℃ 25 s,34个循环,最后72℃延伸5 min;其中退火温度X随引物设计适度调整。PCR产物取2-2.5 µL用6%非变性聚丙烯酰胺凝胶电泳1.5-2.0 h左右(根据差异大小来决定电泳时间)。电泳结束后,关闭电源,从电泳槽中将胶板取下,用铲子将两板分开,缓慢将胶取下,并记录胶的顺序编号,经银染、显色、水洗等程序获得扩增条带,然后在灯箱板上进行胶片的拍摄(EOS 5D,Canon,日本)。

2 结果 2.1 26份重测序材料多态性SSR标记筛选

利用高粱中26份具有代表性的不育系和恢复系材料,进行重测序序列分析。重测序完成后,进行SSR标记的筛选,为考虑将来SSR分子标记检测的便利性,本研究制定了比较严格的筛选标准。SSR筛选标准如下所示:(1)两碱基单元重复SSR标记的重复次数需≥6次重复,即这个SSR标记长度必须在12 bp以上;三碱基重复序列SSR重复次数≥5次;四碱基重复序列SSR的重复次数≥4次;五碱基重复序列SSR的重复次数≥3;六碱基重复序列SSR的重复次数≥3次。(2)在所有26个高粱品种中要有多态性,至少是两种。经过了本研究的标准筛选,共得到24 441个多态性SSR,以2或是3个基序重复的SSR为主,两碱基重复SSR标记11 051个;三碱基重复6 082个;四碱基重复2 600个;五碱基重复2 449个;六碱基重复2 259个(图 1-A)。对筛选到的SSR标记在26个品种间进行基因型比较,基因型多态类型在2-7种之间,最多能达到7种多态型,大部分的标记仅有两种,然后多态性数目呈断崖式下降,以2种多态性的为主,高达68%;其次是3种多态型的占21%;而其它几种多态型就相对较少分布,7种多态型的标记仅有77个(图 1-B)。

图 1 不同重复单元碱基数的SSR标记的数量(A)及其在26个品种间的不同多态型标记数量(B)
2.2 单拷贝基因处多态性SSR分子标记的筛选

在分子育种实践中,功能性标记起到至关重要的作用。功能性标记,主要是位于基因位置上的标记,而一般这样的基因,几乎都是单拷贝基因。所以本研究的策略是筛选在单拷贝基因位置的SSR标记。本研究筛选首先是进行单拷贝基因的鉴定,然后分析这些单拷贝基因(包含该基因上下游)序列中所包含的SSR序列,筛选位于单拷贝基因(含上下游2 k)内的多态性SSR标记。相对所有的SSR标记数量,位于基因区标记的SSR数量,仅为总量的1/4左右,总计筛选到6 733个标记。2-3个基序重复的SSR标记,仅有2 000左右,而4-6重复的SSR标记,约700-800个(图 2-A)。大部分的单拷贝基因上SSR标记在26个品种仅有2种基因型,占了总SSR的69%;其次为3种基因型占总数的20%,4-7种基因型的SSR标记比较少,7种基因型的SSR标记仅为28个(图 2-B)。

图 2 单拷贝基因处不同重复单元碱基数的SSR标记数量(A)和26个品种间不同多态型标记数量(B)
2.3 单拷贝基因处多态性SSR分子标记在基因上位置分析

通过分析这些SSR标记在基因上的位置,6 733个SSR标记中,位于编码区的仅有820个,UTR区1 276个,内含子725个,大多在上下游区域共3 932个。如在2个基序重复的SSR中,占有63%,而分布在编码区多为3碱基或6碱基重复(图 3-A)。这些SSR标记在26个品种间的基因型数,可以看出在基因上下游区域的SSR标记居多,位于基因编码区的最少,约占所有在编码区附近的12%。大多数SSR在26个高粱品种有两种基因型,依次递减到7种多态型(图 3-B)。

图 3 位于单拷贝基因上不同重复单元碱基数的SSR标记位于基因不同位置的数量(A)及其在26个品种间的多态型数目(B)
2.4 SSR标记有效性评价

为了检测开发SSR标记的有效性,本研究在位于编码区约800个SSR标记引物中,在每条染色体上挑选了5对相对均一覆盖整条染色体的SSR标记,在10条染色体上进行了引物的挑选、合成,共计50对引物,引物相关信息如表 2所示。为了检验引物的实用性,利用了参考基因组高粱材料BTX623和杂交种辽糯3号,因为本研究在育种实践中很多时候利用的是杂交种材料。在50对引物中,两个材料中仅有一对引物未扩增出产物(Chr6-3两个亲本间无扩增),引物成功率高达98%,另有两对引物仅能在一个材料中进行扩增;另一个材料显示无扩增产物(Chr2-3,Chr2-5都是在BTX623中无扩增,在辽糯3中能正常扩增),最终显示有18对引物在这两个亲本间存在多态性。

表 2 分布于10条染色体上的50对SSR引物信息

为进一步检验该批引物的质量,本研究同时挑选了引物Chr1-1,分析其在74份核心种质资源中的多态性丰富程度。该引物在BTX623中扩增的产物的大小,应该是266 bp,扩增产物中较浓的条带,大小基本符合预期,该条带即是目标条带。条带大小比对分析表明,该标记在74份核心种质资源中至少有8种多态型,标记Chr1-1具有比较高的分辨能力(图 4)。

B:高粱品种BTX623;阿拉伯数字:微核心高粱种质编号;罗马数字:不同的多态型;M:DNA分子量pBR322 /MspI Marker 图 4 引物Chr1-1在74份高粱微核心种质资源中多态性分析
3 讨论

SSR分子标记因其价廉物美,仪器设备要求不高、多态性好、实践中可操作性强等特点,一直是分子标记领域的热门开发方向[3, 18-19]。近年来,由于高通量测序技术的发展,成本日益降级,利用高通量测序开发分子标记,越来越高效和便捷。在很多研究中利用转录组数据开发SSR标记,由于转录组数据本身的缺陷,如测序主要是基因转录区段,很多基因具有时空表达,于是会漏掉很多基因组序列信息,造成开发多态性SSR标记效率并不高[9-12]

在高粱作物中尽管BTX623的基因组序列在2009年已经完成[13],Yonemaru等[15]利用该基因组序列开发多态性SSR标记,共获得5599个非冗余SSR标记,其中(AT/TA)n占所有SSR的26.1%,其次是(AG/TC)n占20.5%、(AC/TG)n占13.7%和(CG/GC)n占11.8%。其中5012个SSR标记染色体位置是通过e-PCR技术与34 008个基因座的预测位置进行比较来确定的。在通过片段分析验证的970个标记中,67.8%(970个标记中的658个)的标记成功地在高粱品系BTx623中扩增,在11个高粱品系和一个苏丹草品系的组合中,所有SSR基因座的平均多态性率为45.1%(658个标记中的297个)。BTX623来源于美国,其基因组序列仅能代表部分生态型品种的序列,国内高粱育种中使用的很多资源与BTX623有较大的差异,且遗传范围狭窄,造成SSR标记的开发在基因组一些区域的多态性标记开发效率低下,极大限制了高粱SSR分子标记在国内高粱育种上的应用。

为了能开发多态性高的SSR标记,本研究利用实验室先前进行了26份不育系和恢复系材料重测序,利用这26份材料的重测序数据进行SSR标记的开发,有效提高了多态性标记开发的力度和效率。本研究设计开发的50对SSR引物在两个亲本BTX623和杂交种辽糯3中进行扩增,有49对成功扩增出条带,其中有两对引物仅在辽糯3号中能够扩增,表明很有可能某些基因组区域在BTX623中是缺失的,仅存在国内某些高粱材料中。50对引物在这两个品种中有多态性的SSR标记为36%,并挑选了SSR标记Chr1-1在74份微核心种质资源中进行分析,初步分析该标记在这些种质资源中有8种多态型之多,表明从开发的SSR标记中容易筛选出多态性好的标记。

本研究开发的SSR分子标记是以26份材料中必须至少有两种多态型作为筛选标准。在这些入选的SSR标记中,大部分入选的SSR标记都是以2个碱基基序为重复单元的分子标记,3个以上碱基重复的达到6 082,26个品种中多态性超过2种的有24 441,分布在单拷贝基因上SSR标记占总标记数1/4,分布单拷贝基因编码区的标记占落在单拷贝基因上的12%。这些标记类型和特点为高粱基因定位、克隆以及分子育种等分子标记的开发提供了可靠的参考数据。

4 结论

利用14个不育系和12个恢复系作为重测序材料,开发了在26份材料中至少含有2种多态型的SSR标记24 441个单拷贝基因处的多态性SSR 6 733个。随机挑选均匀覆盖10条染色体的单拷贝基因处SSR标记50对,利用辽宁高粱杂交种辽糯3号进行测试,其中49对能扩增出产物,成功率高达98%,利用高粱杂交种辽糯3号、BTX623和74份微核心种质资源测试表明,50对SSR标记在2个品种中有18对表现出多态性,挑选了一对引物在74份微核心种质中可见8种多态型。本研究表明利用不育系和恢复系材料进行重测序能有效开发多态性高的SSR标记。

参考文献
[1]
卢庆善, 邹剑秋, 朱凯, 等. 试论我国高粱产业发展-一论全国高粱生产优势区[J]. 杂粮作物, 2009, 29(2): 78-80. DOI:10.3969/j.issn.2095-0896.2009.02.007
[2]
Kraft T, Hansen M, Nilsson NO, et al. Linkage disequilibrium and fingerprinting in sugar beet[J]. Theoretical and Applied Genetics, 2000, 101(3): 323-326. DOI:10.1007/s001220051486
[3]
Ellegren H. Microsatellites:simple sequences with complex evolution[J]. Nature Reviews Genetics, 2004, 5(6): 435-445. DOI:10.1038/nrg1348
[4]
Paran I, Michelmore RW. Development of reliable PCR-based markers linked to downy mildew resistance genes in lettuce[J]. Theoretical and Applied Genetics, 1993, 85(8): 985-993. DOI:10.1007/BF00215038
[5]
Semagn K, Babu R, Hearne S, et al. Single nucleotide polymorphism genotyping using Kompetitive Allele Specific PCR(KASP):overview of the technology and its application in crop improvement[J]. Molecular Breeding, 2014, 33(1): 1-14. DOI:10.1007/s11032-013-9917-x
[6]
Neff MM, Neff JD, Chory J, et al. dCAPS, a simple technique for the genetic analysis of single nucleotide polymorphisms:experimental applications in Arabidopsis thaliana genetics[J]. Plant Journal, 1998, 14(3): 387-392. DOI:10.1046/j.1365-313X.1998.00124.x
[7]
Wang Z, Gerstein M, Snyder M, et al. RNA-Seq:a revolutionary tool for transcriptomics[J]. Nature Reviews Genetics, 2009, 10(1): 57-63. DOI:10.1038/nrg2484
[8]
Bentley DR. Whole-genome re-sequencing[J]. Current Opinion in Genetics & Development, 2006, 16(6): 545-552.
[9]
Zhang H, Wei L, Miao H, et al. Development and validation of genic-SSR markers in sesame by RNA-seq[J]. BMC Genomics, 2012, 13(1): 316-316. DOI:10.1186/1471-2164-13-316
[10]
Hao X, Yang T, Liu R, et al. An RNA Sequencing Transcriptome Analysis of Grasspea(Lathyrus sativus L.)and Development of SSR and KASP Markers[J]. Frontiers in Plant Science, 2017.
[11]
Zhu Y, Wang X, Huang L, et al. Transcriptomic Identification of Drought-Related Genes and SSR Markers in Sudan Grass Based on RNA-Seq[J]. Frontiers in Plant Science, 2017.
[12]
梅利那, 范付华, 崔博文, 等. 基于马尾松转录组的SSR分子标记开发及种质鉴定[J]. 农业生物技术学报, 2017, 25(6): 991-1002.
[13]
Paterson AH, Bowers JE, Bruggmann R, et al. The Sorghum bicolor genome and the diversification of grasses[J]. Nature, 2009, 457(7229): 551-556. DOI:10.1038/nature07723
[14]
Menz MA, Klein RR, Mullet JE, et al. A high-density genetic map of Sorghum bicolor(L.)Moench based on 2926 AFLP®, RFLP and SSR markers[J]. Plant Molecular Biology, 2002, 483-499.
[15]
Yonemaru J, Ando T, Mizubayashi T, et al. Development of genome-wide simple sequence repeat markers using whole-genome shotgun sequences of sorghum(Sorghum bicolor(L.)Moench)[J]. DNA Research, 2009, 16(3): 187-193. DOI:10.1093/dnares/dsp005
[16]
Zhao Q, Feng Q, Lu H, et al. Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice[J]. Nat Genet, 2018, 50(2): 278-284. DOI:10.1038/s41588-018-0041-z
[17]
Li Y, Zhou G, Ma J, et al. De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits[J]. Nature Biotechnology, 2014, 32(10): 1045-1052. DOI:10.1038/nbt.2979
[18]
Sharopova N, Mcmullen MD, Schultz L, et al. Development and mapping of SSR markers for maize[J]. Plant Molecular Biology, 2002, 48(5): 463-481.
[19]
Ravi M, Geethanjali S, Sameeyafarheen F, et al. Molecular marker based genetic diversity analysis in rice(Oryza sativa L.)using RAPD and SSR markers[J]. Euphytica, 2003, 133(2): 243-252. DOI:10.1023/A:1025513111279