中国生物工程杂志  2017, Vol. 37 Issue (2): 111-120

文章信息

梁士博, 刘佳莹, 刘杰, 杨江涛, 李集临, 张延明.
LIANG Shi-bo, LIU Jia-ying, LIU Jie, YANG Jiang-tao, LI Ji-lin, ZHANG Yan-ming.
NGS技术在作物基因组研究中的应用
Next-generation Sequencing Applications for Crop Genomes
中国生物工程杂志, 2017, 37(2): 111-120
China Biotechnology, 2017, 37(2): 111-120
http://dx.doi.org/DOI:10.13523/j.cb.20170216

文章历史

收稿日期: 2016-11-25
修回日期: 2017-01-08
NGS技术在作物基因组研究中的应用
梁士博 , 刘佳莹 , 刘杰 , 杨江涛 , 李集临 , 张延明     
哈尔滨师范大学生命科学与技术学院 黑龙江省分子细胞遗传与遗传育种重点实验室 哈尔滨 150025
摘要: 新一代测序技术(Next-generation sequencing,NGS)在阐明复杂和高度重复的基因组结构,DNA序列与基因组结构变异同重要农艺性状之间的关系等方面具有重要作用。从NGS系统的开发与作物基因组测序,NGS与转录组分析,NGS与全基因组关联图谱,及SNPs开发与预测育种等方面,综述了NGS技术在作物基因组研究中的应用,可为作物基因组研究提供理论基础。
关键词: 新一代测序     转录组     单核苷酸多态性     作物基因组    
Next-generation Sequencing Applications for Crop Genomes
LIANG Shi-bo , LIU Jia-ying , LIU Jie , YANG Jiang-tao , LI Ji-lin , ZHANG Yan-ming     
Key Laboratory of Molecular Cytogenetics and Genetic Breeding of Heilongjiang Province/College of Life Science and Technology, Harbin Normal University, Harbin 150025, China
Abstract: Next-generation sequencing technology plays an important role in elucidating the complex and highly repetitive genome structure, and the relationship between DNA sequence and genomic structural variation with the important agronomic traits. The NGS technology in crop genome research, including the development of the crop genome sequencing NGS technology, NGS and the transcriptome analysis, genome-wide association map and NGS, SNPs development and forecasting breeding, etc.were reviewed. It aims to provide a theoretical basis for crops genomic research.
Key words: Next-generation sequencing     Transcription     Single nucleotide polymorphisms     Crop genomes    

DNA测序技术在推动遗传学和基因组学发展的同时,也正在经历一场革命。虽然传统的Sanger测序仍然流行,但现在多数的DNA和表达基因序列数据来自于新一代测序技术 (Next-generation sequencing,NGS)。NGS通常是指第二代和第三代测序技术。这两者的平台比第一代Sanger测序技术具有更好的能效比和更高的通量性。NGS技术的空前发展为科学家深入了解作物基因组提供了有效途径,也为作物遗传育种提供了令人兴奋的新机遇[1-3]。在作物中,近期的绝大多数基因组测序工作都已采用第二代光学测序平台[3-5]。测序成本的大幅降低和系统规模的快速增加[6],使DNA测序技术更加便捷,功能更加强大,甚至可以通过高通量分析庞大复杂的作物基因组。随着NGS技术的不断深入,产生的大量数据对生物信息学分析提出了新的要求,使得用于查询和分析测序数据的工具越来越多[7-8]。NGS技术不仅有助于我们理解复杂作物基因组的起源和结构,并且可通过识别和利用有价值的遗传多样性,来进行基因分析、性状剖析和作物育种。本文将从作物基因组测序,转录组分析,全基因组关联图谱及SNPs开发与预测育种等方面,综述NGS技术在作物基因组研究中的应用进展。

1 NGS技术与作物基因组测序 1.1 NGS系统的开发

第一个开发的商用NGS系统是Roche公司推出的454系统 (商用名为GS20),它属于循环阵列合成测序。该系统利用大规模矩阵结构的微阵列分析技术,通过DNA聚合酶或连接酶及引物对模板进行一系列的延伸,采用显微技术观察记录连续测序循环中的光学信号来实现测序[9]。454系统经数次升级后,目前最新的GS FLX序列分析仪配合Titanium系列测序试剂可具有更高的测序通量 (400Mb每反应),及更广泛的灵活性和准确性。该系统不仅保持了新一代测序技术中运行速度最快 (3~5天) 和最高单序列读长 (400 bp) 的优势,而且达到单一读长的准确性超过99.5%,完整测序结果准确性大于99.99% (http://www.454.com)。此外,2011年来自Illumina公司的测序产品MiSeq以其性价比高、操作界面友好、数据产出易于分析等特点而受到关注,该测序仪升级后读长能达400bp,质量可达Q30,数据产出7G,运行时间23小时。如其配置Nextera文库制备试剂盒,可以在90分钟内完成建库工作。目前,MiSeq系列产品已升级到了HiSeq 2500,其突出优点是通量极高,一次运行可输出600G数据,运行时间也延长到了11天,堪称“工厂化测序”。因此适用于任何高通量测序。不过该系统读长较短,约为180bp,并且准确度也较Roche 454差。另一个重要的测序系统为ABI公司研发的SOLiD (Sequencing by Oligonucleotide Ligation and Detection) 系统。该系统所使用的测序技术可简单概括为连接测序法 (Sequencing by Ligation),它能够对链接成珠粒的克隆扩增DNA片段进行平行测序。该系统在进行SNP发现时,可对读取参数进行比较,同时具有内部检错功能。目前ABI公司已推出了5500系列基因分析系统,该系统每天最多可产出30G的数据量,准确率达Q20以上,但片段较短,一般在50~100bp之间。从当前应用来看ABI SOLiD没有Roche 454和Illumina Solexa测序应用范围广泛,主要原因是没有明显的优势,其读长不及Solexa,更比不上454(表 1),数据产出也远无法和Solexa相比。

表 1 新一代测序技术的比较[10] Table 1 Comparison of next-generation sequencing technology
平台 454’s GS
FLX Titanium
Illumina Miseq Illumina Solexa’s
HiSeq2500
Life/APG’s
SOLiD5500xl
Heliscope/Helicos
Genetic Analysis System
SMRT PacBio
RS I1
纳米孔单分子
化学原理 焦磷酸测序 边合成边测序 边合成边测序 边连接边测序 边合成边测序/DNA聚合酶 边合成边测序/DNA聚合酶 电信号测序/核酸外切酶
PCR扩增
读长 (bp) 700 2×300 700 75 11 000 4 600~20 000 5000
运行 (d) 0.96 8 6 6 8 1.7 -
数据量 (Gb/次) 0.7 3-6 1000 30 1 3.2 -
错误率 0.5% > 0.1% 2% > 0.01% - 15% 0.2%
花费 (美元/运行) 6 200 99 000 30 000 10 000 965 000 4 800 1 000
Note:The reference of table 1 are from http://www.454.com; http://www.illumina.com; http://www.appliedbiosystems.com

单分子DNA测序技术是近10年发展起来的新一代测序技术,也称为第三代测序技术。最具代表性的有Heliscope单分子测序技术、单分子实时合成测序技术和纳米孔测序技术等。

2008年,Helicospe公司采取新的单分子DNA测序技术成功重测了M13病毒的基因组。首先在DNA分子3′端加上poly (A) 后,直接以单链的形式结合在特制的玻璃表面,形成单分子阵列 (Array),然后依次加入标记不同荧光的核苷酸,在DNA聚合酶的作用下,核苷酸配对到相应的模板上,激发出荧光,被机器采集后读出序列。这种测序技术同Solexa和454比较类似,但它突破了建库扩增的限制。尽管其初始读长只有23bp,但其成本却远低于第二代测序。

单分子实时合成测序技术 (Single-molecule Real-Time Sequencing, SMRT) 由Pacific Biosciences公司开发,是指当DNA模板被聚合酶捕获后,不同荧光标记的dNTP通过布朗运动随机进入检测区域并与聚合酶结合,与模板匹配的碱基生成化学键的时间远远长于其他碱基停留的时间。因此统计荧光信号存在时间的长短,可区分匹配的碱基与游离碱基。通过统计4种荧光信号与时间的关系图,即可测定DNA模板序列。该技术测序长度可达100 000bp (表 2)。

表 2 第三代测序平台比较 Table 2 The comparison of third-generation sequencing platform
No Sequencing method Company Methods/enzyme Sequencing length
1 Heliscope/HelicosGenetic Analysis System Helicos Sequencing-by-synthesis / DNA polymerase 30~35bp
2 SMRT Pacific Biosciences Sequencing-by-synthesis / DNA polymerase 100 000bp
3 Single-molecule nanopore Oxford Nanopore Electrical signal sequencing / exonuclease Infinite

纳米孔测序技术 (Single-molecule nanopore) 是利用不同碱基在通过纳米小孔时引起的静电感应的不同,或者不同碱基通过小孔的能力的差异,来区分不同的碱基信号[11]。类似电泳,即DNA分子的单核苷酸在外切酶的作用下,逐一被切除,单核苷酸落入直径非常小的纳米孔 (Nanopore) 内,由于这种孔的直径限制了核苷酸只能单一地通过,当顺序切割掉的单核苷酸一次通过纳米孔时,会产生不同的电流变化,根据这种变化就可推测出DNA的序列信息。该技术测序长度没有限制。

另外,一个较新的NGS技术是Life Technologies公司的离子激流技术 (Ion Torrent)。该技术是使用由高密度阵列反应室构成的微半导体 (http://www.iontorrent.com),产生100~200bp的序列读取,每次运行可达1Gbp数据。在测序反应中,四种DNA核苷酸分别流动地穿过微反应室,当一个碱基中的氢离子被释放时,系统通过记录pH值变化的顺序完成测序。该数据的误差是偏向均聚物误差,第一个100bp具有98.897%碱基精度[12],该技术在重测序和发现变异的成本效益方面具有显著潜力。

1.2 作物基因组测序

利用NGS平台重新测序,建立可行的参考基因组集合,是发现DNA序列变异的关键。2002年,水稻第一个公布基因组测序结果[13-14]。随后,一系列作物基因组序列的测序结果被公布,如:2009年公布玉米基因组序列[15],2012年公布大麦基因组序列[16],2013年公布面包小麦的A、D基因组供体Triticum urartuAegilops tauschii的序列[17-18],2014年公布面包小麦基因组序列草图[19-20]。在大麦、玉米、水稻和小麦这四种作物中,玉米基因组 (2.3Gbp) 具有大量增殖的长末端重复反转录转座子,是首先公布的大作物基因组[21]。通过对遗传多样的玉米品系中基因部分区段进行重测序,Gore等[22]创制了单倍型图谱,它为研究DNA序列变异同重要农艺学性状表型变异的关系提供了基础。玉米重测序还首次证明在多样的同种作物品种间,DNA序列和基因组结构存在着巨大差异[23]。而大豆基因组 (1.1Gbp) 则是两个古老基因组发生重组,随后经过广泛的基因多样化、基因缺失和染色体重排而形成,已通过全基因组鸟枪法完成测序[24]。此外,通过破译测序纯合双单体马铃薯克隆,完成了马铃薯基因组 (同源四倍体,844 Mbp) 的测序工作[25]。基因组测序的有效性,使作物基因组中的性状剖析和序列挖掘有了巨大的进步[26-28]

普通小麦基因组测序的困难主要是基因组庞大,具有多倍性和丰富的重复因子[29]。目前估计基因的变化约为77 000~295 900个[30-33]。小麦多基因组中存在的部分同源序列,及丰富的重复序列[34]和嵌入的转座子[35],增加了基因组的规模,使得基因组的装配和测序变得复杂。例如,基因和低拷贝区域穿插的大段重复,在基因组组装期间很难去除掉。促进六倍体小麦基因组装配的关键是分离单个染色体的能力[36-37]。根据染色体大小,使用流式细胞术可以进行染色体分离[38-39]。如小麦3B染色体,因为它的体积比较大首先被分离出来。而染色体结构的差异,使3B染色体可进一步分离出单个染色体臂[37]。通过物理分割将基因组变成更易分析的片段,降低序列组装的复杂度,利用该方法,已成功地对水稻[40]、鹰嘴豆[41],黑麦[42],大麦[43]和小麦[36]的基因组进行了研究。国际小麦基因组测序协会 (IWGSC) 于2005年成立,目标是对于普通小麦“中国春”基因组进行完整测序和注释。自成立以来,创建了所有小麦染色体臂的BAC文库,包括染色体3B[29]和3DS[44]的物理图谱及亚基因组特异性分子标记等[45-47]。利用流式细胞术和NGS联合绘图,已公布了普通小麦“中国春”的基因组草图,在同源染色体和亚基因组中注释了124 021个基因位点[20]

全染色体霰弹法 (whole chromosome shotgun, WCS) 测序技术,创建初期是计划替代BAC-BAC小麦基因组测序的方法[48]。而NGS技术的出现使WCS在大型的、复杂作物基因组的研究中发挥了作用。对分离的大麦1H染色体DNA进行测序后,Mayer等[49]组装了罗氏454的测序数据,利用大麦、水稻和高粱基因组测序同线性关系,开发出一个基因组拉链的方法。该方法已用于整个大麦基因组的研究[50]。在小麦上,利用WCS方法有效地绘制了小麦染色体7A、7B和7D[32, 51],以及4AL[52]图谱。从单个染色体臂分离和测序DNA,有效地降低了基因组大小和复杂性,并有助于下游生物信息学的组装和分析,也利于理解当前基因组序列组装的瓶颈。

2 NGS与转录组分析

在蛋白质合成过程中,基因组DNA转录产生mRNA。mRNA通过翻译合成蛋白质,细胞或组织中的所有RNA分子被称为转录组。利用全部或部分有代表性的mRNA测序,来进行全转录组分析,是查询基因表达的一种有效技术[53]

早期的高通量转录组分析依赖于DNA微阵列技术。DNA微阵列是将寡核苷酸或cDNA的高密度阵列连接到固体表面及其杂交标记的RNA或cDNA上,通过测量杂交强度,来计算基因表达水平。与微阵列方法相反,序列测序法可通过cDNA的Sanger测序直接确定mRNA序列。不过,该方法因产量低和成本高受到限制,通常不用于定量分析。因此,人们开发出基于标签的测序方法,如基因表达序列分析和大规模平行信号测序,用以弥补测序法的不足,来提供更精确的数字基因表达水平分析。而基于NGS的转录组分析技术可以很好地克服以上技术的局限性,不仅显著提高了基因表达谱的检测精度,而且在关注未知基因的同时,可以区分部分同源基因与共生同源基因拷贝的表达[54]。NGS平台的建立显著提高了基因发现的效率和速度,降低了测序成本。基于NGS的转录组分析可以对极低丰度的转录物进行数字化分析,例如极少量的RNA,或单细胞水平的全基因表达[55]。与基于阵列的表达分析相比,数字基因表达 (Digital Gene Expression,DGE) 更具优势。DGE是对某一物种或特定细胞在特定功能状态下产生的mRNA进行高通量测序,它可以对表达水平进行数字化分析,甚至可对低丰度转录或未知基因进行深度测序。

基于NGS的全转录组分析还可以实现对大规模转录起始位点和可变剪接的特征进行描述,可以在全基因组层面大范围地发掘已知和未知、保守和非保守的miRNA[56-57],发现更多的新转录本,并对基因结果进行优化[58]。此外,NGS技术可定位生物体的表观基因组,并将这些信息与转录组数据相结合[59],来揭示表观基因组和转录组之间的复杂的关系[60]

3 NGS与全基因组关联图谱

全基因组关联研究 (Genome-wide association study,GWAS) 是对多个个体在全基因组范围中的遗传变异多态性进行检测,获得基因型后,将基因型与可观测的性状 (即表型) 进行群体水平的统计学分析,再根据统计量或P值筛选出最有可能影响该性状的遗传变异。GWAS的主要方法学依据是归纳法中的共变法,是探究复杂因果关系的最主要的思想和方法。得到高密度、高可信的遗传变异是GWAS的基础,这些遗传变异包括单核苷酸多态性 (Single nucleotide polymorphisms, SNP)、插入缺失 (Insertion and deletion, InDel) 及拷贝数变异 (Copy number variation, CNV) 等。其中最主要的是SNP,占标记总量的90%以上。目前获得高密度SNP的方法主要是利用SNP芯片,它的特点是高效、易用、廉价等。

NGS的快速发展,为GWAS的相关研究工作提供了新的技术和思路[61]。在主要作物中,NGS平台使SNP发现进入程序化,“基因分型-测序”技术已成常规技术[62-65]。随着测序成本的不断下降,作为GWAS的一种研究方法,全基因组或简化代表重测序技术将取代基于阵列的SNP筛选[66]。在多倍体作物研究中,该技术具有很好的准确性,特别是对于将基因的SNP分配到特定的同源位点上来说,使用来源于单倍型的测序数据比阵列平台更加可靠。此外,在遗传多样性关联平台上,基于NGS的基因分型方法比基于阵列的SNP筛选方法更具潜在的优势[67]。它只需在给定的SNP特定条件下调查已知的等位基因,如通过GWAS发现SNP, 就能够在水稻中更高效地进行重要农艺性状的基因发掘[62, 66]

另外,基于NGS的GWAS大大提高了QTL检测的分辨率,特别是在拟南芥,水稻和玉米[25, 62, 68-70]的研究中。例如,对玉米的开花时间[71]、叶片结构[72]和抗枯萎病[73-74]的研究;利用低覆盖度测序结合基因型填充策略对水稻的重要农艺性状进行研究[75-76];以及通过RNA-seq对玉米产油量性状的eQTL进行研究[77]等。但是,标准的GWAS方法还有一些缺点 (如QTL检测的统计力低),这意味着它们不适合复杂性状的研究 (比如种子产量,它是由许多微效QTL起作用的)。为了克服这些缺点,Yu等[78]引入巢式联合作图 (Nested-association mapping,NAM) 的概念。这种方法提高了GWAS检测编码复杂性状基因的能力。NAM技术在玉米中的成功应用,促使其他许多作物开始了大规模的研发工作[79]。不过,虽然良好的NAM群体可用于解析基因组的复杂性状,但是在基因组复杂的作物中,通过GWAS和NAM准确识别关联基因的能力,最终还是依赖于高密度SNP标记,因为它可以有效地分辨同源位点。

4 SNPs开发与预测育种 4.1 SNPs的开发

单核苷酸多态性 (Single nucleotide polymorphisms,SNP) 是现在植物遗传分析中使用的主要标记,主要指由单个核苷酸的变异而引起基因组水平上的DNA序列多态性,形式包括单碱基缺失、插入、转换及颠换等。一般而言,上述形式中最少1种等位基因在群体中的频率不小于1%[80],但在某种特殊情况下也可以小于1%[81]。1个SNP在基因组某个位点上的单核苷酸变化,主要有两种形式:一是由单碱基的转换所引起的,即以一种嘧啶置换另一种嘧啶或一种嘌呤置换另一种嘌呤;另一种则是颠换,即嘌呤与嘧啶互换。在理论上,突变的碱基可以是C、G、A、T,而实际上SNP多发生在T和C之间[82]。在生物体的任何地方都可以找到SNPs,根据它们在基因组分布的位置可分为基因编码区SNPs (cSNPs)、基因间SNPs (iSNPs) 和基因周边SNPs (pSNPs) 等三类[83]。由于cSNP在外显子内的变异率仅为周围序列的1/5,因此数量相对比较少[84],但它在生物育种研究中具有重要意义。由于高错误率和短读取,从NGS的数据中发现SNP是具有挑战性的[85]。Barbazuk等[86]首先从新一代基因组序列数据中发现谷物SNP,在玉米自交系B73和Mo17之间确定了7 000多个候选SNP位点,利用Roche454的数据得到了超过85%的验证率。使用AutoSNPdb Roche 454的数据,确定了大批小麦表达基因的SNP,也得到了大量水稻、大麦和油菜的Sanger序列数据[87-88]

随着NGS的不断发展,Illumina测序平台的大数据量,为发现大量的全基因组SNP提供了潜在位点[4]。在六个玉米自交系统之间确定了100多万个与杂种优势相关联的SNP位点[51]。Allen等[89]利用Illumina GAIIx数据,在6 255个不同品种的小麦参考序列中,确定了14 078个公认的SNP位点,其中1 659个子集的验证率为67%[62]。节节麦 (Ae. Tauschii) AL8/78的Roche454测序与节节麦AS75的基因组DNA和cDNA的Applied Biosystems SOLiD测序结合,通过AGSNP共确定了497 118个SNP位点[46]。为预测全基因组Illumina鸟枪序列数据中的SNP而设计的SGSautoSNP (第二代测序autoSNP),在油菜中已成功识别超过150万个SNP位点,以及超过900 000个横跨小麦基因组7条染色体的SNP位点[90-92]。该法使得在复杂的基因组中也能识别大量的全基因组SNP位点,在未来的几年里,可用于小麦、油菜等其他多倍体作物的改良[93]

目前,简化复杂性的重测序方法已用于发现复杂作物基因组中的SNP位点,如甘蓝型油菜和小麦[94-97]。这些方法包括,利用Illumina技术测序转录组[54, 55, 89];锚定EST测序[98];使用寡核苷酸探针进行序列捕获[99-101]等。序列捕获 (Sequence capture) 是将感兴趣的基因组区域定制成特异性探针与基因组DNA进行杂交,将目标基因组区域的DNA片段进行富集后再利用第二代测序技术进行测序。这种方法是多倍体物种中SNP发现的一种常用方法。Pichon等[100]利用不同品种的甘蓝型油菜Aviso和Montego的SNP发现,来证明序列捕获的实用性。结果表明,超过7 000个SNP位点被认证,其中验证66.8%的SNPs适合于Illumina Golden Gate TM试验,基因型横跨480个品系。该方法也适用于小麦,其中异源四倍体小麦3.5MB的外显子靶标的重测序覆盖了3 497个位点,识别了4 000个SNP位点[101]。Snowdon等[102]描述了在甘蓝型油菜中使用不同的序列捕获技术。结果表明,一方面可捕捉到同产量性状相关的meta-QTL, 另一方面定向重测序的调节基因可能参与了发育和产量相关性状的表达。此外,转录组测序也被广泛用于甘蓝型油菜的SNP发现。在双二倍体品系Tapidor 9、Ningyou 7作图群体中,使用Illumina RNA-seq数据分析,结果表明在栽培品种间有23 000~41 000个SNP被确认,其中每个品种使用了2 000万个EST[54, 98]

4.2 基因组选择和预测育种

二十几年前DNA标记首次应用在实际育种中,提高了育种家对性状的选择能力和对表型特性的评估能力。DNA标记也被认为可以显著改善栽培品种的开发效率和速度[103-104]。虽然许多育种家的确应用标记辅助选择,对简单的单基因性状或主效QTL进行了选择,然而,成功应用分子标记对多基因性状进行选择的例子极少[105-106]。主要原因在于,经典的QTL分析往往仅鉴定少数同大表型效应相关的标记,在大的育种群体中单标记的分析会受成本限制,这意味着标记辅助选择策略仅对具有高经济回报的性状是划算的。

目前,通过NGS平台,运用高通量SNP阵列技术或基因分型-测序技术,可调查数千个甚至数十万个标记,其成本同育种家以前在少量的主要基因选择标记上的花费相比,已经少了很多。在一个大的多样性“驯化”(training) 群体中,通过估计大量全基因组SNPs的独立表型效应,使人们可以选用适当的统计模型来计算基因组评估育种值 (Genomic estimated breeding values, GEBV),从而预测非个体表型的预期表现[107]。即使对SNP有益性状的功能一无所知,GEBV仍是很理想的选择工具。因为它可以在理论上消除新育种品系表型所需要的高成本。这个概念,也称为“基因组选择”[108-109]。随着基因分型和测序成本继续下降,毫无疑问基因组选择在植物育种中的重要作用将会提高[110]

基于全基因组SNP标记的预测育种策略将会有利于最佳杂交组合的选择,从而开发出具有较好特性的F1群体。在作物中,如玉米和油菜,F1杂交品种具有重要作用。然而,无论是亲本品系特性或者遗传距离的估测都不是杂种特性良好的预测指标。事实上,育种家在评估育种群体中大量纯合近交亲本系的常规组合能力 (General combining abilities,GCA) 的工作中耗费了大量的时间和精力。最近的一项玉米研究表明,可以用全基因组SNP标记来实现准确的统计预测GCA,根据基因组的预测指标,来提高选择杂交亲本的可能性,而不是依据表型或种群遗传参数[111]。因此,对主要作物育种来说,在全基因组范围内使用NGS技术调查序列变异 (包含转录序列数据) 进入预测模型,将有可能进一步提高基因组选择技术的能力[112]

5 展望

在未来几年里,“表型瓶颈”将是植物育种面临的主要挑战。虽然,我们可以在短时间内,以较低的成本开发数量巨大的基因型和序列数据,不过对于复杂性状表型来说,要解决基因型容量的问题,仍然带有挑战性[113]。而对复杂的多倍体作物基因组来说,使用NGS技术将会提高我们对基因组研究的认知力。即使像油菜和小麦这样的大型多倍体基因组,全基因组SNPs的发现和筛选也将不再是阻碍,这为应用高分辨率关联遗传学和基因组选择进行重要作物的遗传分析和改良开辟了新的道路。NGS的不断发展,测序成本的持续降低,使得在种质资源多样性丰富的育种群体中,利用降低代表性或全基因组重测序手段进行基因分型研究将更为深入。对于基因型-性状关联和预测育种策略来说,在考虑其他表型数据系统水平的同时,也将更加重视基于序列的全基因表达分析。随着测序技术的发展进步,我们对作物基因组遗传构成的复杂性的理解将更为细致,这也将有助于我们更加充分地考虑因环境变化而对表型特性造成的影响。

参考文献
[1] Varshney R K, Nayak S N, May G D, et al. Next generation sequencing technologies and their implications for crop genetics and breeding. Trends Biotechnol, 2009, 27(9) : 522–530. DOI:10.1016/j.tibtech.2009.05.006
[2] Duran C, Eales D, Marshall D, et al. Future tools for association mapping in crop plants. Genome, 2010, 53(11) : 1017–1023. DOI:10.1139/G10-057
[3] Edwards D, Batley J. Plant genome sequencing:applications for crop improvement. Plant Biotech, 2010, 8(1) : 2–9. DOI:10.1111/(ISSN)1467-7652
[4] Imelfort M, Batley J, Grimmond S, et al. Genome sequencing approaches and successes. Methods Mol Biol, 2009, 513 : 345–358. DOI:10.1007/978-1-59745-427-8
[5] Imelfort M, Edwards D. De novo sequencing of plant genomes using second-generation technologies. Brief Bioinform, 2009, 10(6) : 609–618. DOI:10.1093/bib/bbp039
[6] Muers M. Technology:getting Moore from DNA sequencing. Nat Rev Genet, 2011, 12(9) : 586–587.
[7] Lai K, Lorenc M T, Edwards D. Genomic databases for crop improvement. Agronomy, 2012, 2(1) : 62–73.
[8] Lee H, Lai K, Lorenc M T, et al. Bioinformatics tools and databases for analysis of next generation sequence data. Brief Funct Genomics, 2012, 11(1) : 12–24. DOI:10.1093/bfgp/elr037
[9] Shendure J, Porreca G J, Reppas N B. Accurate multiplex polony sequencing of an evolved bacterial genome. Science, 2005, 309(5471) : 1728–1732.
[10] Michael L M. Sequencing technologies——the next generation. Nat Rev Genet, 2010, 11(1) : 31–46. DOI:10.1038/nrg2626
[11] Eid J, Fehr A, Gray J. Real-time DNA sequencing from single polymerase molecules. Science, 2009, 323(5910) : 133–138. DOI:10.1126/science.1162986
[12] Rothberg J M, Hinz W, Rearick T M, et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature, 2011, 475 : 348–352. DOI:10.1038/nature10242
[13] Goff S A, Ricke D, Lan T H, et al. A draft sequence of the rice genome (Oryza sativa Lssp japonica). Science, 2002, 296(5565) : 92–100. DOI:10.1126/science.1068275
[14] Yu J, Hu S, Wang J, et al. A draft sequence of the rice genome (Oryza sativa L. ssp. indica). Science, 2002, 296(5565) : 79–92. DOI:10.1126/science.1068037
[15] Schnable P S, Ware D, Fulton R S, et al. The B73 maize genome:complexity, diversity, and dynamics. Science, 2009, 326(5956) : 1112–1115. DOI:10.1126/science.1178534
[16] Mayer K F, Waugh R, Brown J W, et al. A physical, genetic and functional sequence assembly of the barley genome. Nature, 2012, 491(7426) : 711–716.
[17] Jia J, Zhao S, Kong X, et al. Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation. Nature, 2013, 496(4) : 91–95.
[18] Ling H Q, Zhao S, Liu D, et al. Draft genome of the wheat A-genome progenitor Triticum urartu. Nature, 2013, 496(4) : 87–90.
[19] Brenchley R, Spannagl M, Pfeifer M, et al. Analysis of the bread wheat genome using whole-genome shotgun sequencing. Nature, 2012, 491(11) : 705–710.
[20] Jarrod A, Martin M, Aydin B, et al. A chromosome-based draft sequence of the hexaploid bread wheat (Triticum aestivum) genome. Science, 2014, 345(6194) : 1251788. DOI:10.1126/science.1251788
[21] Schnable J C, Springer N M, Freeling M. Differentiation of the maize subgenomes by genome dominance and both ancient and ongoing gene loss. Proc Nat Acad Sci USA, 2011, 108(10) : 4069–4074. DOI:10.1073/pnas.1101368108
[22] Gore M Q, Chia J M, Elshire R J. A first-generation haplotype map of maize. Science, 2009, 326(5956) : 1115–1117. DOI:10.1126/science.1177837
[23] Springer N M, Ying K, Fu Y, et al. Maize inbreds exhibit high levels of copy number variation and presence/absence variation in genome content. PLoS Genet, 2009, 10(12) : 1000721–1000734.
[24] Schmutz J, Cannon S B, Schlueter J, et al. Genome sequence of the palaeopolyploid soybean. Nature, 2010, 463(1) : 178–183.
[25] Xu X, Pan S K, Cheng S F, et al. Genome sequence and analysis of the tuber crop potato. Nature, 2011, 475(8) : 189–195.
[26] Hayward A, McLanders J, Campbell E, et al. Genomic advances will herald new insights into the Brassica:Leptosphaeria maculans pathosystem. Plant Biol, 2012, 14(5) : 1–10.
[27] Hayward A, Vighnesh G, Delay C, et al. Second-generation sequencing for gene discovery in the Brassicaceae. Plant Biotech J, 2012, 10(6) : 750–759. DOI:10.1111/j.1467-7652.2012.00719.x
[28] Raman H, Harsh R, Raman R, et al. Genetic and physical mapping of flowering time loci in oilseed rape (Brassica napus L.). Theor Appl Genet, 2012, 126(1) : 119–132.
[29] Paux E, Sourdille P, Salse J, et al. A physical map of the 1-gigabase bread wheat chromosome 3B. Science, 2008, 322(5898) : 101–104. DOI:10.1126/science.1161847
[30] Rabinowicz P D, Citek R, Budiman M A, et al. Differential methylation of genes and repeats in land plants. Genome Res, 2005, 15(10) : 1431–1440. DOI:10.1101/gr.4100405
[31] Paux E, Roger D, Badaeva E, et al. Characterizing the composition and evolution of homoeologous genomes in hexaploid wheat through BAC-end sequencing on chromosome 3B. Plant J, 2006, 48(3) : 463–474. DOI:10.1111/tpj.2006.48.issue-3
[32] Berkman P J, Skarshewski A, Lorenc M T, et al. Sequencing and assembly of low copy and genic regions of isolated Triticum aestivum chromosome arm 7DS. Plant Biotech J, 2011, 9(7) : 768–775. DOI:10.1111/pbi.2011.9.issue-7
[33] Berkman P J, Skarshewski A, Manoli S, et al. Sequencing wheat chromosome arm 7BS delimits the 7BS/4AL translocation and reveals homoeologous gene conservation. Theor Appl Genet, 2011, 124(3) : 423–432.
[34] Wanjugi H, Coleman D, Huo N X, et al. Rapid development of PCR-based genome-specific repetitive DNA junction markers in wheat. Genome, 2009, 52(6) : 576–587. DOI:10.1139/G09-033
[35] Li W, Zhang P, Fellers J, et al. Sequence composition, organization, and evolution of the core Triticeae genome. Plant J, 2004, 40(4) : 500–511. DOI:10.1111/tpj.2004.40.issue-4
[36] Vrána J, Kubaláková M, Šimková H, et al. Flow sorting of mitotic chromosomes in common wheat (Triticum aestivum L.). Genetics, 2000, 156(4) : 2033–2041.
[37] Kubaláková M, Vrána J, Číhalíková J, et al. Flow karyotyping and chromosome sorting in bread wheat (Triticum aestivum L.). Theor Appl Genet, 2002, 8(104) : 1362–1372.
[38] Laat A, Blaas J. Flow-cytometric characterization and sorting of plant chromosomes. Theor Appl Genet, 1984, 67(5) : 463–467. DOI:10.1007/BF00263414
[39] Kubalakova M, Lysak M A, Vrana J, et al. Rapid identification and determination of purity of flow-sorted plant chromosomes using C-PRINS. Cytometry, 2000, 41(2) : 102–108. DOI:10.1002/(ISSN)1097-0320
[40] Lee J H, Arumuganathan K, Metaphase chromosome accumulation and flow karyotypes in rice (Oryza sativa L. ) root tip meristem cells. Mol Cells, 1999, 9(4) : 436–439.
[41] Vlacilova K, Ohri D, Vrana J, et al. Development of flow cytogenetics and physical genome mapping in chickpea (Cicer arietinum L.). Chromosom Res, 2002, 10(8) : 695–706. DOI:10.1023/A:1021584914931
[42] Kubaláková M, Valarik M, Bartos J, et al. Analysis and sorting of rye (Secale cereale L.) chromosomes using flow cytometry. Genome, 2003, 46(5) : 893–905. DOI:10.1139/g03-054
[43] Lysak M A, Koch M A, Pecinka A, et al. Chromosome triplication found across the tribe Brassiceae. Genome Res, 2005, 15(4) : 516–525. DOI:10.1101/gr.3531105
[44] Fleury D, Luo M C, Dvorak J, et al. Physical mapping of a large plant genome using global high-information-content-fingerprinting:the distal region of the wheat ancestor Aegilops tauschii chromosome 3DS. BMC Genomics, 2010, 11(7) : 382.
[45] Sabot F, Guyot R, Wicker T, et al. Updating of transposable element annotations from large wheat genomic sequences reveals diverse activities and gene associations. Mol Genetics Genomics, 2005, 274(2) : 119–130. DOI:10.1007/s00438-005-0012-9
[46] You F M, Huo N, Deal K R, et al. Annotation-based genome-wide SNP discovery in the large and complex Aegilops tauschii genome using next-generation sequencing without a reference genome sequence. BMC Genomics, 2011, 25(2) : 12–59.
[47] Nie X, Li B, Wang L, et al. Development of chromosome-arm specific microsatellite markers in Triticum aestivum (Poaceae) using NGS technology. Am J Bot, 2012, 99(9) : 369–371. DOI:10.3732/ajb.1200077
[48] Gill B S, Appels R, Botha-Oberholster A M, et al. A workshop report on wheat genome sequencing:international genome research on wheat consortium. Genetics, 2004, 168(2) : 1087–1096. DOI:10.1534/genetics.104.034769
[49] Mayer K F, Taudien S, Martis M, et al. Gene content and virtual gene order of barley chromosome 1H. Plant Physiol, 2009, 151(2) : 496–505. DOI:10.1104/pp.109.142612
[50] Mayer K F, Martis M, Hedley P E, et al. Unlocking the barley genome by chromosomal and comparative genomics. Plant Cell, 2011, 4(23) : 1249–1263.
[51] Lai K, Berkman P J, Lorenc M T, et al. Wheat genome.info:an integrated database and portal for wheat genome information. Plant Cell Physiol, 2011, 53(2) : 2–7.
[52] Hernandez P, Martis M, Dorado G, et al. Next generation sequencing and syntenic integration of flowsorted arms of wheat chromosome 4A exposes the chromosome structure and gene content. Plant J, 2012, 69(3) : 377–386. DOI:10.1111/tpj.2012.69.issue-3
[53] Wang L, Li P H, Brutnell T P. Exploring plant transcriptomes using ultra high-throughput sequencing. Brief Funct Genomics, 2010, 2(9) : 118–128.
[54] Trick M, Long Y, Meng J, et al. Single nucleotide polymorphism (SNP) discovery in the polyploidy Brassica napus using solexa transcriptome sequencing. Plant Biotech J, 2009, 7(4) : 334–346. DOI:10.1111/pbi.2009.7.issue-4
[55] Bancroft I, Stokes D R, Morgan C L, et al. Prediction of heterosis and other traits by transcriptome analysis. U.S.A., 20090300781, 2009.
[56] Moxon S, Jing R, Szittya G, et al. Deep sequencing of tomato short RNAs identifies microRNAs targeting genes involved in fruit ripening. Genome Research, 2008, 18(10) : 1602–1609. DOI:10.1101/gr.080127.108
[57] Wei B, Cai T, Zhang R, et al. Novel microRNAs uncovered by deep sequencing of small RNA transcriptomes in bread wheat (Triticum aestivum L.) and Brachypodium distachyon (L.) Beauv. Functional & Integrative Genomics, 2009, 9(4) : 499–511.
[58] Yamaguchi T, Nakayama K, Hayashi T, et al. cDNA microarray analysis of rice anther genes under chilling stress at the microsporpgenesis stage revealed two genes with DNA transposon castaway in the 5'-flanking region. Bioscience Biotechnology and Biochemistry, 2004, 68(6) : 1315–1323. DOI:10.1271/bbb.68.1315
[59] Eckardt N A. Deep sequencing maps the maize epigenomic landscape. The Plant Cell, 2009, 21(4) : 1024–1026. DOI:10.1105/tpc.109.068064
[60] Elling A A, Deng X W. Next-generation sequencing reveals complex relationships between the epigenome and transcriptome in maize. Plant Signaling & Behavior, 2009, 4(8) : 760–762.
[61] 周家蓬, 裴智勇, 陈禹保, 等. 基于高通量测序的全基因组关联研究策略. 遗传, 2014, 36(11) : 1099–1111. Zhou J P, Pei Z Y, Chen Y B, et al. Strategies of genome-wide association study based on high-throughput sequencing. Hereditas, 2014, 36(11) : 1099–1111.
[62] Huang X, Wei X, Sang T, et al. Genome-wide association studies of 14 agronomic traits in rice landraces. Nat Genet, 2010, 42(12) : 961–967.
[63] Chutimanitsakun Y, Nipper R W, Cuesta-Marcos A, et al. Construction and application for QTL analysis of a restriction site. Bmc Genomics, 2011, 4(7) : 12–14.
[64] Elshire R J, Glaubitz J C, Sun Q, et al. A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species. PLoS One, 2011, 6 : e19379. DOI:10.1371/journal.pone.0019379
[65] Pfender W F, Saha M C, Johnson E A, et al. Mapping with RAD (restriction-site associated DNA) markers to rapidly identify QTL for stem rust resistance in Lolium perenne. Theor Appl Genet, 2011, 122(8) : 1467–1480. DOI:10.1007/s00122-011-1546-3
[66] Chia J M, Ware D. Sequencing for the cream of the crop. Nat Biotech, 2011, 29(2) : 138–139. DOI:10.1038/nbt.1756
[67] Davey J W, Hohenlohe P A, Etter P D, et al. Genome-wide genetic marker discovery and genotyping using next-generation sequencing. Nat Rev Genet, 2011, 12(7) : 499–510. DOI:10.1038/nrg3012
[68] Breseghello F, Sorrells M E. Association analysis as a strategy for improvement of quantitative traits in plants. Crop Sci, 2006, 46 : 1323–1330. DOI:10.2135/cropsci2005.09-0305
[69] Nordborg M, Weigel D. Next-generation genetics in plants. Nature, 2008, 456(10) : 720–723.
[70] Atwell S, Huang Y S, Vilhjalmsson B J, et al. Genome-wide association study of 107 phenotypes in Arabidopsis thaliana inbred lines. Nature, 2010, 465(7298) : 627–631. DOI:10.1038/nature08800
[71] Buckler E S, Holland J B, Bradbury P J, et al. The genetic architecture of maize flowering time. Science, 2009, 325(5941) : 714–718. DOI:10.1126/science.1174276
[72] Tian F, Bradbury P J, Brown P J, et al. Genome-wide association study of leaf architecture in the maize nested association mapping population. Nat Genet, 2011, 43(2) : 159–162. DOI:10.1038/ng.746
[73] Kump K L, Bradbury P J, Wisser R J, et al. Genome-wide association study of quantitative resistance to southern leaf blight in the maize nested association mapping population. Nat Genet, 2011, 43(2) : 163–168. DOI:10.1038/ng.747
[74] Poland J A, Bradbury P J, Buckler E S, et al. Genome-wide nested association mapping of quantitative resistance to northern leaf blight in maize. Proc Natl Acad Sci USA, 2011, 108(17) : 6893–6898. DOI:10.1073/pnas.1010894108
[75] Zhao K Y, Tung C W, Eizenga G C, et al. Genome-wide association mapping reveals a rich genetic architecture of complex traits in Oryza sativa. Nat Commun, 2011, 2 : 467. DOI:10.1038/ncomms1467
[76] Huang X H, Wei X H, Sang T, et al. Genome-wide association studies of 14 agronomic traits in rice landraces. Nat Genet, 2010, 42(11) : 961–967. DOI:10.1038/ng.695
[77] Li H, Peng Z Y, Yang X H, et al. Genome-wide association study dissects the genetic architecture of oil biosynthesis in maize kernels. Nat Genet, 2013, 45(1) : 43–50.
[78] Yu J, Holland J B, McMullen M D, et al. Genetic design and statistical power of nested association mapping in maize. Genetics, 2008, 178(1) : 539–551. DOI:10.1534/genetics.107.074245
[79] McMullen M D, Kresovich S, Villeda H S, et al. Genetic properties of the maize nested association mapping population. Science, 2009, 325(5941) : 737–740. DOI:10.1126/science.1174320
[80] Vignal A, Milan D, Magali S C. A review on SNP and other types of molecular markers and their use in animal genetics. Genet Sel Evol, 2002, 34 : 275–305. DOI:10.1186/1297-9686-34-3-275
[81] Brooker A J. The essence of SNPs. Gene, 1999, 234(2) : 177–186. DOI:10.1016/S0378-1119(99)00219-X
[82] 杜玮南, 孙红霞, 方福德. 单核苷酸多态性的研究进展. 国外医学:遗传学分册, 2000, 4 : 392–394. Du W N, Sun H X, Fang F D. The research development of single nucleotide polymorphism. International Journal of Genetics, 2000, 4 : 392–394.
[83] Wang D G, Fan J B, Siao C J. Large scale identification, mapping, and genotyping of single nucleotide polymorphism in the human genome. Science, 1998, 280 : 1077–1082. DOI:10.1126/science.280.5366.1077
[84] 杨永强, 王巍杰, 徐长波. 单核苷酸多态性研究进展. 化学与生物工程, 2009, 26(8) : 9. Yang Y Q, Wang W J, Xu C B. The research development of single nucleotide polymorphism. Chemical Engineering and Biotechnology, 2009, 26(8) : 9.
[85] Imelfort M, Duran C, Batley J, et al. Discovering genetic polymorphisms in next generation sequencing data. Plant Biotech J, 2009, 7(4) : 312–317. DOI:10.1111/pbi.2009.7.issue-4
[86] Barbazuk W B, Emrich S J, Chen H D, et al. SNP discovery via 454 transcriptome sequencing. Plant J, 2007, 51(5) : 910–918. DOI:10.1111/j.1365-313X.2007.03193.x
[87] Duran C, Appleby N, Clark T, et al. AutoSNPdb:an annotated single nucleotide polymorphism database for crop plants. Nucl Acids Res, 2009, 10(37) : 951–953.
[88] Duran C, Appleby N, Vardy M, et al. Single nucleotide polymorphism discovery in barley using autoSNPdb. Plant Biotech J, 2009, 7(4) : 326–333. DOI:10.1111/pbi.2009.7.issue-4
[89] Allen A M, Barker G L, Berry S T, et al. Single nucleotide polymorphism discovery and linkage analysis in hexaploid bread wheat (Triticum aestivum L.). Plant Biotech J, 2011, 9(9) : 1086–1099. DOI:10.1111/pbi.2011.9.issue-9
[90] Edwards D, Wilcox S, Barrero R A, et al. Bread matters:a national initiative to profile the genetic diversity of Australian wheat. Plant Biotech J, 2012, 10(6) : 703–708. DOI:10.1111/j.1467-7652.2012.00717.x
[91] Lai K, Duran C, Berkman P J, et al. Single nucleotide polymorphism discovery from wheat next-generation sequence data. Plant Biotech J, 2012, 10(6) : 743–749. DOI:10.1111/j.1467-7652.2012.00718.x
[92] Lorenc M T, Hayashi S, Stiller J, et al. Discovery of single nucleotide polymorphisms in complex genomes using SGSautoSNP. Biology, 2012, 1(2) : 370–382.
[93] Hayward A, Dalton-Morgan J, Mason A, et al. SNP discovery and applications in Brassica napus. J Plant Biotech, 2012, 39(1) : 49–61. DOI:10.5010/JPB.2012.39.1.049
[94] Bundock P C, Casu R E, Henry R J. Enrichment of genomic DNA for polymorphism detection in a non-model highly polyploid crop plant. Plant Biotech J, 2012, 10 : 657–667. DOI:10.1111/j.1467-7652.2012.00707.x
[95] Gholami M, Bekele W A, Schondelmaier J, et al. A tailed PCR procedure for cost-effective, two-order multiplex sequencing of candidate genes in polyploid plants. Plant Biotech J, 2012, 10(6) : 635–645. DOI:10.1111/j.1467-7652.2012.00696.x
[96] Liu L, Wittkop B, Stein A, et al. A knockout mutation in the lignin biosynthesis gene CCR1 explains a major QTL for acid detergent lignin content in Brassica napus seeds. Theor Appl Genet, 2012, 124(8) : 1573–1586. DOI:10.1007/s00122-012-1811-0
[97] Winfield M O, Wilkinson P A, Allen A M, et al. Targeted re-sequencing of the allohexaploid wheat exome. Plant Biotech J, 2012, 10(6) : 733–742. DOI:10.1111/j.1467-7652.2012.00713.x
[98] Parkin I A, Gulden S M, Sharpe A G, et al. Segmental structure of the Brassica napus genome based on comparative analysis with Arabidopsis thaliana. Genetics, 2005, 2(171) : 765–781.
[99] Fu Y, Springer N M, Gerhardt D J, et al. Repeat subtraction-mediated sequence capture from a complex genome. Plant J, 2010, 62(5) : 898–909. DOI:10.1111/tpj.2010.62.issue-5
[100] Pichon J P, Riviere N, Duarte J, et al. Rapeseed SNP discovery using a dedicated sequence capture protocol and 454 sequencing. Plant and Animal Genome XVIII Conference, San Diego, USA, 2010.
[101] Saintenac C, Jiang D, Akhunov E D. Targeted analysis of nucleotide and copy number variation by exon capture in allotetraploid wheat genome. Genome Biol, 2011, 12(9) : 12–88.
[102] Snowdon R J, Luy I. Breeding oilseed rape and canola in the genomics era. Plant Breed, 2012, 131(3) : 351–360. DOI:10.1111/pbr.2012.131.issue-3
[103] Beckmann J S, Soller M. Restriction fragment length polymorphisms and genetic improvement of agricultural species. Euphytica, 1986, 35(1) : 111–124. DOI:10.1007/BF00028548
[104] Tanksley S D, Young N D, Paterson A H, et al. RFLP mapping in plant breeding:new tools for an old science. Nat Biotech, 1989, 7(3) : 257–264. DOI:10.1038/nbt0389-257
[105] Bernardo R. Molecular markers and selection for complex traits in plants:learning from the last 20 years. Crop Sci, 2008, 48(5) : 1649–1664. DOI:10.2135/cropsci2008.03.0131
[106] Xu Y, Crouch J H. Marker-assisted selection in plant breeding:from publications to practice. Crop Sci, 2008, 48(5) : 391–407.
[107] Meuwissen T H, Hayes B J, Goddard M E. Prediction of total genetic value using genome-wide dense marker maps. Genetics, 2011, 157(4) : 1819–1829.
[108] Hayes B J, Bowman P J, Chamberlain A J, et al. Genomic selection in dairy cattle:progress and challenges. J Dairy Sci, 2009, 92(2) : 433–443. DOI:10.3168/jds.2008-1646
[109] Bagnato A, Rosati A. From the editors-animal selection:the genomics revolution. Anim Front, 2012, 12(1) : 1–2.
[110] Jannink J L, Lorenz A J, Iwata H. Genomic selection in plant breeding:from theory to practice. Brief Funct Genomics, 2010, 9(2) : 166–177. DOI:10.1093/bfgp/elq001
[111] Riedelsheimer C, Czedik-Eysenberg A, Grieder C, et al. Genomic and metabolic prediction of complex heterotic traits in hybrid maize. Nat Genet, 2012, 44(2) : 217–220. DOI:10.1038/ng.1033
[112] Stokes D, Fraser F, Morgan C, et al. An association transcriptomics approach to the prediction of hybrid performance. Mol Breed, 2010, 26(1) : 91–106. DOI:10.1007/s11032-009-9379-3
[113] David E, Jacqueline B, Rod S, et al. Accessing complex crop genomes with next-generation sequencing. Theor Appl Genet, 2013, 126(1) : 1–11. DOI:10.1007/s00122-012-1964-x