文章信息
- 梁健翔, 吴进樟, 张尧, 曹世江
- LIANG Jianxiang, WU Jinzhang, ZHANG Yao, CAO Shijiang
- 杨梅侧生器官边界域基因组鉴定及进化分析
- Genomic identification and evolutionary analysis of the boundary domain of lateral organs in Myrica rubra
- 森林与环境学报,2021, 41(2): 172-179.
- Journal of Forest and Environment,2021, 41(2): 172-179.
- http://dx.doi.org/10.13324/j.cnki.jfcf.2021.02.008
-
文章历史
- 收稿日期: 2020-11-29
- 修回日期: 2021-01-18
杨梅[Myrica rubra (Lour.) S. et Zucc.]是杨梅科(Myricaceae)杨梅属(Myrica)的常绿乔木,是我国原产的特色植物。作为二倍体(2n=16)雌雄异株植物[1],其基因组测序最早始于2012年,焦云[2]对杨梅雄株材料进行鸟枪法测序,共获得9.01 Gb的原始数据,覆盖深度为26X,预测杨梅的全基因组大小约为323 Mb;戚行江等[3]对杨梅再次进行全基因组测序,采用IluminaHiseq 2500的双端测序,得到约13.70 Gb的原始数据,估计杨梅基因组大小约为304.38 Mb。贾慧敏等[4]对水晶杨梅优质雌株材料‘Y2012-145’进行全基因组测序,结果表明其大小约为322.7 Mb。
侧生器官边界域(lateral organ boundary domain, LBD)基因也称作为AS2/LOB基因,是被证实在植物中独特拥有的一类转录因子,并在植物的侧生组织原基中特异性表达[5]。一部分植物的LBD家族基因已经在全基因组水平上进行了鉴定、研究和分析,例如在番茄(Lycopersicon esculentum Mill.)[6]、辣椒(Capsicum annuum L.)[7]、葡萄(Vitis vinifera L.)[8]以及毛果杨(Populus trichocarpa Torr.)[9]的全基因组水平上分别鉴定得到了46、45、30和57个LBD基因家族的成员。在氮素处理下,毛果杨有12个LBD家族基因在根中表达量上升,15个LBD家族基因在茎中表达量下降;不同的LBD基因在茎和根中对不同氮素(氨、硝酸盐和尿素)的敏感性存在差异,表明LBD家族基因可能发挥调控氮素代谢的功能[9]。除此之外,蒺藜苜蓿(Medicago truncatula L.)LBD家族基因的Medtr3g452660.1、Medtr2g093310.1、Medtr4g060950.1、Medtr3g071590.1和Medtr4g083680.1基因参与了植株幼苗期对干旱生境的抗逆[10]。小麦(Triticum aestivum L.)LBD家族基因的Ta-4A LBD34、Ta-4B LBD43和Ta-4D LBD54基因在冷胁迫下的差异表达,表明它们在逆境胁迫方面发挥作用[11]。这些研究表明了LBD家族基因可能会参与逆境胁迫响应等过程,在植物生长发育中发挥重要作用。目前,对于杨梅LBD家族基因的成员数量和结构尚不明确。鉴于此,本研究通过生物信息分析的方法,从杨梅全基因组中筛选、鉴定出LBD基因,并对其进行染色体定位、系统进化、基因结构以及物种之间的共线性等进行全面分析,以期为杨梅LBD家族基因的功能分析奠定基础。
1 材料与方法 1.1 杨梅侧生器官边界域基因鉴定与染色体定位杨梅全基因组数据下载于美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI, https://www.ncbi.nlm.nih.gov/),拟南芥(Arabidopsis thaliana L.)LBD蛋白质序列通过TAIR(http://arabidopsis.org/)下载。由Pfam(http://pfam.xfam.org/)获得LBD结构域(PF03195),并在HMMER-3.3中对杨梅所有蛋白质序列进行筛选,标准e值<10-5,筛选出可能含有LBD结构域的序列,然后用NCBI-CDD(https: //www.ncbi.nlm.nih.gov/cdd)再次筛选最终得到33条杨梅LBD蛋白质序列。杨梅LBD蛋白质家族分子质量以及等电点用ExPASy(https://web.expasy.org/protparam)进行分析。杨梅LBD蛋白质序列的二级结构通过PRABI(http://www.prabi.fr/)进行分析。根据杨梅全基因组数据得知染色体基本信息并使用MG2C v2.1(http://mg2c.iask.in/mg2c_v2.1/)绘制染色体物理位置图。
1.2 杨梅侧生器官边界域基因系统进化与基因结构分析杨梅和拟南芥的LBD蛋白质序列通过MUSCLE v3.8.1软件进行多序列比对,通过IQ-TREE v1.6软件采用极大似然法构建相关蛋白的系统进化树,校验参数Bootstrap设定为1 000。进化树的数据结果传输到iTol(https://itol.embl.de/)进行后期处理。由GSDS 2.0在线分析网站(Gene Structure Display Server 2.0, http://gsds.cbi.pku.edu.cn/)分析杨梅LBD的内含子以及外显子。
1.3 杨梅侧生器官边界域蛋白序列的保守性分析杨梅LBD蛋白质的保守基序通过MEME(http://meme-suite.org/)分析,基序数量设置为15。通过DNAMAN 10.0对杨梅LBD蛋白序列进行完全比对从而对LBD保守结构域进行分析。基于SWISS-MODEL(https://swissmodel.expasy.org/)数据库对杨梅LBD蛋白进行同源蛋白建模。
1.4 物种共线性和同源性分析根据杨梅基因组数据中的基因位置信息,将所有LBD基因定位到杨梅染色体上,通过TBtools软件进行共线性分析,为了显示杨梅和其他所选物种中获得的同源LBD基因之间的共性关系,从植物基因组数据库(https: //phytozome.jgi.doe.gov/)下载了拟南芥、玉米(Zea mays L.)、水稻(Oryza sativa L.)、葡萄、小麦和番茄的全基因组序列和基因注释文件。利用TBtools软件构建了共性分析图谱。
2 结果与分析 2.1 杨梅侧生器官边界域基因理化性质分析对杨梅LBD转录因子家族信息进行分析,结果如表 1所示。杨梅LBD蛋白中长度最短的MrLOB基因(登录号KAB1223427.1)的氨基酸残基(amino acid residue, aa)数仅108,而最长的MrLBD8基因(登录号KAB1214668.1)包含的aa数为329;用ExPASy(https: //web.expasy.org/protparam)对杨梅LBD蛋白进行分子质量以及等电点的预测,最大分子质量为36 638.90 u(基因名MrLBD8,登录号KAB1214668.1),而最小分子质量为12 094.11 u(基因名MrLOB,登录名KAB1223427.1);等电点范围4.68~9.48。
基因名 Gene name |
登录号 Accession No. |
蛋白长度 Protein length |
分子质量 Molecular weight/u |
等电点 Isoelectric point |
基因名 Gene name |
登录号 Accession No. |
蛋白长度 Protein length |
分子质量 Molecular weight/u |
等电点 Isoelectric point |
|
MrLOB | KAB1223427.1 | 108 | 12 094.11 | 8.83 | MrLBD17 | KAB1208819.1 | 210 | 22 728.94 | 8.05 | |
MrLBD1 | KAB1222157.1 | 171 | 18 526.11 | 8.59 | MrLBD18 | KAB1218941.1 | 205 | 22 350.21 | 6.69 | |
MrLBD2 | KAB1216947.1 | 157 | 17 409.86 | 6.80 | MrLBD19 | KAB1218043.1 | 282 | 31 107.21 | 6.54 | |
MrLBD3 | KAB1222304.1 | 212 | 23 479.40 | 8.24 | MrLBD20 | KAB1216690.1 | 287 | 32 868.93 | 5.25 | |
MrLBD4 | KAB1222158.1 | 227 | 25 170.86 | 9.48 | MrLBD21 | KAB1208818.1 | 230 | 25 390.20 | 6.03 | |
MrLBD5 | KAB1217662.1 | 164 | 18 323.97 | 6.57 | MrLBD22 | KAB1218423.1 | 263 | 30 227.93 | 5.36 | |
MrLBD6 | KAB1209131.1 | 173 | 19 335.18 | 8.89 | MrLBD23 | KAB1217832.1 | 209 | 22 745.62 | 4.68 | |
MrLBD7 | KAB1226130.1 | 206 | 22 159.18 | 5.57 | MrLBD24 | KAB1202028.1 | 244 | 27 870.43 | 5.52 | |
MrLBD8 | KAB1214668.1 | 329 | 36 638.90 | 6.76 | MrLBD25 | KAB1216529.1 | 223 | 24 426.64 | 8.75 | |
MrLBD9 | KAB1214092.1 | 221 | 24 051.33 | 9.01 | MrLBD26 | KAB1214888.1 | 227 | 24 587.14 | 8.40 | |
MrLBD10 | KAB1225696.1 | 199 | 21 545.77 | 8.90 | MrLBD27 | KAB1211189.1 | 300 | 32 441.61 | 7.02 | |
MrLBD11 | KAB1217642.1 | 179 | 19 421.12 | 8.11 | MrLBD28 | KAB1208384.1 | 194 | 21 115.93 | 5.77 | |
MrLBD12 | KAB1218940.1 | 233 | 24 202.75 | 8.19 | MrLBD29 | KAB1223200.1 | 328 | 36 306.27 | 8.72 | |
MrLBD13 | KAB1219657.1 | 170 | 19 273.29 | 5.50 | MrLBD30 | KAB1204031.1 | 328 | 36 316.30 | 8.72 | |
MrLBD14 | KAB1210747.1 | 143 | 15 916.37 | 6.87 | MrLBD31 | KAB1202246.1 | 146 | 16 044.26 | 7.59 | |
MrLBD15 | KAB1210750.1 | 156 | 17 266.82 | 6.87 | MrLBD32 | KAB1226549.1 | 231 | 26 061.33 | 8.04 | |
MrLBD16 | KAB1223345.1 | 234 | 25 229.54 | 7.00 |
为了明确杨梅LBD基因家族中基因之间的联系,对其采取了染色体定位方法进行研究,结果如图 1所示。杨梅33个LBD基因随机分布在8条染色体上,3号染色体上分布的LBD基因最多(8个,占比24%),其次是2号染色体和6号染色体(6个,占比18%),最少的是7号染色体(1个,占比3%);1号、4号、5号、8号染色体上各有3个LBD基因。
2.3 杨梅和拟南芥侧生器官边界域基因系统进化分析经过对差异性种类植物的LBD基因进行系统发育的比较研究,可以发现植物中LBD基因家族演化过程存在广泛性和相对保守性[12]。为了分析杨梅和拟南芥的LBD基因之间的进化关系,建立了杨梅与拟南芥LBD系统进化树(图 2)。根据系统进化树聚类结构,Class Ⅰ类可划分为Class Ⅰa、Class Ⅰb、Class Ⅰc、Class Ⅰd、Class Ⅰe和Class f六个亚类,杨梅基因组分别包括3、6、4、4、11和1个LBD基因家族成员;拟南芥基因组分别包括3、10、8、8、7和0个LBD基因家族成员。因为存在Class Ⅱa和Class Ⅱ b亚类,杨梅基因组总共包括1个和4个LBD基因家族的成员,而拟南芥基因组的Class Ⅱa和Class Ⅱ b亚类都分别拥有3个LBD基因家族的成员。由此可排除Class Ⅰf,其余任何的分类中都涵盖了杨梅和拟南芥LBD基因家族的成员,这就证明它们可能拥有相同的先祖,但是在Class Ⅰf亚类中只含有杨梅LBD基因家族成员MrLBD32,这表明了杨梅MrLBD32基因(登录号KAB1226549.1)有可能是与拟南芥最后的一个共同祖先产生歧化后所获得的,或可能是在拟南芥中失去或形成物种特异的LBD基因导致功能分化的结果。
2.4 杨梅侧生器官边界域基因保守基序与基因结构分析通过对LBD基因家族的基因结构和保守基序进行分析,发现了15个保守基序(图 3),其中的Motif 1、Motif 2、Motif 3、Motif 4和Motif 11构成保守性的LOB结构域。Motif 1包含了LBD基因家族的CX2CX6CX3C基序,并且在每一个LBD基因家族的成员中都存在Motif 1。除了MrLBD31(登录号KAB1202246.1)和MrLBD32(登录号KAB1226549.1)以外其他的LBD蛋白都包括Motif 2和Motif 3,这说明Motif 2和Motif 3是LOB中相对保守的一段序列。在Class Ⅱ类中的5个蛋白都含有Motif 1、Motif 2、Motif 3和Motif 9,从而推断Motif 1、Motif 2、Motif 3和Motif 9基序或许决定了Class Ⅱ类蛋白的特异性功能,因此,今后对Class Ⅱ类的Motif 1、Motif 2、Motif 3和Motif 9基序的蛋白功能研究应该更加深入。LBD基因家族各组成员包含了各种不同的Motif,这可能是在高等植物进化过程中形成的[13]。因为不同基因家族成员的Motif可能在特定的基因特性上呈现差异性的变化,所以位于同一个亚类或分支下的杨梅LBD基因在同等的位置拥有类似的蛋白基序。同时,对LBD基因的内含子和外显子结构进行研究,发现杨梅LBD基因结构并不复杂,除MrLBD32基因(总共含有4个内含子)之外,其余LBD基因所含内含子都不超过2个,在这其中有8个基因不含内含子,另外18个基因中只包含1个内含子,6个基因含有2个内含子。
2.5 杨梅侧生器官边界域蛋白序列比对与三级结构分析对33个杨梅LBD蛋白进行多基因序列比较,并绘制出两段有颜色标识的序列以此来认定保守序列的性质(图 4)。LOB结构域序列的N处端都存在一个CX2CX6CX3C。除此之外,在Class Ⅰ类蛋白中仅含9个MrLBD蛋白序列包含有完整的类亮氨酸拉链LX6LX3LX6L基序,这些蛋白序列分别是MrLBD3(登录号KAB1222304.1)、MrLBD6(登录号KAB1209131.1)、MrLBD7(登录号KAB1226130.1)、MrLBD8(登录号KAB1214668.1)、MrLBD12(登录号KAB1218940.1)、MrLBD16(登录号KAB1223345.1)、MrLBD17(登录号KAB1208819.1)、MrLBD18(登录号KAB1218941.1)、MrLBD19(登录号KAB1218043.1)。
基于SWISS-MODEL数据库对杨梅MrLBD蛋白质进行同源建模,选择QMean值最高的结构作为MrLBD蛋白的最佳结构,预测了杨梅MrLBD两个亚家族的成员结构,结果如图 5所示。其中Class Ⅰ是MrLOB的结构[图 5(a)],Class Ⅱ是MrLBD29的结构[图 5(b)]。MrLBD蛋白3D结构的氨基末端区域(amino terminal domain, NTR)和羧基末端区域(carboxyl terminal domain, CTR)也显示在图 5中。正如同源建模模拟分析所显示,每个亚科(MrLOB和MrLBD29)的3D结构都呈现出近似于对称的“Y”形,因此,它们在结构上具有相似性;位于每个亚科上的CTR和NTR具有一些保守性的结构,从而可推测出这两个亚科在蛋白质结构水平上的基因和功能存在相似性。
2.6 杨梅侧生器官边界域基因的共线性及同源性分析杨梅LBD基因的染色体分布和染色体间的关系示意图如图 6所示,除了Chr7之外,MrLBD基因在8个染色体上分布不均。其中一些连锁群上具有较多的基因(如Chr3和Chr6),在Chr3上包含数量最多的MrLBD基因(8个);而在Chr7上只包含1个MrLBD28基因。这些结果表明,染色体的长度与基因的数量无正相关性;部分MrLBD基因可能是自身基因复制产生的,分段性的复制事件是MrLBD进化的主要驱动力[14]。
为了进一步推测杨梅LBD基因家族的系统发育机制,构建了杨梅与6种代表性植物相关性比较的共线图谱,其中包括3种双子叶植物(拟南芥、番茄和葡萄)和3种单子叶植物(小麦、水稻和玉米),结果如图 7所示。杨梅共有31个MrLBD基因与葡萄同源,其次是与番茄(21个)、拟南芥(19个)、小麦(14个)、水稻(12个)和玉米(11个)同源。一些MrLBD基因被发现至少与3对同源基因相关联(特别是杨梅和葡萄)。例如MrLBD13和MrLBD26,可以推测出这些基因可能在LBD基因家族的进化过程中发挥了重要作用。值得注意的是,在杨梅和番茄之间发现的一些LBD共线性基因对被锚定在高度保守的共线性片段之上,这些片段跨越了100多个基因。杨梅和拟南芥之间的基因都位于同线性区域中,其同源基因对不超过20对。杨梅与水稻、小麦、玉米和葡萄的亲缘关系也很相似,除此之外,在杨梅和6种代表性植物之间发现了一些共线对,表明这些同源基因对可能在祖先分化之前就已经存在了。
3 讨论与结论LBD基因是植物中存在的独特的一类基因家族,其在植物生长发育过程和逆境响应调控网络中发挥了重要的功能[15]。杨梅已经有多个基因已被筛选鉴定,但在全基因组水平上对杨梅LBD基因家族的鉴定与剖析鲜见报道。本研究对杨梅LBD基因家族进行全面分析,共鉴定出33个家族成员,可分为Class Ⅰ和Class Ⅱ两大类,在同一类或亚类中具有高度相似的外显子-内含子结构和基序。在杨梅LBD基因结构中,除MrLBD32(包含4个内含子)情况特殊之外,其余内含子数都不超过2;相同的亚类基因拥有的内含子数目和外显子长度接近,这说明进化关系相接近的基因拥有类似的基因结构。对拟南芥与杨梅LBD基因进行聚类分析,由此建立系统进化树,并且选用33个杨梅LBD蛋白序列进行对比可知,除MrLBD32外,其他所有蛋白序列都包括有半胱氨酸CX2CX6CX3C,在Class Ⅰ类蛋白中仅含9个MrLBD蛋白序列拥有类亮氨酸拉链LX6LX3LX6L,该结构功能与蛋白二聚化的形成有密切联系[16]。不同物种的同义分析是洞察其进化和亲缘关系的一种方式[17],最后通过杨梅自身种内共线性比对、与6种代表性植物的种间共线性比对发现,杨梅的这些同源基因对与6种代表性植物的同源基因对可能在祖先分化之前就已经存在了。本研究结果可为今后更全面地研究杨梅LBD基因的特性作用奠定基础,对杨梅LBD基因家族其他功能的研究将成为未来的科研重点。
[1] |
凌关庭. 杨梅提取物及其抗氧化作用[J]. 粮食与油脂, 2009(4): 38-41. DOI:10.3969/j.issn.1008-9578.2009.04.013 |
[2] |
焦云. 杨梅基因组SSR标记开发和雄株遗传多样性分析[D]. 杭州: 浙江大学, 2012.
|
[3] |
戚行江, 任海英, 梁森苗, 等. 杨梅全基因组测序结果初报[J]. 浙江农业科学, 2015, 56(10): 1564-1566. |
[4] |
贾慧敏. 杨梅全基因组测序和雌雄性别控制遗传分析[D]. 杭州: 浙江大学, 2016.
|
[5] |
MAJER C, HOCHHOLDINGER F. Defining the boundaries: structure and function of LOB domain proteins[J]. Trends in Plant Science, 2011, 16(1): 47-52. DOI:10.1016/j.tplants.2010.09.009 |
[6] |
王小非, 刘鑫, 苏玲, 等. 番茄LBD基因家族的全基因组序列鉴定及其进化和表达分析[J]. 中国农业科学, 2013, 46(12): 2501-2513. DOI:10.3864/j.issn.0578-1752.2013.12.011 |
[7] |
郑忠凡, 张亚利, 胡灿, 等. 辣椒全基因组中LBD转录因子的鉴定与表达分析[J]. 园艺学报, 2016, 43(4): 683-694. |
[8] |
何红红, 马宗桓, 张元霞, 等. 葡萄LBD基因家族的鉴定与表达分析[J]. 中国农业科学, 2018, 51(21): 4102-4118. DOI:10.3864/j.issn.0578-1752.2018.21.009 |
[9] |
芦强, 邵芬娟, 邱德有. 毛果杨LBD基因家族的全基因组分析[J]. 基因组学与应用生物学, 2018, 37(1): 313-325. |
[10] |
贾喜涛, 刘文献, 谢文刚, 等. 蒺藜苜蓿LBD转录因子基因家族全基因组分析[J]. 西北植物学报, 2014, 34(11): 2176-2187. DOI:10.7606/j.issn.1000-4025.2014.11.2176 |
[11] |
邢光伟, 王梦醒, 马小飞, 等. 小麦LBD基因家族的全基因组鉴定、表达特性及调控网络分析[J]. 麦类作物学报, 2017, 37(7): 855-863. |
[12] |
芦强, 邵芬娟, 邱德有. 雷蒙德氏棉LBD基因家族的鉴定及进化表达分析[J]. 分子植物育种, 2017, 15(11): 4308-4324. |
[13] |
徐道兰. 问荆(Equisetum arvense)MADS-box基因的克隆与分析[D]. 上海: 上海师范大学, 2014.
|
[14] |
XIE T, CHEN C J, LI C H, et al. Genome-wide investigation of WRKY gene family in pineapple: evolution and expression profiles during development and stress[J]. BMC Genomics, 2018, 19(1): 490. DOI:10.1186/s12864-018-4880-x |
[15] |
IWAKAWA H, UENO Y, SEMIARTI E, et al. The ASYMMETRIC LEAVES2 gene of Arabidopsis thaliana, required for formation of asymmetric flat leaf lamina, encodes a member of a novel family of proteins characterized by cysteine repeats and a leucine zipper[J]. Plant & Cell Physiology, 2002, 43(5): 467-478. |
[16] |
MATSUMURA Y, IWAKAWA H, MACHIDA Y, et al. Characterization of genes in the ASYMMETRIC LEAVES2/LATERAL ORGAN BOUNDARIES (AS2/LOB) family in Arabidopsis thaliana, and functional and molecular compar-isons between AS2 and other family members[J]. The Plant Journal, 2009, 58(3): 525-537. DOI:10.1111/j.1365-313X.2009.03797.x |
[17] |
YU J W, XIE Q W, LI C, et al. Comprehensive characterization and gene expression patterns of LBD gene family in Gossypium[J]. Planta, 2020, 251(4): 81. DOI:10.1007/s00425-020-03364-8 |