文章信息
- 原晓龙, 王毅, 张劲峰
- YUAN Xiaolong, WANG Yi, ZHANG Jingfeng
- 灰毛浆果楝叶绿体基因组密码子使用特征分析
- Characterization of codon usage in Cipadessa cinerascens chloroplast genome
- 森林与环境学报,2020, 40(2): 195-202.
- Journal of Forest and Environment,2020, 40(2): 195-202.
- http://dx.doi.org/10.13324/j.cnki.jfcf.2020.02.013
-
文章历史
- 收稿日期: 2019-12-16
- 修回日期: 2020-01-30
2. 云南省森林植物培育与开发利用重点实验室, 云南 昆明 650201
2. Yunnan Key Laboratory of Forest Plant Cultivation and Utilization, Kunming, Yunnan 650201, China
叶绿体拥有一套独立于核的基因组,是一种存在于植物中的半自主性细胞器,属细胞质遗传[1]。叶绿体是植物光合作用的细胞器,且植物的能量供给和次生代谢产物的生物合成均在其参与下完成[2]。植物花粉中不含叶绿体,且叶绿体基因拷贝数多、基因组数量多[3],因此以叶绿体基因组为受体进行转基因操作可避免花粉逃逸带来的生物安全问题[4],并可迅速得到表达量较高的转基因后代[1],叶绿体基因工程已在拟南芥[Arabidopsis thaliana (L.) Heynh][5]、棉花(Gossypium hirsutum L.)[6]等植物中成功转化。叶绿体基因工程是以基因序列的同源重组为基础[7],因此通过研究叶绿体基因组的蛋白编码序列特征和密码子的碱基组成,有助于提高遗传转化效率和目的基因高效稳定表达[8],还可以评估分子系统进化水平[9]。蛋白编码序列的DNA由除起始密码子和终止密码子外通用的61个密码子翻译,除蛋氨酸和色氨酸外,其余氨基酸均有两种以上的同义密码子共同编码[10];各同义密码子在翻译过程中的使用频率并不均等,这种现象称为密码子偏好性(codon usage bias, CUB)[11]。密码子偏好性在不同物种、组织或基因中具丰富的多样性,这是物种或基因在长期的进化过程中受自然选择、碱基突变及遗传漂移等因素综合作用的结果[12-13];同时密码子偏好性还与基因组大小[14]、内含子数量[15]、tRNA丰度[16]和基因表达水平[17]等因素存在关联。密码子偏好性是物种的进化特征之一,分析密码子的使用模式和影响因素,有助于对生物适应性的分子机制、物种间的进化关系等研究提供参考依据。
灰毛浆果楝[Cipadessa cinerascens (Pell.) Hand.-Mazz.]又名亚洛轻、假茶辣等,为楝科(Meliaceae)浆果楝属(Cipadessa)植物,灌木或小乔木,主要生长在四川、贵州、广西及云南等地160~2 400 m的雨林、常绿阔叶林、山坡灌丛和草地[18-19]。灰毛浆果楝的根、叶及全株均可入药,目前已报道的主要成分包括二萜、黄酮及其苷,以及作为楝科植物特征次生代谢产物的柠檬苦素等化合物,其中柠檬苦素类化合物含有丰富的四降三萜的结构骨架,含四降三萜结构骨架的化合物具抗肿瘤、抗菌、拒食活性等生物活性[18, 20-21]。目前多种植物的叶绿体基因组全长序列已经测定完成,叶绿体基因密码子使用模式在竹亚科植物[10]和7种作物[1]中已有报道。本研究通过对灰毛浆果楝叶绿体基因组进行高通量测序,通过同源序列比对和基因注释获得了蛋白编码序列,以此为基础,对灰毛浆果楝叶绿体基因的密码子使用模式进行初步分析,探讨影响其密码子使用偏性形成的主要因素, 以期为灰毛浆果楝叶绿体分子进化、明确灰毛浆果楝的系统发育位置、不同种源鉴定及叶绿体基因工程等提供基础数据。
1 材料与方法 1.1 试验材料灰毛浆果楝叶片采自云南省林业和草原科学院普文热带林业研究所,送至生工生物工程(上海)股份有限公司进行测序,获得灰毛浆果楝叶绿体基因组数据并提交至美国国立生物技术中心(National Center for Biotechnology Information, NCBI)查询其登录号为MN126582,对其叶绿体的编码序列(coding sequence, CDS)进行筛选,剔除序列长度小于300 bp、序列不完整和序列中间存在终止密码子的序列,留存含有起始密码子ATG和末端终止密码子UAA、UAG、UGA的CDS[22]。从灰毛浆果楝叶绿体基因组85条蛋白编码序列中筛选得到54条CDS。
1.2 研究方法对从灰毛浆果楝叶绿体基因组中筛选得到的54条CDS进行分析,其中通过在线软件CUSP(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)计算不同基因密码子各位置的鸟嘌呤和胞嘧啶(guanine and cytosine, GC)含量(GC1、GC2、GC3)[1],以GC12(GC1、GC2的平均值)为纵坐标、以GC3为横坐标进行中性绘图分析,以GC3为横坐标、有效密码子数(effective number of codons, Nec)为纵坐标进行有效密码子数绘图(Nec-plot)分析,以A3/(A3+T3)为纵坐标、G3/(G3+C3)为横坐标进行奇偶偏差(PR2-plot)分析,通过上述分析以明确灰毛浆果楝叶绿体基因组密码子的使用偏性规律[1, 10]。
结合灰毛浆果楝叶绿体基因组密码子的高频率密码子和高表达密码子的分析结果,将同义密码子相对使用度(relative synonymous codon usage, URSC)>1的密码子确定为高频密码子;以Nec值为偏好性标准,选择两极10%的基因构建高低偏性基因库,将ΔURSC≥0.08的密码子定为高表达优越密码子;最终将同时满足2种条件的密码子定为灰毛浆果楝叶绿体基因组的最优密码子[23]。
2 结果与分析 2.1 叶绿体编码基因同义密码子的使用偏性选择灰毛浆果楝叶绿体基因组中CDS长度大于300 bp的54个蛋白编码序列整合成一个整体进行同义密码子偏好性分析,该序列共有64 473 bp的核苷酸序列,21 491个有义密码子,其中含21 437个同义密码子。用Codon W 1.4.2和在线软件CUSP分析该序列,得到灰毛浆果楝叶绿体基因组不同位置的GC含量(表 1),在灰毛浆果楝叶绿体基因组中,密码子的平均GC含量为38.70%,3个位置上GC含量从大到小依次为GC1、GC2、GC3,含量分别为47.41%、39.74%和28.95%,可见叶绿体基因中的GC含量总体较低,且3个位置上GC含量差异较大,表现为GC3含量最低,说明在灰毛浆果楝叶绿体中,以A和T碱基结尾的密码子的使用频率高于以G和C碱基结尾的密码子。Nec作为判断密码子使用偏性的指标之一,取值范围从20到61,具体可阐释为若每个氨基酸仅用一个密码子则Nec值为20,若各同义密码子的使用机会完全均等则Nec值为61,即Nec值越小则密码子使用偏性则越大[24];灰毛浆果楝叶绿体基因组的Nec平均值为48.09,Nec实际值介于34.60~61.00,Nec值大于45的基因有39个,说明该叶绿体基因组的密码子使用偏性非随机选择,且偏性较弱。
| 基因 Gene |
GC含量Content of GC/% | Nec | |||
| GC1 | GC2 | GC3 | GCall | ||
| psbA | 50.28 | 43.22 | 33.05 | 42.18 | 40.05 |
| matK | 42.29 | 31.62 | 28.85 | 34.26 | 52.16 |
| atpA | 54.94 | 39.72 | 28.46 | 41.04 | 48.03 |
| atpF | 46.49 | 32.97 | 32.43 | 37.30 | 43.46 |
| atpI | 48.79 | 37.10 | 28.63 | 38.17 | 46.13 |
| rps2 | 44.30 | 43.88 | 28.69 | 38.96 | 48.54 |
| rpoC2 | 46.88 | 37.49 | 31.40 | 38.59 | 51.24 |
| rpoC1 | 50.44 | 38.37 | 27.03 | 38.61 | 48.50 |
| rpoB | 50.23 | 37.54 | 29.13 | 38.97 | 49.56 |
| psbD | 52.54 | 43.22 | 32.20 | 42.66 | 43.66 |
| psbC | 54.01 | 45.99 | 31.86 | 43.95 | 46.33 |
| rps14 | 42.57 | 45.54 | 31.68 | 39.93 | 40.49 |
| psaB | 49.12 | 42.99 | 31.70 | 41.27 | 48.58 |
| psaA | 52.46 | 43.54 | 33.16 | 43.05 | 49.70 |
| ycf3 | 47.34 | 38.46 | 33.14 | 39.64 | 61.00 |
| rps4 | 51.98 | 38.12 | 24.75 | 38.28 | 51.25 |
| ndhJ | 50.94 | 37.11 | 29.56 | 39.20 | 55.39 |
| ndhK | 44.00 | 43.56 | 30.22 | 39.26 | 53.77 |
| ndhC | 44.63 | 33.06 | 28.10 | 35.26 | 53.43 |
| atpE | 47.01 | 40.30 | 29.10 | 38.81 | 46.28 |
| atpB | 56.91 | 41.88 | 31.06 | 43.29 | 48.07 |
| rbcL | 57.64 | 43.39 | 30.17 | 43.73 | 49.14 |
| accD | 41.16 | 37.75 | 29.12 | 36.01 | 46.17 |
| ycf4 | 44.27 | 39.06 | 32.29 | 38.54 | 51.04 |
| cemA | 41.63 | 28.76 | 31.33 | 33.91 | 58.38 |
| petA | 54.21 | 36.45 | 32.71 | 41.12 | 52.15 |
| rps18 | 35.29 | 42.16 | 24.51 | 33.99 | 34.60 |
| rpl20 | 38.98 | 44.07 | 24.58 | 35.88 | 48.35 |
| rps12 | 52.42 | 48.39 | 32.26 | 44.35 | 44.48 |
| clpP | 56.35 | 37.56 | 34.52 | 42.81 | 56.78 |
| psbB | 54.81 | 46.37 | 28.49 | 43.22 | 45.59 |
| petB | 49.07 | 41.20 | 27.78 | 39.35 | 43.07 |
| petD | 51.55 | 39.13 | 27.33 | 39.34 | 43.37 |
| rpoA | 46.34 | 31.10 | 28.05 | 35.16 | 51.21 |
| rps11 | 56.12 | 58.99 | 25.90 | 47.00 | 48.55 |
| rps8 | 42.96 | 39.26 | 29.63 | 37.28 | 40.73 |
| rpl14 | 55.28 | 38.21 | 25.20 | 39.57 | 48.79 |
| rpl16 | 48.53 | 52.21 | 26.47 | 42.40 | 38.36 |
| rps3 | 48.18 | 33.18 | 20.00 | 33.79 | 43.58 |
| rpl22 | 43.21 | 36.42 | 28.40 | 36.01 | 55.07 |
| rpl2 | 51.27 | 48.73 | 32.73 | 44.24 | 54.40 |
| ycf2 | 42.10 | 34.77 | 36.95 | 37.94 | 53.67 |
| ndhB | 42.19 | 39.35 | 31.44 | 37.66 | 48.67 |
| rps7 | 53.21 | 44.87 | 24.36 | 40.81 | 44.41 |
| ndhF | 37.58 | 36.38 | 25.50 | 33.15 | 45.54 |
| ccsA | 34.11 | 36.73 | 27.99 | 32.94 | 46.39 |
| ndhD | 42.55 | 37.65 | 33.73 | 37.97 | 52.69 |
| ndhE | 39.60 | 35.64 | 28.71 | 34.65 | 54.67 |
| ndhG | 45.25 | 34.64 | 25.70 | 35.20 | 47.79 |
| ndhI | 42.86 | 38.10 | 20.83 | 33.93 | 41.58 |
| ndhA | 42.86 | 39.01 | 23.36 | 35.16 | 40.82 |
| ndhH | 50.51 | 36.29 | 27.66 | 38.16 | 49.17 |
| ycf1 | 36.55 | 29.78 | 26.79 | 31.04 | 47.63 |
| rps7 | 53.21 | 44.87 | 24.36 | 40.81 | 44.41 |
| 平均值 Average |
47.41 | 39.74 | 28.95 | 38.70 | 48.09 |
GC1、GC2、GC3、GCall、Nec和密码子数目(N)的相关性分析结果(表 2)表明,GCall与GC1、GC2、GC3,GC1与GC2等均呈极显著相关,GC3与GC1、GC2均未达到显著相关,说明密码子的第1位和第2位碱基组成相似,而与密码子第3位碱基组成存在差异。Nec与GC3呈极显著相关,Nec与GC2呈显著相关,Nec与GC1未达到显著相关水平,说明密码子第2位和第3位碱基GC含量对密码子偏好性有影响,其中第3位影响最大。GC3和N呈显著相关关系,说明N对Nec具一定的影响。除蛋氨酸和色氨酸外,其余18种氨基酸的URSC值(表 3)显示,URSC值大于1的密码子有29个,其中16个以U结尾,12个以A结尾,1个以G结尾,密码子以A和U出现的频率较高,说明其为灰毛浆果楝叶绿体基因组的偏好密码子,而以C和G结尾的密码子为非偏好密码子。
| 因素Factor | GC1 | GC2 | GC3 | GCall | Nec |
| GC2 | 0.425** | ||||
| GC3 | 0.147 | 0.015 | |||
| GCall | 0.829** | 0.766** | 0.416** | ||
| Nec | 0.074 | -0.336* | 0.427** | 0.004 | |
| N | -0.150 | -0.261 | 0.299* | -0.123 | 0.154 |
| 注:**表示在P < 0.01水平(双侧)上显著相关;*表示在P < 0.05水平(双侧)上显著相关。Notes: ** means extremely significant correlation at P < 0.01(bilateral); * means significant correlation at P < 0.05(bilateral). | |||||
| 基酸 Amino acid |
密码子 Codon |
数量 Number |
URSC |
| 苯丙氨酸 Phe |
UUU | 805 | 1.32 |
| UUC | 415 | 0.68 | |
| 半胱氨酸 Cys |
UGU | 172 | 1.46 |
| UGC | 64 | 0.54 | |
| 谷氨酰胺 Gln |
CAA | 591 | 1.56 |
| CAG | 168 | 0.44 | |
| 缬氨酸 Val |
GUU | 440 | 1.48 |
| GUC | 131 | 0.44 | |
| GUA | 454 | 1.53 | |
| GUG | 162 | 0.55 | |
| 甘氨酸 Gly |
GGU | 508 | 1.34 |
| GGC | 143 | 0.38 | |
| GGA | 604 | 1.60 | |
| GGG | 259 | 0.68 | |
| 亮氨酸 Leu |
UUA | 714 | 1.90 |
| UUG | 456 | 1.22 | |
| CUU | 470 | 1.25 | |
| CUC | 135 | 0.36 | |
| CUA | 311 | 0.83 | |
| CUG | 164 | 0.44 | |
| 天冬氨酸 Asp |
GAU | 698 | 1.59 |
| GAC | 180 | 0.41 | |
| 组氨酸 His |
CAU | 390 | 1.46 |
| CAC | 144 | 0.54 | |
| 天冬酰胺 Asn |
AAU | 794 | 1.55 |
| AAC | 229 | 0.45 | |
| 脯氨酸 Pro |
CCU | 338 | 1.53 |
| CCC | 184 | 0.84 | |
| CCA | 240 | 1.09 | |
| CCG | 119 | 0.54 | |
| 丙氨酸 Ala |
GCU | 537 | 1.75 |
| GCC | 195 | 0.64 | |
| GCA | 343 | 1.12 | |
| GCG | 150 | 0.49 | |
| 丝氨酸 Ser |
UCU | 438 | 1.63 |
| UCC | 265 | 0.99 | |
| UCA | 310 | 1.16 | |
| UCG | 157 | 0.59 | |
| AGU | 331 | 1.24 | |
| AGC | 98 | 0.37 | |
| 谷氨酸 Glu |
GAA | 874 | 1.52 |
| GAG | 273 | 0.48 | |
| 酪氨酸 Tyr |
UAU | 639 | 1.63 |
| UAC | 145 | 0.37 | |
| 赖氨酸 Lys |
AAA | 833 | 1.49 |
| AAG | 283 | 0.51 | |
| 苏氨酸 Thr |
ACU | 423 | 1.58 |
| ACC | 200 | 0.75 | |
| ACA | 329 | 1.23 | |
| ACG | 118 | 0.44 | |
| 异亮氨酸 Ile |
AUU | 901 | 1.47 |
| AUC | 381 | 0.62 | |
| AUA | 557 | 0.91 | |
| 精氨酸 Arg |
CGU | 273 | 1.26 |
| CGC | 102 | 0.47 | |
| CGA | 301 | 1.39 | |
| CGG | 111 | 0.51 | |
| AGA | 381 | 1.76 | |
| AGG | 133 | 0.61 |
灰毛浆果楝叶绿体基因组中各基因中性绘图分析(图 1)显示,GC12处于0.331 7~0.575 6区间,GC3处于0.200 0~0.369 5区间;除ycf2基因的GC12(0.384 4)、GC3(0.369 5),二者的比值为1.04,在图中接近对角线;其余基因均分布在对角线上方。采用SPSS 19.0软件分析GC12和GC3的相关性统计(Pearson)的相关系数为0.098 4,相关性不显著,回归系数(对角线斜率)为0.137 9,表明在灰毛浆果楝叶绿体基因组中,各基因的密码子第1位、第2位与第3位的碱基组成无显著差异,其密码子使用偏性较多地受选择压力的影响。
|
图 1 密码子使用的中性绘图分析 Fig. 1 Neutrality plot analysis of the codon usage |
GC3与Nec的关联分析(图 2)显示,灰毛浆果楝叶绿体中的部分基因位于标准曲线附近,这部分基因的实际Nec值与预期Nec值接近;另一部分基因距离标准曲线较远的位置,即实际Nec值与预期Nec值差异较大。为了更准确地说明哪些基因离标准曲线较近,采用Nec比值((预期Nec值-实际Nec值)/预期Nec值)统计Nec比值频数(表 4),结果显示Nec比值位于-0.05~0.05区间外的基因数有36个,即大部分基因的实际Nec值与预期Nec值的相差较大,密码子偏好性与GC3的差异有关,故灰毛浆果楝叶绿体基因组密码子偏好性更多地受选择的影响。
|
图 2 密码子使用的有效密码子数绘图分析 Fig. 2 Nec-plot analysis of the codon usage |
| 组限 Class limit |
组中值 Class mid-value |
组数 Frequency number |
组频 Frequency |
| -0.15~(-0.05) | -0.1 | 6 | 0.11 |
| -0.05~0.05 | 0.0 | 18 | 0.33 |
| 0.05~0.15 | 0.1 | 21 | 0.39 |
| 0.15~0.25 | 0.2 | 7 | 0.13 |
| 0.25~0.35 | 0.3 | 2 | 0.04 |
| 合计Total | 54 | 1.00 |
通过PR2-plot绘图分析灰毛浆果楝各基因编码的部分氨基酸的嘌呤(A和G)与嘧啶(T和C)的关系(图 3),结果显示,大部分基因位于PR2平面图的下方,其中位于PR2平面图右下方的基因较多,说明在碱基使用频率方面,T>A且G>C;如果仅受碱基突变的影响,则4个碱基平均分布在PR2平面,这个结果说明灰毛浆果楝叶绿体基因组密码子使用模式受多种因素共同作用的影响。
|
图 3 奇偶偏差绘图分析 Fig. 3 Analysis of PR2 bias plot |
将灰毛浆果楝叶绿体基因组中的54个编码基因作为一个整体在Codon W 1.4.2软件上运行,以Nec值为标准进行排序,选择两极5%的构建高表达和低表达基因库,分别对两个库中的密码子计算URSC值,再统计各基因ΔURSC值(表 5),筛选得到0.08≤ΔURSC < 0.30的密码子,含UUC、UUG和CUA等26个高表达优越密码子(在表 5中用*表示),其中6个以A结尾、9个以U结尾、2个以G结尾和9个以C结尾;0.30≤ΔURSC < 0.50的有9个,ΔURSC≥0.50的有5个。结合高频密码子和高表达优越密码子,将同时满足2种条件的密码子确定为灰毛浆果楝叶绿体基因组的最优密码子,即可最终确定GUU、GUA、UCU、AGU、CCU、ACU、GGU、GCU、CAA、AAA、UGU、AGA和AUU,且全部以A或U结尾,其中9个以U结尾,4个以A结尾。
| 氨基酸 Amino acid |
密码子 Codon |
高表达基因 High expression gene |
低表达基因 Low expression gene |
ΔURSC | |||
| 数目Number | URSC | 数目Number | URSC | ||||
| 苯丙氨酸 Phe |
UUU | 17 | 0.87 | 26 | 1.30 | -0.43 | |
| UUC** | 22 | 1.13 | 14 | 0.70 | 0.43 | ||
| 酪氨酸 Tyr |
UAU | 18 | 1.50 | 42 | 1.68 | -0.18 | |
| UAC* | 6 | 0.50 | 8 | 0.32 | 0.18 | ||
| 组氨酸 His |
CAU | 12 | 1.26 | 17 | 1.42 | -0.16 | |
| CAC* | 7 | 0.74 | 7 | 0.58 | 0.16 | ||
| 谷氨酰胺 Gln |
CAA** | 19 | 1.90 | 26 | 1.53 | 0.37 | |
| CAG | 1 | 0.10 | 8 | 0.47 | -0.37 | ||
| 天冬酰胺 Asn |
AAU | 23 | 1.07 | 31 | 1.48 | -0.41 | |
| AAC** | 20 | 0.93 | 11 | 0.52 | 0.41 | ||
| 赖氨酸 Lys |
AAA** | 32 | 1.73 | 29 | 1.26 | 0.47 | |
| AAG | 5 | 0.27 | 17 | 0.74 | -0.47 | ||
| 天冬氨酸 Asp |
GAU | 10 | 1.11 | 31 | 1.63 | -0.52 | |
| GAC*** | 8 | 0.89 | 7 | 0.37 | 0.52 | ||
| 谷氨酸 Glu |
GAA | 32 | 1.52 | 52 | 1.60 | -0.08 | |
| GAG* | 10 | 0.48 | 13 | 0.40 | 0.08 | ||
| 半胱氨酸 Cys |
UGU*** | 6 | 2.00 | 7 | 1.40 | 0.60 | |
| UGC | 0 | 0 | 3 | 0.60 | -0.60 | ||
| 缬氨酸 Val |
GUU* | 17 | 1.66 | 19 | 1.52 | 0.14 | |
| GUC | 2 | 0.20 | 6 | 0.48 | -0.28 | ||
| GUA* | 20 | 1.95 | 22 | 1.76 | 0.19 | ||
| GUG | 2 | 0.20 | 3 | 0.24 | -0.04 | ||
| 脯氨酸 Pro |
CCU** | 15 | 1.76 | 12 | 1.37 | 0.39 | |
| CCC | 7 | 0.82 | 10 | 1.14 | -0.32 | ||
| CCA | 6 | 0.71 | 7 | 0.80 | -0.09 | ||
| CCG | 6 | 0.71 | 6 | 0.69 | 0.02 | ||
| 苏氨酸 Thr |
ACU*** | 19 | 1.81 | 12 | 1.30 | 0.51 | |
| ACC** | 12 | 1.14 | 6 | 0.65 | 0.49 | ||
| ACA | 9 | 0.86 | 14 | 1.51 | -0.65 | ||
| ACG | 2 | 0.19 | 5 | 0.54 | -0.35 | ||
| 甘氨酸 Gly |
GGU*** | 31 | 1.94 | 17 | 1.21 | 0.73 | |
| GGC | 6 | 0.38 | 11 | 0.79 | -0.41 | ||
| GGA | 19 | 1.19 | 18 | 1.29 | -0.10 | ||
| GGG | 8 | 0.50 | 10 | 0.71 | -0.21 | ||
| 丙氨酸 Ala |
GCU*** | 34 | 2.39 | 20 | 1.48 | 0.91 | |
| GCC | 4 | 0.28 | 14 | 1.04 | -0.76 | ||
| GCA* | 15 | 1.05 | 12 | 0.89 | 0.16 | ||
| GCG | 4 | 0.28 | 8 | 0.59 | -0.31 | ||
| 异亮氨酸 Ile |
AUU* | 39 | 1.54 | 40 | 1.36 | 0.18 | |
| AUC* | 17 | 0.67 | 15 | 0.51 | 0.16 | ||
| AUA | 20 | 0.79 | 33 | 1.13 | -0.34 | ||
| 亮氨酸 Leu |
UUA | 20 | 1.67 | 25 | 1.67 | 0.00 | |
| UUG** | 17 | 1.42 | 14 | 0.93 | 0.49 | ||
| CUU | 17 | 1.42 | 21 | 1.40 | 0.02 | ||
| CUC | 3 | 0.25 | 7 | 0.47 | -0.22 | ||
| CUA* | 13 | 1.08 | 14 | 0.93 | 0.15 | ||
| CUG | 2 | 0.17 | 9 | 0.60 | -0.43 | ||
| 丝氨酸 Ser |
UCU* | 24 | 2.29 | 21 | 2.03 | 0.26 | |
| UCC* | 10 | 0.95 | 8 | 0.77 | 0.18 | ||
| UCA | 4 | 0.38 | 11 | 1.06 | -0.68 | ||
| UCG | 6 | 0.57 | 6 | 0.58 | -0.01 | ||
| AGU** | 16 | 1.52 | 11 | 1.06 | 0.46 | ||
| AGC | 3 | 0.29 | 5 | 0.48 | -0.19 | ||
| 精氨酸 Arg |
CGU | 22 | 1.57 | 12 | 1.50 | 0.07 | |
| CGC* | 4 | 0.29 | 1 | 0.13 | 0.16 | ||
| CGA | 22 | 1.57 | 13 | 1.63 | -0.06 | ||
| CGG | 3 | 0.21 | 6 | 0.75 | -0.54 | ||
| AGA** | 24 | 1.71 | 10 | 1.25 | 0.46 | ||
| AGG | 9 | 0.64 | 6 | 0.75 | -0.11 | ||
| 注: *表示0.08≤ΔURSC < 0.30, **表示0.30≤ΔURSC < 0.50, ***表示ΔURSC≥0.50。Notes: * means 0.08≤ΔURSC < 0.30, **means 0.30≤ΔURSC < 0.50, ***means ΔURSC≥0.50. | |||||||
遗传密码子是关联基因组DNA和功能蛋白质的联系枢纽,是构成生命信息的基本单元。然而除了蛋氨酸和色氨酸外,其余氨基酸的同义密码子的使用频率并不相同,而是存在一定的使用偏性[17];同义密码子的主要区别在于密码子的第3位碱基,密码子第3位碱基的改变通常不会引起编码氨基酸的改变,所受选择压力较小,因此研究密码子第3位碱基组成对研究植物叶绿体密码子使用偏好性具重要意义[23]。本研究通过中性绘图分析及比较灰毛浆果楝叶绿体基因组密码子3位碱基上的GC含量发现,密码子第3位碱基大多数为A和T;与大多数植物的叶绿体基因组密码子偏好性基本一致[1, 10, 23-24]。密码子使用偏性的主要驱动力是自然选择和碱基突变[12],Nec与GC3的相关性分析结合Nec比值频数分布能够推断密码子使用偏性的主要影响因素,即通过比较基因与标准曲线的距离远近的数量,若距标准曲线距离近的基因数量较多,则主要受突变的影响;而距标准曲线距离较远的基因数量较少,则主要受选择的影响[25];同时Nec值以45为界限,小于45则偏性较强,相反则偏性较弱[1]。本研究中灰毛浆果楝叶绿体基因组中的密码子偏好性较弱,且36个基因与标准曲线的距离较远,即大多数基因与标准曲线距离较近,说明其密码子偏好性主要受选择的影响;该植物叶绿体基因组密码子的使用偏性与蒺藜苜蓿(Medicago truncatula L.)[23]、刺五加[Eleutherococcus senticosus (Rupr. and Maxim) Maxim][25]、黄芩(Scutellaria baicalensis Georgi)[26]、酸枣[Ziziphus jujuba Mill. var. spinosa (Bunge) Hu ex H. F. Chou][27]等植物一致。同时PR2-plot分析亦证明灰毛浆果楝叶绿体基因组中的密码子偏好性受突变及其他因素的影响,说明影响植物密码子偏好性的因素均非单一因素,而是多因素综合的结果。
密码子偏好性说明某些蛋白质编码基因序列内存在较少使用的稀有密码子,与其匹配的同义tRNA数量同样较少,会导致翻译速率降低,生物合成酶产出量亦会减少,因此对目标基因的密码子进行优化,可有效提高其蛋白的产出量[11, 12, 17]。最优密码子的确定需满足高频率和高表达密码子两个标准[24],本研究中灰毛浆果楝叶绿体基因组的最优密码子均以A或U结尾。之所以要采用高频率和高表达优越密码子结合的方式,因为采用单一因素会造成最优密码子确定的错误,如本研究中编码天冬氨酸(Asp)的GAU密码子虽然其URSC值均大于1,但其高表达密码子的URSC值小于低表达蛋白编码基因,这种仅采用高频率密码子分析法已被证明无法将高低表达编码基因有效分开,当某些密码子的高表达优越性在总体上表现不突出时,这种优越性易被湮灭[28];同样在编码天冬氨酸的GAC密码子,虽然其ΔURSC≥0.50,但其URSC值小于1,故而不可作为最优密码子,因此对最优密码子增加条件,使URSC值小于1.00的密码子不能成为主要偏爱密码子,就可有效获得各植物叶绿体基因组的最优密码子[16]。这对于从分子水平上研究物种进化具有重要的指导意义,同时对目标基因进行密码子优化以提高该基因在宿主细胞中的表达量,并通过的叶绿体基因工程对潜在新基因的功能进行预测。
| [1] |
晁岳恩, 常阳, 王美芳, 等. 7种作物叶绿体基因的密码子偏好性及聚类分析[J]. 华北农学报, 2012, 27(4): 60-64. |
| [2] |
陈凌艳, 何丽婷, 赖金莉, 等. 银丝竹不同叶色叶绿素合成及叶结构差异[J]. 森林与环境学报, 2017, 37(4): 385-391. |
| [3] |
李宏韬, 赵淑青, 赵彦修, 等. 叶绿体基因工程简介[J]. 遗传, 2003, 25(4): 495-498. |
| [4] |
DANIELL H, KHAN M S, ALLISON L. Milestones in chloroplast genetic engineering:an environmentally friendly era in biotechnology[J]. Trends in Plant Science, 2002, 7(2): 84-91. |
| [5] |
SIKDAR S R, SERINO G, CHAUDHURI S, et al. Plastid transformation in Arabidopsis thaliana[J]. Plant Cell Reports, 1998, 18(1/2): 20-24. |
| [6] |
KUMAR S, DHINGRA A, DANIELL H. Stable transformation of the cotton plastid genome and maternal inheritance of transgenes[J]. Plant Molecular Biology, 2004, 56(2): 203-216. |
| [7] |
侯丙凯, 于惠敏, 夏光敏. 用于叶绿体遗传转化的表达载体[J]. 遗传, 2002, 24(1): 100-103. |
| [8] |
ZHOU M, TONG C F, SHI J S. A preliminary analysis of synonymous codon usage in poplar species[J]. Journal of Plant Physiology and Molecular Biology, 2007, 33(4): 285-293. DOI:10.2471/BLT.13.118778 |
| [9] |
SHAW J, LICKEY E B, SCHILLING E E, et al. Comparison of whole chloroplast genome sequences to choose noncoding regions for phylogenetic studies in angiosperms:the tortoise and the hare Ⅲ[J]. American Journal of Botany, 2007, 94(3): 275-288. |
| [10] |
吴妙丽, 陈世品, 陈辉. 竹亚科叶绿体基因组的密码子使用偏性分析[J]. 森林与环境学报, 2019, 39(1): 9-14. |
| [11] |
IKEMURA T. Codon usage and tRNA content in unicellular and multicellular organisms[J]. Molecular Biology and Evolution, 1985, 2(1): 13-34. |
| [12] |
MA L N, CUI P, ZHU J, et al. Translational selection in human:more pronounced in housekeeping genes[J]. Biology Direct, 2014, 9(1): 17. |
| [13] |
HERSHBERG R, PETROV D A. Selection on codon bias[J]. Annual Review of Genetics, 2008, 42: 287-299. |
| [14] |
DOS REIS M, SAVVA R, WERNISCH L. Solving the riddle of codon usage preferences:a test for translational selection[J]. Nucleic Acids Research, 2004, 32(17): 5036-5044. |
| [15] |
QIN Z, CAI Z Q, XIA G M, et al. Synonymous codon usage bias is correlative to intron number and shows disequilibrium among exons in plants[J]. BMC Genomics, 2013, 14(1): 56. |
| [16] |
DURET L. tRNA gene number and codon usage in the C. elegans genome are co-adapted for optimal translation of highly expressed genes[J]. Trends in Genetics, 2000, 16(7): 287-289. |
| [17] |
HIRAOKA Y, KAWAMATA K, HARAGUCHI T, et al. Codon usage bias is correlated with gene expression levels in the fission yeast Schizosaccharomyces pombe[J]. Genes to Cells, 2009, 14(4): 499-509. |
| [18] |
FANG X, DI Y C, LI C S, et al. Tetranortriterpenoids from the leaves of Cipadessa cinerascens[J]. Journal of Natural Products, 2009, 72(4): 714-718. |
| [19] |
傅淋然, 马青云, 黄圣卓, 等. 灰毛浆果楝茎的化学成分[J]. 中草药, 2015, 46(5): 633-638. |
| [20] |
JIANG C S, LI Y, WANG Z Z, et al. Cipatrijugin G, a new trijugin-type limonoid bearing an uncommon γ-hydroxybutenolide unit from the aerial parts of Cipadessa cinerascens[J]. Natural Products and Bioprospecting, 2013, 3(6): 267-270. DOI:10.1007/s13659-013-0074-z |
| [21] |
任艳丽, 唐前瑞, 邸迎彤, 等. 灰毛浆果楝的化学成分研究[J]. 中草药, 2008, 39(9): 1302-1303. |
| [22] |
傅建敏, 索玉静, 刘慧敏, 等. 柿属植物叶绿体蛋白质编码基因密码子用法[J]. 经济林研究, 2017, 35(2): 38-44. |
| [23] |
杨国锋, 苏昆龙, 赵怡然, 等. 蒺藜苜蓿叶绿体密码子偏好性分析[J]. 草业学报, 2015, 24(12): 171-179. |
| [24] |
刘福利, 王飞久, 邵展茹. 长囊水云叶绿体基因组密码子使用特征分析[J]. 海洋科学进展, 2012, 30(4): 587-594. |
| [25] |
邢朝斌, 曹蕾, 周秘, 等. 刺五加叶绿体基因组密码子的用法分析[J]. 中国中药杂志, 2013, 38(5): 661-665. |
| [26] |
王文斌, 于欢, 邱相坡. 黄芩叶绿体基因组重复序列及密码子偏好性分析[J]. 分子植物育种, 2018, 16(8): 2445-2452. |
| [27] |
胡晓艳, 许艳秋, 韩有志, 等. 酸枣叶绿体基因组密码子使用偏性分析[J]. 森林与环境学报, 2019, 39(6): 621-628. |
| [28] |
林涛, 倪志华, 沈明山, 等. 高频密码子分析法及其在烟草密码子分析中的应用[J]. 厦门大学学报(自然科学版), 2002, 41(5): 551-554. |
2020, Vol. 40


