森林与环境学报  2020, Vol. 40 Issue (2): 195-202   PDF    
http://dx.doi.org/10.13324/j.cnki.jfcf.2020.02.013
0

文章信息

原晓龙, 王毅, 张劲峰
YUAN Xiaolong, WANG Yi, ZHANG Jingfeng
灰毛浆果楝叶绿体基因组密码子使用特征分析
Characterization of codon usage in Cipadessa cinerascens chloroplast genome
森林与环境学报,2020, 40(2): 195-202.
Journal of Forest and Environment,2020, 40(2): 195-202.
http://dx.doi.org/10.13324/j.cnki.jfcf.2020.02.013

文章历史

收稿日期: 2019-12-16
修回日期: 2020-01-30
灰毛浆果楝叶绿体基因组密码子使用特征分析
原晓龙1,2 , 王毅1,2 , 张劲峰1     
1. 云南省林业和草原科学院, 云南 昆明 650201;
2. 云南省森林植物培育与开发利用重点实验室, 云南 昆明 650201
摘要:通过分析灰毛浆果楝叶绿体基因组密码子的使用特征,探讨影响其密码子使用偏性的主要因素。从灰毛浆果楝叶绿体基因组中筛选出54条编码序列(CDS),利用Codon W 1.4.2和CUSP软件计算不同基因密码子各位置的GC含量,以明确灰毛浆果楝叶绿体基因组密码子的使用偏性规律。结果显示:灰毛浆果楝叶绿体基因组密码子第3位碱基的GC含量为28.95%,即第3位密码子富含A和U,有效密码子数(Nec)在34.60~61.00之间,Nec值大于45的CDS有39个;相对同义密码子使用度(URSC)值大于1的密码子有29个,其中16个以U结尾,12个以A结尾;中性绘图分析结果显示GC12和GC3的相关系数为0.098 4,相关性不显著,回归系数(对角线斜率)为0.137 9;基因Nec比值大多数分布在-0.05~0.05区间外,即大部分基因Nec值与预期值差距较大;相关关系分析显示,GC3与GC1、GC2均未达到显著相关,Nec与GC3呈极显著相关。综合分析发现灰毛浆果楝叶绿体基因组密码子偏好性较弱,选择为主要影响因素,同时受到其他因素的影响。结合高表达优越密码子和高频密码子确定GUU、GUA、UCU、AGU、CCU、ACU、GGU、GCU、CAA、AAA、UGU、AGA和AUU等13个密码子为最优密码子。
关键词灰毛浆果楝    叶绿体基因组    密码子    偏好性    最优密码子    
Characterization of codon usage in Cipadessa cinerascens chloroplast genome
YUAN Xiaolong1,2 , WANG Yi1,2 , ZHANG Jingfeng1     
1. Yunnan Academy of Forestry and Grassland, Kunming, Yunnan 650201, China;
2. Yunnan Key Laboratory of Forest Plant Cultivation and Utilization, Kunming, Yunnan 650201, China
Abstract: Codon usage characterization of the Cipadessa cinerascens chloroplast genome was done to determine the factors influencing codon bias. Fifty-four coding DNA sequences were selected from the C. cineraseces chloroplast genome and the genes analyzed using Codon W 1.4.2 and CUSP. According to the results, the GC content at the 3rd codon position in the C. cineraseces chloroplast genome was 28.59%. In addition, the 3rd codon position was rich in A and T, and the Nec value was in the 34.60-61.00 range. Furthermore, there were 39 genes when the Nec value was higher than 45. Twenty-nine codons exhibited relative synonymous codon usage values greater than 1, including at the end with 16 U codons and 12 A codons. The neutrality plots revealed that the correlation coefficient of GC12 and GC3 was 0.098 4, and that there was no significant correlation between GC12 and GC3. The regression coefficient (the diagonal line slope) was 0.137 9 and the Nec ratios of most of the genes were beyond -0.05 to 0.05. The disparities between the actual Nec and the expected Nec values for the genes were very large. Although the correlation analysis revealed no significant correlation between GC3 and GC1, GC2, there was an extremely high and significant correlation between Nec and GC3. The codon usage bias in the C. cinerascens chloroplast genome was weak based on the comprehensive analysis performed, mainly due to the effect of selection, in addition to other factors. Furthermore, analysis of the high-expression codons and high-frequency codons verified 13 codons as the optimal codons, including GUU, GUA, UCU, AGU, CCU, ACU, GGU, GCU, CAA, AAA, UGU, AGA, and AUU.
Key words: Cipadessa cinerascens     chloroplast genome     codon     usage bias     optimal codon    

叶绿体拥有一套独立于核的基因组,是一种存在于植物中的半自主性细胞器,属细胞质遗传[1]。叶绿体是植物光合作用的细胞器,且植物的能量供给和次生代谢产物的生物合成均在其参与下完成[2]。植物花粉中不含叶绿体,且叶绿体基因拷贝数多、基因组数量多[3],因此以叶绿体基因组为受体进行转基因操作可避免花粉逃逸带来的生物安全问题[4],并可迅速得到表达量较高的转基因后代[1],叶绿体基因工程已在拟南芥[Arabidopsis thaliana (L.) Heynh][5]、棉花(Gossypium hirsutum L.)[6]等植物中成功转化。叶绿体基因工程是以基因序列的同源重组为基础[7],因此通过研究叶绿体基因组的蛋白编码序列特征和密码子的碱基组成,有助于提高遗传转化效率和目的基因高效稳定表达[8],还可以评估分子系统进化水平[9]。蛋白编码序列的DNA由除起始密码子和终止密码子外通用的61个密码子翻译,除蛋氨酸和色氨酸外,其余氨基酸均有两种以上的同义密码子共同编码[10];各同义密码子在翻译过程中的使用频率并不均等,这种现象称为密码子偏好性(codon usage bias, CUB)[11]。密码子偏好性在不同物种、组织或基因中具丰富的多样性,这是物种或基因在长期的进化过程中受自然选择、碱基突变及遗传漂移等因素综合作用的结果[12-13];同时密码子偏好性还与基因组大小[14]、内含子数量[15]、tRNA丰度[16]和基因表达水平[17]等因素存在关联。密码子偏好性是物种的进化特征之一,分析密码子的使用模式和影响因素,有助于对生物适应性的分子机制、物种间的进化关系等研究提供参考依据。

灰毛浆果楝[Cipadessa cinerascens (Pell.) Hand.-Mazz.]又名亚洛轻、假茶辣等,为楝科(Meliaceae)浆果楝属(Cipadessa)植物,灌木或小乔木,主要生长在四川、贵州、广西及云南等地160~2 400 m的雨林、常绿阔叶林、山坡灌丛和草地[18-19]。灰毛浆果楝的根、叶及全株均可入药,目前已报道的主要成分包括二萜、黄酮及其苷,以及作为楝科植物特征次生代谢产物的柠檬苦素等化合物,其中柠檬苦素类化合物含有丰富的四降三萜的结构骨架,含四降三萜结构骨架的化合物具抗肿瘤、抗菌、拒食活性等生物活性[18, 20-21]。目前多种植物的叶绿体基因组全长序列已经测定完成,叶绿体基因密码子使用模式在竹亚科植物[10]和7种作物[1]中已有报道。本研究通过对灰毛浆果楝叶绿体基因组进行高通量测序,通过同源序列比对和基因注释获得了蛋白编码序列,以此为基础,对灰毛浆果楝叶绿体基因的密码子使用模式进行初步分析,探讨影响其密码子使用偏性形成的主要因素, 以期为灰毛浆果楝叶绿体分子进化、明确灰毛浆果楝的系统发育位置、不同种源鉴定及叶绿体基因工程等提供基础数据。

1 材料与方法 1.1 试验材料

灰毛浆果楝叶片采自云南省林业和草原科学院普文热带林业研究所,送至生工生物工程(上海)股份有限公司进行测序,获得灰毛浆果楝叶绿体基因组数据并提交至美国国立生物技术中心(National Center for Biotechnology Information, NCBI)查询其登录号为MN126582,对其叶绿体的编码序列(coding sequence, CDS)进行筛选,剔除序列长度小于300 bp、序列不完整和序列中间存在终止密码子的序列,留存含有起始密码子ATG和末端终止密码子UAA、UAG、UGA的CDS[22]。从灰毛浆果楝叶绿体基因组85条蛋白编码序列中筛选得到54条CDS。

1.2 研究方法

对从灰毛浆果楝叶绿体基因组中筛选得到的54条CDS进行分析,其中通过在线软件CUSP(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)计算不同基因密码子各位置的鸟嘌呤和胞嘧啶(guanine and cytosine, GC)含量(GC1、GC2、GC3)[1],以GC12(GC1、GC2的平均值)为纵坐标、以GC3为横坐标进行中性绘图分析,以GC3为横坐标、有效密码子数(effective number of codons, Nec)为纵坐标进行有效密码子数绘图(Nec-plot)分析,以A3/(A3+T3)为纵坐标、G3/(G3+C3)为横坐标进行奇偶偏差(PR2-plot)分析,通过上述分析以明确灰毛浆果楝叶绿体基因组密码子的使用偏性规律[1, 10]

结合灰毛浆果楝叶绿体基因组密码子的高频率密码子和高表达密码子的分析结果,将同义密码子相对使用度(relative synonymous codon usage, URSC)>1的密码子确定为高频密码子;以Nec值为偏好性标准,选择两极10%的基因构建高低偏性基因库,将ΔURSC≥0.08的密码子定为高表达优越密码子;最终将同时满足2种条件的密码子定为灰毛浆果楝叶绿体基因组的最优密码子[23]

2 结果与分析 2.1 叶绿体编码基因同义密码子的使用偏性

选择灰毛浆果楝叶绿体基因组中CDS长度大于300 bp的54个蛋白编码序列整合成一个整体进行同义密码子偏好性分析,该序列共有64 473 bp的核苷酸序列,21 491个有义密码子,其中含21 437个同义密码子。用Codon W 1.4.2和在线软件CUSP分析该序列,得到灰毛浆果楝叶绿体基因组不同位置的GC含量(表 1),在灰毛浆果楝叶绿体基因组中,密码子的平均GC含量为38.70%,3个位置上GC含量从大到小依次为GC1、GC2、GC3,含量分别为47.41%、39.74%和28.95%,可见叶绿体基因中的GC含量总体较低,且3个位置上GC含量差异较大,表现为GC3含量最低,说明在灰毛浆果楝叶绿体中,以A和T碱基结尾的密码子的使用频率高于以G和C碱基结尾的密码子。Nec作为判断密码子使用偏性的指标之一,取值范围从20到61,具体可阐释为若每个氨基酸仅用一个密码子则Nec值为20,若各同义密码子的使用机会完全均等则Nec值为61,即Nec值越小则密码子使用偏性则越大[24];灰毛浆果楝叶绿体基因组的Nec平均值为48.09,Nec实际值介于34.60~61.00,Nec值大于45的基因有39个,说明该叶绿体基因组的密码子使用偏性非随机选择,且偏性较弱。

表 1 灰毛浆果楝叶绿体基因组不同位置的GC含量 Table 1 The GC content at different positions of codons in chloroplast genome of C. cinerascens
基因
Gene
GC含量Content of GC/% Nec
GC1 GC2 GC3 GCall
psbA 50.28 43.22 33.05 42.18 40.05
matK 42.29 31.62 28.85 34.26 52.16
atpA 54.94 39.72 28.46 41.04 48.03
atpF 46.49 32.97 32.43 37.30 43.46
atpI 48.79 37.10 28.63 38.17 46.13
rps2 44.30 43.88 28.69 38.96 48.54
rpoC2 46.88 37.49 31.40 38.59 51.24
rpoC1 50.44 38.37 27.03 38.61 48.50
rpoB 50.23 37.54 29.13 38.97 49.56
psbD 52.54 43.22 32.20 42.66 43.66
psbC 54.01 45.99 31.86 43.95 46.33
rps14 42.57 45.54 31.68 39.93 40.49
psaB 49.12 42.99 31.70 41.27 48.58
psaA 52.46 43.54 33.16 43.05 49.70
ycf3 47.34 38.46 33.14 39.64 61.00
rps4 51.98 38.12 24.75 38.28 51.25
ndhJ 50.94 37.11 29.56 39.20 55.39
ndhK 44.00 43.56 30.22 39.26 53.77
ndhC 44.63 33.06 28.10 35.26 53.43
atpE 47.01 40.30 29.10 38.81 46.28
atpB 56.91 41.88 31.06 43.29 48.07
rbcL 57.64 43.39 30.17 43.73 49.14
accD 41.16 37.75 29.12 36.01 46.17
ycf4 44.27 39.06 32.29 38.54 51.04
cemA 41.63 28.76 31.33 33.91 58.38
petA 54.21 36.45 32.71 41.12 52.15
rps18 35.29 42.16 24.51 33.99 34.60
rpl20 38.98 44.07 24.58 35.88 48.35
rps12 52.42 48.39 32.26 44.35 44.48
clpP 56.35 37.56 34.52 42.81 56.78
psbB 54.81 46.37 28.49 43.22 45.59
petB 49.07 41.20 27.78 39.35 43.07
petD 51.55 39.13 27.33 39.34 43.37
rpoA 46.34 31.10 28.05 35.16 51.21
rps11 56.12 58.99 25.90 47.00 48.55
rps8 42.96 39.26 29.63 37.28 40.73
rpl14 55.28 38.21 25.20 39.57 48.79
rpl16 48.53 52.21 26.47 42.40 38.36
rps3 48.18 33.18 20.00 33.79 43.58
rpl22 43.21 36.42 28.40 36.01 55.07
rpl2 51.27 48.73 32.73 44.24 54.40
ycf2 42.10 34.77 36.95 37.94 53.67
ndhB 42.19 39.35 31.44 37.66 48.67
rps7 53.21 44.87 24.36 40.81 44.41
ndhF 37.58 36.38 25.50 33.15 45.54
ccsA 34.11 36.73 27.99 32.94 46.39
ndhD 42.55 37.65 33.73 37.97 52.69
ndhE 39.60 35.64 28.71 34.65 54.67
ndhG 45.25 34.64 25.70 35.20 47.79
ndhI 42.86 38.10 20.83 33.93 41.58
ndhA 42.86 39.01 23.36 35.16 40.82
ndhH 50.51 36.29 27.66 38.16 49.17
ycf1 36.55 29.78 26.79 31.04 47.63
rps7 53.21 44.87 24.36 40.81 44.41
平均值
Average
47.41 39.74 28.95 38.70 48.09

GC1、GC2、GC3、GCallNec和密码子数目(N)的相关性分析结果(表 2)表明,GCall与GC1、GC2、GC3,GC1与GC2等均呈极显著相关,GC3与GC1、GC2均未达到显著相关,说明密码子的第1位和第2位碱基组成相似,而与密码子第3位碱基组成存在差异。Nec与GC3呈极显著相关,Nec与GC2呈显著相关,Nec与GC1未达到显著相关水平,说明密码子第2位和第3位碱基GC含量对密码子偏好性有影响,其中第3位影响最大。GC3N呈显著相关关系,说明NNec具一定的影响。除蛋氨酸和色氨酸外,其余18种氨基酸的URSC值(表 3)显示,URSC值大于1的密码子有29个,其中16个以U结尾,12个以A结尾,1个以G结尾,密码子以A和U出现的频率较高,说明其为灰毛浆果楝叶绿体基因组的偏好密码子,而以C和G结尾的密码子为非偏好密码子。

表 2 灰毛浆果楝叶绿体基因组中各基因相关性分析 Table 2 Correlation analysis of each genes related parameters of chloroplast genome of C. cinerascens
因素Factor GC1 GC2 GC3 GCall Nec
GC2 0.425**
GC3 0.147 0.015
GCall 0.829** 0.766** 0.416**
Nec 0.074 -0.336* 0.427** 0.004
N -0.150 -0.261 0.299* -0.123 0.154
  注:**表示在P < 0.01水平(双侧)上显著相关;*表示在P < 0.05水平(双侧)上显著相关。Notes: ** means extremely significant correlation at P < 0.01(bilateral); * means significant correlation at P < 0.05(bilateral).
表 3 灰毛浆果楝各氨基酸相对同义密码子使用度 Table 3 URSC analysis of protein coding region in C. cinerascens
基酸
Amino acid
密码子
Codon
数量
Number
URSC
苯丙氨酸
Phe
UUU 805 1.32
UUC 415 0.68
半胱氨酸
Cys
UGU 172 1.46
UGC 64 0.54
谷氨酰胺
Gln
CAA 591 1.56
CAG 168 0.44
缬氨酸
Val
GUU 440 1.48
GUC 131 0.44
GUA 454 1.53
GUG 162 0.55
甘氨酸
Gly
GGU 508 1.34
GGC 143 0.38
GGA 604 1.60
GGG 259 0.68
亮氨酸
Leu
UUA 714 1.90
UUG 456 1.22
CUU 470 1.25
CUC 135 0.36
CUA 311 0.83
CUG 164 0.44
天冬氨酸
Asp
GAU 698 1.59
GAC 180 0.41
组氨酸
His
CAU 390 1.46
CAC 144 0.54
天冬酰胺
Asn
AAU 794 1.55
AAC 229 0.45
脯氨酸
Pro
CCU 338 1.53
CCC 184 0.84
CCA 240 1.09
CCG 119 0.54
丙氨酸
Ala
GCU 537 1.75
GCC 195 0.64
GCA 343 1.12
GCG 150 0.49
丝氨酸
Ser
UCU 438 1.63
UCC 265 0.99
UCA 310 1.16
UCG 157 0.59
AGU 331 1.24
AGC 98 0.37
谷氨酸
Glu
GAA 874 1.52
GAG 273 0.48
酪氨酸
Tyr
UAU 639 1.63
UAC 145 0.37
赖氨酸
Lys
AAA 833 1.49
AAG 283 0.51
苏氨酸
Thr
ACU 423 1.58
ACC 200 0.75
ACA 329 1.23
ACG 118 0.44
异亮氨酸
Ile
AUU 901 1.47
AUC 381 0.62
AUA 557 0.91
精氨酸
Arg
CGU 273 1.26
CGC 102 0.47
CGA 301 1.39
CGG 111 0.51
AGA 381 1.76
AGG 133 0.61
2.2 叶绿体基因组密码子使用的中性绘图分析

灰毛浆果楝叶绿体基因组中各基因中性绘图分析(图 1)显示,GC12处于0.331 7~0.575 6区间,GC3处于0.200 0~0.369 5区间;除ycf2基因的GC12(0.384 4)、GC3(0.369 5),二者的比值为1.04,在图中接近对角线;其余基因均分布在对角线上方。采用SPSS 19.0软件分析GC12和GC3的相关性统计(Pearson)的相关系数为0.098 4,相关性不显著,回归系数(对角线斜率)为0.137 9,表明在灰毛浆果楝叶绿体基因组中,各基因的密码子第1位、第2位与第3位的碱基组成无显著差异,其密码子使用偏性较多地受选择压力的影响。

图 1 密码子使用的中性绘图分析 Fig. 1 Neutrality plot analysis of the codon usage
2.3 叶绿体基因组有效密码子数绘图分析

GC3Nec的关联分析(图 2)显示,灰毛浆果楝叶绿体中的部分基因位于标准曲线附近,这部分基因的实际Nec值与预期Nec值接近;另一部分基因距离标准曲线较远的位置,即实际Nec值与预期Nec值差异较大。为了更准确地说明哪些基因离标准曲线较近,采用Nec比值((预期Nec值-实际Nec值)/预期Nec值)统计Nec比值频数(表 4),结果显示Nec比值位于-0.05~0.05区间外的基因数有36个,即大部分基因的实际Nec值与预期Nec值的相差较大,密码子偏好性与GC3的差异有关,故灰毛浆果楝叶绿体基因组密码子偏好性更多地受选择的影响。

图 2 密码子使用的有效密码子数绘图分析 Fig. 2 Nec-plot analysis of the codon usage
表 4 有效密码子数比值频数分布 Table 4 Distribution of Nec ratio of the codon usage
组限
Class limit
组中值
Class mid-value
组数
Frequency number
组频
Frequency
-0.15~(-0.05) -0.1 6 0.11
-0.05~0.05 0.0 18 0.33
0.05~0.15 0.1 21 0.39
0.15~0.25 0.2 7 0.13
0.25~0.35 0.3 2 0.04
合计Total 54 1.00
2.4 叶绿体基因组密码子的奇偶偏差绘图分析

通过PR2-plot绘图分析灰毛浆果楝各基因编码的部分氨基酸的嘌呤(A和G)与嘧啶(T和C)的关系(图 3),结果显示,大部分基因位于PR2平面图的下方,其中位于PR2平面图右下方的基因较多,说明在碱基使用频率方面,T>A且G>C;如果仅受碱基突变的影响,则4个碱基平均分布在PR2平面,这个结果说明灰毛浆果楝叶绿体基因组密码子使用模式受多种因素共同作用的影响。

图 3 奇偶偏差绘图分析 Fig. 3 Analysis of PR2 bias plot
2.5 叶绿体基因组中最优密码子的确定

将灰毛浆果楝叶绿体基因组中的54个编码基因作为一个整体在Codon W 1.4.2软件上运行,以Nec值为标准进行排序,选择两极5%的构建高表达和低表达基因库,分别对两个库中的密码子计算URSC值,再统计各基因ΔURSC值(表 5),筛选得到0.08≤ΔURSC < 0.30的密码子,含UUC、UUG和CUA等26个高表达优越密码子(在表 5中用*表示),其中6个以A结尾、9个以U结尾、2个以G结尾和9个以C结尾;0.30≤ΔURSC < 0.50的有9个,ΔURSC≥0.50的有5个。结合高频密码子和高表达优越密码子,将同时满足2种条件的密码子确定为灰毛浆果楝叶绿体基因组的最优密码子,即可最终确定GUU、GUA、UCU、AGU、CCU、ACU、GGU、GCU、CAA、AAA、UGU、AGA和AUU,且全部以A或U结尾,其中9个以U结尾,4个以A结尾。

表 5 灰毛浆果楝叶绿体基因组最优密码子确定 Table 5 Preferred codons in chloroplast genome of C. cinerascens
氨基酸
Amino acid
密码子
Codon
高表达基因
High expression gene
低表达基因
Low expression gene
ΔURSC
数目Number URSC 数目Number URSC
苯丙氨酸
Phe
UUU 17 0.87 26 1.30 -0.43
UUC** 22 1.13 14 0.70 0.43
酪氨酸
Tyr
UAU 18 1.50 42 1.68 -0.18
UAC* 6 0.50 8 0.32 0.18
组氨酸
His
CAU 12 1.26 17 1.42 -0.16
CAC* 7 0.74 7 0.58 0.16
谷氨酰胺
Gln
CAA** 19 1.90 26 1.53 0.37
CAG 1 0.10 8 0.47 -0.37
天冬酰胺
Asn
AAU 23 1.07 31 1.48 -0.41
AAC** 20 0.93 11 0.52 0.41
赖氨酸
Lys
AAA** 32 1.73 29 1.26 0.47
AAG 5 0.27 17 0.74 -0.47
天冬氨酸
Asp
GAU 10 1.11 31 1.63 -0.52
GAC*** 8 0.89 7 0.37 0.52
谷氨酸
Glu
GAA 32 1.52 52 1.60 -0.08
GAG* 10 0.48 13 0.40 0.08
半胱氨酸
Cys
UGU*** 6 2.00 7 1.40 0.60
UGC 0 0 3 0.60 -0.60
缬氨酸
Val
GUU* 17 1.66 19 1.52 0.14
GUC 2 0.20 6 0.48 -0.28
GUA* 20 1.95 22 1.76 0.19
GUG 2 0.20 3 0.24 -0.04
脯氨酸
Pro
CCU** 15 1.76 12 1.37 0.39
CCC 7 0.82 10 1.14 -0.32
CCA 6 0.71 7 0.80 -0.09
CCG 6 0.71 6 0.69 0.02
苏氨酸
Thr
ACU*** 19 1.81 12 1.30 0.51
ACC** 12 1.14 6 0.65 0.49
ACA 9 0.86 14 1.51 -0.65
ACG 2 0.19 5 0.54 -0.35
甘氨酸
Gly
GGU*** 31 1.94 17 1.21 0.73
GGC 6 0.38 11 0.79 -0.41
GGA 19 1.19 18 1.29 -0.10
GGG 8 0.50 10 0.71 -0.21
丙氨酸
Ala
GCU*** 34 2.39 20 1.48 0.91
GCC 4 0.28 14 1.04 -0.76
GCA* 15 1.05 12 0.89 0.16
GCG 4 0.28 8 0.59 -0.31
异亮氨酸
Ile
AUU* 39 1.54 40 1.36 0.18
AUC* 17 0.67 15 0.51 0.16
AUA 20 0.79 33 1.13 -0.34
亮氨酸
Leu
UUA 20 1.67 25 1.67 0.00
UUG** 17 1.42 14 0.93 0.49
CUU 17 1.42 21 1.40 0.02
CUC 3 0.25 7 0.47 -0.22
CUA* 13 1.08 14 0.93 0.15
CUG 2 0.17 9 0.60 -0.43
丝氨酸
Ser
UCU* 24 2.29 21 2.03 0.26
UCC* 10 0.95 8 0.77 0.18
UCA 4 0.38 11 1.06 -0.68
UCG 6 0.57 6 0.58 -0.01
AGU** 16 1.52 11 1.06 0.46
AGC 3 0.29 5 0.48 -0.19
精氨酸
Arg
CGU 22 1.57 12 1.50 0.07
CGC* 4 0.29 1 0.13 0.16
CGA 22 1.57 13 1.63 -0.06
CGG 3 0.21 6 0.75 -0.54
AGA** 24 1.71 10 1.25 0.46
AGG 9 0.64 6 0.75 -0.11
  注: *表示0.08≤ΔURSC < 0.30, **表示0.30≤ΔURSC < 0.50, ***表示ΔURSC≥0.50。Notes: * means 0.08≤ΔURSC < 0.30, **means 0.30≤ΔURSC < 0.50, ***means ΔURSC≥0.50.
3 讨论与结论

遗传密码子是关联基因组DNA和功能蛋白质的联系枢纽,是构成生命信息的基本单元。然而除了蛋氨酸和色氨酸外,其余氨基酸的同义密码子的使用频率并不相同,而是存在一定的使用偏性[17];同义密码子的主要区别在于密码子的第3位碱基,密码子第3位碱基的改变通常不会引起编码氨基酸的改变,所受选择压力较小,因此研究密码子第3位碱基组成对研究植物叶绿体密码子使用偏好性具重要意义[23]。本研究通过中性绘图分析及比较灰毛浆果楝叶绿体基因组密码子3位碱基上的GC含量发现,密码子第3位碱基大多数为A和T;与大多数植物的叶绿体基因组密码子偏好性基本一致[1, 10, 23-24]。密码子使用偏性的主要驱动力是自然选择和碱基突变[12]Nec与GC3的相关性分析结合Nec比值频数分布能够推断密码子使用偏性的主要影响因素,即通过比较基因与标准曲线的距离远近的数量,若距标准曲线距离近的基因数量较多,则主要受突变的影响;而距标准曲线距离较远的基因数量较少,则主要受选择的影响[25];同时Nec值以45为界限,小于45则偏性较强,相反则偏性较弱[1]。本研究中灰毛浆果楝叶绿体基因组中的密码子偏好性较弱,且36个基因与标准曲线的距离较远,即大多数基因与标准曲线距离较近,说明其密码子偏好性主要受选择的影响;该植物叶绿体基因组密码子的使用偏性与蒺藜苜蓿(Medicago truncatula L.)[23]、刺五加[Eleutherococcus senticosus (Rupr. and Maxim) Maxim][25]、黄芩(Scutellaria baicalensis Georgi)[26]、酸枣[Ziziphus jujuba Mill. var. spinosa (Bunge) Hu ex H. F. Chou][27]等植物一致。同时PR2-plot分析亦证明灰毛浆果楝叶绿体基因组中的密码子偏好性受突变及其他因素的影响,说明影响植物密码子偏好性的因素均非单一因素,而是多因素综合的结果。

密码子偏好性说明某些蛋白质编码基因序列内存在较少使用的稀有密码子,与其匹配的同义tRNA数量同样较少,会导致翻译速率降低,生物合成酶产出量亦会减少,因此对目标基因的密码子进行优化,可有效提高其蛋白的产出量[11, 12, 17]。最优密码子的确定需满足高频率和高表达密码子两个标准[24],本研究中灰毛浆果楝叶绿体基因组的最优密码子均以A或U结尾。之所以要采用高频率和高表达优越密码子结合的方式,因为采用单一因素会造成最优密码子确定的错误,如本研究中编码天冬氨酸(Asp)的GAU密码子虽然其URSC值均大于1,但其高表达密码子的URSC值小于低表达蛋白编码基因,这种仅采用高频率密码子分析法已被证明无法将高低表达编码基因有效分开,当某些密码子的高表达优越性在总体上表现不突出时,这种优越性易被湮灭[28];同样在编码天冬氨酸的GAC密码子,虽然其ΔURSC≥0.50,但其URSC值小于1,故而不可作为最优密码子,因此对最优密码子增加条件,使URSC值小于1.00的密码子不能成为主要偏爱密码子,就可有效获得各植物叶绿体基因组的最优密码子[16]。这对于从分子水平上研究物种进化具有重要的指导意义,同时对目标基因进行密码子优化以提高该基因在宿主细胞中的表达量,并通过的叶绿体基因工程对潜在新基因的功能进行预测。

参考文献(References)
[1]
晁岳恩, 常阳, 王美芳, 等. 7种作物叶绿体基因的密码子偏好性及聚类分析[J]. 华北农学报, 2012, 27(4): 60-64.
[2]
陈凌艳, 何丽婷, 赖金莉, 等. 银丝竹不同叶色叶绿素合成及叶结构差异[J]. 森林与环境学报, 2017, 37(4): 385-391.
[3]
李宏韬, 赵淑青, 赵彦修, 等. 叶绿体基因工程简介[J]. 遗传, 2003, 25(4): 495-498.
[4]
DANIELL H, KHAN M S, ALLISON L. Milestones in chloroplast genetic engineering:an environmentally friendly era in biotechnology[J]. Trends in Plant Science, 2002, 7(2): 84-91.
[5]
SIKDAR S R, SERINO G, CHAUDHURI S, et al. Plastid transformation in Arabidopsis thaliana[J]. Plant Cell Reports, 1998, 18(1/2): 20-24.
[6]
KUMAR S, DHINGRA A, DANIELL H. Stable transformation of the cotton plastid genome and maternal inheritance of transgenes[J]. Plant Molecular Biology, 2004, 56(2): 203-216.
[7]
侯丙凯, 于惠敏, 夏光敏. 用于叶绿体遗传转化的表达载体[J]. 遗传, 2002, 24(1): 100-103.
[8]
ZHOU M, TONG C F, SHI J S. A preliminary analysis of synonymous codon usage in poplar species[J]. Journal of Plant Physiology and Molecular Biology, 2007, 33(4): 285-293. DOI:10.2471/BLT.13.118778
[9]
SHAW J, LICKEY E B, SCHILLING E E, et al. Comparison of whole chloroplast genome sequences to choose noncoding regions for phylogenetic studies in angiosperms:the tortoise and the hare Ⅲ[J]. American Journal of Botany, 2007, 94(3): 275-288.
[10]
吴妙丽, 陈世品, 陈辉. 竹亚科叶绿体基因组的密码子使用偏性分析[J]. 森林与环境学报, 2019, 39(1): 9-14.
[11]
IKEMURA T. Codon usage and tRNA content in unicellular and multicellular organisms[J]. Molecular Biology and Evolution, 1985, 2(1): 13-34.
[12]
MA L N, CUI P, ZHU J, et al. Translational selection in human:more pronounced in housekeeping genes[J]. Biology Direct, 2014, 9(1): 17.
[13]
HERSHBERG R, PETROV D A. Selection on codon bias[J]. Annual Review of Genetics, 2008, 42: 287-299.
[14]
DOS REIS M, SAVVA R, WERNISCH L. Solving the riddle of codon usage preferences:a test for translational selection[J]. Nucleic Acids Research, 2004, 32(17): 5036-5044.
[15]
QIN Z, CAI Z Q, XIA G M, et al. Synonymous codon usage bias is correlative to intron number and shows disequilibrium among exons in plants[J]. BMC Genomics, 2013, 14(1): 56.
[16]
DURET L. tRNA gene number and codon usage in the C. elegans genome are co-adapted for optimal translation of highly expressed genes[J]. Trends in Genetics, 2000, 16(7): 287-289.
[17]
HIRAOKA Y, KAWAMATA K, HARAGUCHI T, et al. Codon usage bias is correlated with gene expression levels in the fission yeast Schizosaccharomyces pombe[J]. Genes to Cells, 2009, 14(4): 499-509.
[18]
FANG X, DI Y C, LI C S, et al. Tetranortriterpenoids from the leaves of Cipadessa cinerascens[J]. Journal of Natural Products, 2009, 72(4): 714-718.
[19]
傅淋然, 马青云, 黄圣卓, 等. 灰毛浆果楝茎的化学成分[J]. 中草药, 2015, 46(5): 633-638.
[20]
JIANG C S, LI Y, WANG Z Z, et al. Cipatrijugin G, a new trijugin-type limonoid bearing an uncommon γ-hydroxybutenolide unit from the aerial parts of Cipadessa cinerascens[J]. Natural Products and Bioprospecting, 2013, 3(6): 267-270. DOI:10.1007/s13659-013-0074-z
[21]
任艳丽, 唐前瑞, 邸迎彤, 等. 灰毛浆果楝的化学成分研究[J]. 中草药, 2008, 39(9): 1302-1303.
[22]
傅建敏, 索玉静, 刘慧敏, 等. 柿属植物叶绿体蛋白质编码基因密码子用法[J]. 经济林研究, 2017, 35(2): 38-44.
[23]
杨国锋, 苏昆龙, 赵怡然, 等. 蒺藜苜蓿叶绿体密码子偏好性分析[J]. 草业学报, 2015, 24(12): 171-179.
[24]
刘福利, 王飞久, 邵展茹. 长囊水云叶绿体基因组密码子使用特征分析[J]. 海洋科学进展, 2012, 30(4): 587-594.
[25]
邢朝斌, 曹蕾, 周秘, 等. 刺五加叶绿体基因组密码子的用法分析[J]. 中国中药杂志, 2013, 38(5): 661-665.
[26]
王文斌, 于欢, 邱相坡. 黄芩叶绿体基因组重复序列及密码子偏好性分析[J]. 分子植物育种, 2018, 16(8): 2445-2452.
[27]
胡晓艳, 许艳秋, 韩有志, 等. 酸枣叶绿体基因组密码子使用偏性分析[J]. 森林与环境学报, 2019, 39(6): 621-628.
[28]
林涛, 倪志华, 沈明山, 等. 高频密码子分析法及其在烟草密码子分析中的应用[J]. 厦门大学学报(自然科学版), 2002, 41(5): 551-554.