留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

梁山慈竹叶绿体基因组密码子偏好性分析

魏亚楠 龚明贵 白娜 苏佳杰 姜霞

王安妮, 王开良, 柴静瑜, 等. 普通油茶全双列杂交子代种仁含油率及其相关性状的遗传分析[J]. 浙江农林大学学报, 2024, 41(6): 1170-1179. DOI: 10.11833/j.issn.2095-0756.20230603
引用本文: 魏亚楠, 龚明贵, 白娜, 等. 梁山慈竹叶绿体基因组密码子偏好性分析[J]. 浙江农林大学学报, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
WANG Anni, WANG Kailiang, CHAI Jingyu, et al. Genetic analysis of kernel oil content and related traits in complete diallel progenies of Camellia oleifera[J]. Journal of Zhejiang A&F University, 2024, 41(6): 1170-1179. DOI: 10.11833/j.issn.2095-0756.20230603
Citation: WEI Ya’nan, GONG Minggui, BAI Na, et al. Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus[J]. Journal of Zhejiang A&F University, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498

梁山慈竹叶绿体基因组密码子偏好性分析

DOI: 10.11833/j.issn.2095-0756.20230498
基金项目: 贵州省林业局资助项目(黔林科合〔2019〕06号);国家自然科学基金资助项目(31860178)
详细信息
    作者简介: 魏亚楠(ORCID: 0009-0001-4831-8988),从事资源微生物研究。E-mail: weiynkfc@163.com
    通信作者: 龚明贵(ORCID: 0000-0001-6863-5115),副教授,博士,从事资源微生物研究。E-mail: gongminggui@163.com。姜霞(ORCID: 0009-0006-0720-4622),副研究员,从事森林生态学研究。E-mail: 43644135@qq.com
  • 中图分类号: S795.5;S722

Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus

  • 摘要:   目的  探究梁山慈竹Dendrocalamus farinosus叶绿体基因组密码子偏好性使用形式,分析影响梁山慈竹密码子使用偏好性的主要原因,并确定最优密码子,为竹亚科 Bambusoideae植物叶绿体基因组学研究提供参考依据。  方法  根据GenBank登录号MZ681865.156从美国国家生物技术信息中心(NCBI)数据库中下载85条梁山慈竹叶绿体基因序列,利用CodonW、CUSP及R语言软件分析有效密码子数(ENC)、适应指数(CAI)和同义密码子相对使用度(RSCU)等指标,对RSCU进行对应性分析,并根据ENC和RSCU对密码子进行排序。  结果  梁山慈竹叶绿体基因组密码子的鸟嘌呤(G)和胞嘧啶(C)所占的比率(GC比率)平均为39.48%,且GC1(47.69%)>GC2(39.70%)>GC3(31.05%),密码子末位碱基偏好以A/U结尾;ENC多数在35以上,CAI为16.6%,其密码子偏好性较弱;中性绘图分析、ENC-plot分析和PR2-plot分析表明:影响梁山慈竹叶绿体基因组密码子偏好性的主要原因是自然选择。共有GCA、GCU、UUC及GGU等18个密码子被鉴定为梁山慈竹叶绿体基因组的最优密码子。  结论  自然选择是梁山慈竹叶绿体基因组密码子偏好性的主要因素,并筛选出梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子。图5表5参30
  • 油茶广义上是山茶科Theaceae山茶属Camellia中种子油脂含量较高的一类植物,是世界四大木本油料树种之一。其中,普通油茶Camellia oleifera是栽培面积最大、最重要的物种。科学经营油茶有保持水土、涵养水源、增加碳汇和调节气候等生态效益,具有重要的生态价值;同时茶油中不饱和脂肪酸高达90%以上,被誉为“油中软黄金”,具有很高的营养和经济价值[1],因此油茶产业是中国山区林农脱贫致富的重要产业。良种是油茶产业健康发展的基础和关键。提高果实产量,发掘高含油率的种质是选育油茶高产良种的重要途径之一。前人对普通油茶的选育大多以果实产量为主要育种目标,种仁含油率的分析和评估还处于起步阶段[2]。研究普通油茶种仁含油率等经济性状的遗传变异规律,可为油茶高含油率种质创制与筛选提供科学依据,对油茶高产良种选育具有重要意义[3]

    杂交育种是林木育种的有效技术之一,通过杂交创造新的变异,可有效缩短育种周期[4]。杂交育种策略在桉树Eucalyptus robusta[5]、杨树Populus spp.[6]、马尾松Pinus massniana[7]、杉木Cunninghamia lanceolata[8]和马褂木Liriodendron sino-americanum[9]等用材树种良种选育中发挥了重要作用,同时培育了大量良种。亲本的科学选配是杂交育种成功的先决条件[10],对杂交亲本进行配合力等遗传参数估算,筛选优良的亲本和亲本组合,能够有效提高杂交育种效率[11]。配合力是指亲本对子代性状的影响力,包括一般配合力和特殊配合力[12]。一般配合力反映亲本的育种利用价值并能预测后代的表现[13],特殊配合力是某一特定组合后代偏离双亲一般配合力的表型偏差[14]。高配合力亲本能够更好地遗传优势性状,在一定程度上预测杂交子代表型,缩小筛选育种材料范围,节省育种时间,提高育种效率[15]。目前,普通油茶的杂交育种工作主要局限于简单互补性状的亲本杂交,关于亲本配合力、重要性状遗传力等遗传参数的研究还处于起步阶段[16]。林萍等[17]对普通油茶杂交子代幼林生长、含油率等性状进行了亲本的配合力分析,初步筛选了一批具有育种潜力的杂交亲本与组合。但由于林木大多数性状的亲本配合力、遗传力等遗传参数会随着树龄的增长而变化。以幼龄林为研究对象对杂交育种的指导具有局限性,因此,以普通油茶杂交子代成林评估各性状的遗传参数显得非常重要。

    种仁含油率是油茶高产育种的最主要指标之一。木质素、纤维素、半纤维素等在植物的生长发育过程中具有重要作用,主要表现在增强植物体的机械强度、疏导水分和营养物质的运输、阻止病原菌的侵染以及增强对各种胁迫的防御能力等[18]。MIAO等[19]研究发现:油菜Brassica napus种皮中木质素、纤维素和半纤维素质量分数与含油率呈显著负相关。王安妮等[20]研究也发现:油茶种仁含油率与木质素、纤维素质量分数亦具有显著相关性。因此,研究木质素、纤维素和半纤维素质量分数的遗传规律,对油茶高产育种具有一定的指导意义。

    本研究以普通油茶全双列杂交的20个杂交组合为对象,分析了林龄为8 a的盛产期子代群体种仁含油率、木质素、纤维素和半纤维素质量分数的变异规律,探讨了各性状间的相关关系,评估了亲本在4个性状的配合力效应,解析了4个性状在油茶成林阶段的遗传力和杂种优势,为制定油茶高产杂交育种策略提供理论依据。

    在浙江省金华市婺城区东方红林场国家油茶种质资源收集库内,选择普通油茶无性系‘长林4号’ ‘长林10号’‘长林40号’‘长林53号’‘长林95号’(表1),按照5×5全双列杂交设计创制了20个杂交组合(无自交)。于2014年春季利用杂交子代2年生幼苗营建子代测定林。控制授粉、群体的创制与子代测定林营造管理等参照林萍等[17]的方法。

    表 1  亲本种仁含油率相关性状的平均值
    Table 1  Mean value of oil content related traits of parent seed kernel
    亲本 含油率/
    (mg·g−1)
    木质素质
    量分数/
    (mg·g−1)
    纤维素质
    量分数/
    (mg·g−1)
    半纤维素质
    量分数/
    (mg·g−1)
    ‘长林4号’ 425.32 109.06 84.73 42.65
    ‘长林10号’ 402.81 105.87 75.48 49.02
    ‘长林40号’ 421.91 98.70 77.87 46.87
    ‘长林53号’ 412.38 109.38 77.73 40.82
    ‘长林95号’ 400.05 108.78 85.14 35.31
    下载: 导出CSV 
    | 显示表格

    于2021年秋季采集林龄为8 a的子代测定林果实样品测定相关性状。各杂交组合10株一小区,3次重复,共30株单株取样。每单株随机取30颗果实,测定种仁含油率、木质素、纤维素和半纤维素质量分数等性状平均值作为单株果实经济性状。种仁含油率测定采用姚小华等[21]和杨雨晨等[22]的方法。木质素、纤维素和半纤维素质量分数的测定采用王安妮等[20]的方法。

    用Excel 2010整理数据。性状间采用Pearson相关性分析,家系间的表型差异进行单因素方差分析。利用固定模型估算杂交亲本的一般配合力、特殊配合力和反交效应[2324],根据随机模型估算加性、显性、表型和遗传方差以及广义、狭义遗传力。估算参照林萍等[17]的方法。所有分析采用DPS软件[25]完成。

    相关性分析(表2)发现:杂交群体中,普通油茶种仁中的含油率与木质素、纤维素、半纤维素质量分数呈显著(P<0.05)或者极显著负相关(P<0.01)。木质素与纤维素、半纤维素质量分数呈极显著正相关(P<0.01)。纤维素和半纤维素质量分数呈极显著负相关(P<0.01)。因此,在高产油茶良种选育中,除了含油率,木质素、纤维素和半纤维素质量分数也可作为高产种质筛选的重要判断依据。

    表 2  普通油茶杂交一代群体种仁性状的相关性
    Table 2  Correlation of the kernel traits of the first-filial progency of C. oleifera
    性状
    含油率 木质素
    质量分数
    纤维素
    质量分数
    半纤维素
    质量分数
    含油率 1
    木质素质量分数 −0.47** 1
    纤维素质量分数 −0.11* 0.19** 1
    半纤维素质量分数 −0.30** 0.22** −0.25** 1
      说明:*表示显著相关(P<0.05);**表示极显著相关(P<0.01)。
    下载: 导出CSV 
    | 显示表格

    20个家系的含油率平均值为411.84 mg·g−1,变异幅度为14.46%~53.71%;木质素、纤维素、半纤维素质量分数的平均值依次为106.36、80.19和42.93 mg·g−1,变异幅度分别为4.68%~22.02%、3.70%~13.00%和0.08%~11.89%,其中,半纤维素质量分数的变异系数最大,达38.03%。方差分析结果(表3)表明:含油率和木质素、纤维素、半纤维素质量分数在不同组合间的差异均达到极显著水平(P<0.01),表明采用不同优良性状的无性系开展杂交可为油茶育种创造出变异丰富的育种群体。

    表 3  普通油茶杂交子代种仁性状方差分析
    Table 3  Variance analysis of the kernel traits of the first-filial progeny of C. oleifera
    性状
    自由度F平均值/
    (mg·g−1)
    变异
    幅度/%
    变异
    系数/%
    含油率194.61**411.8414.46~53.7113.22
    木质素质量分数196.54**106.364.68~22.0216.82
    纤维素质量分数197.06**80.193.70~13.0016.23
    半纤维素质量分数195.27**42.930.08~11.8938.03
      说明:**表示极显著相关(P<0.01)。
    下载: 导出CSV 
    | 显示表格

    多重比较结果(表4)表明:含油率最高的前2个家系为‘长林4号’ב长林40号’和‘长林4号’ב长林53号’,其含油率均值为451.58和443.71 mg·g−1,分别是含油率最小家系‘长林40号’ב长林10号’的1.18和1.16倍。‘长林4号’ב长林95号’和‘长林40号’ב长林95号’的木质素和纤维素质量分数在所有的家系中分别是最高和最低的,前者分别是后者的1.39和1.32倍。半纤维素质量分数均值最高的家系为‘长林40号’ב长林10号’,是最低家系‘长林95号’ב长林40号’的1.86倍。家系‘长林40号’ב长林10号’半纤维素质量分数排名第1位,但含油率在所有家系中最低,这与含油率和半纤维素质量分数呈显著负相关关系一致。

    表 4  普通油茶杂交组合子代各种仁性状及其多重比较
    Table 4  Multiple comparison results of kernel traits in first-filial progeny of C. oleifera
    组合
    (母本×父本)
    含油率/
    (mg·g−1)
    木质素质量分数/
    (mg·g−1)
    纤维素质量分数/
    (mg·g−1)
    半纤维素质量分数/
    (mg·g−1)
    ‘长林4号’ב长林40号’ 451.58±44.39 a 95.08±20.05 fgh 79.89±14.75 bcdef 37.18±17.58 def
    ‘长林4号’ב长林53号’ 443.71±51.98 ab 109.13±15.61 bcdef 81.50±17.41 abcde 50.47±28.34 abc
    ‘长林53号’ב长林4号’ 443.37±30.62 ab 107.01±17.97 bcdef 76.47±13.62 cdef 43.49±20.44 bcdef
    ‘长林40号’ב长林95号’ 435.78±63.22 abc 89.47±13.94 h 69.54±15.58 f 42.08±19.71 bcdef
    ‘长林10号’ב长林4号’ 424.45±55.25 abcde 108.06±20.22 bcdef 72.66±14.60 ef 46.04±20.28 bcde
    ‘长林40号’ב长林4号’ 420..91±56.76 abcdef 107.72±15.00 bcdef 76.74±16.14 cdef 37.94±12.10 cdef
    ‘长林95号’ב长林40号’ 419.66±59.79 abcdef 111.95±24.13 abcde 85.03±13.79 abc 32.03±15.26 ef
    ‘长林53号’ב长林40号’ 416.62±44.69 abcdef 98.72±13.67 defgh 77.14±11.50 cdef 34.09±18.79 ef
    ‘长林40号’ב长林53号’ 412..07±50.31 bcdef 97.63±19.16 efgh 74.13±15.27 def 47.78±18.34 abcd
    ‘长林95号’ב长林53号’ 411.12±45.76 bcdef 106.66±24.80 bcdefg 78.83±13.87 bcdef 37.15±16.84 def
    ‘长林10号’ב长林95号’ 410.69±28.82 bcdef 109.58±4.43b cdef 70.68±6.51 ef 52.95±15.12 ab
    ‘长林4号’ב长林10号’ 408.77±19.15 bcdef 107.98±7.25 bcdef 86.05±5.39 ab 44.08±6.72 bcdef
    ‘长林95号’ב长林4号’ 403.41±80.21 cdef 101.71±13.46 cdefgh 87.75±14.86 ab 36.32±13.56 def
    ‘长林4号’ב长林95号’ 397.24±38.43 def 124.07±14.67 a 91.48±5.42 a 38.87±11.49 cdef
    ‘长林53号’ב长林10号’ 395.50±57.45 ef 111.34±37.01 abcde 83.36±13.95 abcd 40.06±16.08 bcdef
    ‘长林53号’ב长林95号’ 394.00±65.17 ef 120.46±24.40 ab 73.96±11.38 def 45.63±16.09 bcde
    ‘长林10号’ב长林53号’ 391.03±45.67 ef 113.45±20.75 abcd 79.91±13.28 bcdef 50.08±15.41 abc
    ‘长林95号’ב长林10号’ 388.98±48.55 ef 114.81±17.24 abc 88.96±15.89 ab 35.74±10.70 def
    ‘长林10号’ב长林40号’ 385.08±40.73 ef 92.39±15.12 gh 78.66±9.01 bcdef 47.02±13.68 bcde
    ‘长林40号’ב长林10号’ 382.87±65.80 f 99.97±20.04 cdefgh 91.08±20.64 a 59.66±20.08 a
      说明:数据为平均值±标准差。同列不同小写字母表示差异极显著(P<0.01)。
    下载: 导出CSV 
    | 显示表格

    本研究中不同组合间各性状均差异极显著(P<0.01)。在此基础上,进一步采用固定模型评估杂交亲本的配合力。由表5可知:杂交亲本在纤维素和半纤维素质量分数的一般配合力、特殊配合力和反交效应值差异均达极显著水平(P<0.01)。亲本含油率的一般配合力和特殊配合力差异达极显著水平(P<0.01),反交效应值无显著差异。木质素质量分数的亲本一般配合力和反交效应值差异达极显著水(P<0.01),特殊配合力差异不显著。可见,普通油茶杂交育种中,一般配合力、特殊配合力和反交效应值对杂交群体含油率和木质素、纤维素和半纤维素质量分数等性状具有极显著影响(P<0.01)。

    表 5  普通油茶全双列杂交(无自交)配合力及反交效应值的方差分析
    Table 5  Variance analysis of combining ability and reciprocal cross effect in complete diallel cross of C. oleifera
    变异来源 自由度 F
    含油率 木质素
    质量分数
    纤维素质
    量分数
    半纤维素
    质量分数
    一般配合力 4 11.18** 15.57** 3.98** 7.26**
    特殊配合力 5 6.45** 0.88 7.32** 3.88**
    反交效应值 10 1.31 6.08** 8.10** 5.03**
      说明:**表示差异极显著(P<0.01)。
    下载: 导出CSV 
    | 显示表格

    对差异极显著的各亲本一般配合力多重比较(表6)表明:‘长林4号’含油率和纤维素质量分数的一般配合力均最高,分别为1.64和0.18,这与该良种年平均产油量高的特性一致。在半纤维素质量分数中,‘长林10号’的一般配合力最高,为0.54,明显高于其他亲本,同时‘长林10号’的含油率一般配合力最低,为−1.79。‘长林95号’木质素质量分数的一般配合力排名第1位,为0.46,含油率的一般配合力为−0.56,排名倒数第2位。可见,在高含油率杂交种质创制时,除了选择含油率一般配合力高的亲本外,选择木质素、纤维素和半纤维素质量分数一般配合力较低的亲本也是可行的。

    表 6  各组合母本一般配合力估计值
    Table 6  Estimated general combining ability of female parent of each cross     
    亲本 一般配合力估计值
    含油率 木质素
    质量分数
    纤维素
    质量分数
    半纤维素
    质量分数
    ‘长林4号’ 1.64 0.16 0.18 −0.15
    ‘长林10号’ −1.79 0.11 0.16 0.54
    ‘长林40号’ 0.50 −0.97 −0.16 −0.09
    ‘长林53号’ 0.21 0.23 −0.27 0.09
    ‘长林95号’ −0.56 0.46 0.08 −0.38
      说明:表中数据均为平均值。
    下载: 导出CSV 
    | 显示表格

    不同杂交组合含油率的特殊配合力为−2.23~1.66,根据含油率的特殊配合力效应选出前5个亲本组合为‘长林40号’ב长林95号’(‘长林95号’ב长林40号’)、‘长林4号’ב长林53号’(‘长林53号×长林4号’)、‘长林10号’ב长林95号’(‘长林95号’ב长林10号’)、‘长林4号’ב长林10号’(‘长林10号’ב长林4号’)和‘长林4号’ב长林40号’(‘长林40号’ב长林4号’)(表7)。由于木质素、纤维素、半纤维素质量分数与含油率呈负相关,因此在以含油率为育种目标时,宜选择特殊配合力较低的组合。各杂交组合木质素含量的特殊配合力为−0.22~0.31,由于组合间差异不显著(表5),因此该特殊配合力效应只作为筛选优良组合的参考,不具有决定性。根据纤维素和半纤维素质量分数的特殊配合力,筛选出纤维素质量分数特殊配合力较低的组合有‘长林4号’ב长林10号’(‘长林10号’ב长林4号’)、‘长林10号’ב长林95号’(‘长林95号’ב长林10号’)、‘长林4号’ב长林40号’(‘长林40号’ב长林4号’)、‘长林40号’ב长林95号’(‘长林95号’ב长林40号’)和‘长林53号’ב长林95号’(‘长林95号’ב长林53号’)。筛选出半纤维素质量分数特殊配合力较低的组合有‘长林40号’ב长林95号’(‘长林95号’ב长林40号’)、‘长林4号’ב长林40号’(‘长林40号’ב长林4号’)、‘长林40号’ב长林53号’(‘长林53号’ב长林40号’)、‘长林4号’ב长林10号’(‘长林10号’ב长林4号’)、‘长林10号’ב长林53号’(‘长林53号’ב长林10号’)。

    表 7  普通油茶亲本组合的特殊配合力及反交效应值
    Table 7  Values of specific combining ability and reciprocal cross effect for different combinations of C. oleifera
    序号
    组合
    (母本×父本)
    含油率 木质素质量分数 纤维素质量分数 半纤维素质量分数
    特殊配合力 反交效应值 特殊配合力 反交效应值 特殊配合力 反交效应值 特殊配合力 反交效应值
    1 ‘长林4号’ב长林53号’ 1.31 0.02 −0.22 0.11 −0.03 0.25 0.47 0.35
    ‘长林53号’ב长林4号’
    2 ‘长林4号’ב长林95号’ −2.23 −0.31 0.02 0.03 0.68 0.19 −0.01 0.13
    ‘长林95号’ב长林4号’
    3 ‘长林53号’ב长林95号’ −0.57 −0.86 0.03 0.69 −0.18 −0.24 0.14 0.42
    ‘长林95号’ב长林53号’
    4 ‘长林4号’ב长林40号’ 0.30 1.53 0.31 −0.63 −0.22 0.16 −0.29 −0.04
    ‘长林40号’ב长林4号’
    5 ‘长林40号’ב长林53号’ −0.46 −0.23 −0.08 −0.05 −0.03 −0.15 −0.19 0.68
    ‘长林53号’ב长林40号’
    6 ‘长林40号’ב长林95号’ 1.66 0.81 −0.06 −1.12 −0.21 −0.77 −0.11 0.50
    ‘长林95号’ב长林40号’
    7 ‘长林4号’ב长林10号’ 0.62 −0.78 −0.11 0.27 −0.43 0.67 −0.17 −0.10
    ‘长林10号’ב长林4号’
    8 ‘长林10号’ב长林53号’ −0.28 −0.22 0.27 0.11 0.25 −0.17 −0.41 0.50
    ‘长林53号’ב长林10号’
    9 ‘长林10号’ב长林95号’ 1.15 1.08 0.01 −0.26 −0.28 −0.91 −0.02 0.86
    ‘长林95号’ב长林10号’
    10 ‘长林10号’ב长林40号’ −1.50 0.11 −0.16 −0.38 0.46 −0.62 0.60 −0.63
    ‘长林40号’ב长林10号’
    下载: 导出CSV 
    | 显示表格

    依据反交效应。可判断一对杂交亲本中哪个做母本更易获得性状优良的杂交子代。通常,反交效应值为正时,正交组合能够更容易获得较高水平表型的子代,反交效应值为负时,采用反交组合将更易创制较高水平表型的子代。对依据特殊配合力筛选出的5个亲本组合,进一步根据反交效应确定高含油率的杂交组合为‘长林40号’ב长林95号’、‘长林4号’ב长林53号’、‘长林10号’ב长林95号’、‘长林10号’ב长林4号’和‘长林4号’ב长林40号’。低纤维素特殊配合力的杂交组合为‘长林10号’ב长林4号’、‘长林10号’ב长林95号’、‘长林40号’ב长林4号’、‘长林40号’ב长林95号’和‘长林53号’ב长林95号’。低半纤维素的杂交组合有‘长林53号’ב长林10号’、‘长林4号’ב长林40号’、‘长林53号’ב长林40号’、‘长林4号’ב长林10号’和‘长林95号’ב长林40号’。综合子代含油率、纤维素、半纤维素质量分数的配合力分析结果,筛选出‘长林40号’ב长林95号’和‘长林4号’ב长林53号’,这2个组合含油率的特殊配合力较高,含油率在20个家系中的排名分别为第4位和第5位,在纤维素质量分数排名为第20位和第8位;在半纤维素质量分数排名为第11位和第3位。推测这2个组合在普通油茶高含油率育种中具有重要的育种潜力和价值。

    在本研究群体中,含油率和纤维素和半纤维素质量分数的显性方差均大于加性方差(表8)。其中,含油率的加性方差和显性方差分别为1.38、2.39,显性方差是加性方差的1.73倍;纤维素质量分数的遗传方差主要为显性方差,加性方差为0;半纤维素质量分数的显性方差略大于加性方差,是加性方差的1.24倍。可见这3个性状均以非加性遗传效应控制为主,加性效应次之,尤其是纤维素质量分数主要由显性遗传效应控制。木质素质量分数的加性方差为0.58,显性方差为0,这一性状主要由加性效应控制,这与木质素质量分数的特殊配合力方差差异不显著是一致的。含油率和木质素、纤维素和半纤维素质量分数的广义遗传力为7.86%~14.03%,狭义遗传力为0~14.03%,遗传力均较低,说明这些数量性状受到较强的环境效应影响。

    表 8  普通油茶种仁性状的主要遗传参数
    Table 8  Major genetic parameters for kernel traits of C. oleifera
    遗传参数
    加性
    方差
    显性
    方差
    遗传
    方差
    表型
    方差
    广义遗
    传力/%
    狭义遗
    传力/%
    含油率 1.38 2.39 3.74 30.00 12.55 4.60
    木质素质量分数 0.58 0.00 0.58 4.17 14.03 14.03
    纤维素质量分数 0.00 0.20 0.20 2.05 9.52 0.00
    半纤维素质量分数 0.11 0.14 0.25 3.16 7.86 3.51
    下载: 导出CSV 
    | 显示表格

    在本研究中,含油率与木质素、纤维素和半纤维质量分数在油茶群体中具有显著负相关关系。MIAO等[19]研究发现:油菜籽含油率与木质素和纤维素质量分数也存在显著负相关,且相关性系数与油茶相当;与半纤维素质量分数的相关性系数略低。WANG等[26]研究表明:油菜籽中的纤维组分包括木质素、纤维素和半纤维素,对含油率有负面影响。推测可能是纤维素和半纤维素的合成减少了进入种子油生物合成途径中的光合同化物,从而导致含油率降低[2728]。SCHILBERT等[29]研究发现:BnaPAL4基因在这个过程中起重要作用。可见,木质素、纤维素、半纤维素质量分数等3个性状作为间接参考指标,衡量油茶种仁含油率是可行的。当油脂测定不便或样本材料较少时,可通过测定饼粕中木质素、纤维素和半纤维素质量分数间接评估油茶中的含油率。

    目前,油茶产业上用的无性系良种多来源于选择育种,但通过选择育种来培育高产优质新品种的潜力逐渐减小。正确选择亲本是普通油茶杂交育种成功的基础和关键,开展杂交亲本一般配合力和特殊配合力的估算,能够更高效地提高育种效率。本研究发现:普通油茶杂交亲本在油脂性状上的一般配合力、特殊配合力和反交效应都差异极显著,表明亲本评估对以含油率为育种目标的普通油茶杂交非常关键。

    本研究中,5个亲本在含油率以及木质素、纤维素和半纤维素质量分数等4个性状中的一般配合力有较大差异。同一亲本的一般配合力在不同的性状间存在明显差异,同一性状在不同亲本的一般配合力间也存在显著差异。如‘长林4号’在含油率的一般配合力最高,在半纤维素质量分数的一般配合力是倒数第2位。亲本在半纤维素质量分数的一般配合力范围较大,最高的‘长林10号’一般配合力为0.54,最低的‘长林95号’一般配合力为−0.38,这与桤木Alnus cremastogyne种间杂交亲本种实性状(种子长度、宽度、千粒重)的配合力情况相同[30]。同样地,各组合在4个油脂相关性状上的特殊配合力值也存在显著差异。

    一般配合力和特殊配合力的相对重要性一直是林木杂交育种中亲本的评估重点[17]。研究表明:一般配合力和特殊配合力的相对重要性受测试材料、性状、地点和树龄等的影响[15]。牛慧敏等[31]研究发现:对于杉木幼林的干形性状,一般配合力测定比特殊配合力测定更重要。吴兵等[32]研究发现:桉树种间杂交子代的生长性状受加性与非加性效应的共同作用,但是以加性效应为主,所以应更关注双亲的一般配合力。林萍等[15]针对油茶5×5全双列杂交子代幼林生长性状的研究表明:一般配合力比特殊配合力更重要;对(不完全双列杂交)设计的油茶子代林分析发现:林龄不同其生长性状的一般配合力和特殊配合力方差分量也不相同,1年生子代林的一般配合力方差分量高于特殊配合力,而2年生子代林一般配合力方差分量均明显低于特殊配合力[16]。柴静瑜等[33]对进入盛产期的油茶巢式杂交子代群体进行遗传分析显示:组合间含油率和脂肪酸质量分数的差异主要来源于双亲的特殊配合力,评估双亲的特殊配合力远比亲本的一般配合力更重要。赵颖等[14]评估了马尾松纸浆材主要经济性状,发现特殊配合力相对重要性大于一般配合力。在本研究中,油茶杂交子代成林的含油率和纤维素质量分数的显性方差显著大于加性方差,这2个性状亲本的特殊配合力比一般配合力更重要。半纤维素质量分数的显性方差与加性方差相当,说明半纤维素质量分数亲本的一般配合力和特殊配合力同等重要。因此,在以含油率为育种目标的油茶杂交中,优先选择特殊配合力较高的亲本组合,同时兼顾亲本的一般配合力。

    因受测试材料、性状、地点和树龄等因素的不同,遗传力也有差别。吴兵等[32]研究发现:桉树幼林各生长性状遗传力均在0.57以上。黄逢龙等[34]发现:杨树无性系的各树冠性状遗传力都较低,均小于0.50。在马尾松巢式交配子代生长性状遗传分析发现:胸径、树高和单株材的广义遗传力为0.48~0.69,受中度遗传控制[7],这与红松Pinus koraiensis[35]的研究结果一致。林萍等[17]研究发现:普通油茶杂交子代林幼龄时期种仁含油率、脂肪酸成分及其质量分数等经济性状受环境影响较大,遗传控制力度较弱。柴静瑜等[33]研究发现:盛产期后油茶油脂性状的遗传力显著升高,尤其是硬脂酸、油酸、亚油酸等决定油脂品质的脂肪酸质量分数。可见,子代幼林的遗传力评估仅可作为油茶杂交育种策略制定的参考,重点应关注成林的遗传力参数。

    本研究发现:普通油茶含油率和木质素、纤维素、半纤维素质量分数4个性状在组合间存在显著差异,且含油率与木质素、纤维素、半纤维素质量分数间存在显著负相关;4个性状的亲本一般配合力、特殊配合力和反交效应值差异显著。含油率和纤维素质量分数的遗传方差以显性效应为主,半纤维素质量分数的加性方差与显性方差相当,而木质素质量分数的遗传方差则以加性效应为主;4个性状的遗传力均较低,受环境影响较大。在此基础上,筛选出可用于高含油率种质创制的优良亲本‘长林4号’和‘长林40号’,优良杂交组合‘长林40号’ב长林95号’和‘长林4号’ב长林53号’。

  • 图  1  中性绘图分析

    Figure  1  Analysis of neutrality plot

    图  2  ENC-plot分析

    Figure  2  Analysis of ENC-plot

    图  3  PR2-plot分析

    Figure  3  Analysis of PR2-plot

    图  4  梁山慈竹与其他物种密码子偏好性比较

    Figure  4  Comparison of codon preference between D. farinosus and other species

    图  5  梁山慈竹基因组密码子RSCU的对应性分析

    Figure  5  Correspondence Analysis on RSCU of D. farinosus

    表  1  梁山慈竹叶绿体基因结构分析

    Table  1.   Structural analysis of the choroplast genome of D. farinosus

    基因分类基因分组基因名称
    光合系统基因光系统Ⅰ基因psaApsaBpsbApsbCpsbDpsbB
    光系统Ⅱ基因petApetBpetD
    细胞色素b/f复合体基因atpAatpBatpEatpFatpI
    三磷酸腺苷合成酶基因ndhAndhBndhCndhDndhEndhFndhGndhHndhIndhJndhK
    遗传系统基因烟酰胺腺票吟二核甘酸氧化还原酶基因rbcL
    二磷酸核酮糖羧化酶大亚基基因rpoArpoBrpoC1、rpoC2
    RNA聚合酶亚基基因rps2、rps3、rps4、rps7、rps8、rps11、rps12、rps14、rps18
    核糖体蛋白小亚基基因rpl2、rpl14、rpl16、rpl20、rpl22
    其他基因成熟酶K基因matK
    膜蛋白基因cemA
    细胞色素合成基因ccsA
    酪蛋白分解蛋白酶基因clpP
    未知功能基因假定叶绿体阅读框ycf2、ycf3、infA
    下载: 导出CSV

    表  2  梁山慈竹叶绿体基因组各基因密码子相关参数统计

    Table  2.   Statistics of codon related parameters of various genes in the chloroplast genome of D. farinosus

    基因GC比率/%ENCCAIFOP基因GC比率/%ENCCAIFOP
    GCGC1GC2GC3GCGC1GC2GC3
    rps1241.8752.0047.2026.4044.850.1400.341rps1833.5334.5039.7726.3239.040.1470.333
    psbA42.5649.7242.9435.0341.330.3130.532rpl2036.1138.3340.8329.1750.970.1120.298
    matK34.4440.8232.4230.0849.490.1660.329clpP43.0152.5338.2538.2552.370.1750.337
    psbD44.4453.3943.5036.4448.990.2420.456psbB44.0154.4245.9731.6350.730.1900.380
    psbC44.6653.5944.7335.6348.910.1830.386petB41.0648.9341.2033.0547.310.1910.333
    rpoB39.1949.8138.0129.7449.690.1530.353petD40.3750.9339.1331.0649.460.1610.305
    rpoC139.8749.9338.0731.6352.770.1560.347rpoA37.0646.1835.5929.4149.940.1510.311
    rpoC238.9549.0136.6431.1852.290.1540.333rps1143.5250.6956.2523.6144.330.1740.396
    rps238.4040.5140.9333.7652.550.1680.338infA40.3543.8635.9641.2361.000.1810.409
    atpI38.8447.5836.2932.6650.550.1630.353rps836.5041.6141.6126.2846.620.1220.374
    atpF38.2747.6235.4531.7553.170.1470.353rpl1438.7154.8437.1024.1951.900.1810.392
    atpA42.0656.0139.9630.1249.960.1820.385rpl1644.7652.1453.5728.5739.410.1150.354
    rps1439.4239.4246.1532.6941.730.1350.384rps333.4743.7531.6725.0048.030.1930.402
    psaB41.8148.7143.1333.6149.340.1720.350rpl2237.5641.3336.6734.6747.480.1880.415
    psaA43.6851.8043.2835.9552.070.1980.373rpl244.5651.7748.5833.3353.330.1430.361
    ycf339.6947.4038.1533.5355.450.1560.343ndhB38.1642.0739.3333.0746.710.1560.348
    rps437.1347.5237.1326.7349.590.1690.386rps739.4949.6845.2223.5748.310.1640.373
    ndhJ39.3849.3836.8831.8851.480.1760.356ndhF34.1937.8438.9225.8146.190.1440.321
    ndhK38.6041.7043.7230.3651.910.1590.329ccsA33.6433.7441.1026.0745.600.1520.307
    ndhC39.6750.4136.3632.3348.750.1770.345ndhD36.1940.7236.9330.9448.980.1330.314
    atpE42.5152.1739.1336.2359.510.1670.405ndhE33.3341.1832.3526.4759.060.1440.316
    atpB42.6253.9141.6832.2647.430.1920.381ndhG34.4644.0732.7726.5545.770.1250.250
    rbcL44.1457.1143.9331.3850.190.2710.454ndhI34.9937.5738.6728.7352.090.1710.345
    ycf441.2248.3939.7835.4847.140.1620.385ndhA33.9842.4236.3623.1444.350.1400.321
    cemA33.6241.9927.7131.1755.910.1760.342ndhH37.8250.7634.7727.9249.950.1550.322
    petA40.2953.5835.232.0951.120.1550.331
    下载: 导出CSV

    表  3  梁山慈竹叶绿体基因组中各基因参数的相关性分析

    Table  3.   Correlation analysis of various gene parameters in the chloroplast genome of D. farinosus

    参数GC1GC2GC3ENCCAICBIFOPGC3sGC
    GC11
    GC20.300*1
    GC30.265−0.0091
    ENC0.142−0.425**0.389**1
    CAI0.409**0.0760.370**0.0121
    CBI0.438**0.2720.322*−0.0920.774**1
    FOP0.402**0.312*0.341*−0.0640.797**0.965**1
    GC3s0.271−0.0290.946**0.445**0.330*0.330*0.370**1
    GC0.814**0.673**0.525**0.0100.407**0.512**0.518**0.499**1
      说明: *表示显著相关 (P<0.05);**表示极显著相关 (P<0.01)。
    下载: 导出CSV

    表  4  梁山慈竹叶绿体基因组蛋白编码序列RSCU分析

    Table  4.   RSCU of protein coding region in the chloroplast of D. farinosus

    氨基酸
    密码子数量RSCU氨基酸密码子数量RSCU氨基酸
    密码子数量RSCU氨基酸密码子数量RSCU
    PheUUU*6441.29TyrUAU*5321.59SerUCU*3431.58CysUGU*1511.53
    PheUUC3510.71TyrUAC1370.41SerUCC*2601.19CysUGC470.47
    LeuUUA*6341.94TERUAA*281.56SerUCA*2221.02ArgAGA*3221.75
    LeuUUG*3621.11TERUAG140.78SerUCG1190.55ArgAGG1190.64
    LeuCUU*4201.29TERUGA120.67SerAGU*2731.25ArgCGU*2611.41
    LeuCUC1380.42TrpUGG*3281.00SerAGC890.41ArgCGC950.51
    LeuCUA2950.90GlnCAA*4771.53ThrACU*4031.68ArgCGA*2341.27
    LeuCUG1070.33GlnCAG1480.47ThrACC1810.75ArgCGG760.41
    IleAUU*7401.48GluGAA*7051.46ThrACA*2591.08GlyGGU*4211.24
    IleAUC2950.59GluGAG2630.54ThrACG1160.48GlyGGC1450.43
    IleAUA4610.92LysAAA*6471.44AlaGCU*4931.73GlyGGA*5381.58
    MetAUG*4161.00LysAAG2530.56AlaGCC1720.60GlyGGG2590.76
    ValGUU*3821.47AspGAU*5221.54AlaGCA*3431.20ProCCU*2861.48
    ValGUC1260.49AspGAC1550.46AlaGCG1350.47ProCCC*1961.01
    ValGUA*3901.50HisCAU*3111.47AsnAAU*5281.48ProCCA*2091.08
    ValGUG1390.54HisCAC1120.53AsnAAC1870.52ProCCG840.43
      说明:*表示RSCU大于1的高频密码子。
    下载: 导出CSV

    表  5  梁山慈竹叶绿体基因组各氨基酸的RSCU分析及最优密码子分析

    Table  5.   RSCU analysis and optimal codon analysis of amino acids in chloroplast genome of D. farinosus

    氨基酸密码子基因组
    RSCU
    高表达
    RSCU
    低表达
    RSCU
    ΔRSCU氨基酸密码子基因组
    RSCU
    高表达
    RSCU
    低表达
    RSCU
    ΔRSCU
    TerUAA***1.560 01.800 01.200 00.600 0MetAUG1.000 01.000 01.000 00
    UAG0.780 00.600 01.200 0−0.600 0AsnAAC*0.520 00.893 60.625 00.268 6
    UGA0.670 00.600 00.600 00AAU1.480 01.106 41.375 0−0.268 6
    AlaGCA**1.200 01.200 00.734 70.465 3ProCCA**1.080 00.800 00.500 00.300 0
    GCC0.600 00.457 10.653 1−0.196 0CCC1.010 00.800 01.166 7−0.366 7
    GCG0.470 00.228 60.734 7−0.506 1CCG0.430 00.444 41.000 0−0.555 6
    GCU*1.730 02.114 31.877 60.236 7CCU***1.480 01.955 61.333 30.622 3
    CysUGC**0.470 00.400 000.400 0GlnCAA*1.530 01.500 01.368 40.131 6
    UGU1.530 01.600 02.000 0−0.400 0CAG0.470 00.500 00.631 6−0.131 6
    AspGAC*0.460 00.500 00.411 80.088 2ArgAGA*1.750 01.723 41.534 90.188 5
    GAU1.540 01.500 01.588 2-0.088 2AGG0.640 00.319 10.837 2−0.518 1
    GluGAA1.460 01.189 21.578 9−0.389 7CGA1.270 01.276 61.395 3−0.118 7
    GAG**0.540 00.810 80.421 10.389 7CGC0.510 00.319 10.837 2−0.518 1
    PheUUC**1.290 01.041 70.650 00.391 7CGG0.410 00.319 10.279 10.040 0
    UUU0.710 00.958 31.350 0−0.391 7CGU***1.410 02.042 61.116 30.926 3
    GlyGGA1.580 01.253 71.818 2−0.564 5SerAGC0.410 00.384 60.470 6−0.086 0
    GGC0.430 00.417 90.484 8−0.066 9AGU**1.250 01.846 21.411 80.434 4
    GGG0.760 00.119 40.363 6−0.244 2UCA1.020 00.615 41.058 8−0.443 4
    GGU***1.240 02.209 01.333 30.875 7UCC***1.190 01.769 20.941 20.828 0
    HisCAC**0.530 00.941 20.571 40.369 8UCG0.550 00.153 80.705 9−0.552 1
    CAU1.470 01.058 81.428 6−0.369 8UCU1.580 01.230 81.411 8−0.181 0
    Ile AUA0.920 00.850 70.949 4−0.098 7ThrACA1.080 01.181 81.176 50.005 3
    AUC*0.590 00.626 90.531 60.095 3ACC0.500 00.818 21.058 8−0.240 6
    AUU1.480 01.522 41.519 00.003 4ACG0.480 00.363 60.588 2−0.224 6
    LysAAA**1.440 01.471 71.155 60.316 1ACU**1.680 01.636 41.176 50.459 9
    AAG0.560 00.528 30.844 4−0.316 1ValGUA***1.500 01.767 41.257 10.510 3
    LeuCUA0.900 00.833 31.295 5−0.462 2GUC0.490 001.028 6−1.028 6
    CUC0.420 000.545 5−0.545 5GUG0.540 00.372 10.342 90.029 2
    CUG0.330 00.250 00.477 3−0.227 3GUU**1.470 01.860 51.371 40.489 1
    CUU*1.290 01.333 31.227 30.106 0TrpUGG1.000 01.000 01.000 00
    UUA***1.940 02.166 71.022 71.144 0TyrUAC**0.410 00.521 70.166 70.355 0
    UUG1.110 01.416 71.431 8−0.015 1UAU1.590 01.478 31.833 3−0.355 0
      说明: 高频密码子(RSCU>1.00)带下划线;*. ΔRSCU≥0.08;**. ΔRSCU≥0.3;***. ΔRSCU≥0.5; 加粗的密码子表示最优密码子。
    下载: 导出CSV
  • [1] 周涛, 杨林, 舒军霞, 等. 3种含笑属植物叶绿体基因组密码子偏好性分析[J]. 西部林业科学, 2022, 51(3): 91 − 100.

    ZHOU Tao, YANG Lin, SHU Junxia, et al. Analysis of codon bias in the chloroplast genome of three of Michelia spp. species [J]. Journal of West China Forestry Science, 2022, 51(3): 91 − 100.
    [2] ANDARGIE M, ZHU Congyi. Genome-wide analysis of codon usage in sesame (Sesamum indicum L. ) [J/OL]. Heliyon, 2022, 8(1): e8687[2023-09-08]. doi: 10.1016/j.heliyon.2021.e08687.
    [3] 孟祎, 李菁, 杜少兵, 等. 17种鼠李科植物的叶绿体基因组特征和密码子偏好性分析[J/OL]. 分子植物育种, 2023-08-22[2023-09-08]. https://link.cnki.net/urlid/46.1068.S.20230822.1011.002.

    MENG Yi, LI Jing, DU Shaobing, et al. Analysis of chloroplast genome characteristics and codon preference of 17 species of Rhamnaceae [J/OL]. Molecular Plant Breeding, 2023-08-22[2023-09-08]. https://link.cnki.net/urlid/46.1068.S.20230822.1011.002.
    [4] 辛雅萱, 黎若竹, 李鑫, 等. 杧果叶绿体基因组密码子使用偏好性分析[J]. 中南林业科技大学学报, 2021, 41(9): 148 − 156, 165.

    XIN Yaxuan, LI Ruozhu, LI Xin, et al. Analysis on codon usage bias of chloroplast genome in Mangifera indica [J]. Journal of Central South University of Forestry &Technology, 2021, 41(9): 148 − 156, 165.
    [5] PARVATHY S T, UDAYASURIYAN V, BHADANA V. Codon usage bias [J]. Molecular Biology Reports, 2022, 49(1): 539 − 565.
    [6] CHAKRABORTY S, YENGKHOM S, UDDIN A. Analysis of codon usage bias of chloroplast genes in Oryza species [J/OL]. Planta, 2020, 252(4): 67[2023-09-08]. doi: 10.1007/s00425-020-03470-7.
    [7] LI Changle, ZHOU Ling, NIE Jiangbo, et al. Codon usage bias and genetic diversity in chloroplast genomes of Elaeagnus species (Myrtiflorae: Elaeagnaceae) [J]. Physiology and Molecular Biology of Plants, 2023, 29(2): 239 − 251.
    [8] WU Peng, XIAO Wenqi, LUO Yingyong, et al. Comprehensive analysis of codon bias in 13 Ganoderma mitochondrial genomes [J/OL]. Frontiers in Microbiology, 2023, 14: 1170790[2023-09-08]. doi: 10.3389/fmicb.2023.1170790.
    [9] GENG Xiaoshan, HUANG Ning, ZHU Yuling, et al. Codon usage bias analysis of the chloroplast genome of cassava [J]. South African Journal of Botany, 2022, 151: 970 − 975.
    [10] 王身昌, 胡尚连, 曹颖, 等. 梁山慈竹高通量转录组测序及差异表达基因分析[J]. 华北农学报, 2016, 31(3): 65 − 71.

    WANG Shenchang, HU Shanglian, CAO Ying, et al. High-throughput RNA-seg and analysis on differential expressed gene from Dendrocalamus farinosus [J]. Acta Agriculturae Boreali-Sinica, 2016, 31(3): 65 − 71.
    [11] 姜霞, 周华, 晏玉莹, 等. 梁山慈竹和硬头黄竹秆形结构和地上生物量分配特性[J]. 贵州林业科技, 2023, 51(1): 39 − 43.

    JIANG Xia, ZHOU Hua, YAN Yuying, et al. Culm structure and above-ground biomass allocation of Dendrocalamus farinosus and Bambusa rigida [J]. Guizhou Forestry Science and Technology, 2023, 51(1): 39 − 43.
    [12] JIANG Yue, DENG Fei, WANG Hualin, et al. An extenxive analysis on the global codon usage pattern of baculoviruses [J]. Archives of Virology, 2008, 153(12): 2273 − 2282.
    [13] 原晓龙, 王毅, 张劲峰. 灰毛浆果楝叶绿体基因组密码子使用特征分析[J]. 森林与环境学报, 2020, 40(2): 195 − 202.

    YUAN Xiaolong, WANG Yi, ZHANG Jinfeng. Characterization of codon usage in Cipadessa cinerascens chloroplast genome [J]. Journal of Forest and Environment, 2020, 40(2): 195 − 202.
    [14] MAZUMDER G A, UDDIN A, CHAKRABORTY S. Analysis of codon usage bias in mitochondrial CO gene among platyhelminthes [J/OL]. Molecular & Biochemical Parasitology, 2021, 245: 111410[2023-09-08]. doi: 10.1016/j.molbiopara.2021.111410.
    [15] 秦政, 郑永杰, 桂丽静, 等. 樟树叶绿体基因组密码子偏好性分析[J]. 广西植物, 2018, 38(10): 1346 − 1355.

    QIN Zheng, ZHENG Yongjie, GUI Lijing, et al. Codon usage bias analysis of chloroplast genome of camphora tree (Cinnamomum camphora) [J]. Guihaia, 2018, 38(10): 1346 − 1355.
    [16] BEGUM N S, CHAKRABORTY S. Influencing elements of codon usage bias in Birnaviridae and its evolutionary analysis [J/OL]. Virus Research, 2022, 310: 198672[2023-09-08]. doi: 10.1016/j.virusres.2021.198672.
    [17] 唐晓芬, 陈莉, 马玉韬. 密码子使用偏性量化方法研究综述[J]. 基因组学与应用生物学, 2013, 32(5): 660 − 666.

    TANG Xiaofen, CHEN Li, MA Yutao. Review and prospect of the principle and methods quantifying codon usage bias [J]. Genomics and Applied Biology, 2013, 32(5): 660 − 666.
    [18] 陆奇丰, 骆文华. 广西秋海棠叶绿体基因组密码子偏好性分析[J/OL]. 分子植物育种, 2023, 2023-09-05[2023-09-08]. https://link.cnki.net/urlid/46.1068.S.20230905.0920.002.

    LU Qifeng, LUO Wenhua. Analysis of codon usage bias in chloroplast genome of Begonia guangxiensis [J/OL]. Molecular Plant Breeding, 2023, 2023-09-05[2023-09-08]. https://link.cnki.net/urlid/46.1068.S.20230905.0920.002.
    [19] 原晓龙, 李云琴, 张劲峰, 等. 乳油木叶绿体基因组密码子偏好性分析[J]. 分子植物育种, 2020, 18(17): 5658 − 5664.

    YUAN Xiaolong, LI Yunqin, ZHANG Jinfeng, et al. Codon usage bias analysis of chloroplast genome in Vitellaria paradoxa [J]. Molecular Plant Breeding, 2020, 18(17): 5658 − 5664.
    [20] 沈莲文, 田金红, 王玉昌, 等. 2种玉兰属植物叶绿体基因组密码子偏好性分析[J]. 西南林业大学学报(自然科学), 2023, 43(2): 44 − 53.

    SHEN Lianwen, TIAN Jinhong, WANG Yuchang, et al. Analysis of codon usage bias (CUB) in the chloroplast genomes of 2 Yulania species [J]. Journal of Southwest Forestry University (Natural Sciences), 2023, 43(2): 44 − 53.
    [21] 王鹏良, 吴双成, 杨利平, 等. 巨桉叶绿体基因组密码子偏好性分析[J]. 广西植物, 2019, 39(12): 1583 − 1592.

    WANG Pengliang, WU Shuangcheng, YANG Liping, et al. Analysis of codon bias of chloroplast genome in Eucalyptus grandis [J]. Guihaia, 2019, 39(12): 1583 − 1592.
    [22] 胡晓艳, 许艳秋, 韩有志, 等. 酸枣叶绿体基因组密码子使用偏性分析[J]. 森林与环境学报, 2019, 39(6): 621 − 628.

    HU Xiaoyan, XU Yanqiu, HAN Youzhi, et al. Codon usage bias analysis of the chloroplast genome of Ziziphus jujuba var. spinosa [J]. Journal of Forest and Environment, 2019, 39(6): 621 − 628.
    [23] 李江飞, 王瑜, 颜廷雨, 等. 云南油杉叶绿体基因组密码子偏好性分析[J]. 中南林业科技大学学报, 2022, 42(4): 30 − 39.

    LI Jiangfei, WANG Yu, YAN Tingyu, et al. Analysis on codon usage bias of Keteleeria evelyniana chloroplast genome [J]. Journal of Central South University of Forestry &Technology, 2022, 42(4): 30 − 39.
    [24] 刘兴跃, 何仲坚, 邱毅敏. 4种蔷薇科果树叶绿体基因组密码子偏好性分析[J]. 分子植物育种, 2022, 20(16): 5299 − 5308.

    LIU Xingyue, HE Zhongjian, QIU Yimin. Analysis of codon bias in the chloroplast genome of four Rosaceae fruit trees [J]. Molecular Plant Breeding, 2022, 20(16): 5299 − 5308.
    [25] ZHOU Meng, LONG Wei, LI Xia. Analysis of synonymous codon usage in chloroplast genome of Populus alba [J]. Journal of Forestry Research, 2008, 19(4): 293 − 297.
    [26] 王占军, 丁亮, 蔡倩文, 等. 3种木薯全基因组的密码子偏好性模式与变异来源比较[J]. 应用与环境生物学报, 2021, 27(4): 1013 − 1021.

    WANG Zhanjun, DING Liang, CAI Qianwen, et al. Comparison of codon preference patterns and variation sources in Manihot esculenta Crantz genomes [J]. Chinese Journal of Applied and Environmental, 2021, 27(4): 1013 − 1021.
    [27] 李江飞, 李亚麒, 唐军荣, 等. 高山松叶绿体基因组密码子偏好性模式[J]. 生物学杂志, 2023, 40(1): 52 − 59.

    LI Jiangfei, LI Yaqi, TANG Junrong, et al. Comparison of codon preference patterns in the chloroplast genome of Pinus densata [J]. Journal of Biology, 2023, 40(1): 52 − 59.
    [28] 李江平, 秦政, 国春策, 等. 抽筒竹叶绿体基因组的密码子偏好性分析[J]. 竹子学报, 2019, 38(2): 79 − 87.

    LI Jiangping, QIN Zheng, GUO Chunce, et al. Codon bias in the chloroplast genome of Gelidocalamus tessellatus [J]. Journal of Bamboo Research, 2019, 38(2): 79 − 87.
    [29] 黄笑宇, 许在恩, 郭小勤. 基于全基因组的毛竹同义密码子使用偏好性分析[J]. 浙江农林大学学报, 2017, 34(1): 120 − 128.

    HUANG Xiaoyu, XU Zai’en, GUO Xiaoqin. Synonymous codon bias of Phyllostachys edulis [J]. Journal of Zhejiang A&F University, 2017, 34(1): 120 − 128.
    [30] MA Xingliang, ZHU Qinlong, CHEN Yuanling, et al. CRISPRICas9 platforms for genome editing in plants: developments and applications [J]. Molecular Plant, 2016, 9(7): 961 − 974.
  • [1] 陈梦瑶, 胡怡然, 郑志富, 潘天.  大豆IGT基因家族的全基因组鉴定及组织表达分析 . 浙江农林大学学报, 2025, 42(1): 64-73. doi: 10.11833/j.issn.2095-0756.20240354
    [2] 江转转, 陈红, 鲍红艳, 代雨童.  狼尾草属叶绿体基因组特征与分子标记开发 . 浙江农林大学学报, 2025, 42(2): 365-372. doi: 10.11833/j.issn.2095-0756.20240371
    [3] 朱梦飞, 胡迎峰, 师雪芹.  濒危植物新绒苔叶绿体基因组特征及系统发育位置分析 . 浙江农林大学学报, 2025, 42(1): 55-63. doi: 10.11833/j.issn.2095-0756.20240356
    [4] 李妍, 舒金平, 华克达, 张亚波, 应玥, 张威.  暗影饰皮夜蛾线粒体基因组全序列测定与分析 . 浙江农林大学学报, 2024, 41(4): 724-734. doi: 10.11833/j.issn.2095-0756.20240138
    [5] 刘萱, 邹龙海, 周明兵.  黄槽毛竹叶绿体基因组及毛竹种下分类群的叶绿体基因组序列比较 . 浙江农林大学学报, 2024, 41(5): 1037-1046. doi: 10.11833/j.issn.2095-0756.20240110
    [6] 段春燕, 王晓凌.  重瓣榆叶梅全叶绿体基因组遗传特征分析 . 浙江农林大学学报, 2024, 41(3): 577-585. doi: 10.11833/j.issn.2095-0756.20230489
    [7] 吴民华, 叶晓霞, 谭靖怡, 梁秋婷, 吴子健, 黄琼林.  了哥王叶绿体基因组分析 . 浙江农林大学学报, 2024, 41(2): 297-305. doi: 10.11833/j.issn.2095-0756.20230412
    [8] 洪森荣, 张牧彤, 徐子林, 张钦荣, 罗雨欣, 田文慧, 王心雨.  ‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析 . 浙江农林大学学报, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
    [9] 王杰, 贺文闯, 向坤莉, 武志强, 顾翠花.  基因组时代的植物系统发育研究进展 . 浙江农林大学学报, 2023, 40(1): 227-236. doi: 10.11833/j.issn.2095-0756.20220313
    [10] 周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南.  荆芥HD-Zip基因家族的全基因组鉴定及分析 . 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
    [11] 刘俊, 李龙, 陈玉龙, 刘燕, 吴耀松, 任闪闪.  杜仲CONSTANS-like全基因组鉴定、系统进化及表达模式分析 . 浙江农林大学学报, 2022, 39(3): 475-485. doi: 10.11833/j.issn.2095-0756.20210385
    [12] 阮诗雨, 张智俊, 陈家璐, 马瑞芳, 朱丰晓, 刘笑雨.  毛竹GRF基因家族全基因组鉴定与表达分析 . 浙江农林大学学报, 2021, 38(4): 792-801. doi: 10.11833/j.issn.2095-0756.20200544
    [13] 陈蓉芬, 黄坚钦, 陈荣, 徐川梅.  流式细胞术在测定竹类植物基因组大小中的应用 . 浙江农林大学学报, 2021, 38(1): 103-111. doi: 10.11833/j.issn.2095-0756.20200212
    [14] 郑钢, 顾翠花, 林琳, 王杰.  20种千屈菜科植物rbcL基因密码子使用偏好性分析 . 浙江农林大学学报, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
    [15] 金京, 谢榕, 李霞, 周柳江, 杜永斌, 顾宇彤, 樊建庭.  3种不同寄主植物对黄脊竹蝗取食偏好性和生长发育的影响 . 浙江农林大学学报, 2020, 37(6): 1143-1148. doi: 10.11833/j.issn.2095-0756.20190723
    [16] 李思巧, 韦伊, 刘洪妤, 张志东, 张野, 王丽华, 刘玉林.  花椒cpSSR标记开发及在种间、种内的通用性分析 . 浙江农林大学学报, 2019, 36(6): 1241-1246. doi: 10.11833/j.issn.2095-0756.2019.06.023
    [17] 黄笑宇, 许在恩, 郭小勤.  基于全基因组的毛竹同义密码子使用偏好性分析 . 浙江农林大学学报, 2017, 34(1): 120-128. doi: 10.11833/j.issn.2095-0756.2017.01.017
    [18] 杜海慧, 孙芳利, 蒋身学.  慈竹重组材防霉性能的研究 . 浙江农林大学学报, 2013, 30(1): 95-99. doi: 10.11833/j.issn.2095-0756.2013.01.014
    [19] 谢一青, 李志真, 黄儒珠, 肖祥希, 王志洁.  光皮桦基因组DNA 提取方法比较 . 浙江农林大学学报, 2006, 23(6): 664-668.
    [20] 吴炳生, 夏玉芳, 傅懋毅, 张家贤, 周伟.  料慈竹化学成分的研究 . 浙江农林大学学报, 1995, 12(3): 281-285.
  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20230498

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2024/4/696

图(5) / 表(5)
计量
  • 文章访问数:  422
  • HTML全文浏览量:  77
  • PDF下载量:  23
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-10-08
  • 修回日期:  2024-03-06
  • 录用日期:  2024-03-11
  • 网络出版日期:  2024-07-12
  • 刊出日期:  2024-07-12

梁山慈竹叶绿体基因组密码子偏好性分析

doi: 10.11833/j.issn.2095-0756.20230498
    基金项目:  贵州省林业局资助项目(黔林科合〔2019〕06号);国家自然科学基金资助项目(31860178)
    作者简介:

    魏亚楠(ORCID: 0009-0001-4831-8988),从事资源微生物研究。E-mail: weiynkfc@163.com

    通信作者: 龚明贵(ORCID: 0000-0001-6863-5115),副教授,博士,从事资源微生物研究。E-mail: gongminggui@163.com。姜霞(ORCID: 0009-0006-0720-4622),副研究员,从事森林生态学研究。E-mail: 43644135@qq.com
  • 中图分类号: S795.5;S722

摘要:   目的  探究梁山慈竹Dendrocalamus farinosus叶绿体基因组密码子偏好性使用形式,分析影响梁山慈竹密码子使用偏好性的主要原因,并确定最优密码子,为竹亚科 Bambusoideae植物叶绿体基因组学研究提供参考依据。  方法  根据GenBank登录号MZ681865.156从美国国家生物技术信息中心(NCBI)数据库中下载85条梁山慈竹叶绿体基因序列,利用CodonW、CUSP及R语言软件分析有效密码子数(ENC)、适应指数(CAI)和同义密码子相对使用度(RSCU)等指标,对RSCU进行对应性分析,并根据ENC和RSCU对密码子进行排序。  结果  梁山慈竹叶绿体基因组密码子的鸟嘌呤(G)和胞嘧啶(C)所占的比率(GC比率)平均为39.48%,且GC1(47.69%)>GC2(39.70%)>GC3(31.05%),密码子末位碱基偏好以A/U结尾;ENC多数在35以上,CAI为16.6%,其密码子偏好性较弱;中性绘图分析、ENC-plot分析和PR2-plot分析表明:影响梁山慈竹叶绿体基因组密码子偏好性的主要原因是自然选择。共有GCA、GCU、UUC及GGU等18个密码子被鉴定为梁山慈竹叶绿体基因组的最优密码子。  结论  自然选择是梁山慈竹叶绿体基因组密码子偏好性的主要因素,并筛选出梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子。图5表5参30

English Abstract

王安妮, 王开良, 柴静瑜, 等. 普通油茶全双列杂交子代种仁含油率及其相关性状的遗传分析[J]. 浙江农林大学学报, 2024, 41(6): 1170-1179. DOI: 10.11833/j.issn.2095-0756.20230603
引用本文: 魏亚楠, 龚明贵, 白娜, 等. 梁山慈竹叶绿体基因组密码子偏好性分析[J]. 浙江农林大学学报, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
WANG Anni, WANG Kailiang, CHAI Jingyu, et al. Genetic analysis of kernel oil content and related traits in complete diallel progenies of Camellia oleifera[J]. Journal of Zhejiang A&F University, 2024, 41(6): 1170-1179. DOI: 10.11833/j.issn.2095-0756.20230603
Citation: WEI Ya’nan, GONG Minggui, BAI Na, et al. Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus[J]. Journal of Zhejiang A&F University, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
  • 密码子是识别和传递生物体遗传信息、联系蛋白质与DNA之间的重要桥梁,在生物体遗传和变异中起着至关重要的作用[1]。编码同一氨基酸的不同密码子被称为同义密码子。由于基因突变和自然选择的影响,某些同义密码子在蛋白质翻译过程中往往被高频使用,被称为密码子的使用偏好性[23]。物种的生物学功能与密码子偏好性密切相关,密码子偏好性不仅可以影响生物编码基因的蛋白质合成速率和翻译速率[4],还会影响蛋白质结构、折叠程度和mRNA的合成[5]。研究表明:同一物种或亲缘关系相近的物种,具有相似的密码子偏好使用模式[6],通过分析物种的密码子偏好性可以衡量物种之间的基因表达量,进而探究物种之间亲属关系[7]。通过密码子偏好性的研究,能够更好地阐明物种进化过程中基因的表达规律[8],为利用基因工程技术改良物种目标基因提供参考依据[9]

    梁山慈竹Dendrocalamus farinosus属竹亚科Bambusoideae牡竹属Dendrocalamus,又名大叶竹和瓦灰竹,是中国西南地区重要的经济竹种[10],生长速度快,适应性强,竹笋效益高,属于优良的笋竹两用竹种,与硬头黄竹Bambusa rigida都属于竹编和制浆造纸的优质原料[11]。针对梁山慈竹叶绿体基因组密码子使用偏好性的研究鲜见报道。为了更好地挖掘和利用梁山慈竹的潜在经济价值,本研究以梁山慈竹叶绿体基因组序列为研究对象,分析其密码子偏好性使用模式,探究并总结其相关表达基因的密码子偏好性,以期分析影响梁山慈竹叶绿体基因组密码子偏好性的主要因素,并筛选出最优密码子,为后续梁山慈竹叶绿体基因工程改造等研究提供理论基础。

    • 根据GenBank登录号MZ681865.156在美国国家生物技术信息中心(NCBI)数据库中搜索并下载梁山慈竹叶绿体基因组序列,共有85条编码序列(CDS)。序列重复或小于300 bp会对密码子偏好性指标的测定产生影响[12]。对基因序列进行筛选,剔除序列长度小于300 bp且重复的序列,获取起始密码子为ATG,终止密码子为TAG、TGA和TAA的序列,最终获得51条CDS序列作为后续分析的样本序列。

    • 运用CodonW1.4.2 (http://sourceforge.net/projects/codonw)和EMBOSS (http://imed.med.ucm.es/EMBOSS/)计算有效密码子数(ENC)、适应指数(CAI)、密码子偏性指数(CBI)、最优密码子频率(FOP)以及密码子第3位核苷酸A、T、C、G的含量(分别记为A3、T3、C3、G3)。利用ENC判断密码子偏好性程度,ENC>35说明密码子偏好性比较弱;反之,说明偏好性强[13]。通过CUSP软件分析并获得密码子鸟嘌呤(G)和胞嘧啶(C)所占的比率(GC比率)及GC平均比率(GCall),使用SPSS 25.0软件对梁山慈竹密码子各位置的GC比率与ENC进行相关分析。

    • 运用CodonW 1.4.2对同义密码子相对使用度(RSCU)进行分析,即该密码子的实际使用频率与其理论使用频率的比值[14]。当RSCU大于1时,同义密码子中偏好使用该密码子,被称为高频密码子;当RSCU等于1时,密码子无偏好性;当RSCU小于1时,密码子使用偏好性较弱[15]

    • 中性绘图分析是对影响密码子使用偏好性的关键因素进行分析,X轴为GC3,Y轴为GC1和GC2的平均值,绘制二维散点图对GC3和GC12 (各基因 GC1和GC2的平均值)的相关性进行分析(GC1、GC2、GC3分别代表第1、2、3位密码子的GC比例)。若回归系数接近1,代表GC3和GC12显著相关,碱基组成没有差异,说明突变是决定密码子偏好性的主要因素;若回归系数接近0,则代表自然选择是主要因素。

    • ENC-plot绘图分析表现密码子的使用偏好性受到突变和自然选择的影响程度。使用Python 3.7进行ENC-plot绘图分析,构建散点图,横纵坐标分别为GC3、ENC,并绘制ENC的标准曲线。基因位点靠近或在标准曲线上,表明突变是决定密码子偏好性的主要因素,若基因位点和标准曲线距离很大,则说明偏好性主要由自然选择决定。

    • PR2-plot分析表明基因中密码子的第3位碱基的构成情况。计算密码子碱基中第3位上4种碱基A、T、C、G比例,G3/(G3+C3)为X轴,A3/(A3+T3)为Y轴,绘制PR2-plot散点图,中心点为碱基比例A=T、C=G时的值,代表处于此区域的密码子并无使用偏好性[16]

    • 将51条基因升序排列后的ENC前后两端10%的基因建立高、低表达基因库。通过CodonW软件计算2个表达库中密码子的RSCU和ΔRSCU,同时满足高频密码子(RSCU>1)和高表达密码子(ΔRSCU≥0.08)的为最优密码子[17]

    • 在Codon Usage Database (http://www.kazusa.or.jp/codon/)下载异源表达宿主和植物代表类群,包括巨龙竹D. farinosus、粉麻竹D. sinicus、小叶龙竹D. pulverulentus、硬头黄竹、大肠埃希菌Escherichia coli、烟草Nicotiana tabacum、拟南芥Arabidopsis thaliana和酿酒酵母Saccharomyces cerevisiae等物种基因组密码子的使用频率,与梁山慈竹基因组密码子使用频率比值进行比较分析,当梁山慈竹密码子使用频率比其他生物的比值≥2.0或≤0.5时,说明该物种与梁山慈竹的同义密码子的使用偏好性差异较大,当比值不在上述范围内时,表明这2个物种对该密码子的偏好性较接近。

    • 将叶绿体基因如表1所示进行功能分类,使用CodinW软件,选择对应分析计算样本中各个基因的RSCU,将分析结果分布在59维向量空间中,分析指标间的对应性。

      表 1  梁山慈竹叶绿体基因结构分析

      Table 1.  Structural analysis of the choroplast genome of D. farinosus

      基因分类基因分组基因名称
      光合系统基因光系统Ⅰ基因psaApsaBpsbApsbCpsbDpsbB
      光系统Ⅱ基因petApetBpetD
      细胞色素b/f复合体基因atpAatpBatpEatpFatpI
      三磷酸腺苷合成酶基因ndhAndhBndhCndhDndhEndhFndhGndhHndhIndhJndhK
      遗传系统基因烟酰胺腺票吟二核甘酸氧化还原酶基因rbcL
      二磷酸核酮糖羧化酶大亚基基因rpoArpoBrpoC1、rpoC2
      RNA聚合酶亚基基因rps2、rps3、rps4、rps7、rps8、rps11、rps12、rps14、rps18
      核糖体蛋白小亚基基因rpl2、rpl14、rpl16、rpl20、rpl22
      其他基因成熟酶K基因matK
      膜蛋白基因cemA
      细胞色素合成基因ccsA
      酪蛋白分解蛋白酶基因clpP
      未知功能基因假定叶绿体阅读框ycf2、ycf3、infA
    • 分析梁山慈竹叶绿体基因组CDS序列的碱基组成:梁山慈竹的4种碱基所对应的同义密码子的第3位碱基比例 (T3s、A3s、C3s、G3s)分别为45.28%、42.07%、18.13%、17.96%,T3s和A3s远高于G3s和C3s,表明梁山慈竹叶绿体基因组密码子的第3位碱基以A/U结尾为主。梁山慈竹的ENC为50.40,CAI为16.6%,第3位同义密码子的GC比率 (GC3S)为28.1%,表明其叶绿体基因组密码子偏好性较弱。

      梁山慈竹叶绿体基因组密码子的GC平均比率为39.48%,且GC1 (47.69%)>GC2 (39.70%)>GC3 (31.05%)。ENC为 39.04~61.00,均值为49.51,GC比率在基因密码子上并没有均匀分布(表2)。ENC和密码子3个位置GC比率的相关分析(表3)结果发现:ENC与GC3比率显著相关,与GC1、GC2不显著相关,说明密码子使用偏好性形成过程中GC3的影响作用大于GC1、GC2。

      表 2  梁山慈竹叶绿体基因组各基因密码子相关参数统计

      Table 2.  Statistics of codon related parameters of various genes in the chloroplast genome of D. farinosus

      基因GC比率/%ENCCAIFOP基因GC比率/%ENCCAIFOP
      GCGC1GC2GC3GCGC1GC2GC3
      rps1241.8752.0047.2026.4044.850.1400.341rps1833.5334.5039.7726.3239.040.1470.333
      psbA42.5649.7242.9435.0341.330.3130.532rpl2036.1138.3340.8329.1750.970.1120.298
      matK34.4440.8232.4230.0849.490.1660.329clpP43.0152.5338.2538.2552.370.1750.337
      psbD44.4453.3943.5036.4448.990.2420.456psbB44.0154.4245.9731.6350.730.1900.380
      psbC44.6653.5944.7335.6348.910.1830.386petB41.0648.9341.2033.0547.310.1910.333
      rpoB39.1949.8138.0129.7449.690.1530.353petD40.3750.9339.1331.0649.460.1610.305
      rpoC139.8749.9338.0731.6352.770.1560.347rpoA37.0646.1835.5929.4149.940.1510.311
      rpoC238.9549.0136.6431.1852.290.1540.333rps1143.5250.6956.2523.6144.330.1740.396
      rps238.4040.5140.9333.7652.550.1680.338infA40.3543.8635.9641.2361.000.1810.409
      atpI38.8447.5836.2932.6650.550.1630.353rps836.5041.6141.6126.2846.620.1220.374
      atpF38.2747.6235.4531.7553.170.1470.353rpl1438.7154.8437.1024.1951.900.1810.392
      atpA42.0656.0139.9630.1249.960.1820.385rpl1644.7652.1453.5728.5739.410.1150.354
      rps1439.4239.4246.1532.6941.730.1350.384rps333.4743.7531.6725.0048.030.1930.402
      psaB41.8148.7143.1333.6149.340.1720.350rpl2237.5641.3336.6734.6747.480.1880.415
      psaA43.6851.8043.2835.9552.070.1980.373rpl244.5651.7748.5833.3353.330.1430.361
      ycf339.6947.4038.1533.5355.450.1560.343ndhB38.1642.0739.3333.0746.710.1560.348
      rps437.1347.5237.1326.7349.590.1690.386rps739.4949.6845.2223.5748.310.1640.373
      ndhJ39.3849.3836.8831.8851.480.1760.356ndhF34.1937.8438.9225.8146.190.1440.321
      ndhK38.6041.7043.7230.3651.910.1590.329ccsA33.6433.7441.1026.0745.600.1520.307
      ndhC39.6750.4136.3632.3348.750.1770.345ndhD36.1940.7236.9330.9448.980.1330.314
      atpE42.5152.1739.1336.2359.510.1670.405ndhE33.3341.1832.3526.4759.060.1440.316
      atpB42.6253.9141.6832.2647.430.1920.381ndhG34.4644.0732.7726.5545.770.1250.250
      rbcL44.1457.1143.9331.3850.190.2710.454ndhI34.9937.5738.6728.7352.090.1710.345
      ycf441.2248.3939.7835.4847.140.1620.385ndhA33.9842.4236.3623.1444.350.1400.321
      cemA33.6241.9927.7131.1755.910.1760.342ndhH37.8250.7634.7727.9249.950.1550.322
      petA40.2953.5835.232.0951.120.1550.331

      表 3  梁山慈竹叶绿体基因组中各基因参数的相关性分析

      Table 3.  Correlation analysis of various gene parameters in the chloroplast genome of D. farinosus

      参数GC1GC2GC3ENCCAICBIFOPGC3sGC
      GC11
      GC20.300*1
      GC30.265−0.0091
      ENC0.142−0.425**0.389**1
      CAI0.409**0.0760.370**0.0121
      CBI0.438**0.2720.322*−0.0920.774**1
      FOP0.402**0.312*0.341*−0.0640.797**0.965**1
      GC3s0.271−0.0290.946**0.445**0.330*0.330*0.370**1
      GC0.814**0.673**0.525**0.0100.407**0.512**0.518**0.499**1
        说明: *表示显著相关 (P<0.05);**表示极显著相关 (P<0.01)。
    • 梁山慈竹叶绿体基因组中共包含18110个密码子(表4),总计编码20个氨基酸,密码子数为12~705个,其中密码子UGA共有12个,密码子含量最多的是编码谷氨酸的GAA,共有705个。梁山慈竹叶绿体基因组蛋白编码序列RSCU分析表明:氨基酸含量较高的有亮氨酸(Leu)和精氨酸(Arg),均为6个密码子编码,编码精氨酸的是UUA、UUG、CUU、CUC、CUA和CUG;编码亮氨酸的有AGA、AGG、CGU、CGC、CGA和CGG;除此之外,蛋氨酸(Met)和色氨酸(Trp)均只有1个密码子编码,分别是AUG和UGG,其余氨基酸密码子编码个数分别为2~4个。

      表 4  梁山慈竹叶绿体基因组蛋白编码序列RSCU分析

      Table 4.  RSCU of protein coding region in the chloroplast of D. farinosus

      氨基酸
      密码子数量RSCU氨基酸密码子数量RSCU氨基酸
      密码子数量RSCU氨基酸密码子数量RSCU
      PheUUU*6441.29TyrUAU*5321.59SerUCU*3431.58CysUGU*1511.53
      PheUUC3510.71TyrUAC1370.41SerUCC*2601.19CysUGC470.47
      LeuUUA*6341.94TERUAA*281.56SerUCA*2221.02ArgAGA*3221.75
      LeuUUG*3621.11TERUAG140.78SerUCG1190.55ArgAGG1190.64
      LeuCUU*4201.29TERUGA120.67SerAGU*2731.25ArgCGU*2611.41
      LeuCUC1380.42TrpUGG*3281.00SerAGC890.41ArgCGC950.51
      LeuCUA2950.90GlnCAA*4771.53ThrACU*4031.68ArgCGA*2341.27
      LeuCUG1070.33GlnCAG1480.47ThrACC1810.75ArgCGG760.41
      IleAUU*7401.48GluGAA*7051.46ThrACA*2591.08GlyGGU*4211.24
      IleAUC2950.59GluGAG2630.54ThrACG1160.48GlyGGC1450.43
      IleAUA4610.92LysAAA*6471.44AlaGCU*4931.73GlyGGA*5381.58
      MetAUG*4161.00LysAAG2530.56AlaGCC1720.60GlyGGG2590.76
      ValGUU*3821.47AspGAU*5221.54AlaGCA*3431.20ProCCU*2861.48
      ValGUC1260.49AspGAC1550.46AlaGCG1350.47ProCCC*1961.01
      ValGUA*3901.50HisCAU*3111.47AsnAAU*5281.48ProCCA*2091.08
      ValGUG1390.54HisCAC1120.53AsnAAC1870.52ProCCG840.43
        说明:*表示RSCU大于1的高频密码子。

      梁山慈竹叶绿体基因组RSCU大于1的密码子数目为34个(分别为UUU、UUA、UUG、CUU、AUU、AUG、GUU、GUA、UCU、UCC、UCA、AGU、ACU、ACA、GCU、GCA、AAU、UAU、UAA、UGG、CAA、GAA、AAA、GAU、CAU、UGU、AGA、CGU、CGA、GGU、GGA、CCU、CCC和CCA),即筛选出了34个高频密码子,其中以A、U、C、G结尾的密码子分别有13、16、2和1个,这说明密码子偏好以A和U结尾,RSCU较高的3个密码子分别为UUU (1.94)、CUA (1.73)和UCU (1.75)。

    • 中性绘图分析量化自然选择和突变压力之间的关系,阐明3个密码子位置之间的联系。结果表明:横坐标GC3的数值为23.14%~41.23%,纵坐标GC12的数值为39.04%~61.00% (图1)。梁山慈竹的Pearson相关系数为0.17,呈正相关关系,数据拟合后的回归系数为0.1868,决定系数(R2)较小,为0.0282,GC12和GC3的相关性不显著,说明其叶绿体基因组密码子偏好性受自然选择影响较大。

      图  1  中性绘图分析

      Figure 1.  Analysis of neutrality plot

    • 图2显示:ENC分布并不紧密,少量分布在标准曲线附近,还有个别分布在标准曲线上侧,位点的ENC均大于35,与预期ENC值有差距。说明梁山慈竹密码子偏好性较弱且自然选择和突变都对其偏好性有影响。由于落在标准曲线下方的基因点数量比较多,所以梁山慈竹基因组密码子使用偏好性主要受自然选择的影响。

      图  2  ENC-plot分析

      Figure 2.  Analysis of ENC-plot

    • 图3显示:基因位点在平面图4个区域内分布并不均匀,在A3/(A3+T3)<0.5和G3/(G3+C3)>0.5区域范围内分布最多。表明第3位碱基使用频率为:T>A、G>C,梁山慈竹叶绿体基因组密码子的第3位碱基在选择上具有偏好性,同时说明其密码子使用偏好性主要受自然选择的影响。

      图  3  PR2-plot分析

      Figure 3.  Analysis of PR2-plot

    • 对梁山慈竹的ENC进行升序排列,前10%为高表达基因,即rps18、rpl16、psbA、rps14、rps11,后10%为低表达基因,即 ycf3、cemA、ndhE、atpE、infA。梁山慈竹的RSCU和ΔRSCU表明(表5):梁山慈竹叶绿体基因组有32个高频密码子,筛选出GCA、GCU等25个高表达密码子,最终确定18个密码子作为梁山慈竹叶绿体基因组的最优密码子,分别为UAA、GCA、GCU、UUC、GGU、AAA、CUU、UUA、CCA、CCU、CAA、AGA、CGU、AGU、UCC、ACU、GUA、GUU。其中16个以A/U结尾,2个以C结尾。

      表 5  梁山慈竹叶绿体基因组各氨基酸的RSCU分析及最优密码子分析

      Table 5.  RSCU analysis and optimal codon analysis of amino acids in chloroplast genome of D. farinosus

      氨基酸密码子基因组
      RSCU
      高表达
      RSCU
      低表达
      RSCU
      ΔRSCU氨基酸密码子基因组
      RSCU
      高表达
      RSCU
      低表达
      RSCU
      ΔRSCU
      TerUAA***1.560 01.800 01.200 00.600 0MetAUG1.000 01.000 01.000 00
      UAG0.780 00.600 01.200 0−0.600 0AsnAAC*0.520 00.893 60.625 00.268 6
      UGA0.670 00.600 00.600 00AAU1.480 01.106 41.375 0−0.268 6
      AlaGCA**1.200 01.200 00.734 70.465 3ProCCA**1.080 00.800 00.500 00.300 0
      GCC0.600 00.457 10.653 1−0.196 0CCC1.010 00.800 01.166 7−0.366 7
      GCG0.470 00.228 60.734 7−0.506 1CCG0.430 00.444 41.000 0−0.555 6
      GCU*1.730 02.114 31.877 60.236 7CCU***1.480 01.955 61.333 30.622 3
      CysUGC**0.470 00.400 000.400 0GlnCAA*1.530 01.500 01.368 40.131 6
      UGU1.530 01.600 02.000 0−0.400 0CAG0.470 00.500 00.631 6−0.131 6
      AspGAC*0.460 00.500 00.411 80.088 2ArgAGA*1.750 01.723 41.534 90.188 5
      GAU1.540 01.500 01.588 2-0.088 2AGG0.640 00.319 10.837 2−0.518 1
      GluGAA1.460 01.189 21.578 9−0.389 7CGA1.270 01.276 61.395 3−0.118 7
      GAG**0.540 00.810 80.421 10.389 7CGC0.510 00.319 10.837 2−0.518 1
      PheUUC**1.290 01.041 70.650 00.391 7CGG0.410 00.319 10.279 10.040 0
      UUU0.710 00.958 31.350 0−0.391 7CGU***1.410 02.042 61.116 30.926 3
      GlyGGA1.580 01.253 71.818 2−0.564 5SerAGC0.410 00.384 60.470 6−0.086 0
      GGC0.430 00.417 90.484 8−0.066 9AGU**1.250 01.846 21.411 80.434 4
      GGG0.760 00.119 40.363 6−0.244 2UCA1.020 00.615 41.058 8−0.443 4
      GGU***1.240 02.209 01.333 30.875 7UCC***1.190 01.769 20.941 20.828 0
      HisCAC**0.530 00.941 20.571 40.369 8UCG0.550 00.153 80.705 9−0.552 1
      CAU1.470 01.058 81.428 6−0.369 8UCU1.580 01.230 81.411 8−0.181 0
      Ile AUA0.920 00.850 70.949 4−0.098 7ThrACA1.080 01.181 81.176 50.005 3
      AUC*0.590 00.626 90.531 60.095 3ACC0.500 00.818 21.058 8−0.240 6
      AUU1.480 01.522 41.519 00.003 4ACG0.480 00.363 60.588 2−0.224 6
      LysAAA**1.440 01.471 71.155 60.316 1ACU**1.680 01.636 41.176 50.459 9
      AAG0.560 00.528 30.844 4−0.316 1ValGUA***1.500 01.767 41.257 10.510 3
      LeuCUA0.900 00.833 31.295 5−0.462 2GUC0.490 001.028 6−1.028 6
      CUC0.420 000.545 5−0.545 5GUG0.540 00.372 10.342 90.029 2
      CUG0.330 00.250 00.477 3−0.227 3GUU**1.470 01.860 51.371 40.489 1
      CUU*1.290 01.333 31.227 30.106 0TrpUGG1.000 01.000 01.000 00
      UUA***1.940 02.166 71.022 71.144 0TyrUAC**0.410 00.521 70.166 70.355 0
      UUG1.110 01.416 71.431 8−0.015 1UAU1.590 01.478 31.833 3−0.355 0
        说明: 高频密码子(RSCU>1.00)带下划线;*. ΔRSCU≥0.08;**. ΔRSCU≥0.3;***. ΔRSCU≥0.5; 加粗的密码子表示最优密码子。
    • 将梁山慈竹基因组密码子使用频率与巨龙竹、粉麻竹、小叶龙竹、硬头黄竹、大肠埃希菌、烟草、拟南芥和酿酒酵母等物种的基因组密码子使用频率进行比较(图4)。结果显示:梁山慈竹与巨龙竹、粉麻竹、小叶龙竹和硬头黄竹的密码子使用频率为0.5~2.0,说明它们的密码子使用偏好性相似,推测具有亲缘关系的禾本科Gramineae牡竹属植物叶绿体基因组密码子偏好性相似;在大肠埃希菌、烟草、拟南芥和酿酒酵母的密码子使用比值中筛选≥2.0或≤0.5的密码子,分别有28和15、15、14个,表明梁山慈竹与这些物种在同义密码子的偏好性上有一定差异。

      图  4  梁山慈竹与其他物种密码子偏好性比较

      Figure 4.  Comparison of codon preference between D. farinosus and other species

    • 将梁山慈竹的51个叶绿体基因的基因功能分为光合系统基因、遗传系统基因、其他基因和未知功能基因四大类,在计算RSCU的基础上将各个基因分布到59维的向量空间。对应分析结果(图5)显示:前4个向量轴分别存在18.3%、16.8%、15.6%和15.4%的差异,前4向量轴累计差异为66.1%,4个轴对密码子均有不同程度的影响;第1轴的值大于其他轴,说明第1轴对梁山慈竹叶绿体基因组密码子偏好性的影响较大。对第1轴与CAI、CBI、FOP、ENC和GC3s等指数进行进一步的相关分析发现:梁山慈竹基因在第1轴上的坐标值与CAI (r=−0.001 7,P<0.01)、CBI (r=0.099 0,P<0.01)、FOP (r=0.083 0,P<0.01)、ENC (r=0.112 0,P<0.01)、GC3s (r=−0.145 0,P<0.01)间具有极显著的相关关系,其中CAI和GC3s第1轴具有负相关关系,表明基因组密码子的偏好性不止受单一因素的影响,自然选择、基因突变均有可能影响梁山慈竹基因组密码子使用偏好性[18]

      图  5  梁山慈竹基因组密码子RSCU的对应性分析

      Figure 5.  Correspondence Analysis on RSCU of D. farinosus

    • 本研究对梁山慈竹叶绿体基因组密码子进行使用偏好性分析,筛选出51条CDS序列,分析表明:GC1>GC2>GC3,密码子在3个位置上的分布并不均匀,密码子偏好使用以A或U结尾的碱基,且梁山慈竹叶绿体基因组的ENC均值为49.51,表明其叶绿体基因组密码子使用偏好性较弱。这与乳油木Vitellaria paradoxa[19]和二乔玉兰Magnolia soulangeana[20]等植物叶绿体基因组密码子偏好性相似。

      对梁山慈竹叶绿体基因组密码子进行中性绘图、ENC-plot分析、PR2-plot分析和对应分析。在中性绘图分析中,回归系数为0.412 8,说明密码子偏好性更多受到自然选择的影响;在ENC-plot分析中,多数基因离标准曲线距离较远,实际ENC和预期ENC有差距,表明该部分基因的密码子偏好性主要受自然选择的影响;在PR2-plot绘图分析中,大部分基因位于平面图的右下方,即T>A、G>C,表明其密码子的使用更多受自然选择的影响。综上所述,影响梁山慈竹叶绿体基因组密码子偏好性的主要原因是自然选择。该研究结果与巨桉Eucalyptus grandi[21]、灰毛浆果楝Cipadessa cinerascens、酸枣Ziziphus jujuba var. spinosa[22]和云南油杉Keteleeria evelyniana[23]等叶绿体基因组密码子偏好性研究结果基本一致;但在对4种蔷薇科 Rosaceae果树[24]和银白杨Populus alba[25]的研究中发现:突变是影响密码子偏好性的主要因素。这说明密码子的使用偏好性受自然选择或基因突变因素影响。基于RSCU的对应分析表明:梁山慈竹的密码子使用变异原因除了突变和自然选择之外,还有其他的因素,这其中光合系统基因和遗传系统基因分布相对集中,各类基因密码子使用偏好性较为接近。该结论与木薯Manihot esculenta[26]和高山松Pinus densata[27]的研究结果一致。密码子使用频率比较结果显示:梁山慈竹与禾本科牡竹属的植物密码子偏好性相似,在基因选择外源系统表达时,可以选择密码子偏好性差异相对较小的酿酒酵母,在选择大肠埃希菌、烟草和拟南芥作为外源表达宿主时,需要根据密码子使用偏好性进行碱基优化,从而使基因在宿主体内更好地表达。

      最优密码子分析表明:梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子,最优密码子大部分以A或U结尾。该结果与抽筒竹Gelidocalamus tessellatus[28]和毛竹Phyllostachys edulis[29]叶绿体基因组最优密码子分析结果一致,这可能与亲缘关系相近,但不同物种之间叶绿体基因组进化过程中的相对保守性有关系[21]。通过筛选获取梁山慈竹偏好使用密码子,可进一步对目标基因进行密码子优化,提高梁山慈竹的竹笋产量和造纸纤维含量,以及利用新一代精准基因编辑工具CRISPR/Cas9优化梁山慈竹密码子,从而改造梁山慈竹基因组编辑的Cas9基因,提高该基因在梁山慈竹中的表达水平[30]

    • 本研究通过分析梁山慈竹叶绿体基因组的CDS序列,对梁山慈竹的叶绿体基因组进行生物信息学分析,筛选出梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子。研究结果表明:影响梁山慈竹密码子偏好性的主要因素是自然选择。研究结果为后续在分子层面上利用基因工程开发梁山慈竹优良资源提供参考。

参考文献 (30)

目录

/

返回文章
返回