留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

20种千屈菜科植物rbcL基因密码子使用偏好性分析

郑钢 顾翠花 林琳 王杰

郑钢, 顾翠花, 林琳, 王杰. 20种千屈菜科植物rbcL基因密码子使用偏好性分析[J]. 浙江农林大学学报, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
引用本文: 郑钢, 顾翠花, 林琳, 王杰. 20种千屈菜科植物rbcL基因密码子使用偏好性分析[J]. 浙江农林大学学报, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
ZHENG Gang, GU Cuihua, LIN Lin, WANG Jie. Codon usage bias analysis of rbcL genes of 20 Lythraceae species[J]. Journal of Zhejiang A&F University, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
Citation: ZHENG Gang, GU Cuihua, LIN Lin, WANG Jie. Codon usage bias analysis of rbcL genes of 20 Lythraceae species[J]. Journal of Zhejiang A&F University, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390

20种千屈菜科植物rbcL基因密码子使用偏好性分析

doi: 10.11833/j.issn.2095-0756.20200390
基金项目: 浙江省自然科学基金资助项目(LY21C160001)
详细信息
    作者简介: 郑钢(ORCID: 0000-0001-5666-4832),实验师,从事园林植物遗传育种研究。E-mail: 305788868@qq.com
    通信作者: 王杰(ORCID: 0000-0003-0038-1045),从事园林植物遗传育种与种质资源创新研究。E-mail: wangjie@stu.zafu.edu.cn
  • 中图分类号: S718.3

Codon usage bias analysis of rbcL genes of 20 Lythraceae species

  • 摘要:   目的  分析千屈菜科Lythraceae植物rbcL基因密码子使用特性,明确密码子偏好性的影响因素,筛选rbcL基因异源表达和遗传转化的合适受体。  方法  从美国国家生物技术信息中心(NCBI)获取20种千屈菜科植物的rbcL基因全长编码区序列(CDS)数据,运用CodonW、EMBOSS和DAMBE软件获取基因碱基组成和密码子使用偏好性的相关参数,分析该类植物叶绿体rbcL基因使用密码子的偏倚性及其影响因素。  结果  千屈菜科植物rbcL基因GC含量(GC)为0.425~0.437,密码子第3位碱基GC含量(GC3s)为0.275~0.300。GC3s、GC与有效密码子数(ENC)显著相关(P<0.01);ENC-GC3s散点图分析、中性绘图分析、奇偶偏差分析均表明:相较于突变压力,自然选择压力对千屈菜科植物rbcL基因密码子使用偏好性的影响更大。基于同义密码子相对使用度的系统聚类与CDS邻接树结果部分一致。与千屈菜科rbcL基因密码子平均使用频率相比,大肠埃希菌Escherichia coli、酵母Saccharomyces cerevisiae、拟南芥Arabidopsis thaliana、烟草Nicotiana tabacum和番茄Solanum lycopersicum分别存在28、26、20、19和17个使用频率相差较大的密码子。  结论  千屈菜科植物rbcL基因碱基组成上更倾向于选择A/T碱基,且偏好使用末端A/T碱基的密码子;rbcL基因密码子使用偏好性受多种因素共同作用,但自然选择压力是最主要因素;密码子偏好性的系统聚类可为系统发育研究提供补充;酵母更适合作为千屈菜科植物rbcL基因异源表达受体,番茄更适合作为rbcL基因遗传转化和功能研究的受体材料。图6表3参32
  • 图  1  20种千屈菜科植物rbcL基因同义密码子相对使用度

    Figure  1  RSCU of rbcL genes from 20 Lythraceae species

    图  2  rbcL基因ENC-GC3s绘图分析

    Figure  2  ENC-GC3s plot analysis of rbcL genes

    图  3  GC3s与GC12的中性绘图

    Figure  3  Neutral plot of GC3s and GC12

    图  4  rbcL基因密码子第3位点碱基奇偶偏好

    Figure  4  PR2 plot of the 3rd sites in codons of rbcL genes

    图  5  基于rbcL基因CDS的邻接树(左)和基于59个密码子RSCU的聚类树状图(右)

    Figure  5  NJ tree based on CDS of rbcL genes (left) and cluster dendrogram based on RSCU of 59 codons (right)

    图  6  千屈菜科植物与模式生物密码子使用频率比值

    Figure  6  Ratios of codon usage frequency of Lythraceae species to model organisms

    表  1  20种千屈菜科植物rbcL基因信息

    Table  1.   Information of rbcL genes from 20 Lythraceae species

    物种GenBank登录号CDS位置物种GenBank登录号CDS位置
    萼距花 Cuphea hyssopifoliaMN83321158955~60382南洋紫薇 Lagerstroemia siamicaMK88162855129~56556
    八宝树 Duabanga grandifloraMK88163856823~58250绒毛紫薇 Lagerstroemia tomentosaMK88163254873~56300
    黄薇 Heimia myrtifoliaMG92161558612~60039西双紫薇 Lagerstroemia venustaMK88163055159~56586
    副萼紫薇 Lagerstroemia calyculataMK88163654873~56300散沫花 Lawsonia inermisMK88163158836~60263
    川黔紫薇 Lagerstroemia excelsaMK88163554910~56337千屈菜 Lythrum salicariaMK88162959099~60526
    屋久岛紫薇 Lagerstroemia faurieiNC_02980854810~56237石榴 Punica granatumNC_03524059017~60444
    多花紫薇 Lagerstroemia floribundaNC_03182554776~56203圆叶节节菜 Rotala rotundifoliaMK88162658835~60262
    桂林紫薇 Lagerstroemia guilinensisNC_02988554697~56124细果野菱 Trapa maximowicziiNC_03702358322~59770
    云南紫薇 Lagerstroemia intermediaNC_03466254948~56375欧菱 Trapa natansMK88163458387~59814
    福建紫薇 Lagerstroemia limiiMK88162754830~56257虾子花 Woodfordia fruticosaMK88163759444~60871
    下载: 导出CSV

    表  2  20种千屈菜科植物rbcL基因碱基组成和密码子使用特性

    Table  2.   Base composition and codon usage characteristics of rbcL genes from 20 Lythraceae species

    物种A3sT3sG3sC3sGCGC1sGC2sGC3sCAIENC
    萼距花  0.3760.5310.1570.1730.4350.5820.4370.2860.27645.392
    八宝树  0.3800.5260.1520.1800.4310.5710.4330.2880.27845.942
    黄薇   0.3900.5080.1450.1940.4340.5710.4330.2960.28346.540
    副萼紫薇 0.3770.5250.1480.1860.4320.5760.4290.2920.27745.635
    川黔紫薇 0.3760.5260.1490.1870.4320.5710.4310.2940.27545.743
    屋久岛紫薇0.3790.5290.1460.1840.4310.5710.4310.2900.27245.659
    多花紫薇 0.3780.5260.1480.1840.4320.5760.4290.2920.27645.625
    桂林紫薇 0.3760.5260.1490.1870.4320.5710.4310.2940.27545.743
    云南紫薇 0.3790.5260.1400.1910.4310.5710.4310.2900.27545.340
    福建紫薇 0.3790.5310.1420.1840.4300.5710.4310.2880.27445.564
    南洋紫薇 0.3790.5260.1400.1910.4310.5710.4310.2900.27545.340
    绒毛紫薇 0.3770.5250.1480.1860.4320.5760.4290.2920.27745.635
    西双紫薇 0.3790.5260.1400.1910.4310.5710.4310.2900.27545.340
    散沫花  0.3790.5360.1510.1710.4290.5690.4350.2820.27645.264
    千屈菜  0.3890.5350.1380.1730.4280.5760.4330.2750.28545.007
    石榴   0.3810.5180.1530.1840.4360.5780.4370.2940.27546.153
    圆叶节节菜0.3790.5360.1510.1710.4290.5690.4350.2820.27645.264
    细果野菱 0.3870.5320.1540.1650.4250.5670.4310.2770.27444.181
    欧菱   0.3870.5320.1540.1650.4260.5690.4310.2770.27444.029
    虾子花  0.3760.5160.1630.1840.4370.5760.4350.3000.27046.458
    下载: 导出CSV

    表  3  碱基组成与密码子使用偏好相关性

    Table  3.   Correlation between base composition and codon usage bias

    参数CAIENCGCGC1sGC2sGC3s
    ENC0.062
    GC− 0.1360.855**
    GC1s0.1380.4030.712**
    GC2s0.0290.2290.3480.314
    GC3s− 0.2640.856**0.846**0.324− 0.074
    GC120.1120.4030.684**0.869**0.743**0.190
      说明:**表示在0.01水平上显著相关(双尾)
    下载: 导出CSV
  • [1] WANG Liyuan, XIGN Huixian, YUAN Yanchao, et al. Genome-wide analysis of codon usage bias in four sequenced cotton species[J]. PLoS One, 2018, 13(3): e0194372. doi: 10.1371/journal.pone.0194372.
    [2] GUSTAFSSON C, GOVINDARAJAN S, MINSHULL J. Codon bias and heterologous protein expression [J]. Trends Biotechnol, 2004, 22(7): 346 − 353.
    [3] KAPRALOV M V, FILATOV D A. Widespread positive selection in the photosynthetic Rubisco enzyme[J]. BMC Evol Biol, 2007, 7: 73. doi: 10.1186/1471-2148-7-73.
    [4] SIQUEIRA A S, LIMA A R J, DALL’AGNOL L T. Comparative modeling and molecular dynamics suggest high carboxylase activity of the Cyanobium sp. CACIAM14 rbcL protein[J]. J Mol Model, 2016, 22(3): 68. doi: 10.1007/s00894-016-2943-y.
    [5] ANDERSSON I, BACKLUND A. Structure and function of Rubisco [J]. Plant Physiol Biochem, 2008, 46(3): 275 − 291.
    [6] 卞赛男, 常鹏杰, 王宁杭, 等. 氮素形态对喜树叶片生长、叶绿素荧光参数及叶绿体相关基因表达的影响[J]. 浙江农林大学学报, 2019, 36(5): 908 − 916.

    BIAN Sainan, CHANG Pengjie, WANG Ninghang, et al. Leaf growth, chlorophyll fluorescence characteristics, and expression of photosystem-related genes in Camptotheca acuminata with different N forms’ fertilization [J]. J Zhejiang A&F Univ, 2019, 36(5): 908 − 916.
    [7] 李冬林, 金雅琴, 崔梦凡, 等. 夏季遮光对连香树幼苗形态、光合作用及叶肉细胞超微结构的影响[J]. 浙江农林大学学报, 2020, 37(3): 496 − 505.

    LI Donglin, JIN Yaqin, CUI Mengfan, et al. Growth, photosynthesis and ultrastructure of mesophyll cells for Cercidiphyllum japonicum seedlings with shading in summer [J]. J Zhejiang A&F Univ, 2020, 37(3): 496 − 505.
    [8] QIN Haining, SHIRLEY A G, MICHAEL G G. Lythraceae[M]//WU Zhengyi, PETER H R, HONG Deyuan. Flora of China vol 13. Beijing: Science Press, 2007: 274 − 290.
    [9] HUANG Yelin, SHI Suhua. Phylogenetics of Lythraceae sensu lato: a preliminary analysis based on chloroplast rbcL gene, psaA-ycf3 spacer and nuclear rDNA internal transcribed spacer (ITS) sequences [J]. Int J Plant Sci, 2005, 163(2): 215 − 225.
    [10] ZHENG Gang, WEI Lingling, MA Li, et al. Comparative analysis of chloroplast genomes from 13 Lagerstroemia (Lythraceae) species: identification of highly divergent regions and inference of phylogenetic relationships [J]. Plant Mol Biol, 2020, 102(6): 659 − 676.
    [11] 赵洋, 杨培迪, 刘振, 等. 13种植物actin基因的密码子使用特性分析[J]. 南方农业学报, 2016, 47(4): 519 − 523.

    ZHAO Yang, YANG Peidi, LIU Zhen, et al. Characterization of codon usage of actin genes for 13 species of plants [J]. J Southern Agric, 2016, 47(4): 519 − 523.
    [12] 朱沛煌, 陈妤, 朱灵芝, 等. 马尾松转录组密码子使用偏好性及其影响因素[J]. 林业科学, 2020, 56(4): 74 − 81.

    ZHU Peihuang, CHEN Yu, ZHU Lingzhi, et al. Codon usage bias and its influencing factors in Pinus massoniana transcriptome [J]. Sci Silv Sin, 2020, 56(4): 74 − 81.
    [13] 李国灵, 陶文, 高诗晨, 等. 红藻rbcL基因密码子偏爱性分析[J]. 分子植物育种, 2019, 18(1): 109 − 117.

    LI Guoling, TAO Wen, GAO Shichen, et al. The codon usage analysis in rbcL gene within Rhodophyta [J]. Mol Plant Breed, 2019, 18(1): 109 − 117.
    [14] 吴妙丽, 陈世品, 陈辉. 竹亚科叶绿体基因组的密码子使用偏性分析[J]. 森林与环境学报, 2019, 39(1): 9 − 14.

    WU Miaoli, CHEN Shipin, CHEN Hui. Condon preference of chloroplast genome of Bambusoideae [J]. J For Environ, 2019, 39(1): 9 − 14.
    [15] 李慧姬, 吉雪花, 朱冉冉, 等. 10种植物PSY基因密码子使用偏好性分析[J]. 西北农业学报, 2020, 29(2): 276 − 284.

    LI Huiji, JI Xuehua, ZHU Ranran, et al. Codon usage bias analysis for octahydrolycopene synthase gene (PSY) from ten plant species [J]. Acta Agric Boreali-Occident Sin, 2020, 29(2): 276 − 284.
    [16] 巫伟峰, 陈明杰, 陈发兴. ‘皇冠李’苹果酸转运体基因ALMT4、ALMT9和tDT密码子偏好性分析[J]. 农业生物技术学报, 2020, 28(1): 42 − 57.

    WU Weifeng, CHEN Mingjie, CHEN Faxing. Codon bias analysis of Prunus salicina ‘Huangguan’ malate transporter ALMT4, ALMT9 and tDT genes [J]. J Agric Biotechnol, 2020, 28(1): 42 − 57.
    [17] 彭丽云, 王云, 孙雪丽, 等. 苋菜AmMYB2基因密码子偏好性与进化分析[J]. 应用与环境生物学报, 2019, 25(3): 679 − 686.

    PENG Liyun, WANG Yun, SUN Xueli, et al. Codon bias and evolutionary analysis of the AmMYB2 gene in Amaranthus tricolor L. [J]. Chin J Appl Environ Biol, 2019, 25(3): 679 − 686.
    [18] 晁岳恩, 吴政卿, 杨会民, 等. 11种植物psbA基因的密码子偏好性及聚类分析[J]. 核农学报, 2011, 25(5): 927 − 932.

    CHAO Yueen, WU Zhengqing, YANG Huimin, et al. Cluster analysis and codon usage bias studies on psbA genes from 11 plant species [J]. J Nucl Agric Sci, 2011, 25(5): 927 − 932.
    [19] JIANG Yue, DENG Feng, WANG Hualin, et al. An extensive analysis on the global codon usage pattern of baculoviruses [J]. Arch Virol, 2008, 153(12): 2273 − 2282.
    [20] 李凌烜, 陈安琪, 黄凯, 等. 豆科植物dxr基因密码子偏好性分析[J]. 生物学杂志, 2020, 37(1): 30 − 34.

    LI Lingxuan, CHEN Anqi, HUANG Kai, et al. Analysis of codon bias of dxr gene in Leguminous plants [J]. J Biol, 2020, 37(1): 30 − 34.
    [21] SHARP P M, LI W H. An evolutionary perspective on synonymous codon usage in unicellular organisms [J]. J Mol Evol, 1986, 24(1/2): 28 − 38.
    [22] 王云, 彭丽云, 苏立遥, 等. 龙眼Hsf基因家族密码子使用模式分析[J]. 分子植物育种, 2019, 17(17): 5595 − 5603.

    WANG Yun, PENG Liyun, SU Liyao, et al. Codon usage pattern analysis of Dimocarpus longan Lour. Hsf gene family [J]. Mol Plant Breed, 2019, 17(17): 5595 − 5603.
    [23] KAWABE A, MIYASHITA N T. Patterns of codon usage bias in three dicot and four monocot plant species [J]. Genes Genet Syst, 2003, 78(5): 343 − 352.
    [24] 王宇, 周俊良, 唐冬梅, 等. 阔叶猕猴桃叶绿体基因组特征及密码子偏好性分析[J]. 种子, 2020, 39(5): 13 − 19.

    WANG Yu, ZHOU Junliang, TANG Dongmei, et al. Analysis of chloroplast genome characteristics and codon preference in broad-leaf Kiwifruit [J]. Seed, 2020, 39(5): 13 − 19.
    [25] 原晓龙, 王毅, 张劲峰. 灰毛浆果楝叶绿体基因组密码子使用特征分析[J]. 森林与环境学报, 2020, 40(2): 195 − 202.

    YUAN Xiaolong, WANG Yi, ZHANG Jinfeng. Characterization of codon usage in Cipadessa cinerascens chloroplast genome [J]. J For Environ, 2020, 40(2): 195 − 202.
    [26] KUSUMI J, TACHIDA H. Compositional properties of green-plant plastid genomes [J]. J Mol Evol, 2005, 60(4): 417 − 425.
    [27] WANG Mingcong, KAPRALOV M V, ANISIMOVA M. Coevolution of amino acid residues in the key photosynthetic enzyme Rubisco[J]. BMC Evol Biol, 2011, 11(1): 266. doi: 10.1186/1471-2148-11-266.
    [28] LIU Lei, ZHAO Bo, ZHANG Yu, et al. Adaptive evolution of the rbcL gene in Brassicaceae [J]. Biochem Syst Ecol, 2012, 44: 13 − 19.
    [29] MIWA H, ODRZYKOSKI I J, MATSUI A, et al. Adaptive evolution of rbcL in Conocephalum (Hepaticae, bryophytes) [J]. Gene, 2009, 441(1/2): 169 − 175.
    [30] DANIEL H, LIN C S, YU Ming, et al. Chloroplast genomes: diversity, evolution, and applications in genetic engineering[J]. Genome Biol, 2016, 17(1): 134. doi: 10.1186/s13059-016-1004-2.
    [31] 刘佳音, 李儒剑, 齐双慧, 等. 叶绿体遗传转化系统及其应用进展[J]. 安徽农业科学, 2020, 48(6): 16 − 19.

    LIU Jiayin, LI Rujian, QI Shuanghui, et al. Chloroplast genetic transformation system and its application progress [J]. J Anhui Agric Sci, 2020, 48(6): 16 − 19.
    [32] SUI Xiaoming, WANG Yang, ZHAO Mingyuan, et al. Cloning and expression analysis of RrGT2 gene related to anthocyanin biosynthesis in Rosa rugosa [J]. Am J Plant Sci, 2018, 9(10): 2008 − 2019.
  • [1] 金笑雨, 王艺光, 赵宏波, 董彬.  彩叶桂叶色变化及生理特征分析 . 浙江农林大学学报, 2024, 41(5): 1056-1065. doi: 10.11833/j.issn.2095-0756.20240160
    [2] 王爽, 董彬, 王艺光, 赵宏波.  不同梅品种花果特性分析与评价 . 浙江农林大学学报, 2024, 41(1): 113-123. doi: 10.11833/j.issn.2095-0756.20230213
    [3] 冯歌林, 高竞, 严淑娴, 王晶, 梁辰飞, 秦华, 陈俊辉, 徐秋芳.  3种竹子内生固氮菌特征及多样性 . 浙江农林大学学报, 2021, 38(6): 1203-1212. doi: 10.11833/j.issn.2095-0756.20190586
    [4] 火艳, 招雪晴, 黄厚毅, 黄贤斌, 许云方, 祝遵凌, 苑兆和.  观赏石榴表型遗传多样性分析 . 浙江农林大学学报, 2020, 37(5): 939-949. doi: 10.11833/j.issn.2095-0756.20190619
    [5] 夏雯, 芦建国, 景蕾.  镇江市低影响开发示范区植物群落特征与物种多样性 . 浙江农林大学学报, 2019, 36(4): 793-800. doi: 10.11833/j.issn.2095-0756.2019.04.020
    [6] 杨静怡, 夏玉芳, 谢钊俊, 陶兴月, 丁小霞.  核桃不同单株种子化学成分傅立叶红外光谱差异性分析 . 浙江农林大学学报, 2015, 32(3): 420-425. doi: 10.11833/j.issn.2095-0756.2015.03.014
    [7] 张梅, 刘利, 伊力塔.  辽宁白石砬子国家级自然保护区植物区系的多样性 . 浙江农林大学学报, 2014, 31(2): 210-216. doi: 10.11833/j.issn.2095-0756.2014.02.008
    [8] 吴月燕, 陶巧静, 李波, 许丹叶.  西洋杜鹃SRAP体系优化及遗传多样性分析 . 浙江农林大学学报, 2013, 30(6): 844-851. doi: 10.11833/j.issn.2095-0756.2013.06.007
    [9] 樊二齐, 王云华, 郭叶, 俞春莲, 林新春.  6种木兰科植物叶片精油的气质联用(GC-MS)分析 . 浙江农林大学学报, 2012, 29(2): 307-312. doi: 10.11833/j.issn.2095-0756.2012.02.023
    [10] 沈俊岭, 倪慧群, 陈晓阳, 黄少伟.  麻疯树遗传多样性的相关序列扩增多态性(SRAP)分析 . 浙江农林大学学报, 2010, 27(3): 347-353. doi: 10.11833/j.issn.2095-0756.2010.03.005
    [11] 莫文娟, 袁德义, 段经华, 邹锋.  新高系梨9个品种SSR 标记分析 . 浙江农林大学学报, 2009, 26(5): 639-643.
    [12] 楼崇, 祝国民.  浙江省竹林生态区划研究 . 浙江农林大学学报, 2007, 24(6): 741-746.
    [13] 吴祝华, 施季森, 席梦利, 刘光欣.  百合种质资源花粉形态及亲缘关系研究 . 浙江农林大学学报, 2007, 24(4): 406-412.
    [14] 朱臻, 沈月琴, 汪君莲, 王峥嵘.  山区农民林业收益分析及增收对策的案例研究 . 浙江农林大学学报, 2006, 23(4): 460-464.
    [15] 景芸, 梁一池, 杨华.  不同锥栗无性系果实营养成分的比较分析 . 浙江农林大学学报, 2004, 21(2): 176-179.
    [16] 梁健, 孙婷.  延安林区啮齿动物群落的聚类分析 . 浙江农林大学学报, 2004, 21(1): 70-74.
    [17] 唐娟娟, 范义荣, 朱睦元.  黄山松群体遗传多样性分析 . 浙江农林大学学报, 2003, 20(1): 23-26.
    [18] 刘安兴.  树高曲线聚类分析研究 . 浙江农林大学学报, 2001, 18(3): 228-232.
    [19] 黄必恒.  浙江省各市县国民经济状况统计分析 . 浙江农林大学学报, 1999, 16(4): 420-424.
    [20] 张君析, 林绍生.  应用气候生态聚类指导脐橙引种 . 浙江农林大学学报, 1996, 13(1): 41-47.
  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20200390

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2021/3/476

图(6) / 表(3)
计量
  • 文章访问数:  1572
  • HTML全文浏览量:  245
  • PDF下载量:  67
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-06-19
  • 修回日期:  2021-03-08
  • 网络出版日期:  2021-06-09
  • 刊出日期:  2021-06-09

20种千屈菜科植物rbcL基因密码子使用偏好性分析

doi: 10.11833/j.issn.2095-0756.20200390
    基金项目:  浙江省自然科学基金资助项目(LY21C160001)
    作者简介:

    郑钢(ORCID: 0000-0001-5666-4832),实验师,从事园林植物遗传育种研究。E-mail: 305788868@qq.com

    通信作者: 王杰(ORCID: 0000-0003-0038-1045),从事园林植物遗传育种与种质资源创新研究。E-mail: wangjie@stu.zafu.edu.cn
  • 中图分类号: S718.3

摘要:   目的  分析千屈菜科Lythraceae植物rbcL基因密码子使用特性,明确密码子偏好性的影响因素,筛选rbcL基因异源表达和遗传转化的合适受体。  方法  从美国国家生物技术信息中心(NCBI)获取20种千屈菜科植物的rbcL基因全长编码区序列(CDS)数据,运用CodonW、EMBOSS和DAMBE软件获取基因碱基组成和密码子使用偏好性的相关参数,分析该类植物叶绿体rbcL基因使用密码子的偏倚性及其影响因素。  结果  千屈菜科植物rbcL基因GC含量(GC)为0.425~0.437,密码子第3位碱基GC含量(GC3s)为0.275~0.300。GC3s、GC与有效密码子数(ENC)显著相关(P<0.01);ENC-GC3s散点图分析、中性绘图分析、奇偶偏差分析均表明:相较于突变压力,自然选择压力对千屈菜科植物rbcL基因密码子使用偏好性的影响更大。基于同义密码子相对使用度的系统聚类与CDS邻接树结果部分一致。与千屈菜科rbcL基因密码子平均使用频率相比,大肠埃希菌Escherichia coli、酵母Saccharomyces cerevisiae、拟南芥Arabidopsis thaliana、烟草Nicotiana tabacum和番茄Solanum lycopersicum分别存在28、26、20、19和17个使用频率相差较大的密码子。  结论  千屈菜科植物rbcL基因碱基组成上更倾向于选择A/T碱基,且偏好使用末端A/T碱基的密码子;rbcL基因密码子使用偏好性受多种因素共同作用,但自然选择压力是最主要因素;密码子偏好性的系统聚类可为系统发育研究提供补充;酵母更适合作为千屈菜科植物rbcL基因异源表达受体,番茄更适合作为rbcL基因遗传转化和功能研究的受体材料。图6表3参32

English Abstract

郑钢, 顾翠花, 林琳, 王杰. 20种千屈菜科植物rbcL基因密码子使用偏好性分析[J]. 浙江农林大学学报, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
引用本文: 郑钢, 顾翠花, 林琳, 王杰. 20种千屈菜科植物rbcL基因密码子使用偏好性分析[J]. 浙江农林大学学报, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
ZHENG Gang, GU Cuihua, LIN Lin, WANG Jie. Codon usage bias analysis of rbcL genes of 20 Lythraceae species[J]. Journal of Zhejiang A&F University, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
Citation: ZHENG Gang, GU Cuihua, LIN Lin, WANG Jie. Codon usage bias analysis of rbcL genes of 20 Lythraceae species[J]. Journal of Zhejiang A&F University, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
  • 密码子承担着生物体内遗传信息传递的重要功能,是DNA转录与翻译、蛋白质合成与表达过程中的关键单元。在生物体共用的一套密码子中,终止密码子不编码氨基酸,甲硫氨酸(Met)和色氨酸(Trp)分别由1种密码子编码。其余59个密码子具有简并性,即1种氨基酸可由2~6个密码子对应编码,编码相同氨基酸的密码子即为同义密码子[1]。基因并非完全随机地使用同义密码子,而是存在一定的偏好性。特定的密码子偏好性是生物体长期适应性进化的结果,能够反映生物对环境的分子适应机制[2]。分析密码子偏好性及其影响因素,对生物遗传育种、进化基因组学以及系统发育学研究具有深远的意义。1,5-二磷酸核酮糖羧化/加氧酶(Ribulose-1,5-bisphosphate carboxylase/oxygenase, Rubisco酶)是植物叶绿体基质中参与光合作用的关键酶,约占可溶性蛋白质总量的50%[3]。Rubisco酶具有催化1,5-二磷酸核酮糖(Ribulose-1,5-disphosphate, RuBP)与二氧化碳(CO2)羧化反应和光呼吸中RuBP与氧气(O2)加氧反应的双重活性,对净光合率有决定性影响[4]。Rubisco酶由8个大亚基(催化亚基)和8个小亚基(调节亚基)组成,前者是固定CO2的活性位点和催化位点,由叶绿体基因组大单拷贝区的rbcL基因编码[5-6]。环境的变化会导致rbcL基因产生适应性进化,从而影响植物光合效率[7]。因此,研究rbcL基因的密码子使用模式有利于理解高等植物对环境的适应机制。千屈菜科Lythraceae包括许多重要的园林植物,具有重要的观赏价值和经济价值[8]。目前,rbcL基因在千屈菜科中的研究应用仅局限于系统发育[9-10],对于该科密码子使用偏好性的相关研究尚未见报道。本研究选取了千屈菜科具有代表性的10属20种植物,分析rbcL基因的碱基组成、密码子使用偏好性及其影响因素,并与模式物种进行比较,为该科物种rbcL基因异源高效表达提供理论基础。

    • 20条rbcL基因全长编码区序列(CDS)数据来源于美国国家生物技术信息中心(NCBI)的GenBank数据库(https://www.ncbi.nlm.nih.gov/),详见表1

      表 1  20种千屈菜科植物rbcL基因信息

      Table 1.  Information of rbcL genes from 20 Lythraceae species

      物种GenBank登录号CDS位置物种GenBank登录号CDS位置
      萼距花 Cuphea hyssopifoliaMN83321158955~60382南洋紫薇 Lagerstroemia siamicaMK88162855129~56556
      八宝树 Duabanga grandifloraMK88163856823~58250绒毛紫薇 Lagerstroemia tomentosaMK88163254873~56300
      黄薇 Heimia myrtifoliaMG92161558612~60039西双紫薇 Lagerstroemia venustaMK88163055159~56586
      副萼紫薇 Lagerstroemia calyculataMK88163654873~56300散沫花 Lawsonia inermisMK88163158836~60263
      川黔紫薇 Lagerstroemia excelsaMK88163554910~56337千屈菜 Lythrum salicariaMK88162959099~60526
      屋久岛紫薇 Lagerstroemia faurieiNC_02980854810~56237石榴 Punica granatumNC_03524059017~60444
      多花紫薇 Lagerstroemia floribundaNC_03182554776~56203圆叶节节菜 Rotala rotundifoliaMK88162658835~60262
      桂林紫薇 Lagerstroemia guilinensisNC_02988554697~56124细果野菱 Trapa maximowicziiNC_03702358322~59770
      云南紫薇 Lagerstroemia intermediaNC_03466254948~56375欧菱 Trapa natansMK88163458387~59814
      福建紫薇 Lagerstroemia limiiMK88162754830~56257虾子花 Woodfordia fruticosaMK88163759444~60871
    • 通过CodonW 1.4.4软件和在线工具EMBOSS explorer(http://emboss.toulouse.inra.fr./)中的CUSP和CHIPS程序,统计rbcL基因密码子末端各类型碱基含量(A3s、T3s、C3s和T3s)、GC总含量(GC)、密码子各位点GC含量(GC1s、GC2s和GC3s)、有效密码子数(ENC)和密码子适应指数(CAI)。利用SPSS 22.0软件,选用皮尔森相关系数评估碱基组成和密码子偏好性相关显著水平[11]

    • 同义密码子相对使用度(RSCU)是同义密码子的实际使用频次与无使用偏好性时期望频次的比率,去除了碱基成分对密码子使用产生的影响。RSCU>1,表示该密码子在同义密码子中使用相对较多;RSCU=1,表示该密码子在同义密码子中使用无偏好性;RSCU<1表示该密码子在同义密码子中使用相对较少[12]。通过CodonW 1.4.4软件计算千屈菜科植物的RSCU,并利用TBtools 0.6软件绘图。

    • 以GC3s和ENC为横、纵坐标,通过Origin 9.1绘制ENC-GC3s散点图。标准曲线为ENC期望值,即NENC=2+MGC3s+29/[MGC3s2+(1−MGC3s)2],其中NENC表示有效密码子数,MGC3s表示密码子第3位碱基平均GC含量,该公式的成立表示密码子的偏好性仅受突变压力约束[13],此条件下,散点应位于标准曲线上部或紧贴标准曲线下部;当散点分布于曲线下方较远距离的区域时,表明除突变压力作用外,选择压力对偏好性产生主要影响。

    • 以GC3s为横坐标,密码子第1、2位点GC含量平均值(GC12)为纵坐标,利用Origin 9.1绘制散点图并做线性回归分析,分析密码子不同位点碱基组成差异性[14]。当回归曲线斜率趋近1时,密码子各位点碱基成分差异不大,偏好性主要受到突变的影响;当斜率趋近0时,密码子第3位点和第1、2位点碱基变异模式差异较大,偏好性主要受到选择压力影响。

    • 奇偶偏差分析可评估密码子第3位点嘌呤和嘧啶组成偏差对密码子使用偏好性的影响[15]。以G3s/(G3s+C3s)和A3s/(A3s+T3s)为横、纵坐标,利用Origin 9.1绘制奇偶偏差图,交点(0.50, 0.50)表示无碱基突变和选择压力下,A=T且G=C。

    • 参照巫伟峰等[16]方法,以59个密码子(去除AUG、UGG和3个终止密码子UAA、UAG、UGA)的RSCU为变量,20条CDS为个体,通过SPSS进行系统聚类,类间距离为组内联接法,基因间距离为平方欧式距离。分别利用DAMBE 5.2.73和MEGA-X软件对CDS进行碱基替换饱和度检测和总体平均距离(d)计算,同时满足替换饱和度指数(Iss)小于饱和度标准指数(Iss.c),即IssIss.c,表明碱基替换未饱和,且P=0.000和0<d<1后,通过MEGA-X软件邻接法(NJ)构建系统发生树,重复1 000次。

    • 密码子相对使用频率比值是评估不同生物密码子使用偏好性差异程度的重要参数。当比值为0.5~2.0时,认为物种密码子偏好性差异较小[17]。拟南芥Arabidopsis thaliana、烟草Nicotiana tabacum、番茄Solanum lycopersicum、大肠埃希菌Escherichia coli和酵母Saccharomyces cerevisiae的基因组密码子使用频率来源于密码子使用数据库(http://www.kazusa.or.jp/codon/)。千屈菜科物种整体密码子平均使用频率通过EMBOSS explorer中CUSP计算获得[18]。利用Origin 9.1进行绘图。

    • 表2可见:GC含量为0.425~0.437,平均为0.431。结合密码子各位点GC含量(GC1s为0.567~0.582,平均0.573;GC2s为0.429~0.437,平均0.432;GC3s为0.275~0.300,平均0.288),表明rbcL基因CDS在组成上更倾向于使用A/T碱基。第3位点各类型碱基含量从大到小依次为T3s、A3s、C3s、G3s,表明rbcL基因更偏向于使用A/T碱基结尾的密码子。

      表 2  20种千屈菜科植物rbcL基因碱基组成和密码子使用特性

      Table 2.  Base composition and codon usage characteristics of rbcL genes from 20 Lythraceae species

      物种A3sT3sG3sC3sGCGC1sGC2sGC3sCAIENC
      萼距花  0.3760.5310.1570.1730.4350.5820.4370.2860.27645.392
      八宝树  0.3800.5260.1520.1800.4310.5710.4330.2880.27845.942
      黄薇   0.3900.5080.1450.1940.4340.5710.4330.2960.28346.540
      副萼紫薇 0.3770.5250.1480.1860.4320.5760.4290.2920.27745.635
      川黔紫薇 0.3760.5260.1490.1870.4320.5710.4310.2940.27545.743
      屋久岛紫薇0.3790.5290.1460.1840.4310.5710.4310.2900.27245.659
      多花紫薇 0.3780.5260.1480.1840.4320.5760.4290.2920.27645.625
      桂林紫薇 0.3760.5260.1490.1870.4320.5710.4310.2940.27545.743
      云南紫薇 0.3790.5260.1400.1910.4310.5710.4310.2900.27545.340
      福建紫薇 0.3790.5310.1420.1840.4300.5710.4310.2880.27445.564
      南洋紫薇 0.3790.5260.1400.1910.4310.5710.4310.2900.27545.340
      绒毛紫薇 0.3770.5250.1480.1860.4320.5760.4290.2920.27745.635
      西双紫薇 0.3790.5260.1400.1910.4310.5710.4310.2900.27545.340
      散沫花  0.3790.5360.1510.1710.4290.5690.4350.2820.27645.264
      千屈菜  0.3890.5350.1380.1730.4280.5760.4330.2750.28545.007
      石榴   0.3810.5180.1530.1840.4360.5780.4370.2940.27546.153
      圆叶节节菜0.3790.5360.1510.1710.4290.5690.4350.2820.27645.264
      细果野菱 0.3870.5320.1540.1650.4250.5670.4310.2770.27444.181
      欧菱   0.3870.5320.1540.1650.4260.5690.4310.2770.27444.029
      虾子花  0.3760.5160.1630.1840.4370.5760.4350.3000.27046.458

      ENC和CAI是衡量密码子使用偏好性程度的主要指标。ENC从20(氨基酸只由1种同义密码子编码)至61(同义密码子的使用没有偏好性),越接近20偏好性越强。一般认为,ENC<35表示密码子的使用偏好性较强[19]。20种千屈菜科植物ENC为44.029~46.540,平均45.493,分布范围较小且均远大于35,表明rbcL基因整体偏好性不强。CAI取值0~1,越接近1密码子偏好性越强[20]。20种植物CAI为0.270~0.285,平均0.276,同样说明偏好性强度不大。一般情况下,基因的密码子使用偏好性越强,在生物体内的表达水平越高[21],可推测rbcL基因在千屈菜科植物中表达水平较低。

    • 图1显示:在25个高频密码子(RSCU>1)中,23个以A/U结尾,仅2个由C(AUC和AGC)结尾。其中RSCU最高的5个密码子(RSCU>2)末尾均为U碱基,表明rbcL基因CDS对于末端A/U(T)密码子具有的使用偏好性。

      图  1  20种千屈菜科植物rbcL基因同义密码子相对使用度

      Figure 1.  RSCU of rbcL genes from 20 Lythraceae species

    • 相关分析(表3)表明:ENC和GC、GC3s在0.01水平上显著相关(Pearson相关系数分别为0.855和0.856),表明碱基组成,尤其是密码子第3位点碱基类型对千屈菜科rbcL基因的密码子偏好性有明显影响。GC3s和GC12相关不显著,说明不同位点组成上关联不大,碱基变异模式存在差异,rbcL基因较保守,突变偏性较小。

      表 3  碱基组成与密码子使用偏好相关性

      Table 3.  Correlation between base composition and codon usage bias

      参数CAIENCGCGC1sGC2sGC3s
      ENC0.062
      GC− 0.1360.855**
      GC1s0.1380.4030.712**
      GC2s0.0290.2290.3480.314
      GC3s− 0.2640.856**0.846**0.324− 0.074
      GC120.1120.4030.684**0.869**0.743**0.190
        说明:**表示在0.01水平上显著相关(双尾)
    • 图2显示了rbcL基因ENC和GC3s的关系。所有散点分布在标准曲线下方一定距离处,表明千屈菜科植物rbcL基因的密码子偏好性除了受到碱基突变压力外,更主要受自然选择压力的约束;散点集中分布在较小范围内说明自然选择压力强度相近。

      图  2  rbcL基因ENC-GC3s绘图分析

      Figure 2.  ENC-GC3s plot analysis of rbcL genes

    • 中性分析结果(图3)显示:所有散点均落在直线y=x(GC12)上方。GC3s与GC12的回归曲线(斜率为0.069 4,R2=0.036 1)近似平行于X轴,表明千屈菜科植物rbcL基因密码子第1、2位点与第3位点碱基类型相差较大。结合表3,GC3s与GC12相关性较低(Pearson相关系数为0.190),说明碱基突变对于密码子第3位点的作用比第1、2位点弱,密码子偏好性主要受自然选择压力的作用,受突变压力的影响则较小。

      图  3  GC3s与GC12的中性绘图

      Figure 3.  Neutral plot of GC3s and GC12

    • 图4显示:当密码子偏好性只受碱基突变影响时,密码子第3位点上嘌呤和嘧啶含量应相同,即A3s=T3s或C3s=G3s[22]。所有散点均明显偏离交点(0.50, 0.50),且都分布在左下象限[G3s/(G3s+C3s)<0.5,A3s/(A3s+T3s)<0.5],密码子第3位点上嘧啶含量高于嘌呤[(A3s+G3s)<(T3s+C3s)]。4种碱基在密码子第3位点上分布不均匀,说明相较于碱基突变压力,自然选择压力对rbcL密码子偏好性有更强的影响。

      图  4  rbcL基因密码子第3位点碱基奇偶偏好

      Figure 4.  PR2 plot of the 3rd sites in codons of rbcL genes

    • 20条CDS碱基替换未饱和(Iss=0.025 3,Iss.c=0.785 2,P=0.000),总体平均遗传距离为0.2。系统聚类树状图和邻接树均将20种千屈菜科植物聚成了4~5个支系(图5),说明不同支系的植物密码子使用特性存在一定区别。虽然两者在部分支系的内部结构上存在较大矛盾,但在支系水平(属)上,两者对10个紫薇属Lagerstroemia植物、散沫花和圆叶节节菜以及2个菱属Trapa植物之间的聚类结果相对一致,说明基于密码子RSCU的系统聚类能在某种程度上反映千屈菜科植物属间水平的亲缘关系,即不同植物密码子的使用偏好性与亲缘关系存在局部对应。

      图  5  基于rbcL基因CDS的邻接树(左)和基于59个密码子RSCU的聚类树状图(右)

      Figure 5.  NJ tree based on CDS of rbcL genes (left) and cluster dendrogram based on RSCU of 59 codons (right)

    • 图6可以看出:与千屈菜科植物rbcL基因密码子平均使用频率相比,大肠埃希菌有28个密码子相差较大,最大值5.76(AGA);酵母有26个密码子相差较大,最大值4.33(CGU),说明酵母更适合作为千屈菜科植物rbcL基因异源表达的受体。拟南芥、烟草和番茄分别存在20、19和17个使用频率相差较大的密码子,且最大值均出现在CGU,初步说明相较于拟南芥和烟草,番茄更适合作为千屈菜科植物rbcL基因遗传转化的受体。

      图  6  千屈菜科植物与模式生物密码子使用频率比值

      Figure 6.  Ratios of codon usage frequency of Lythraceae species to model organisms

    • 特定的密码子使用偏好性是生物对环境变化适应性的体现,不同物种、不同功能基因的密码子偏好性存在明显差异。大部分双子叶植物密码子偏好A/T碱基结尾,单子叶植物则偏好G/C结尾[23],与本研究中千屈菜科植物rbcL基因密码子A3s+T3s远远大于G3s+C3s的偏好性结果一致。李国灵等[13]对红藻门Rhodophyta植物rbcL基因密码子偏好性研究也得到了类似结果,虽然红藻科和千屈菜科植物生活型、生理特性等相差较大,但千屈菜科也包括许多水生或湿生植物。两者研究结果显示:植物从水生向陆生过渡过程中,rbcL基因密码子使用偏好性的变化可能较为稳定,这也许是rbcL基因受到强烈自然选择作用的结果。生物体内高表达的基因,其密码子偏好性也相对较强,反之亦然[24]。千屈菜科植物rbcL基因ENC较高,CAI较低,说明千屈菜科植物rbcL基因整体的密码子使用偏好性不强,在植物体内表达水平也不高。但仍存在CGU、CCU、ACU等13个偏好性相对较强的密码子(RSCU>1.5),其在氨基酸中残基含量也相对丰富。

      密码子使用偏好性的影响因素包括碱基组成、突变、自然选择、漂变、基因长度、tRNA丰度以及基因表达水平的高低等,但最主要的压力来自于突变和自然选择[25]。本研究中,千屈菜科植物rbcL基因GC3s和GC、ENC的相关性显著,表明密码子偏好性在一定程度上受到了碱基组成的影响,之前的研究也证明GC3s和GC含量之间存在明显的线性关系[26]。但GC3s与GC12相关程度较低,且GC3s集中分布在0.275~0.300内,KAWABE等[23]研究表明:密码子使用偏好性主要受自然选择的影响,而碱基突变的影响则较小,ENC分析、中性分析、奇偶偏差分析也得出相同的结论。这可能是由于rbcL基因本身为叶绿体基因,分子进化速率相较于核基因更慢,且编码的二磷酸核酮糖羧化酶是参与光合作用的关键蛋白,相对比较保守,所以突变压力对其密码子使用偏好性的作用相对较弱;而正选择、协同进化等作用在陆生植物的rbcL基因中被证明广泛存在,也表明rbcL基因密码子使用偏好性可能广泛受到选择约束[27-28]

      与RSCU聚类分析结果相比,基于CDS的邻接树在理论上更接近真实的物种系统发育关系。两者相对一致的部分说明千屈菜科植物rbcL基因密码子使用特性与属间亲缘关系存在一定程度的对应;两者之间较为矛盾的分支可能是系统聚类仅选取单一RSCU数据分析导致的,结合密码子偏好性的其他参数,或许能获得更加一致的结果。由于单基因建树也可能会受到旁系同源基因干扰、水平基因转移等多种因素影响产生误差[29],因此基于密码子偏好性的聚类分析也可对系统发生的研究内容进行一定补充。

      转基因过程中,选择密码子使用偏好性相近的物种作为异源表达受体,有利于外源基因的高效表达[30]。千屈菜科植物多数都是木本植物,遗传转化体系尚未成熟,由于受限于同源物种生活史长、生长速度慢等因素,其基因功能研究十分依赖模式物种。通过与模式物种密码子使用频率的初步比较,酵母更适合作为千屈菜科植物rbcL基因的异源表达受体;与拟南芥、烟草相比,番茄的密码子使用频率与千屈菜科植物rbcL基因差异性最小,更适合作为rbcL基因功能验证的理想受体材料。但相对于番茄,拟南芥和烟草遗传转化体系建立相对较早,发展较为完善,已实现了多种木本植物叶绿体基因的遗传转化,积累的技术经验较多,遗传转化的难度也相对较小[31]。在观赏植物研究中,番茄更多作为植物呈色相关基因的遗传转化受体,验证其在色素积累与代谢中的调控作用[32]。因此,密码子使用频率的比较结果仅能为千屈菜科植物rbcL基因异源表达受体选择提供初步的预测,受限于该科木本植物当前采样难度较大,且遗传转化体系尚未成熟建立等因素,最适的异源表达受体仍须在进一步的实验中进行深入研究和严格筛选。

参考文献 (32)

目录

    /

    返回文章
    返回