留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析

洪森荣 张牧彤 徐子林 张钦荣 罗雨欣 田文慧 王心雨

洪森荣, 张牧彤, 徐子林, 张钦荣, 罗雨欣, 田文慧, 王心雨. ‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析[J]. 浙江农林大学学报, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
引用本文: 洪森荣, 张牧彤, 徐子林, 张钦荣, 罗雨欣, 田文慧, 王心雨. ‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析[J]. 浙江农林大学学报, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
HONG Senrong, ZHANG Mutong, XU Zilin, ZHANG Qinrong, LUO Yuxin, TIAN Wenhui, WANG Xinyu. Chloroplast genome characteristics and codon usage preference of Solanum tuberosum var. cormosus ‘Huaiyushan’[J]. Journal of Zhejiang A&F University, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
Citation: HONG Senrong, ZHANG Mutong, XU Zilin, ZHANG Qinrong, LUO Yuxin, TIAN Wenhui, WANG Xinyu. Chloroplast genome characteristics and codon usage preference of Solanum tuberosum var. cormosus ‘Huaiyushan’[J]. Journal of Zhejiang A&F University, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169

‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析

doi: 10.11833/j.issn.2095-0756.20230169
基金项目: 国家自然科学基金资助项目(32060092,31960079);2022年上饶市科技专项项目(2022A008);江西省科技厅重点研发计划一般项目(20192BBF60006,20202BBF63001);江西省教育厅科学技术研究项目(GJJ201704,GJJ211729);江西省现代农业产业技术体系建设专项(JXARS-13-赣东站);上饶市科技局平台载体建设项目(2020I001,2020J001)
详细信息
    作者简介: 洪森荣(ORCID: 0000-0002-9219-8303),教授,从事植物生物技术研究。E-mail: hongsenrong@163.com
  • 中图分类号: S532

Chloroplast genome characteristics and codon usage preference of Solanum tuberosum var. cormosus ‘Huaiyushan’

  • 摘要:   目的  分析‘怀玉山’高山马铃薯Solanum tuberosum var. cormosus ‘Huaiyushan’叶绿体基因组特征及密码子使用偏好性,为开展‘怀玉山’高山马铃薯叶绿体基因组密码子优化、叶绿体基因组改造,探索物种进化和增加外源基因表达等研究提供参考依据和理论基础。  方法  采用高通量测序技术对‘怀玉山’高山马铃薯叶绿体基因组进行测序,并利用生物信息学分析软件对组装和注释后的叶绿体基因组进行结构、基因组成及密码子偏好性分析。  结果  ‘怀玉山’高山马铃薯叶绿体基因组大小为155 296 bp,为经典的4段式结构。大单拷贝区(LSC)、小单拷贝区(SSC)和反向重复区(IR)长度分别为85 737、18 373、25 593 bp,总鸟嘌呤和胞嘧啶所占的比例(GC比例)为37.88%,共注释出133个基因,包含87个编码区(CDS)基因、37个tRNA基因、8个rRNA基因和1个假基因。‘怀玉山’高山马铃薯叶绿体基因组中共检测到38个简单重复序列位点(SSR位点,36个单碱基重复和2个双碱基重复)和32个长重复序列(16个正向重复和16个回文重复)。‘怀玉山’高山马铃薯叶绿体基因组核苷酸多样性为0~0.139 27,高变区主要分布在大单拷贝区和小单拷贝区,大单拷贝区trnL-UAA-trnF-GAAcemArps12-exon1-clpP1、clpP1基因变异率最高,小单拷贝区rpl32-trnL-UAGycf1基因变异率最高。‘怀玉山’高山马铃薯叶绿体基因组87个CDS基因的平均有效密码子数(ENC)为47.29,ENC>45的基因有60个,密码子偏性较弱。‘怀玉山’高山马铃薯叶绿体基因组密码子偏好以A、U结尾,使用偏性很大程度上受自然选择的影响,而受突变压力的影响小。CGU、AAA、CUU、GUU、GGA、GUA、GGU、UCA、GCU、CCU为‘怀玉山’高山马铃薯叶绿体基因组的10个最优密码子。  结论  ‘怀玉山’高山马铃薯与马铃薯栽培种S. tuberosum‘Desiree’亲缘关系较近。图5表3参41
  • 图  1  ‘怀玉山’高山马铃薯叶绿体基因组图谱

    Figure  1  Chloroplast genome map of S. tuberosum var. cormosus ‘Huaiyushan’

    图  2  ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组大单拷贝区、小单拷贝区和反向重复区边界位置的比较

    Figure  2  Comparison on the boundary locations of large single copy region, small single copy region and inverted repeat region in chloroplast genomes of S. tuberosum var. cormosus ‘Huaiyushan’ and its 10 related species

    图  3  ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组密码子组成成分分析

    Figure  3  Composition analysis of chloroplast genome codons of S. tuberosum var. cormosus ‘Huaiyushan’ and its 10 related species

    图  4  ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组密码子GC3-GC12分析(A)、ENC-plot分析(B)和PR2-plot分析(C)

    Figure  4  GC3-GC12 analysis (A), ENC-plot analysis (B) and PR2-plot analysis (C) of chloroplast genome codons of S. tuberosum var. cormosus ‘Huaiyushan’ and its 10 related species

    图  5  基于叶绿体基因组的‘怀玉山’高山马铃薯及其18个近缘种的系统发育树

    Figure  5  Phylogenetic tree of S. tuberosum var. cormosus ‘Huaiyushan’ and its 18 related species based on chloroplast genome

    表  1  ‘怀玉山’高山马铃薯叶绿体基因功能分类

    Table  1.   Chloroplast gene functional classification of S. tuberosum var. cormosus ‘Huaiyushan’

    基因功能基因类型基因名基因数
    量/个
    光合作用   光系统Ⅰ psaApsaBpsaCpsaIpsaJ 5
    光系统Ⅱ psaJpsbApsbBpsbCpsbDpsbEpsbFpsbH*、psbIpsbKpsbLpsbM
    psbTpsbZ
    15
    NADH 脱氢 ndhAndhB*、ndhCndhDndhEndhFndhGndhHndhIndhJndhK 12
    细胞色素 b/f 复合体 petApetBpetDpetGpetLpetN 6
    ATP 合成酶 atpAatpBatpEatpFatpHatpI 6
    自我复制   核糖体大亚基蛋白质 rpl14、rpl16、rpl2*、rpl20、rpl22、rpl23*、rpl32、rpl33、rpl36 11
    核糖体小亚基蛋白质 rps11、rps12*、rps14、rps15、rps16、rps18、rps19、
    rps2、rps3、rps4、rps7*、rps8
    14
    核糖体大亚基 rbcL 1
    RNA 聚合酶 rpoArpoBrpoC1、rpoC2 4
    核糖体RNA rrn16*、rrn23*、rrn4.5*、rrn5* 8
    转运RNA trnA-UGC*、trnC-GCAtrnD-GUCtrnE-UUCtrnF-GAAtrnG-GCCtrnG-UCC
    trnH-GUGtrnI-CAU*、trnI-GAU*、trnK-UUUtrnL-CAA*、trnL-UAAtrnL-UAG
    trnM-CAUtrnN-GUU*、trnP-UGGtrnQ-UUGtrnR-ACG*、trnR-UCU
    trnS-GCUtrnS-GGAtrnS-UGAtrnT-GGUtrnT-UGUtrnV-GAC*、trnV-UAC
    trnW-CCAtrnY-GUAtrnfM-CAU
    37
    其他基因   成熟酶 matK 1
    蛋白酶 clpP1 1
    囊膜蛋白 cemA 1
    乙酰辅酶 A 羧化酶 accD 1
    c-型细胞色素合成基因 ccsA 1
    翻译起始因子 infA 1
    未知功能基因 保守假设叶绿体阅读框架 ycf1*、ycf15*、ycf2*、ycf3、ycf4 8
      说明:*表示该基因的数量有2个。
    下载: 导出CSV

    表  2  ‘怀玉山’高山马铃薯叶绿体基因组同义密码子的使用频率

    Table  2.   Relative synonymous codon usage (RSCU) of chloroplast genome of S. tuberosum var. cormosus ‘Huaiyushan’

    密码子氨基酸相对同义密码子
    使用频率
    数量/个密码子氨基酸相对同义密码子
    使用频率
    数量/个密码子氨基酸相对同义密码子
    使用频率
    数量/个
    GCAAla1.134 37401GGGGly0.731 07333CCUPro1.521 13432
    GCCAla0.718 53254GGUGly1.242 59566AGCSer0.342 61119
    GCGAla0.390 38138CACHis0.479 87149AGUSer1.191 94414
    GCUAla1.756 72621CAUHis1.520 13472UCASer1.197 70416
    AGAArg1.829 81491AUAIle 0.909 09680UCCSer0.955 85332
    AGGArg0.633 54170AUCIle 0.609 63456UCGSer0.595 97207
    CGAArg1.453 42390AUUIle 1.481 281 108UCUSer1.715 93596
    CGCArg0.368 9499CUALeu0.821 14391UAATer1.655 1748
    CGGArg0.424 85114CUCLeu0.434 72207UAGTer0.758 6222
    CGUArg1.289 44346CUGLeu0.403 22192UGATer0.586 2117
    AACAsn0.485 74315CUULeu1.297 86618ACAThr1.221 17421
    AAUAsn1.514 26982UUALeu1.812 39863ACCThr0.771 57266
    GACAsp0.408 80223UUGLeu1.230 66586ACGThr0.446 70154
    GAUAsp1.591 20868AAALys1.462 871 054ACUThr1.560 55538
    UGCCys0.556 2984AAGLys0.537 13387UGGTrp1.000 00490
    UGUCys1.443 71218AUGMet1.987 34628UACTyr0.397 12193
    CAAGln1.491 10712GUGMet0.012 664UAUTyr1.602 88779
    CAGGln0.508 90243UUCPhe0.722 19542GUAVal1.502 75547
    GAAGlu1.477 521 035UUUPhe1.277 81959GUCVal0.52473191
    GAGGlu0.522 48366CCAPro1.193 66339GUGVal0.524 73191
    GGAGly1.571 90716CCCPro0.742 96211GUUVal1.447 80527
    GGCGly0.454 45207CCGPro0.542 25154
    下载: 导出CSV

    表  3  ‘怀玉山’高山马铃薯叶绿体基因最优密码子筛选

    Table  3.   Optimal codon screening of chloroplast genome of S. tuberosum var. cormosus ‘Huaiyushan’

    密码子氨基酸相对同义密
    码子使用率
    密码子高表
    达相对概率
    密码子低表
    达相对概率
    ΔRSCU密码子氨基酸相对同义密
    码子使用率
    密码子高表
    达相对概率
    密码子低表
    达相对概率
    ΔRSCU
    CGU* Arg 1.289 44 0.631 58 1.428 57 0.796 99 UUU Phe 1.277 81 1.315 79 1.200 00 −0.115 79
    AAA* Lys 1.462 87 1.000 00 1.750 00 0.750 00 UUG Leu 1.230 66 0.750 00 0.600 00 −0.150 00
    CUU* Leu 1.297 86 1.022 73 1.500 00 0.477 27 AUU Ile 1.481 28 1.428 57 1.263 16 −0.165 41
    GUU* Val 1.447 80 0.800 00 1.250 00 0.450 00 CAU His 1.520 13 1.333 33 1.000 00 −0.333 33
    GGA* Gly 1.571 90 1.302 33 1.750 00 0.447 67 GAA Glu 1.477 52 1.469 39 1.000 00 −0.469 39
    GUA* Val 1.502 75 1.400 00 1.750 00 0.350 00 ACA Thr 1.221 17 1.000 00 0.444 44 −0.555 56
    GGU* Gly 1.242 59 1.302 33 1.500 00 0.197 67 CCA Pro 1.193 66 1.142 86 0.571 43 −0.571 43
    UCA* Ser 1.197 70 1.000 00 1.153 85 0.153 85 GAU Asp 1.591 20 1.600 00 1.000 00 −0.600 00
    GCU* Ala 1.756 72 2.105 26 2.250 00 0.144 74 AAU Asn 1.514 26 1.600 00 1.000 00 −0.600 00
    CCU* Pro 1.521 13 1.571 43 1.714 29 0.142 86 CAA Gln 1.491 10 1.615 38 1.000 00 −0.615 38
    AUG Met 1.987 34 1.000 00 1.000 00 0.000 00 AGU Ser 1.191 94 1.444 44 0.769 23 −0.675 21
    UAA Ter 1.655 17 1.200 00 1.200 00 0.000 00 CGA Arg 1.453 42 1.421 05 0.714 29 −0.706 76
    UGU Cys 1.443 71 1.000 00 1.000 00 0.000 00 UUA Leu 1.812 39 1.704 55 0.900 00 −0.804 55
    ACU Thr 1.560 55 1.600 00 1.555 56 −0.044 44 UCU Ser 1.715 93 1.888 89 0.769 23 −1.119 66
    GCA Ala 1.134 37 0.421 05 0.375 00 −0.046 05 AGA Arg 1.829 81 2.368 42 1.071 43 −1.296 99
    UAU Tyr 1.602 88 1.548 39 1.500 00 −0.048 39
      说明:标注*的密码子为最优密码子。
    下载: 导出CSV
  • [1] 尹明华, 谭鑫, 郑亚娇, 等. 高海拔生境下‘怀玉山’高山马铃薯和怀玉山本土农家薯块茎的转录组分析[J]. 核农学报, 2019, 33(7): 1330 − 1339.

    YIN Minghua, TAN Xin, ZHENG Yajiao, et al. The transcriptome analysis of alpine potato tuber and local farm potato tuber in Huaiyushan under high altitude habitats [J]. Journal of Nuclear Agricultural Sciences, 2019, 33(7): 1330 − 1339.
    [2] 尹明华, 刘燕, 郁雪婷, 等. ‘怀玉山’高山马铃薯茎尖再生苗6 种病毒的 DAS-ELISA 检测与分析[J]. 浙江农业学报, 2017, 29(10): 1699 − 1705.

    YIN Minghua, LIU Yan, YU Xueting, et al. DAS-ELISA detection and analysis of six kinds of viruses in plantlets regenerated from Huaiyushan high mountain potato shoot-tips [J]. Acta Agriculturae Zhejiangensis, 2017, 29(10): 1699 − 1705.
    [3] 尹明华, 王钦, 张红蕾, 等. 高海拔生境下‘怀玉山’高山马铃薯和本土农家薯的全基因组重测序分析[J]. 基因组学与应用生物学, 2020, 39(3): 1198 − 1207.

    YIN Minghua, WANG Qin, ZHANG Honglei, et al. Whole genome re-sequencing analysis of alpine potato and local farm potato in Huaiyu Mountain under high altitude habitats [J]. Genomics and Applied Biology, 2020, 39(3): 1198 − 1207.
    [4] 洪森荣, 张铭心, 叶思雨, 等. 高山马铃薯种质资源遗传多样性的同工酶分析[J]. 浙江农业学报, 2018, 30(9): 1445 − 1453.

    HONG Senrong, ZHANG Mingxin, YE Siyu, et al. Genetic diversity analysis of alpine potato germplasm resources by isozyme [J]. Acta Agriculturae Zhejiangensis, 2018, 30(9): 1445 − 1453.
    [5] MEHMETOGLU E, KAYMAZ Y, ATES D, et al. The complete chloroplast genome sequence of Cicer echinospermum, genome organization and comparison with related species [J/OL]. Scientia Horticulturae, 2022, 296: 110912[2023-01-20]. doi: 10.1016/j.scienta.2022.110912.
    [6] SHENG Jiajing, YAN Mi, WANG Jia, et al. The complete chloroplast genome sequences of five Miscanthus species, and comparative analyses with other grass plastomes [J/OL]. Industrial Crops and Products, 2021, 162: 113248[2023-01-20]. doi: 10.1016/j.indcrop.2021.113248.
    [7] TANG Danfeng, WEI Fan, KASHIF M H, et al. Analysis of chloroplast differences in leaves of rice isonuclear alloplasmic lines [J]. Protoplasma, 2018, 255(3): 863 − 871.
    [8] LI Guoling, PAN Zonglian, GAO Shichen, et al. Analysis of synonymous codon usage of chloroplast genome in Porphyra umbilicalis [J]. Genes &Genomics, 2019, 41(10): 1173 − 1181.
    [9] DURET L. Evolution of synonymous codon usage in metazoans [J]. Current Opinion in Genetics &Development, 2002, 12(6): 640 − 649.
    [10] HERSHBERG R, PETROV D A. Selection on codon bias [J]. Annual Review of Genetics, 2008, 42: 287 − 299.
    [11] WANG Hongjun, MENG Tao, WEI Wenqiang. Analysis of synonymous codon usage bias in helicase gene from Autographa californicamultiple ucleopolyhedrovirus [J]. Genes &Genomics, 2018, 40(7): 767 − 780.
    [12] LONG Shiyu, YAO Huipeng, WU Qi, et al. Analysis of compositional bias and codon usage pattern of the coding sequence in Banna virus genome [J]. Virus Research, 2018, 258: 68 − 72.
    [13] 关惜今, 朱智国, 郑昊吉, 等. 马铃薯与其野生近缘种叶绿体基因组差异分析[J]. 云南师范大学学报(自然科学版), 2021, 41(4): 33 − 40.

    GUAN Xijin, ZHU Zhiguo, ZHENG Haoji, et al. Comparative analysis of plastid chloroplast genomes between potato and its wild relatives [J]. Journal of Yunnan Normal University (Natural Sciences Edition), 2021, 41(4): 33 − 40.
    [14] ZHAO Chunbo, CHEN Shanshan, SUN Kai, et al. Sequencing and characterization the complete chloroplast genome of the potato, Solanum tuberosum L. [J]. Mitochondrial DNA Part B, 2019, 4(1): 953 − 954.
    [15] CHUNG H J, JUNG J D, PARK H W, et al. The complete chloroplast genome sequences of Solanum tuberosum and comparative analysis with Solanaceae species identified the presence of a 241-bp deletion in cultivated potato chloroplast DNA sequence [J]. Plant Cell Reports, 2006, 25: 1369 − 1379.
    [16] CHEN Shanshan, ZHAO Yanfei, ZHANG Jingying, et al. Characterization of the complete chloroplast genome of the Solanum tuberosum L. cv. Shepody (Solanaceae) [J]. Mitochondrial DNA Part B, 2021, 6(8): 2342 − 2344.
    [17] PARK T H. Complete chloroplast genome sequence of the wild diploid potato relative, Solanum acaule [J]. Mitochondrial DNA Part B, 2021, 6(3): 1189 − 1191.
    [18] PARK T H. Complete chloroplast genome sequence of the wild diploid potato relative, Solanum brevicaule [J]. Mitochondrial DNA Part B, 2019, 4(2): 4159 − 4160.
    [19] KHAN A R, PARK C E, PARK G S, et al. The whole chloroplast genome sequence of black nightshade plant (Solanum nigrum) [J]. Mitochondrial DNA Part A, 2015, 28(2): 169 − 170.
    [20] 尹明华, 卢咏琪, 罗怿文, 等. 怀玉山高山马铃薯脱落酸和环境胁迫诱导蛋白基因的克隆和序列分析[J]. 西南农业学报, 2021, 34(6): 1181 − 1187.

    YIN Minghua, LU Yongqi, LUO Yiwen, et al. Cloning and sequence analysis of abscisic acid and environmental stress inducible protein gene in alpine potato in Huaiyushan [J]. Southwest China Journal of Agricultural Sciences, 2021, 34(6): 1181 − 1187.
    [21] 尹明华, 叶思雨, 宁本松, 等. 高山马铃薯脱毒苗DNA甲基化的MSAP分析[J]. 核农学报, 2019, 33(6): 1079 − 1087.

    YING Minghua, YE Siyu, NING Bensong, et al. MSAP analysis of genomic DNA methylation in virus-free plantlets of alpine potato [J]. Journal of Nuclear Agricultural Sciences, 2019, 33(6): 1079 − 1087.
    [22] FENG Shangguo, ZHENG Kaixin, JIAO Kaili, et al. Complete chloroplast genomes of four Physalis species (Solanaceae): lights into genome structure, comparative analysis, and phylogenetic relationships [J/OL]. BMC Plant Biology, 2020, 20(1): 242[2023-01-20]. doi: 10.1186/s12870-020-02429-w.
    [23] ZHANG Tongwu, FANG Yongjun, WANG Xumin, et al. The complete chloroplast and mitochondrial genome sequences of Boeahygrometrica: insights into the evolution of plant organellar genomes [J/OL]. PLoS One, 2012, 7(1): e30531[2023-01-20]. doi: 10.1371/journal.pone.0030531.
    [24] 李连星, 彭劲谕, 王大玮, 等. 长爪栘[木衣]叶绿体基因组特征系统发育及密码子偏好性分析[J]. 生物工程学报, 2022, 38(1): 328 − 342.

    LI Lianxing, PENG Jinyu, WANG Dawei, et al. Chloroplast genome phylogeny and codon preference of Docynia longiunguis [J]. Chinese Journal of Biotechnology, 2022, 38(1): 328 − 342.
    [25] PROVAN J, POWELL W, HOLLINGSWORTH P M. Chloroplast microsatellites: new tools for studies in plant ecology and evolution [J]. Trends in Ecology &Evolution, 2001, 16(3): 142 − 147.
    [26] KAUNDUN S S, MATSUNOTO S. Heterologous nuclear and chloroplast microsatellite amplification and variation in tea, Camellia sinensis [J]. Genome, 2002, 45: 1041 − 1048.
    [27] ZHANG Xinye, SHIRAISHI S, HUANG Minren. Analysis of genetic structure in population of Larix kaempferi by chloroplast SSR markers [J]. Hereditas, 2004, 26(4): 486 − 490.
    [28] ZHAO Yuhui, LU Dengxue, HAN Rongbing, et al. The complete chloroplast genome sequence of the shrubby cinquefoil Dasiphora fruticosa (Rosales: Rosaceae) [J]. Conservation Genetics Resources, 2018, 10(4): 675 − 678.
    [29] WANG Wenbin, YU Huan, WANG Jiahui, et al. The complete chloroplast genome sequences of the medicinal plant Forsythia suspensa (Oleaceae) [J/OL]. International Journal of Molecular Sciences, 2017, 18(11): 2288[2023-01-20]. doi: 10.3390/ijms18112288.
    [30] KURLAND C, GALLANT J. Errors of heterologous protein expression [J]. Current Opinion in Biotechnology, 1996, 7(5): 489 − 493.
    [31] QIAN Wenfeng, ZHANG Jianzhi. Codon usage bias and nuclear mRNA concentration: correlation vs. causation [J/OL]. Proceedings of the National Academy of Sciences, 2021, 118: e2104714118[2023-01-20]. doi: 10.1073/pnas.2104714118.
    [32] GUSTAFSSON C, GOVINDARAJAN S, MINSHULL J. Codon bias and heterologous protein expression [J]. Trends in Biotechnology, 2004, 22(7): 346 − 353.
    [33] BUTT A M, NASRULLAH I, TONG Yigang. Genome-wide analysis of codon usage and influencing factors in chikungunya viruses [J/OL]. PLoS One, 2014, 9(3): e90905[2023-01-20]. doi: 10.1371/journal.pone.0090905.
    [34] BHATTACHARYYA D, UDDIN A, DAS S, et al. Mutation pressure and natural selection on codon usage in chloroplast genes of two species in Pisum L. (Fabaceae: Faboideae) [J]. Mitochondrial DNA Part A, 2019, 30(4): 664 − 673.
    [35] GU Wanjun, ZHOU Tong, MA Jianmin, et al. The relationship between synonymous codon usage and protein structure in Escherichia coli and Homo sapiens [J]. Biosystems, 2004, 73(2): 89 − 97.
    [36] INGVARSSON P K. Gene expression and protein length influence codon usage and rates of sequence evolution in Populus tremula [J]. Molecular Biology and Evolution, 2006, 24(3): 836 − 844.
    [37] 尚明照, 刘方, 华金平, 等. 陆地棉叶绿体基因组密码子使用偏性的分析[J]. 中国农业科学, 2011, 44(2): 245 − 253.

    SHANG Mingzhao, LIU Fang, HUA Jinping, et al. Analysis on codon usage of chloroplast genome of Gossypium hirsutum [J]. Scientia Agricultura Sinica, 2011, 44(2): 245 − 253.
    [38] LIU Qingpo, XUE Qingzhong. Comparative studies on codon usage pattern of chloroplasts and their host nuclear genes in four plant species [J]. Journal of Genetics, 2005, 84(1): 55 − 62.
    [39] PLOTKIN J B, KUDLA G. Synonymous but not the same: the causes and consequences of codon bias [J]. Nature Reviews Genetics, 2011, 12(1): 32 − 42.
    [40] ZHOU Zhipeng, DANG Yunkun, ZHOU Mian, et al. Codon usage is an important determinant of gene expression levels largely through its effects on transcription [J/OL]. Proceedings of the National Academy of Sciences, 2016, 113(41): E6117 − E6125[2023-01-20]. doi: 10.1073/pnas.1606724113.
    [41] ZHOU Tao, ZHU Honghong, WANG Jian, et al. Complete chloroplast genome sequence determination of Rheum species and comparative chloroplast genomics for the members of Rumiceae [J]. Plant Cell Reports, 2020, 39(6): 811 − 824.
  • [1] 王书伟, 周明兵.  毛竹ICE基因家族的全基因组鉴定及低温胁迫下的表达模式分析 . 浙江农林大学学报, doi: 10.11833/j.issn.2095-0756.20230445
    [2] 段春燕, 王晓凌.  重瓣榆叶梅全叶绿体基因组遗传特征分析 . 浙江农林大学学报, doi: 10.11833/j.issn.2095-0756.20230489
    [3] 吴民华, 叶晓霞, 谭靖怡, 梁秋婷, 吴子健, 黄琼林.  了哥王叶绿体基因组分析 . 浙江农林大学学报, 2024, 41(2): 297-305. doi: 10.11833/j.issn.2095-0756.20230412
    [4] 周佳圆, 钟玉, 努尔阿斯娅·伊马木, 崔敏龙, 朴春兰.  龙葵UNUSUAL FLORAL ORGANSSnUFO2基因C端序列的保守性对花发育的影响 . 浙江农林大学学报, 2023, 40(1): 38-44. doi: 10.11833/j.issn.2095-0756.20220217
    [5] 周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南.  荆芥HD-Zip基因家族的全基因组鉴定及分析 . 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
    [6] 王杰, 贺文闯, 向坤莉, 武志强, 顾翠花.  基因组时代的植物系统发育研究进展 . 浙江农林大学学报, 2023, 40(1): 227-236. doi: 10.11833/j.issn.2095-0756.20220313
    [7] 陈雪冰, 刘聪, 程赫, 姜廷波, 夏德安, 魏志刚.  毛果杨ZHD家族全基因组水平鉴定及在干旱胁迫下的表达分析 . 浙江农林大学学报, 2022, 39(3): 465-474. doi: 10.11833/j.issn.2095-0756.20210373
    [8] 刘俊, 李龙, 陈玉龙, 刘燕, 吴耀松, 任闪闪.  杜仲CONSTANS-like全基因组鉴定、系统进化及表达模式分析 . 浙江农林大学学报, 2022, 39(3): 475-485. doi: 10.11833/j.issn.2095-0756.20210385
    [9] 黄元城, 郭文磊, 王正加.  薄壳山核桃全基因组LBD基因家族的生物信息学分析 . 浙江农林大学学报, 2021, 38(3): 464-475. doi: 10.11833/j.issn.2095-0756.20200454
    [10] 阮诗雨, 张智俊, 陈家璐, 马瑞芳, 朱丰晓, 刘笑雨.  毛竹GRF基因家族全基因组鉴定与表达分析 . 浙江农林大学学报, 2021, 38(4): 792-801. doi: 10.11833/j.issn.2095-0756.20200544
    [11] 陈娅欣, 周明兵.  毛竹长末端重复序列反转录转座子的全基因组特征及进化分析 . 浙江农林大学学报, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
    [12] 郑钢, 顾翠花, 林琳, 王杰.  20种千屈菜科植物rbcL基因密码子使用偏好性分析 . 浙江农林大学学报, 2021, 38(3): 476-484. doi: 10.11833/j.issn.2095-0756.20200390
    [13] 洪森荣, 曾清华, 谭鑫, 陈永华, 郑亚娇, 徐迎昕, 邱梦琴.  上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析 . 浙江农林大学学报, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
    [14] 王树和, 周彩勤, 张奎望, 刘慧迪.  金叶女贞棒孢叶斑病菌的生物学特性、致病性及系统发育 . 浙江农林大学学报, 2019, 36(6): 1174-1181. doi: 10.11833/j.issn.2095-0756.2019.06.015
    [15] 李思巧, 韦伊, 刘洪妤, 张志东, 张野, 王丽华, 刘玉林.  花椒cpSSR标记开发及在种间、种内的通用性分析 . 浙江农林大学学报, 2019, 36(6): 1241-1246. doi: 10.11833/j.issn.2095-0756.2019.06.023
    [16] 陆军, 孙丽娟, 王晓荣, 吉泓睿, 倪晓详, 程龙军.  巨桉糖基转移酶基因EgrGATL1序列特征及表达分析 . 浙江农林大学学报, 2018, 35(4): 604-611. doi: 10.11833/j.issn.2095-0756.2018.04.004
    [17] 黄耀辉, 张超, 周莉花, 赵宏波.  基于转录组序列的夏蜡梅SSR位点特征与引物开发 . 浙江农林大学学报, 2017, 34(4): 589-596. doi: 10.11833/j.issn.2095-0756.2017.04.004
    [18] 黄笑宇, 许在恩, 郭小勤.  基于全基因组的毛竹同义密码子使用偏好性分析 . 浙江农林大学学报, 2017, 34(1): 120-128. doi: 10.11833/j.issn.2095-0756.2017.01.017
    [19] 李洪滨, 朱诚棋, 周湘, 马良进, 苏秀.  红哺鸡竹异香柱菌的形态学和分子鉴定 . 浙江农林大学学报, 2016, 33(6): 1040-1044. doi: 10.11833/j.issn.2095-0756.2016.06.016
    [20] 王策, 秦静静, 甘红豪1, 李红, 罗志斌.  毛果杨全基因组磷酸根转运蛋白家族成员序列分析 . 浙江农林大学学报, 2012, 29(4): 516-526. doi: 10.11833/j.issn.2095-0756.2012.04.006
  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20230169

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2024/1/92

图(5) / 表(3)
计量
  • 文章访问数:  106
  • HTML全文浏览量:  36
  • PDF下载量:  18
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-02-20
  • 修回日期:  2023-10-30
  • 录用日期:  2023-11-06
  • 网络出版日期:  2023-12-22
  • 刊出日期:  2024-02-20

‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析

doi: 10.11833/j.issn.2095-0756.20230169
    基金项目:  国家自然科学基金资助项目(32060092,31960079);2022年上饶市科技专项项目(2022A008);江西省科技厅重点研发计划一般项目(20192BBF60006,20202BBF63001);江西省教育厅科学技术研究项目(GJJ201704,GJJ211729);江西省现代农业产业技术体系建设专项(JXARS-13-赣东站);上饶市科技局平台载体建设项目(2020I001,2020J001)
    作者简介:

    洪森荣(ORCID: 0000-0002-9219-8303),教授,从事植物生物技术研究。E-mail: hongsenrong@163.com

  • 中图分类号: S532

摘要:   目的  分析‘怀玉山’高山马铃薯Solanum tuberosum var. cormosus ‘Huaiyushan’叶绿体基因组特征及密码子使用偏好性,为开展‘怀玉山’高山马铃薯叶绿体基因组密码子优化、叶绿体基因组改造,探索物种进化和增加外源基因表达等研究提供参考依据和理论基础。  方法  采用高通量测序技术对‘怀玉山’高山马铃薯叶绿体基因组进行测序,并利用生物信息学分析软件对组装和注释后的叶绿体基因组进行结构、基因组成及密码子偏好性分析。  结果  ‘怀玉山’高山马铃薯叶绿体基因组大小为155 296 bp,为经典的4段式结构。大单拷贝区(LSC)、小单拷贝区(SSC)和反向重复区(IR)长度分别为85 737、18 373、25 593 bp,总鸟嘌呤和胞嘧啶所占的比例(GC比例)为37.88%,共注释出133个基因,包含87个编码区(CDS)基因、37个tRNA基因、8个rRNA基因和1个假基因。‘怀玉山’高山马铃薯叶绿体基因组中共检测到38个简单重复序列位点(SSR位点,36个单碱基重复和2个双碱基重复)和32个长重复序列(16个正向重复和16个回文重复)。‘怀玉山’高山马铃薯叶绿体基因组核苷酸多样性为0~0.139 27,高变区主要分布在大单拷贝区和小单拷贝区,大单拷贝区trnL-UAA-trnF-GAAcemArps12-exon1-clpP1、clpP1基因变异率最高,小单拷贝区rpl32-trnL-UAGycf1基因变异率最高。‘怀玉山’高山马铃薯叶绿体基因组87个CDS基因的平均有效密码子数(ENC)为47.29,ENC>45的基因有60个,密码子偏性较弱。‘怀玉山’高山马铃薯叶绿体基因组密码子偏好以A、U结尾,使用偏性很大程度上受自然选择的影响,而受突变压力的影响小。CGU、AAA、CUU、GUU、GGA、GUA、GGU、UCA、GCU、CCU为‘怀玉山’高山马铃薯叶绿体基因组的10个最优密码子。  结论  ‘怀玉山’高山马铃薯与马铃薯栽培种S. tuberosum‘Desiree’亲缘关系较近。图5表3参41

English Abstract

洪森荣, 张牧彤, 徐子林, 张钦荣, 罗雨欣, 田文慧, 王心雨. ‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析[J]. 浙江农林大学学报, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
引用本文: 洪森荣, 张牧彤, 徐子林, 张钦荣, 罗雨欣, 田文慧, 王心雨. ‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析[J]. 浙江农林大学学报, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
HONG Senrong, ZHANG Mutong, XU Zilin, ZHANG Qinrong, LUO Yuxin, TIAN Wenhui, WANG Xinyu. Chloroplast genome characteristics and codon usage preference of Solanum tuberosum var. cormosus ‘Huaiyushan’[J]. Journal of Zhejiang A&F University, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
Citation: HONG Senrong, ZHANG Mutong, XU Zilin, ZHANG Qinrong, LUO Yuxin, TIAN Wenhui, WANG Xinyu. Chloroplast genome characteristics and codon usage preference of Solanum tuberosum var. cormosus ‘Huaiyushan’[J]. Journal of Zhejiang A&F University, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
  • ‘怀玉山’高山马铃薯Solanum tuberosum var. cormosus ‘Huaiyushan’,又名麻籽洋芋,茄科Solanaceae茄属Solanum 1年生草本植物,主要种植区域为江西省玉山县怀玉乡[1]。‘怀玉山’高山马铃薯食用、药用皆优,获批为国家地理标志农产品[23]。已有研究表明:‘怀玉山’高山马铃薯与云南德宏和曲靖以及湖北恩施的高山马铃薯种质存在差异[4]。但‘怀玉山’高山马铃薯的进化来源尚无相关研究报道。

    叶绿体是高等植物细胞内一种重要的与光合作用和物质代谢相关的细胞器,叶绿体基因组是一套具有母系遗传特征的独立基因组,是高等植物细胞质基因组的组成成分之一[5]。与核基因组相比,叶绿体基因组全长序列短、易测序获得、基因直系同源、基因结构稳定、保守性较高、进化速率适中,目前已经广泛应用于植物系统发育分析、物种分类鉴定及分子标记开发等研究中,在物种起源、进化、演变及比较基因组学等研究领域发挥着越来越大的作用[6]。密码子是核酸和蛋白质之间遗传信息传递的桥梁[7],mRNA上的遗传信息以tRNA三重密码子传递。氨基酸一般对应≥1的密码子[8],这些密码子称为同义密码子[9]。在自然选择或突变偏好的情况下,基因倾向于使用≥1的同义密码子,即同义密码子使用偏好性[1012]。目前,关于茄属的叶绿体基因组研究已有报道[1319],而针对‘怀玉山’高山马铃薯的研究大多集中在基因克隆[20]、转录组分析[3]、遗传多样性[4]、脱毒快繁[2]、DNA甲基化敏感扩增多态性(MSAP)分析[21]等方面,对‘怀玉山’高山马铃薯叶绿体全基因组及其密码子使用偏好性方面的研究还未见系统报道。本研究通过对‘怀玉山’高山马铃薯叶绿体基因组进行测序和组装,分析基于叶绿体基因组的‘怀玉山’高山马铃薯系统进化、结构解析和密码子偏好性等,为‘怀玉山’高山马铃薯叶绿体基因组研究和应用提供科学依据,也为进一步研究‘怀玉山’高山马铃薯遗传背景、种质资源保护与开发利用奠定基础。

    • 由上饶市薯芋类作物种质保存与利用重点实验室提供的‘怀玉山’高山马铃薯试管苗。

    • 选取‘怀玉山’高山马铃薯(MLS)试管苗叶片组织,利用植物基因组DNA提取试剂盒(北京天根生化科技有限公司)提取‘怀玉山’高山马铃薯试管苗DNA,质量分数为1%琼脂糖凝胶电泳检测DNA的完整性,NanoDrop 2000 分光光度计(Thermo Scientific公司)检测 DNA 浓度和纯度,用超声波将DNA片段化,然后对片段化的DNA进行片段纯化、末端修复、3′端加A、连接测序接头,再用琼脂糖凝胶电泳进行片段大小选择,进行聚合酶链式反应(PCR)扩增形成测序文库。建好的文库先进行文库质检,质检合格的文库用BGISEQ-500平台进行测序。

    • 通过SOAPnuk 1.3.0对raw data (测序下机的原始数据)进行数据过滤,去除其中的接头序列及低质量reads (高通量测序中一个反应获得的测序序列),获得高质量的clean data (对原始数据进行过滤后并剔除了低质量数据的剩余数据)。采用Noveplastys软件组装叶绿体基因组核心模块,以起始组装序列为起点开始组装叶绿体contigs (很多reads根据序列拼接在一起拼出的片段),如果contigs未环化,则利用CAP 3软件连接多个contigs为完整叶绿体基因组,并手动调整环状叶绿体基因组起始位置。使用GeSeq、tRNAscan-SE对叶绿体基因组进行注释,再经过手工校正后得到最终的基因注释结果。将注释完成的‘怀玉山’高山马铃薯叶绿体基因组序列提交至美国国家生物信息中心(NCBI),获得登录号:OP589401。使用OGDRAW绘制叶绿体基因组图谱。

    • 通过JSHYCloud在线工具集分析并统计叶绿体基因组、大单拷贝区(LSC)、小单拷贝区(SSC)和反向重复区(IR)的鸟嘌呤和胞嘧啶所占的比例(GC比例);使用MISA软件进行简单重复序列(SSR)分析,单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸的最小重复值分别设置为10、6、5、5、5、5;利用REPuter软件进行长重复序列(longrepeat)分析,查找正向重复(F)、反向重复(R)、互补重复(C)、回文重复(P)等4种重复类型;通过Pasteur Galaxy 在线工具集中的CodonW模块分析密码子使用情况,设置输出结果为有效密码子数(ENC)和相对同义密码子使用频率(RSCU),其他参数设为默认值。将‘怀玉山’高山马铃薯叶绿体基因组序列上传至美国国家生物技术信息中心(NCBI) 进行BLASTn比对,选择highly similar sequence (megablast)比较相似性在95 %以上的序列,检索获得‘怀玉山’高山马铃薯的近缘种。利用Gview、VISTA tools、IRscope和DNADnaSP 6.0软件绘制‘怀玉山’高山马铃薯及其10个近缘种(S. cochoae NC_062512、多毛番茄S. habrochaites NC_026879、潘那利番茄S. pennellii NC_035742、S. bukasovii MT120867、S. boliviense NC_062870、S. trisectum NC_062469、S. salamancae NC_062480、S. clivorum NC_062513、S. mortonii NC_062426、S. insanum MW384851)的变异圈图、mVIST结构变异图、IR结构变异图,计算‘怀玉山’高山马铃薯及其10个近缘种的基因组核酸多样性(Pi),参数设置100 bp滑窗,25 bp的步长,并进行中性绘图分析(GC3-GC12分析)、ENC-plot分析、PR2-bias-plot分析和最优密码子分析;对‘怀玉山’高山马铃薯叶绿体基因的ENC进行排序,分别选取两端基因各5个,构建高表达基因库(ENC小)和低表达基因库(ENC大),并计算两者的RSCU差值(ΔRSCU)。筛选ΔRSCU≥0.08的高表达密码子,且将RSCU>1.00的高频率密码子定义为‘怀玉山’高山马铃薯叶绿体基因组的最优密码子;最后利用mafft 7.0和fasttree 2.1.10软件分别对‘怀玉山’高山马铃薯和18个近缘种以及烟草属Nicotiana 2个外类群物种进行序列比对和构建进化树。

    • 经过测序组装的完整的叶绿体基因组长度为155 296 bp,图1显示:‘怀玉山’高山马铃薯叶绿体基因组呈典型的四分体结构,包含1个LSC、1个SSC和2个将LSC与SSC分隔开的IR (IRa和IRb)。基因组的总GC比例为37.88%,A、T、C、G比例分别为30.65%、31.47%、19.24%、18.65%。LSC、SSC和IR的长度分别为85 737、18 373、25 593 bp。LSC的GC比例为36.01%,A、T、C、G比例分别为31.29%、32.70%、18.40%、17.61%;SSC的GC比例为32.09%,A、T、C、G比例分别为33.78%、34.14%、16.69%、15.40%;IRb的GC比例为43.10%,A、T、C、G比例分别为28.57%、28.33%、20.72%、22.39%;IRa的GC比例为43.10%,A、T、C、G比例分别为28.33%、28.57%、22.39%、20.72%。表明‘怀玉山’高山马铃薯IR的GC比例最大,LSC次之,SSC最少;叶绿体基因组总GC比例显著低于AT比例;叶绿体基因组各碱基比例从大到小依次为T、A、C、G。

      图  1  ‘怀玉山’高山马铃薯叶绿体基因组图谱

      Figure 1.  Chloroplast genome map of S. tuberosum var. cormosus ‘Huaiyushan’

    • 叶绿体基因组共注释到光合作用基因、自我复制基因、其他基因和未知功能基因4类,包括87个编码区(CDS)基因、37个tRNA基因、8个rRNA 基因、1个假基因,共133个基因。对有多个外显子的叶绿体基因进行结构分析,由2个外显子构成的基因有21个,包括13个CDS基因和8个tRNA基因;由 3个外显子构成的基因有4个,为clpP1、ycf3、rps12 (2个)基因。LSC的基因数量最多(81个),其中CDS基因59个、tRNA基因22个;SSC的基因数量为11个,其中CDS基因10个、tRNA基因1个;IR的基因数量为17个,其中CDS基因6个、rRNA基因4个、tRNA基因7个;SSC与IRb边界(JSB)的基因数量为2个(ndhFycf1);LSC与IRb边界(JLB)的基因数量为1个(rps19);SSC与IRa边界(JSA)的基因数量为2个(ycf1);LSC与IRa边界(JLA)的基因数量为0。rps12有2个拷贝,每个拷贝具有3个外显子,且2个拷贝共享第1个外显子,第1个外显子位于LSC,另外2个外显子位于IR (表1)。

      表 1  ‘怀玉山’高山马铃薯叶绿体基因功能分类

      Table 1.  Chloroplast gene functional classification of S. tuberosum var. cormosus ‘Huaiyushan’

      基因功能基因类型基因名基因数
      量/个
      光合作用   光系统Ⅰ psaApsaBpsaCpsaIpsaJ 5
      光系统Ⅱ psaJpsbApsbBpsbCpsbDpsbEpsbFpsbH*、psbIpsbKpsbLpsbM
      psbTpsbZ
      15
      NADH 脱氢 ndhAndhB*、ndhCndhDndhEndhFndhGndhHndhIndhJndhK 12
      细胞色素 b/f 复合体 petApetBpetDpetGpetLpetN 6
      ATP 合成酶 atpAatpBatpEatpFatpHatpI 6
      自我复制   核糖体大亚基蛋白质 rpl14、rpl16、rpl2*、rpl20、rpl22、rpl23*、rpl32、rpl33、rpl36 11
      核糖体小亚基蛋白质 rps11、rps12*、rps14、rps15、rps16、rps18、rps19、
      rps2、rps3、rps4、rps7*、rps8
      14
      核糖体大亚基 rbcL 1
      RNA 聚合酶 rpoArpoBrpoC1、rpoC2 4
      核糖体RNA rrn16*、rrn23*、rrn4.5*、rrn5* 8
      转运RNA trnA-UGC*、trnC-GCAtrnD-GUCtrnE-UUCtrnF-GAAtrnG-GCCtrnG-UCC
      trnH-GUGtrnI-CAU*、trnI-GAU*、trnK-UUUtrnL-CAA*、trnL-UAAtrnL-UAG
      trnM-CAUtrnN-GUU*、trnP-UGGtrnQ-UUGtrnR-ACG*、trnR-UCU
      trnS-GCUtrnS-GGAtrnS-UGAtrnT-GGUtrnT-UGUtrnV-GAC*、trnV-UAC
      trnW-CCAtrnY-GUAtrnfM-CAU
      37
      其他基因   成熟酶 matK 1
      蛋白酶 clpP1 1
      囊膜蛋白 cemA 1
      乙酰辅酶 A 羧化酶 accD 1
      c-型细胞色素合成基因 ccsA 1
      翻译起始因子 infA 1
      未知功能基因 保守假设叶绿体阅读框架 ycf1*、ycf15*、ycf2*、ycf3、ycf4 8
        说明:*表示该基因的数量有2个。
    • 叶绿体基因组中共检测到38个SSR位点,其中,单碱基重复有36个,双碱基重复有2个。其中,重复单元为A/T,重复频率为10的SSR位点数量最多(18个),重复频率为11的SSR位点数量次之(11个);重复单元为AT/AT、重复频率为6的SSR位点数量为2个。

    • 叶绿体基因组共鉴定到32个长重复序列,包括16个正向重复(15个30~39 bp,1个40~49 bp),16个回文重复 (13个30~39 bp,2个40~49 bp,1个50~59 bp),无反向重复和互补重复。

    • ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组结构从LSC中间呈线性展开,均由1个LSC、1个SSC和2个IR (IRa和IRb) 4部分组成。‘怀玉山’高山马铃薯及其10个近缘种rpl22、rps19、rpl2、ycf1、ndhFtrnHpsbA位置基本一致,但收缩和扩张的长度存在一些差异(图2)。

      图  2  ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组大单拷贝区、小单拷贝区和反向重复区边界位置的比较

      Figure 2.  Comparison on the boundary locations of large single copy region, small single copy region and inverted repeat region in chloroplast genomes of S. tuberosum var. cormosus ‘Huaiyushan’ and its 10 related species

    • ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组核苷酸多样性的变化范围为0~0.13927,高变区主要分布在LSC和SSC。LSC的trnL-UAA-trnF-GAAcemArps12-exon1-clpP1、clpP1基因变异率最高;SSC的rpl32-trnL-UAGycf1基因变异率最高。

    • 叶绿体基因组87个CDS基因密码子3个位置GC比例的平均值为38.38%,GC1、GC2、GC3分别为45.98%、39.55%、29.60%,这说明GC在密码子3个位点上的分布存在显著差异,只有GC2与平均GC大致接近(图3)。ENC是密码子偏性分析的重要指标,通常将35作为区分值来评估密码子偏倚的强度。叶绿体基因组87个CDS 基因的平均ENC为47.29,ENC>45的基因有60个,ENC>35的基因有83个,有4个基因的ENC<35,这表明叶绿体基因组的密码子偏性较弱。通过SPSS 20.0进行相关性分析,结果表明:密码子总GC比例(GCall)与GC1、GC2在0.01水平上均存在极显著的正相关,GCall与GC3在0.05水平上显著相关;GC1与GC2在0.05水平上存在显著正相关,但两者均与GC3不相关。这表明叶绿体基因组密码子前2位的碱基组成相似,而与第3位不相似。ENC与GC1、GC2、GC3均不相关,说明密码子上第1位、第2位和第3位的碱基组成对ENC没有显著影响。叶绿体基因组 87个CDS基因序列共有31个RSCU>1的密码子。在这31个密码子中,除AUG、UUG外,其余都以A、U结尾,表明A、U碱基在密码子最后位点上出现的频率最高。‘怀玉山’高山马铃薯叶绿体基因组密码子偏好以A、U结尾(表2)。

      图  3  ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组密码子组成成分分析

      Figure 3.  Composition analysis of chloroplast genome codons of S. tuberosum var. cormosus ‘Huaiyushan’ and its 10 related species

      表 2  ‘怀玉山’高山马铃薯叶绿体基因组同义密码子的使用频率

      Table 2.  Relative synonymous codon usage (RSCU) of chloroplast genome of S. tuberosum var. cormosus ‘Huaiyushan’

      密码子氨基酸相对同义密码子
      使用频率
      数量/个密码子氨基酸相对同义密码子
      使用频率
      数量/个密码子氨基酸相对同义密码子
      使用频率
      数量/个
      GCAAla1.134 37401GGGGly0.731 07333CCUPro1.521 13432
      GCCAla0.718 53254GGUGly1.242 59566AGCSer0.342 61119
      GCGAla0.390 38138CACHis0.479 87149AGUSer1.191 94414
      GCUAla1.756 72621CAUHis1.520 13472UCASer1.197 70416
      AGAArg1.829 81491AUAIle 0.909 09680UCCSer0.955 85332
      AGGArg0.633 54170AUCIle 0.609 63456UCGSer0.595 97207
      CGAArg1.453 42390AUUIle 1.481 281 108UCUSer1.715 93596
      CGCArg0.368 9499CUALeu0.821 14391UAATer1.655 1748
      CGGArg0.424 85114CUCLeu0.434 72207UAGTer0.758 6222
      CGUArg1.289 44346CUGLeu0.403 22192UGATer0.586 2117
      AACAsn0.485 74315CUULeu1.297 86618ACAThr1.221 17421
      AAUAsn1.514 26982UUALeu1.812 39863ACCThr0.771 57266
      GACAsp0.408 80223UUGLeu1.230 66586ACGThr0.446 70154
      GAUAsp1.591 20868AAALys1.462 871 054ACUThr1.560 55538
      UGCCys0.556 2984AAGLys0.537 13387UGGTrp1.000 00490
      UGUCys1.443 71218AUGMet1.987 34628UACTyr0.397 12193
      CAAGln1.491 10712GUGMet0.012 664UAUTyr1.602 88779
      CAGGln0.508 90243UUCPhe0.722 19542GUAVal1.502 75547
      GAAGlu1.477 521 035UUUPhe1.277 81959GUCVal0.52473191
      GAGGlu0.522 48366CCAPro1.193 66339GUGVal0.524 73191
      GGAGly1.571 90716CCCPro0.742 96211GUUVal1.447 80527
      GGCGly0.454 45207CCGPro0.542 25154
    • 分析发现:‘怀玉山’高山马铃薯及其10个近缘种植物叶绿体基因的GC3比例分布为0.142 9~0.443 2,GC12比例分布为0.285 7~0.658 5,两者大多沿对角线上方分布。两者的相关系数(r)为0.110 1 (R2=0.012 1),相关不显著(P>0.05),回归斜率为0.117 5,说明GC12与GC3不相关(图4A)。表明‘怀玉山’高山马铃薯叶绿体基因组密码子使用偏性很大程度上受自然选择的影响,而受突变压力的影响小。

      图  4  ‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组密码子GC3-GC12分析(A)、ENC-plot分析(B)和PR2-plot分析(C)

      Figure 4.  GC3-GC12 analysis (A), ENC-plot analysis (B) and PR2-plot analysis (C) of chloroplast genome codons of S. tuberosum var. cormosus ‘Huaiyushan’ and its 10 related species

    • 分析表明:分布在期望曲线上或曲线附近的基因较少,分布在期望曲线下方且远离曲线的基因较多,说明大部分基因的实际ENC (ENCobs)与理论ENC (ENCexp)存在差异。为了解实际ENC和理论ENC的差异度,计算了‘怀玉山’高山马铃薯ENC比值频数,即(ENCexp-ENCobs)/ENCexp。结果表明:‘怀玉山’高山马铃薯叶绿体基因组基因中,有16.47%(14个)的基因分布在0~0.1区间,分布于期望曲线上或曲线附近,即ENCobs接近于ENCexp值,有83.53%的基因分布在0~0.1区间外,远离期望曲线分布,即ENCexp和ENCobs相差较大,表明自然选择是影响‘怀玉山’高山马铃薯叶绿体基因组密码子使用偏性的主要因素,而突变压力的作用较小(图4B)。

    • 分析表明: A3/AU3轴、G3/GC3轴均以0.5为界限,发现4个平面内基因分布不均衡。从G3/GC3轴看,多数基因位于上方(>0.5),少数基因位于下方(<0.5);从A3/AU3轴看,多数基因位于左侧(<0.5),少数基因位于右侧(>0.5)。这表明4种碱基在同义密码子第3位上存在C>G、T>A现象(图4C)。当密码子使用存在偏性完全受突变压力影响时,C和G以及A和T同义密码子在第3位上的分布应相等。因此,‘怀玉山’高山马铃薯叶绿体基因组密码子使用偏性主要受自然选择等因素影响。

    • RSCU分析可知:同时满足RSCU>1和ΔRSCU≥0.08的密码子共10个,即CGU、AAA、CUU、GUU、GGA、GUA、GGU、UCA、GCU、CCU,这些密码子都以A、U结尾,被确定为‘怀玉山’高山马铃薯叶绿体基因组的最优密码子(表3)。

      表 3  ‘怀玉山’高山马铃薯叶绿体基因最优密码子筛选

      Table 3.  Optimal codon screening of chloroplast genome of S. tuberosum var. cormosus ‘Huaiyushan’

      密码子氨基酸相对同义密
      码子使用率
      密码子高表
      达相对概率
      密码子低表
      达相对概率
      ΔRSCU密码子氨基酸相对同义密
      码子使用率
      密码子高表
      达相对概率
      密码子低表
      达相对概率
      ΔRSCU
      CGU* Arg 1.289 44 0.631 58 1.428 57 0.796 99 UUU Phe 1.277 81 1.315 79 1.200 00 −0.115 79
      AAA* Lys 1.462 87 1.000 00 1.750 00 0.750 00 UUG Leu 1.230 66 0.750 00 0.600 00 −0.150 00
      CUU* Leu 1.297 86 1.022 73 1.500 00 0.477 27 AUU Ile 1.481 28 1.428 57 1.263 16 −0.165 41
      GUU* Val 1.447 80 0.800 00 1.250 00 0.450 00 CAU His 1.520 13 1.333 33 1.000 00 −0.333 33
      GGA* Gly 1.571 90 1.302 33 1.750 00 0.447 67 GAA Glu 1.477 52 1.469 39 1.000 00 −0.469 39
      GUA* Val 1.502 75 1.400 00 1.750 00 0.350 00 ACA Thr 1.221 17 1.000 00 0.444 44 −0.555 56
      GGU* Gly 1.242 59 1.302 33 1.500 00 0.197 67 CCA Pro 1.193 66 1.142 86 0.571 43 −0.571 43
      UCA* Ser 1.197 70 1.000 00 1.153 85 0.153 85 GAU Asp 1.591 20 1.600 00 1.000 00 −0.600 00
      GCU* Ala 1.756 72 2.105 26 2.250 00 0.144 74 AAU Asn 1.514 26 1.600 00 1.000 00 −0.600 00
      CCU* Pro 1.521 13 1.571 43 1.714 29 0.142 86 CAA Gln 1.491 10 1.615 38 1.000 00 −0.615 38
      AUG Met 1.987 34 1.000 00 1.000 00 0.000 00 AGU Ser 1.191 94 1.444 44 0.769 23 −0.675 21
      UAA Ter 1.655 17 1.200 00 1.200 00 0.000 00 CGA Arg 1.453 42 1.421 05 0.714 29 −0.706 76
      UGU Cys 1.443 71 1.000 00 1.000 00 0.000 00 UUA Leu 1.812 39 1.704 55 0.900 00 −0.804 55
      ACU Thr 1.560 55 1.600 00 1.555 56 −0.044 44 UCU Ser 1.715 93 1.888 89 0.769 23 −1.119 66
      GCA Ala 1.134 37 0.421 05 0.375 00 −0.046 05 AGA Arg 1.829 81 2.368 42 1.071 43 −1.296 99
      UAU Tyr 1.602 88 1.548 39 1.500 00 −0.048 39
        说明:标注*的密码子为最优密码子。
    • 基于‘怀玉山’高山马铃薯和18个近缘种以及烟草属2个外类群物种叶绿体基因组构建的系统发育树分析可知:茄属聚为一大类,烟草属聚为另一大类。在茄属中,MLS与S. tuberosum NC_008096 (‘Ddeiree’)聚为一小分支。说明‘怀玉山’高山马铃薯与S. tuberosum ‘Ddeiree’亲缘关系较近,两者同源(图5)。

      图  5  基于叶绿体基因组的‘怀玉山’高山马铃薯及其18个近缘种的系统发育树

      Figure 5.  Phylogenetic tree of S. tuberosum var. cormosus ‘Huaiyushan’ and its 18 related species based on chloroplast genome

    • 叶绿体基因组结构保守、独立母系遗传,是被子植物基因组的重要组成部分,广泛用于被子植物的生长发育、类群分析和进化分析[22]。被子植物叶绿体基因组大小一般为120~180 kb,IR大小一般为20~30 kb [2324]。在本研究中,‘怀玉山’高山马铃薯叶绿体基因组长度和IR长度分别为155 296和25 593 bp,与S. tuberosum ‘Shepody’[16]叶绿体基因组长度和IR长度一致,与其他马铃薯品种[1315, 1718]相比,叶绿体基因组长度和IR长度不超过500 bp,说明马铃薯各个品种的叶绿体基因组较为保守。

      叶绿体的SSR不仅与核基因组SSR一样,具有高多态性、多等位性、共显性[25],也具有单亲遗传模式,结构简单、相对保守[26],因此,叶绿体的SSR有较好的种间、种内遗传变异区分能力,已成为区分物种的重要分子标记而被广泛应用[27]。关惜今等[13]研究表明:S. fernandezianum与其野生近缘种(S. phurejaS. palustreS. etuberosum)叶绿体基因组中共检测到36、36、42、40个SSR,SSR类型比较单一,只有单核苷酸和二核苷酸等2种类型,单核苷酸为A和T等2种类型,二核苷酸包括TA和AT等2种类型,其数目比较少。本研究结果与此一致。在本研究中,在‘怀玉山’高山马铃薯叶绿体基因组中共检测到38个SSR位点,其中,单碱基重复有36个,双碱基重复有2个,较少的SSR位点存在表明‘怀玉山’高山马铃薯叶绿体基因组可能不易发生重排。

      IR和单拷贝区(SC)边界的膨胀和收缩被认为是被子植物叶绿体全基因组大小变化的主要机制[28],同一属不同品种叶绿体基因组IR/SC边界位置变化也不同[29]。关惜今等[13]研究表明:S. fernandezianum与其野生近缘种(S. phurejaS. palustreS. etuberosum)叶绿体基因组rps19基因均横跨JLB,S. phurejandhF基因横跨JSB,S. fernandezianumS. palustreS. etuberosumndhF基因均右移,分布在SSC,S. fernandezianum、S. phurejaS. palustreS. etuberosumycf1基因总长度为5 664 bp,均横跨SSC和IRa区域。在本研究中,对‘怀玉山’高山马铃薯及其10个近缘种叶绿体基因组 IR/SC 边界区域的分析结果表明:这些叶绿体基因组的IR都存在扩张或收缩的现象。‘怀玉山’高山马铃薯的rps19基因横跨 JLB,横跨 JLB的左边和右边长度分别为209和69 bp,在JSA,‘怀玉山’高山马铃薯ycf1基因为5 663 bp,左边和右边长度分别为4 541和1 122 bp。

      许多植物存在密码子偏好性(CUB),即某一或几种特定密码子频率超过其他同义密码子。密码子偏好性可用来评估基因组中蛋白质编码区(CDS)的密码子使用情况[30]。植物密码子偏好性是物种不断适应外界环境进化所导致的结果,生物获得特定的密码子使用模式以适应起源、进化、自然选择和突变压力等多种因素[31]。影响不同物种中密码子偏好性差异的因素主要有碱基突变、基因表达水平、自然选择等,自然选择和突变压力被认为是2个最重要的因素[3234]。密码子第3 个碱基的同义突变不能改变氨基酸的类型,但被认为是决定氨基酸类型的重要特征,因此GC3 经常被用作密码子偏向的重要指标[3536]。本研究发现‘怀玉山’高山马铃薯叶绿体基因组的平均GC 比例为38.38%,GC3为29.60%,更倾向于使用A/T 密码子。RSCU分析结果也证实了这一点。‘怀玉山’高山马铃薯叶绿体基因组中存在A/T 密码子使用偏向,这与大多数高等植物的模式一致[37]。‘怀玉山’高山马铃薯叶绿体基因组平均ENC为47.29,ENC>35的基因有83个,有4个基因的ENC<35,表明‘怀玉山’高山马铃薯叶绿体基因组的密码子偏性较弱。当密码子的使用受到自然选择的影响时,GC3值往往分布在一个较小的范围内,GC12和GC3之间没有显著的相关性[38]。密码子偏好性可以通过调节基因翻译的准确性和效率影响基因表达,基因表达水平越高,密码子偏好性越强[3940]。通过建立的高低基因表达库,本研究挖掘到‘怀玉山’高山马铃薯叶绿体基因组10个最优密码子,即CGU、AAA、CUU、GUU、GGA、GUA、GGU、UCA、GCU、CCU,说明‘怀玉山’高山马铃薯叶绿体基因组密码子更偏好于以A/U 结尾。筛选到的最优密码子可以用于设计叶绿体基因表达载体,以提高叶绿体基因组中基因的表达水平,也可以利用已知密码子的使用偏好来推测和预测未知基因的表达和功能,可为今后从遗传水平上进行‘怀玉山’高山马铃薯育种改良提供参考。

      含有足够信息位点的叶绿体基因组已被证明可有效判断系统发育关系,甚至是在较低的分类学水平下植物之间也有较强的分类学意义,为物种间系统发育的研究提供了新的思路[41]。在本研究中,在茄属中‘怀玉山’高山马铃薯与S. tuberosum ‘Desiree’单独聚为一分支。说明‘怀玉山’高山马铃薯与S. tuberosum ‘Desiree’亲缘关系较近,表明两者同源,推测‘怀玉山’高山马铃薯可能是S. tuberosum ‘Desiree’从美国引种的。

      综上所述,本研究测序组装了‘怀玉山’高山马铃薯叶绿体基因组全序列,分析了其编码蛋白基因的密码子使用特点,从高表达优越密码子和高频密码子中选出两者共有的密码子,最终筛选得到了10个叶绿体蛋白编码基因的最优密码子。‘怀玉山’高山马铃薯密码子的偏好性受到突变、选择及其他多方面因素的共同影响,但自然选择的影响更大,这为用基因工程手段改造外源基因密码子,提高其在‘怀玉山’高山马铃薯叶绿体中的表达量提供了参考,也为在分子水平上研究茄科茄属植物的系统进化提供参考。

参考文献 (41)

目录

    /

    返回文章
    返回