留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

濒危植物新绒苔叶绿体基因组特征及系统发育位置分析

朱梦飞 胡迎峰 师雪芹

魏亚楠, 龚明贵, 白娜, 等. 梁山慈竹叶绿体基因组密码子偏好性分析[J]. 浙江农林大学学报, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
引用本文: 朱梦飞, 胡迎峰, 师雪芹. 濒危植物新绒苔叶绿体基因组特征及系统发育位置分析[J]. 浙江农林大学学报, 2025, 42(1): 55−63 doi:  10.11833/j.issn.2095-0756.20240356
WEI Ya’nan, GONG Minggui, BAI Na, et al. Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus[J]. Journal of Zhejiang A&F University, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
Citation: ZHU Mengfei, HU Yingfeng, SHI Xueqin. Characterization and phylogenetic location analysis of chloroplast of the endangered plant Neotrichocolea bissetii[J]. Journal of Zhejiang A&F University, 2025, 42(1): 55−63 doi:  10.11833/j.issn.2095-0756.20240356

濒危植物新绒苔叶绿体基因组特征及系统发育位置分析

DOI: 10.11833/j.issn.2095-0756.20240356
基金项目: 安徽省自然科学基金资助项目(1608085MC61)
详细信息
    作者简介: 朱梦飞 (ORCID: 0009-0006-6726-0351),从事森林资源与开发利用研究。E-mail: 1178585479@qq.com
    通信作者: 师雪芹 (ORCID: 0000-0003-1742-9578),副教授,博士,从事苔藓植物多样性及保护研究。E-mail: baiyunsxq@163.com
  • 中图分类号: Q75

Characterization and phylogenetic location analysis of chloroplast of the endangered plant Neotrichocolea bissetii

  • 摘要:   目的  新绒苔Neotrichocolea bissetii为东亚特有植物,被世界自然保护联盟(IUCN)列为易危植物。阐明新绒苔叶绿体基因组结构特征及系统进化地位,可为新绒苔的物种鉴定、资源保护和系统进化提供理论参考。  方法  以野外采集的新绒苔为材料,进行DNA提取、测序和组装,分析叶绿体基因组结构、重复序列、密码子偏好性,并结合其余18种苔藓植物叶绿体基因组序列构建系统发育关系。  结果  新绒苔叶绿体全基因组序列全长为118 423 bp,包括1对反向重复区(IR,9 031 bp)、1个大单拷贝区(LSC,80 837 bp)和1个小单拷贝区(SSC,19 524 bp);包含79个蛋白质编码基因,8个核糖体RNA (rRNA)和36个转移RNA (tRNA)。新绒苔叶绿体全基因组中共检测到56个简单重复序列(SSR),大部分为AT/AT二核苷酸序列。密码子偏好性分析表明其密码子偏好以A/U结尾。除了少数可变区域外,新绒苔叶绿体基因组的IR边界区域非常保守。系统发育树表明该种与囊绒苔Trichocoleopsis sacculata亲缘关系最密切,两者隶属于新绒苔科。  结论  新绒苔叶绿体基因组为典型的四分体结构,基因组相对保守。系统发育树分析表明新绒苔与囊绒苔聚合成同一分支结构。图5表3参36
  • 密码子是识别和传递生物体遗传信息、联系蛋白质与DNA之间的重要桥梁,在生物体遗传和变异中起着至关重要的作用[1]。编码同一氨基酸的不同密码子被称为同义密码子。由于基因突变和自然选择的影响,某些同义密码子在蛋白质翻译过程中往往被高频使用,被称为密码子的使用偏好性[23]。物种的生物学功能与密码子偏好性密切相关,密码子偏好性不仅可以影响生物编码基因的蛋白质合成速率和翻译速率[4],还会影响蛋白质结构、折叠程度和mRNA的合成[5]。研究表明:同一物种或亲缘关系相近的物种,具有相似的密码子偏好使用模式[6],通过分析物种的密码子偏好性可以衡量物种之间的基因表达量,进而探究物种之间亲属关系[7]。通过密码子偏好性的研究,能够更好地阐明物种进化过程中基因的表达规律[8],为利用基因工程技术改良物种目标基因提供参考依据[9]

    梁山慈竹Dendrocalamus farinosus属竹亚科Bambusoideae牡竹属Dendrocalamus,又名大叶竹和瓦灰竹,是中国西南地区重要的经济竹种[10],生长速度快,适应性强,竹笋效益高,属于优良的笋竹两用竹种,与硬头黄竹Bambusa rigida都属于竹编和制浆造纸的优质原料[11]。针对梁山慈竹叶绿体基因组密码子使用偏好性的研究鲜见报道。为了更好地挖掘和利用梁山慈竹的潜在经济价值,本研究以梁山慈竹叶绿体基因组序列为研究对象,分析其密码子偏好性使用模式,探究并总结其相关表达基因的密码子偏好性,以期分析影响梁山慈竹叶绿体基因组密码子偏好性的主要因素,并筛选出最优密码子,为后续梁山慈竹叶绿体基因工程改造等研究提供理论基础。

    根据GenBank登录号MZ681865.156在美国国家生物技术信息中心(NCBI)数据库中搜索并下载梁山慈竹叶绿体基因组序列,共有85条编码序列(CDS)。序列重复或小于300 bp会对密码子偏好性指标的测定产生影响[12]。对基因序列进行筛选,剔除序列长度小于300 bp且重复的序列,获取起始密码子为ATG,终止密码子为TAG、TGA和TAA的序列,最终获得51条CDS序列作为后续分析的样本序列。

    运用CodonW1.4.2 (http://sourceforge.net/projects/codonw)和EMBOSS (http://imed.med.ucm.es/EMBOSS/)计算有效密码子数(ENC)、适应指数(CAI)、密码子偏性指数(CBI)、最优密码子频率(FOP)以及密码子第3位核苷酸A、T、C、G的含量(分别记为A3、T3、C3、G3)。利用ENC判断密码子偏好性程度,ENC>35说明密码子偏好性比较弱;反之,说明偏好性强[13]。通过CUSP软件分析并获得密码子鸟嘌呤(G)和胞嘧啶(C)所占的比率(GC比率)及GC平均比率(GCall),使用SPSS 25.0软件对梁山慈竹密码子各位置的GC比率与ENC进行相关分析。

    运用CodonW 1.4.2对同义密码子相对使用度(RSCU)进行分析,即该密码子的实际使用频率与其理论使用频率的比值[14]。当RSCU大于1时,同义密码子中偏好使用该密码子,被称为高频密码子;当RSCU等于1时,密码子无偏好性;当RSCU小于1时,密码子使用偏好性较弱[15]

    中性绘图分析是对影响密码子使用偏好性的关键因素进行分析,X轴为GC3,Y轴为GC1和GC2的平均值,绘制二维散点图对GC3和GC12 (各基因 GC1和GC2的平均值)的相关性进行分析(GC1、GC2、GC3分别代表第1、2、3位密码子的GC比例)。若回归系数接近1,代表GC3和GC12显著相关,碱基组成没有差异,说明突变是决定密码子偏好性的主要因素;若回归系数接近0,则代表自然选择是主要因素。

    ENC-plot绘图分析表现密码子的使用偏好性受到突变和自然选择的影响程度。使用Python 3.7进行ENC-plot绘图分析,构建散点图,横纵坐标分别为GC3、ENC,并绘制ENC的标准曲线。基因位点靠近或在标准曲线上,表明突变是决定密码子偏好性的主要因素,若基因位点和标准曲线距离很大,则说明偏好性主要由自然选择决定。

    PR2-plot分析表明基因中密码子的第3位碱基的构成情况。计算密码子碱基中第3位上4种碱基A、T、C、G比例,G3/(G3+C3)为X轴,A3/(A3+T3)为Y轴,绘制PR2-plot散点图,中心点为碱基比例A=T、C=G时的值,代表处于此区域的密码子并无使用偏好性[16]

    将51条基因升序排列后的ENC前后两端10%的基因建立高、低表达基因库。通过CodonW软件计算2个表达库中密码子的RSCU和ΔRSCU,同时满足高频密码子(RSCU>1)和高表达密码子(ΔRSCU≥0.08)的为最优密码子[17]

    在Codon Usage Database (http://www.kazusa.or.jp/codon/)下载异源表达宿主和植物代表类群,包括巨龙竹D. farinosus、粉麻竹D. sinicus、小叶龙竹D. pulverulentus、硬头黄竹、大肠埃希菌Escherichia coli、烟草Nicotiana tabacum、拟南芥Arabidopsis thaliana和酿酒酵母Saccharomyces cerevisiae等物种基因组密码子的使用频率,与梁山慈竹基因组密码子使用频率比值进行比较分析,当梁山慈竹密码子使用频率比其他生物的比值≥2.0或≤0.5时,说明该物种与梁山慈竹的同义密码子的使用偏好性差异较大,当比值不在上述范围内时,表明这2个物种对该密码子的偏好性较接近。

    将叶绿体基因如表1所示进行功能分类,使用CodinW软件,选择对应分析计算样本中各个基因的RSCU,将分析结果分布在59维向量空间中,分析指标间的对应性。

    表 1  梁山慈竹叶绿体基因结构分析
    Table 1  Structural analysis of the choroplast genome of D. farinosus
    基因分类基因分组基因名称
    光合系统基因光系统Ⅰ基因psaApsaBpsbApsbCpsbDpsbB
    光系统Ⅱ基因petApetBpetD
    细胞色素b/f复合体基因atpAatpBatpEatpFatpI
    三磷酸腺苷合成酶基因ndhAndhBndhCndhDndhEndhFndhGndhHndhIndhJndhK
    遗传系统基因烟酰胺腺票吟二核甘酸氧化还原酶基因rbcL
    二磷酸核酮糖羧化酶大亚基基因rpoArpoBrpoC1、rpoC2
    RNA聚合酶亚基基因rps2、rps3、rps4、rps7、rps8、rps11、rps12、rps14、rps18
    核糖体蛋白小亚基基因rpl2、rpl14、rpl16、rpl20、rpl22
    其他基因成熟酶K基因matK
    膜蛋白基因cemA
    细胞色素合成基因ccsA
    酪蛋白分解蛋白酶基因clpP
    未知功能基因假定叶绿体阅读框ycf2、ycf3、infA
    下载: 导出CSV 
    | 显示表格

    分析梁山慈竹叶绿体基因组CDS序列的碱基组成:梁山慈竹的4种碱基所对应的同义密码子的第3位碱基比例 (T3s、A3s、C3s、G3s)分别为45.28%、42.07%、18.13%、17.96%,T3s和A3s远高于G3s和C3s,表明梁山慈竹叶绿体基因组密码子的第3位碱基以A/U结尾为主。梁山慈竹的ENC为50.40,CAI为16.6%,第3位同义密码子的GC比率 (GC3S)为28.1%,表明其叶绿体基因组密码子偏好性较弱。

    梁山慈竹叶绿体基因组密码子的GC平均比率为39.48%,且GC1 (47.69%)>GC2 (39.70%)>GC3 (31.05%)。ENC为 39.04~61.00,均值为49.51,GC比率在基因密码子上并没有均匀分布(表2)。ENC和密码子3个位置GC比率的相关分析(表3)结果发现:ENC与GC3比率显著相关,与GC1、GC2不显著相关,说明密码子使用偏好性形成过程中GC3的影响作用大于GC1、GC2。

    表 2  梁山慈竹叶绿体基因组各基因密码子相关参数统计
    Table 2  Statistics of codon related parameters of various genes in the chloroplast genome of D. farinosus
    基因GC比率/%ENCCAIFOP基因GC比率/%ENCCAIFOP
    GCGC1GC2GC3GCGC1GC2GC3
    rps1241.8752.0047.2026.4044.850.1400.341rps1833.5334.5039.7726.3239.040.1470.333
    psbA42.5649.7242.9435.0341.330.3130.532rpl2036.1138.3340.8329.1750.970.1120.298
    matK34.4440.8232.4230.0849.490.1660.329clpP43.0152.5338.2538.2552.370.1750.337
    psbD44.4453.3943.5036.4448.990.2420.456psbB44.0154.4245.9731.6350.730.1900.380
    psbC44.6653.5944.7335.6348.910.1830.386petB41.0648.9341.2033.0547.310.1910.333
    rpoB39.1949.8138.0129.7449.690.1530.353petD40.3750.9339.1331.0649.460.1610.305
    rpoC139.8749.9338.0731.6352.770.1560.347rpoA37.0646.1835.5929.4149.940.1510.311
    rpoC238.9549.0136.6431.1852.290.1540.333rps1143.5250.6956.2523.6144.330.1740.396
    rps238.4040.5140.9333.7652.550.1680.338infA40.3543.8635.9641.2361.000.1810.409
    atpI38.8447.5836.2932.6650.550.1630.353rps836.5041.6141.6126.2846.620.1220.374
    atpF38.2747.6235.4531.7553.170.1470.353rpl1438.7154.8437.1024.1951.900.1810.392
    atpA42.0656.0139.9630.1249.960.1820.385rpl1644.7652.1453.5728.5739.410.1150.354
    rps1439.4239.4246.1532.6941.730.1350.384rps333.4743.7531.6725.0048.030.1930.402
    psaB41.8148.7143.1333.6149.340.1720.350rpl2237.5641.3336.6734.6747.480.1880.415
    psaA43.6851.8043.2835.9552.070.1980.373rpl244.5651.7748.5833.3353.330.1430.361
    ycf339.6947.4038.1533.5355.450.1560.343ndhB38.1642.0739.3333.0746.710.1560.348
    rps437.1347.5237.1326.7349.590.1690.386rps739.4949.6845.2223.5748.310.1640.373
    ndhJ39.3849.3836.8831.8851.480.1760.356ndhF34.1937.8438.9225.8146.190.1440.321
    ndhK38.6041.7043.7230.3651.910.1590.329ccsA33.6433.7441.1026.0745.600.1520.307
    ndhC39.6750.4136.3632.3348.750.1770.345ndhD36.1940.7236.9330.9448.980.1330.314
    atpE42.5152.1739.1336.2359.510.1670.405ndhE33.3341.1832.3526.4759.060.1440.316
    atpB42.6253.9141.6832.2647.430.1920.381ndhG34.4644.0732.7726.5545.770.1250.250
    rbcL44.1457.1143.9331.3850.190.2710.454ndhI34.9937.5738.6728.7352.090.1710.345
    ycf441.2248.3939.7835.4847.140.1620.385ndhA33.9842.4236.3623.1444.350.1400.321
    cemA33.6241.9927.7131.1755.910.1760.342ndhH37.8250.7634.7727.9249.950.1550.322
    petA40.2953.5835.232.0951.120.1550.331
    下载: 导出CSV 
    | 显示表格
    表 3  梁山慈竹叶绿体基因组中各基因参数的相关性分析
    Table 3  Correlation analysis of various gene parameters in the chloroplast genome of D. farinosus
    参数GC1GC2GC3ENCCAICBIFOPGC3sGC
    GC11
    GC20.300*1
    GC30.265−0.0091
    ENC0.142−0.425**0.389**1
    CAI0.409**0.0760.370**0.0121
    CBI0.438**0.2720.322*−0.0920.774**1
    FOP0.402**0.312*0.341*−0.0640.797**0.965**1
    GC3s0.271−0.0290.946**0.445**0.330*0.330*0.370**1
    GC0.814**0.673**0.525**0.0100.407**0.512**0.518**0.499**1
      说明: *表示显著相关 (P<0.05);**表示极显著相关 (P<0.01)。
    下载: 导出CSV 
    | 显示表格

    梁山慈竹叶绿体基因组中共包含18110个密码子(表4),总计编码20个氨基酸,密码子数为12~705个,其中密码子UGA共有12个,密码子含量最多的是编码谷氨酸的GAA,共有705个。梁山慈竹叶绿体基因组蛋白编码序列RSCU分析表明:氨基酸含量较高的有亮氨酸(Leu)和精氨酸(Arg),均为6个密码子编码,编码精氨酸的是UUA、UUG、CUU、CUC、CUA和CUG;编码亮氨酸的有AGA、AGG、CGU、CGC、CGA和CGG;除此之外,蛋氨酸(Met)和色氨酸(Trp)均只有1个密码子编码,分别是AUG和UGG,其余氨基酸密码子编码个数分别为2~4个。

    表 4  梁山慈竹叶绿体基因组蛋白编码序列RSCU分析
    Table 4  RSCU of protein coding region in the chloroplast of D. farinosus
    氨基酸
    密码子数量RSCU氨基酸密码子数量RSCU氨基酸
    密码子数量RSCU氨基酸密码子数量RSCU
    PheUUU*6441.29TyrUAU*5321.59SerUCU*3431.58CysUGU*1511.53
    PheUUC3510.71TyrUAC1370.41SerUCC*2601.19CysUGC470.47
    LeuUUA*6341.94TERUAA*281.56SerUCA*2221.02ArgAGA*3221.75
    LeuUUG*3621.11TERUAG140.78SerUCG1190.55ArgAGG1190.64
    LeuCUU*4201.29TERUGA120.67SerAGU*2731.25ArgCGU*2611.41
    LeuCUC1380.42TrpUGG*3281.00SerAGC890.41ArgCGC950.51
    LeuCUA2950.90GlnCAA*4771.53ThrACU*4031.68ArgCGA*2341.27
    LeuCUG1070.33GlnCAG1480.47ThrACC1810.75ArgCGG760.41
    IleAUU*7401.48GluGAA*7051.46ThrACA*2591.08GlyGGU*4211.24
    IleAUC2950.59GluGAG2630.54ThrACG1160.48GlyGGC1450.43
    IleAUA4610.92LysAAA*6471.44AlaGCU*4931.73GlyGGA*5381.58
    MetAUG*4161.00LysAAG2530.56AlaGCC1720.60GlyGGG2590.76
    ValGUU*3821.47AspGAU*5221.54AlaGCA*3431.20ProCCU*2861.48
    ValGUC1260.49AspGAC1550.46AlaGCG1350.47ProCCC*1961.01
    ValGUA*3901.50HisCAU*3111.47AsnAAU*5281.48ProCCA*2091.08
    ValGUG1390.54HisCAC1120.53AsnAAC1870.52ProCCG840.43
      说明:*表示RSCU大于1的高频密码子。
    下载: 导出CSV 
    | 显示表格

    梁山慈竹叶绿体基因组RSCU大于1的密码子数目为34个(分别为UUU、UUA、UUG、CUU、AUU、AUG、GUU、GUA、UCU、UCC、UCA、AGU、ACU、ACA、GCU、GCA、AAU、UAU、UAA、UGG、CAA、GAA、AAA、GAU、CAU、UGU、AGA、CGU、CGA、GGU、GGA、CCU、CCC和CCA),即筛选出了34个高频密码子,其中以A、U、C、G结尾的密码子分别有13、16、2和1个,这说明密码子偏好以A和U结尾,RSCU较高的3个密码子分别为UUU (1.94)、CUA (1.73)和UCU (1.75)。

    中性绘图分析量化自然选择和突变压力之间的关系,阐明3个密码子位置之间的联系。结果表明:横坐标GC3的数值为23.14%~41.23%,纵坐标GC12的数值为39.04%~61.00% (图1)。梁山慈竹的Pearson相关系数为0.17,呈正相关关系,数据拟合后的回归系数为0.1868,决定系数(R2)较小,为0.0282,GC12和GC3的相关性不显著,说明其叶绿体基因组密码子偏好性受自然选择影响较大。

    图 1  中性绘图分析
    Figure 1  Analysis of neutrality plot

    图2显示:ENC分布并不紧密,少量分布在标准曲线附近,还有个别分布在标准曲线上侧,位点的ENC均大于35,与预期ENC值有差距。说明梁山慈竹密码子偏好性较弱且自然选择和突变都对其偏好性有影响。由于落在标准曲线下方的基因点数量比较多,所以梁山慈竹基因组密码子使用偏好性主要受自然选择的影响。

    图 2  ENC-plot分析
    Figure 2  Analysis of ENC-plot

    图3显示:基因位点在平面图4个区域内分布并不均匀,在A3/(A3+T3)<0.5和G3/(G3+C3)>0.5区域范围内分布最多。表明第3位碱基使用频率为:T>A、G>C,梁山慈竹叶绿体基因组密码子的第3位碱基在选择上具有偏好性,同时说明其密码子使用偏好性主要受自然选择的影响。

    图 3  PR2-plot分析
    Figure 3  Analysis of PR2-plot

    对梁山慈竹的ENC进行升序排列,前10%为高表达基因,即rps18、rpl16、psbA、rps14、rps11,后10%为低表达基因,即 ycf3、cemA、ndhE、atpE、infA。梁山慈竹的RSCU和ΔRSCU表明(表5):梁山慈竹叶绿体基因组有32个高频密码子,筛选出GCA、GCU等25个高表达密码子,最终确定18个密码子作为梁山慈竹叶绿体基因组的最优密码子,分别为UAA、GCA、GCU、UUC、GGU、AAA、CUU、UUA、CCA、CCU、CAA、AGA、CGU、AGU、UCC、ACU、GUA、GUU。其中16个以A/U结尾,2个以C结尾。

    表 5  梁山慈竹叶绿体基因组各氨基酸的RSCU分析及最优密码子分析
    Table 5  RSCU analysis and optimal codon analysis of amino acids in chloroplast genome of D. farinosus
    氨基酸密码子基因组
    RSCU
    高表达
    RSCU
    低表达
    RSCU
    ΔRSCU氨基酸密码子基因组
    RSCU
    高表达
    RSCU
    低表达
    RSCU
    ΔRSCU
    TerUAA***1.560 01.800 01.200 00.600 0MetAUG1.000 01.000 01.000 00
    UAG0.780 00.600 01.200 0−0.600 0AsnAAC*0.520 00.893 60.625 00.268 6
    UGA0.670 00.600 00.600 00AAU1.480 01.106 41.375 0−0.268 6
    AlaGCA**1.200 01.200 00.734 70.465 3ProCCA**1.080 00.800 00.500 00.300 0
    GCC0.600 00.457 10.653 1−0.196 0CCC1.010 00.800 01.166 7−0.366 7
    GCG0.470 00.228 60.734 7−0.506 1CCG0.430 00.444 41.000 0−0.555 6
    GCU*1.730 02.114 31.877 60.236 7CCU***1.480 01.955 61.333 30.622 3
    CysUGC**0.470 00.400 000.400 0GlnCAA*1.530 01.500 01.368 40.131 6
    UGU1.530 01.600 02.000 0−0.400 0CAG0.470 00.500 00.631 6−0.131 6
    AspGAC*0.460 00.500 00.411 80.088 2ArgAGA*1.750 01.723 41.534 90.188 5
    GAU1.540 01.500 01.588 2-0.088 2AGG0.640 00.319 10.837 2−0.518 1
    GluGAA1.460 01.189 21.578 9−0.389 7CGA1.270 01.276 61.395 3−0.118 7
    GAG**0.540 00.810 80.421 10.389 7CGC0.510 00.319 10.837 2−0.518 1
    PheUUC**1.290 01.041 70.650 00.391 7CGG0.410 00.319 10.279 10.040 0
    UUU0.710 00.958 31.350 0−0.391 7CGU***1.410 02.042 61.116 30.926 3
    GlyGGA1.580 01.253 71.818 2−0.564 5SerAGC0.410 00.384 60.470 6−0.086 0
    GGC0.430 00.417 90.484 8−0.066 9AGU**1.250 01.846 21.411 80.434 4
    GGG0.760 00.119 40.363 6−0.244 2UCA1.020 00.615 41.058 8−0.443 4
    GGU***1.240 02.209 01.333 30.875 7UCC***1.190 01.769 20.941 20.828 0
    HisCAC**0.530 00.941 20.571 40.369 8UCG0.550 00.153 80.705 9−0.552 1
    CAU1.470 01.058 81.428 6−0.369 8UCU1.580 01.230 81.411 8−0.181 0
    Ile AUA0.920 00.850 70.949 4−0.098 7ThrACA1.080 01.181 81.176 50.005 3
    AUC*0.590 00.626 90.531 60.095 3ACC0.500 00.818 21.058 8−0.240 6
    AUU1.480 01.522 41.519 00.003 4ACG0.480 00.363 60.588 2−0.224 6
    LysAAA**1.440 01.471 71.155 60.316 1ACU**1.680 01.636 41.176 50.459 9
    AAG0.560 00.528 30.844 4−0.316 1ValGUA***1.500 01.767 41.257 10.510 3
    LeuCUA0.900 00.833 31.295 5−0.462 2GUC0.490 001.028 6−1.028 6
    CUC0.420 000.545 5−0.545 5GUG0.540 00.372 10.342 90.029 2
    CUG0.330 00.250 00.477 3−0.227 3GUU**1.470 01.860 51.371 40.489 1
    CUU*1.290 01.333 31.227 30.106 0TrpUGG1.000 01.000 01.000 00
    UUA***1.940 02.166 71.022 71.144 0TyrUAC**0.410 00.521 70.166 70.355 0
    UUG1.110 01.416 71.431 8−0.015 1UAU1.590 01.478 31.833 3−0.355 0
      说明: 高频密码子(RSCU>1.00)带下划线;*. ΔRSCU≥0.08;**. ΔRSCU≥0.3;***. ΔRSCU≥0.5; 加粗的密码子表示最优密码子。
    下载: 导出CSV 
    | 显示表格

    将梁山慈竹基因组密码子使用频率与巨龙竹、粉麻竹、小叶龙竹、硬头黄竹、大肠埃希菌、烟草、拟南芥和酿酒酵母等物种的基因组密码子使用频率进行比较(图4)。结果显示:梁山慈竹与巨龙竹、粉麻竹、小叶龙竹和硬头黄竹的密码子使用频率为0.5~2.0,说明它们的密码子使用偏好性相似,推测具有亲缘关系的禾本科Gramineae牡竹属植物叶绿体基因组密码子偏好性相似;在大肠埃希菌、烟草、拟南芥和酿酒酵母的密码子使用比值中筛选≥2.0或≤0.5的密码子,分别有28和15、15、14个,表明梁山慈竹与这些物种在同义密码子的偏好性上有一定差异。

    图 4  梁山慈竹与其他物种密码子偏好性比较
    Figure 4  Comparison of codon preference between D. farinosus and other species

    将梁山慈竹的51个叶绿体基因的基因功能分为光合系统基因、遗传系统基因、其他基因和未知功能基因四大类,在计算RSCU的基础上将各个基因分布到59维的向量空间。对应分析结果(图5)显示:前4个向量轴分别存在18.3%、16.8%、15.6%和15.4%的差异,前4向量轴累计差异为66.1%,4个轴对密码子均有不同程度的影响;第1轴的值大于其他轴,说明第1轴对梁山慈竹叶绿体基因组密码子偏好性的影响较大。对第1轴与CAI、CBI、FOP、ENC和GC3s等指数进行进一步的相关分析发现:梁山慈竹基因在第1轴上的坐标值与CAI (r=−0.001 7,P<0.01)、CBI (r=0.099 0,P<0.01)、FOP (r=0.083 0,P<0.01)、ENC (r=0.112 0,P<0.01)、GC3s (r=−0.145 0,P<0.01)间具有极显著的相关关系,其中CAI和GC3s第1轴具有负相关关系,表明基因组密码子的偏好性不止受单一因素的影响,自然选择、基因突变均有可能影响梁山慈竹基因组密码子使用偏好性[18]

    图 5  梁山慈竹基因组密码子RSCU的对应性分析
    Figure 5  Correspondence Analysis on RSCU of D. farinosus

    本研究对梁山慈竹叶绿体基因组密码子进行使用偏好性分析,筛选出51条CDS序列,分析表明:GC1>GC2>GC3,密码子在3个位置上的分布并不均匀,密码子偏好使用以A或U结尾的碱基,且梁山慈竹叶绿体基因组的ENC均值为49.51,表明其叶绿体基因组密码子使用偏好性较弱。这与乳油木Vitellaria paradoxa[19]和二乔玉兰Magnolia soulangeana[20]等植物叶绿体基因组密码子偏好性相似。

    对梁山慈竹叶绿体基因组密码子进行中性绘图、ENC-plot分析、PR2-plot分析和对应分析。在中性绘图分析中,回归系数为0.412 8,说明密码子偏好性更多受到自然选择的影响;在ENC-plot分析中,多数基因离标准曲线距离较远,实际ENC和预期ENC有差距,表明该部分基因的密码子偏好性主要受自然选择的影响;在PR2-plot绘图分析中,大部分基因位于平面图的右下方,即T>A、G>C,表明其密码子的使用更多受自然选择的影响。综上所述,影响梁山慈竹叶绿体基因组密码子偏好性的主要原因是自然选择。该研究结果与巨桉Eucalyptus grandi[21]、灰毛浆果楝Cipadessa cinerascens、酸枣Ziziphus jujuba var. spinosa[22]和云南油杉Keteleeria evelyniana[23]等叶绿体基因组密码子偏好性研究结果基本一致;但在对4种蔷薇科 Rosaceae果树[24]和银白杨Populus alba[25]的研究中发现:突变是影响密码子偏好性的主要因素。这说明密码子的使用偏好性受自然选择或基因突变因素影响。基于RSCU的对应分析表明:梁山慈竹的密码子使用变异原因除了突变和自然选择之外,还有其他的因素,这其中光合系统基因和遗传系统基因分布相对集中,各类基因密码子使用偏好性较为接近。该结论与木薯Manihot esculenta[26]和高山松Pinus densata[27]的研究结果一致。密码子使用频率比较结果显示:梁山慈竹与禾本科牡竹属的植物密码子偏好性相似,在基因选择外源系统表达时,可以选择密码子偏好性差异相对较小的酿酒酵母,在选择大肠埃希菌、烟草和拟南芥作为外源表达宿主时,需要根据密码子使用偏好性进行碱基优化,从而使基因在宿主体内更好地表达。

    最优密码子分析表明:梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子,最优密码子大部分以A或U结尾。该结果与抽筒竹Gelidocalamus tessellatus[28]和毛竹Phyllostachys edulis[29]叶绿体基因组最优密码子分析结果一致,这可能与亲缘关系相近,但不同物种之间叶绿体基因组进化过程中的相对保守性有关系[21]。通过筛选获取梁山慈竹偏好使用密码子,可进一步对目标基因进行密码子优化,提高梁山慈竹的竹笋产量和造纸纤维含量,以及利用新一代精准基因编辑工具CRISPR/Cas9优化梁山慈竹密码子,从而改造梁山慈竹基因组编辑的Cas9基因,提高该基因在梁山慈竹中的表达水平[30]

    本研究通过分析梁山慈竹叶绿体基因组的CDS序列,对梁山慈竹的叶绿体基因组进行生物信息学分析,筛选出梁山慈竹叶绿体基因组有GCU、GAU以及GGU等18个最优密码子。研究结果表明:影响梁山慈竹密码子偏好性的主要因素是自然选择。研究结果为后续在分子层面上利用基因工程开发梁山慈竹优良资源提供参考。

  • 图  1  新绒苔叶绿体基因组基因图谱

    Figure  1  Chloroplast genome gene map of N. bissetii

    图  2  新绒苔叶绿体基因组SSR信息

    Figure  2  SSR information in chloroplast genome of N. bissetii

    图  3  7种苔藓植物叶绿体基因组长重复序列分析

    Figure  3  Long repeats of chloroplast genome in 7 bryophytes

    图  4  7种苔藓植物叶绿体基因组边界分析

    Figure  4  Chloroplast genome boundary analysis of 7 bryophytes

    图  5  基于19种苔藓植物叶绿体基因组序列构建的系统发育树

    Figure  5  Phylogenetic tree based on chloroplast genome sequences of 19 bryophytes

    表  1  17种苔藓植物样本信息

    Table  1.   Information of 17 samples of bryophytes

    物种 GenBank 登录号 物种 GenBank 登录号
    Aneura mirabilis NC_010359 四齿异萼苔Heteroscyphus argutus NC_043788
    绿片苔Aneura pinguis NC_035617 毛耳苔Jubula hutchinsiae NC_043782
    东亚鞭苔Bazzania praerupta NC_043785 异溪苔Pellia endiviifolia NC_019628
    护蒴苔Calypogeia fissa NC_043757 中华羽苔Plagiochila chinensis NC_043784
    白鳞苔Cheilolejeunea xanthocarpa NC_043777 毛边光萼苔Porella perrottetiana NC_043780
    狭瓣疣鳞苔Cololejeunea lanciloba NC_043778 深裂毛叶苔Ptilidium pulcherrimum NC_015402
    厚角耳叶苔Frullania nodulosa NC_043783 日本扁萼苔Radula japonica NC_043781
    全萼苔Gymnomitrion concinnatum NC_040133 刺边合叶苔Scapania ciliata NC_043786
    爪哇裸蒴苔Haplomitrium blumei NC_043789
    下载: 导出CSV

    表  2  新绒苔叶绿体基因组编码的基因

    Table  2.   Genes encoded by the chloroplast genome of N. bissetii

    基因类别 基因功能 基因名称
    光合作用 ATP合酶亚基 atpA, atpB, atpE, atpH, atpI
    光系统Ⅰ psaA, psaB, psaC, psaJ
    光系统Ⅱ psbA, psbB, psbC, psbD, psbE, psbL, psbN, psbT, psbZ, ycf3
    NADH-脱氢酶亚基 ndhA*, ndhB*, ndhC, ndhD, ndhE, ndhF, ndhH, ndhI, ndhJ, ndhK
    细胞色素复合物b/f亚基 petA, petB *, petD, petG
    Rubisco酶亚基 rbcL
    复制基因 核糖体大亚基 rpl14, rpl16, rpl2*, rpl20, rpl22, rpl33, rpl36
    DNA依赖核酸聚合酶 rpoA, rpoB, rpoC1*, rpoC2
    核糖体小亚基 rps12*, rps19, rps2, rps3, rps4, rps8
    核糖体RNA基因 rrn16S (×2), rrn23S (×2), rrn4.5S (×2), rrn5S (×2)
    转运RNA基因 trnA-UGC (×2)*, trnC-GCA, trnD-GUC, trnE-UUC, trnE-UUC (×2)*, trnF-GAA, trnG-GCC (×2)*, trnH-GUG, trnK-UUU (×2)*, trnL-CAA, trnL-UAA*, trnL-UAG, trnM-CAU (×2), trnN-GUU (×2), trnP-UGG, trnQ-UUG, trnR-ACG (×2), trnR-UCU, trnS-GCU, trnS-GGA, trnS-UGA, trnT-CGU*, trnT-GGU, trnT-UGU, trnV-GAC (×2), trnW-CCA, trnY-GUA
    其他基因 乙酰辅酶A羧化酶亚基
    c型细胞色素合成基因
    accD
    ccsA
    蛋白酶
    包裹膜蛋白
    成熟酶
    clpP**
    cemA
    matK
    保守开放性阅读框 ycf1,ycf2 (×2),ycf66
      说明:*和**标记的分别为含有单内含子和双内含子的基因。位于IR的重复基因标记为(×2)。
    下载: 导出CSV

    表  3  新绒苔叶绿体基因组密码子使用分析

    Table  3.   Analysis of chloroplast genome codon usage in N. bissetii

    氨基酸密码子数量RSCU氨基酸密码子数量RSCU氨基酸密码子数量RSCU氨基酸密码子数量RSCU
    PheUUU21661.36TyrUAU13791.42GluGAG4110.62AlaGCC1770.69
    PheUUC10270.64TyrUAC5660.58SerUCU6371.21AlaGCA3071.20
    LeuUUA11961.74TerUAA12991.47SerUCC4960.94AlaGCG1670.65
    LeuUUG8341.21TerUAG6080.69SerUCA6501.23CysUGU4701.14
    LeuCUU7461.08TerUGA7390.84SerUCG4430.84CysUGC3530.86
    LeuCUC4220.61HisCAU6441.40SerAGU4950.94TrpUGG4751.00
    LeuCUA5710.83HisCAC2770.60SerAGC4370.83ArgCGU2690.75
    LeuCUG3670.53GlnCAA7991.32ProCCU3831.12ArgCGC1460.41
    IleAUU16261.36GlnCAG4100.68ProCCC3140.92ArgCGA3951.11
    IleAUC6860.58AsnAAU16271.42ProCCA4701.38ArgCGG2040.57
    IleAUA12641.06AsnAAC6580.58ProCCG1960.58ArgAGA7202.02
    MetAUG6091.00LysAAA20991.46ThrACU4901.16ArgAGG4041.13
    ValGUU6261.45LysAAG7820.54ThrACC4251.01GlyGGU4111.13
    ValGUC2500.58AspGAU6411.43ThrACA4751.13GlyGGC2070.57
    ValGUA5581.30AspGAC2570.57ThrACG2930.70GlyGGA5261.44
    ValGUG2880.67GluGAA9171.38AlaGCU3741.46GlyGGG3160.87
    下载: 导出CSV
  • [1] 王杰, 贺文闯, 向坤莉, 等. 基因组时代的植物系统发育研究进展[J]. 浙江农林大学学报, 2023, 40(1): 227−236.

    WANG Jie, HE Wenchuang, XIANG Kunli, et al. Advances in plant phylogeny in the genome era [J]. Journal of Zhejiang A&F University, 2023, 40(1): 227−236.
    [2] SUGIURA M, HIROSE T, SUGITA M. Evolution and mechanism of translation in chloroplasts [J]. Annual Review of Genetics, 1998, 32(1): 437−459.
    [3] PALMER J D. Isolation and structural analysis of chloroplast DNA [J]. Methods in Enzymology, 1986, 118(11): 167−186.
    [4] LI Yunfeng, LUO Lian, LIU Yang, et al. The Bryophyte Phylogeny Group: a revised familial classification system based on plastid phylogenomic data [J]. Journal of Systematics and Evolution, 2024, 62(4): 577−588.
    [5] CHOI S S, KWON W, PARK J. The complete chloroplast genome of Scapania ampliata Steph., 1897 (Scapaniaceae, Jungermanniales) [J]. Mitochondrial DNA Part B, 2020, 5 (3): 2890−2892.
    [6] GRAHAM S W, LAM V K Y, MERCKX V S F T. Plastomes on the edge: the evolutionary breakdown of mycoheterotroph plastid genomes [J]. New Phytologist, 2017, 214(1): 48−55.
    [7] LUBNA, ASAF S, JAN R, et al. Plastome diversity and evolution in mosses: insights from structural characterization, comparative genomics, and phylogenetic analysis [J/OL]. International Journal of Biological Macromolecules, 2024, 257 (2): 128608[2024-05-01]. DOI: 10.1016/j.ijbiomac.2023.128608.
    [8] 高谦, 吴玉环. 中国苔藓志 第10卷 叶苔目(裂叶苔科—新绒苔科)[M]. 北京: 科学出版社, 2008: 433−436.

    GAO Qian, WU Yuhuan. Flora Bryophytorum Sinicorrum Vol.10 Jungermanniales (Lophoziaceae−Neotrichocoleaceae) [M]. Beijing: Science Press, 2008: 433−436.
    [9] CHOI S S, BAKALIN V, PARK S J. Integrating continental mainland and islands in temperate East Asia: liverworts and hornworts of the Korean Peninsula [J]. PhytoKeys, 2021, 176: 131−226.
    [10] 何强, 贾渝. 中国苔藓植物濒危等级的评估原则和评估结果[J]. 生物多样性, 2017, 25(7): 774−780.

    HE Qiang, JIA Yu. Assessing the threat status of China’s bryophyte [J]. Biodiversity Science, 2017, 25(7): 774−780.
    [11] EVANS A W. A remarkable Ptilidium from Japan [J]. Revue Bryologique, 1905, 32(4): 57−60.
    [12] HORIKAWA Y. Monographia Hepaticarum Australi-Japonicarum [J]. Journal of Science of the Hiroshima University. Series B, 1934, 2: 101−325.
    [13] LIU Yang, JIA Yu, WANG Wei, et al. Phylogenetic relationships of two endemic genera from East Asia Trichocoleopsis and Neotrichocolea [J]. Annals of the Missouri Botanical Garden, 2008, 95(3): 459−470.
    [14] DOYLE J J, DOYLE J L. A rapid DNA isolation procedure for small quantities of fresh leaf tissue [J]. Phytochemistry, 1987, 19(1): 11−15.
    [15] CHEN Yuxin, CHEN Yongsheng, SHI Chunmei, et al. SOAPnuke: a MapReduce acceleration-supported software for integrated quality control and preprocessing of high-throughput sequencing data [J/OL]. Giga Science, 2018, 7 : gix120[2024-05-01]. DOI: 10.1093/gigascience/gix120.
    [16] JIN Jianjun, YU Wenbin, YANG Junbo, et al. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes [J/OL]. Genome Biology, 2020, 21 (1): 241[2024-05-01]. DOI: 10.1186/s13059-020-02154-5.
    [17] WICK R R, SCHULTZ M B, ZOBEL J, et al. Bandage: interactive visualization of de novo genome assemblies [J]. Bioinformatics, 2015, 31: 3350−3352.
    [18] SHI Linchun, CHEN Haimei, JIANG Mei, et al. CPGAVAS2, an integrated plastome sequence annotator and analyzer [J]. Nucleic Acids Research, 2019, 47: W65−W73.
    [19] LOHSE M, DRECHSEL O, KAHLAU S, et al. OrganellarGenomeDRAW: a suite of tools for generating physical maps of plastid and mitochondrial genomes and visualizing expression data sets [J]. Nucleic Acids Research, 2013, 41: W575−W581.
    [20] BEIER S, THIEL T, MUNCH T, et al. MISA-web: a web server for microsatellite prediction [J]. Bioinformatics, 2017, 33: 2583−2585.
    [21] SHARP P M, LI W H. The codon Adaptation Index − a measure of directional synonymous codon usage bias [J]. Nucleic Acids Research, 1987, 15(3): 1281−1295.
    [22] KURTZ S, CHOUDHURI J V, OHLEBUSCH E, et al. REPuter: the manifold applications of repeat analysis on a genomic scale [J]. Nucleic Acids Research, 2001, 29(22): 4633−4642.
    [23] AMIRYOUSEFI A, HYVÖNEN J, POCZAI P. IRscope: an online program to visualize the junction sites of chloroplast genomes [J]. Bioinformatics, 2018, 34: 3030−3031.
    [24] KATOH K, ROZEWICKI J, YAMADA K D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization [J]. Briefings in Bioinformatics, 2019, 20(4): 1160−1166.
    [25] KURAKU S, ZMASEK C M, NISHIMURA O, et al. aLeaves facilitates on-demand exploration of metazoan gene family trees on MAFFT sequence alignment server with enhanced interactivity [J]. Nucleic Acids Research, 2013, 41(W1): W22−W28.
    [26] FAN Zhifeng, MA Changle. Comparative chloroplast genome and phylogenetic analyses of Chinese Polyspora [J/OL]. Scientific Reports, 2022, 12 (1): 15984[2024-05-01]. DOI: 10.1038/s41598-022-16290-4.
    [27] STAMATAKIS A. RAxML-VI-HPC: maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models [J]. Bioinformatics, 2006, 22(21): 2688−2690.
    [28] RONQUIST F, HUELSENBECK J P. MrBayes 3: bayesian phylogenetic inference under mixed models [J]. Bioinformatics, 2003, 19(12): 1572−1574.
    [29] YU Ying, LIU Hongmei, YANG Junbo, et al. Exploring the plastid genome disparity of liverworts [J]. Journal of Systematics and Evolution, 2019, 57(4): 382−394.
    [30] 尹跃, 安巍, 赵建华, 等. 黑果枸杞转录组SSR信息分析及分子标记开发[J]. 浙江农林大学学报, 2019, 36(2): 422−428.

    YIN Yue, AN Wei, ZHAO Jianhua, et al. SSR information in transcriptome and development of molecular markers in Lycium ruthenicum [J]. Journal of Zhejiang A&F University, 2019, 36(2): 422−428.
    [31] ROMERO H, ZAVALA A, MUSTO H. Codon usage in Chlamydia trachomatis is the result of strand-specific mutational biases and a complex pattern of selective forces [J]. Nucleic Acids Research, 2000, 28(10): 2084−2090.
    [32] BARBHUIYA P A, UDDIN A, CHAKRABORTY S. Analysis of compositional properties and codon usage bias of mitochondrial CYB gene in anura, urodela and gymnophiona [J/OL]. Gene, 2020, 751 : 144762[2024-05-01]. DOI: 10.1016/j.gene.2020.144762.
    [33] 张家榕, 雷万钧. 18种苔藓植物rbcL基因的密码子偏性及聚类分析[J]. 山西农业大学学报(自然科学版), 2020, 40(6): 1−12.

    ZHANG Jiarong, LEI Wanjun. Cluster analysis and codon usage bias studies of rbcL genes in 18 bryophytes [J]. Journal of Shanxi Agricultural University (Natural Science Edition), 2020, 40(6): 1−12.
    [34] XIA Conglong, WANG Manjiong, GUAN Yunhui, et al. Comparative analysis of the chloroplast genome for aconitum species: Genome structure and phylogenetic relationships [J/OL]. Frontiers in Genetics, 2022, 13 : 878182[2024-05-01]. DOI: 10.3389/fgene.2022.878182.
    [35] DONG Shanshan, YU Jin, ZHANG Li, et al. Phylotranscriptomics of liverworts: revisiting the backbone phylogeny and ancestral gene duplications [J]. Annals of Botany, 2022, 130(7): 951−964.
    [36] BECHTELER J, PEÑALOZA-BOJACÁ G, BELL D, et al. Comprehensive phylogenomic time tree of bryophytes reveals deep relationships and uncovers gene incongruences in the last 500 million years of diversification [J/OL]. American Journal of Botany, 2023, 110 (11): e16249[2024-05-01]. DOI: 10.1002/ajb2.16249.
  • [1] 陈梦瑶, 胡怡然, 郑志富, 潘天.  大豆IGT基因家族的全基因组鉴定及组织表达分析 . 浙江农林大学学报, 2025, 42(1): 64-73. doi: 10.11833/j.issn.2095-0756.20240354
    [2] 江转转, 陈红, 鲍红艳, 代雨童.  狼尾草属叶绿体基因组特征与分子标记开发 . 浙江农林大学学报, 2025, 42(2): 365-372. doi: 10.11833/j.issn.2095-0756.20240371
    [3] 李妍, 舒金平, 华克达, 张亚波, 应玥, 张威.  暗影饰皮夜蛾线粒体基因组全序列测定与分析 . 浙江农林大学学报, 2024, 41(4): 724-734. doi: 10.11833/j.issn.2095-0756.20240138
    [4] 刘萱, 邹龙海, 周明兵.  黄槽毛竹叶绿体基因组及毛竹种下分类群的叶绿体基因组序列比较 . 浙江农林大学学报, 2024, 41(5): 1037-1046. doi: 10.11833/j.issn.2095-0756.20240110
    [5] 段春燕, 王晓凌.  重瓣榆叶梅全叶绿体基因组遗传特征分析 . 浙江农林大学学报, 2024, 41(3): 577-585. doi: 10.11833/j.issn.2095-0756.20230489
    [6] 吴民华, 叶晓霞, 谭靖怡, 梁秋婷, 吴子健, 黄琼林.  了哥王叶绿体基因组分析 . 浙江农林大学学报, 2024, 41(2): 297-305. doi: 10.11833/j.issn.2095-0756.20230412
    [7] 洪森荣, 张牧彤, 徐子林, 张钦荣, 罗雨欣, 田文慧, 王心雨.  ‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析 . 浙江农林大学学报, 2024, 41(1): 92-103. doi: 10.11833/j.issn.2095-0756.20230169
    [8] 魏亚楠, 龚明贵, 白娜, 苏佳杰, 姜霞.  梁山慈竹叶绿体基因组密码子偏好性分析 . 浙江农林大学学报, 2024, 41(4): 696-705. doi: 10.11833/j.issn.2095-0756.20230498
    [9] 周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南.  荆芥HD-Zip基因家族的全基因组鉴定及分析 . 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
    [10] 王杰, 贺文闯, 向坤莉, 武志强, 顾翠花.  基因组时代的植物系统发育研究进展 . 浙江农林大学学报, 2023, 40(1): 227-236. doi: 10.11833/j.issn.2095-0756.20220313
    [11] 刘俊, 李龙, 陈玉龙, 刘燕, 吴耀松, 任闪闪.  杜仲CONSTANS-like全基因组鉴定、系统进化及表达模式分析 . 浙江农林大学学报, 2022, 39(3): 475-485. doi: 10.11833/j.issn.2095-0756.20210385
    [12] 谢文远, 鲁益飞, 陈征海, 金孝锋.  浙江广义乌蔹莓属植物的分类研究 . 浙江农林大学学报, 2022, 39(6): 1212-1220. doi: 10.11833/j.issn.2095-0756.20210751
    [13] 阮诗雨, 张智俊, 陈家璐, 马瑞芳, 朱丰晓, 刘笑雨.  毛竹GRF基因家族全基因组鉴定与表达分析 . 浙江农林大学学报, 2021, 38(4): 792-801. doi: 10.11833/j.issn.2095-0756.20200544
    [14] 陈娅欣, 周明兵.  毛竹长末端重复序列反转录转座子的全基因组特征及进化分析 . 浙江农林大学学报, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
    [15] 李思巧, 韦伊, 刘洪妤, 张志东, 张野, 王丽华, 刘玉林.  花椒cpSSR标记开发及在种间、种内的通用性分析 . 浙江农林大学学报, 2019, 36(6): 1241-1246. doi: 10.11833/j.issn.2095-0756.2019.06.023
    [16] 帅敏敏, 张启香, 黄有军.  光周期途径成花关键基因CONSTANS的进化机制 . 浙江农林大学学报, 2019, 36(1): 7-13. doi: 10.11833/j.issn.2095-0756.2019.01.002
    [17] 黄笑宇, 许在恩, 郭小勤.  基于全基因组的毛竹同义密码子使用偏好性分析 . 浙江农林大学学报, 2017, 34(1): 120-128. doi: 10.11833/j.issn.2095-0756.2017.01.017
    [18] 王璇, 马良进, 吕全, 孟娴静, 张星耀.  山核桃干腐病病原菌的鉴定 . 浙江农林大学学报, 2014, 31(2): 238-245. doi: 10.11833/j.issn.2095-0756.2014.02.012
    [19] 王策, 秦静静, 甘红豪1, 李红, 罗志斌.  毛果杨全基因组磷酸根转运蛋白家族成员序列分析 . 浙江农林大学学报, 2012, 29(4): 516-526. doi: 10.11833/j.issn.2095-0756.2012.04.006
    [20] 刘洪愕, 张若蕙, 黄少甫, 赵治芬.  8种蜡梅的染色体研究 . 浙江农林大学学报, 1996, 13(1): 28-33.
  • 期刊类型引用(1)

    1. 何刀山,阳小强,秦雅林,何海燕,谢维,罗治国,李鹏. ‘湘辣14号’叶绿体基因组密码子偏好性分析. 中国果菜. 2025(01): 47-54+79 . 百度学术

    其他类型引用(0)

  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20240356

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2025/1/55

图(5) / 表(3)
计量
  • 文章访问数:  223
  • HTML全文浏览量:  68
  • PDF下载量:  25
  • 被引次数: 1
出版历程
  • 收稿日期:  2024-05-16
  • 修回日期:  2024-09-09
  • 录用日期:  2024-09-14
  • 网络出版日期:  2025-01-20
  • 刊出日期:  2025-02-20

濒危植物新绒苔叶绿体基因组特征及系统发育位置分析

doi: 10.11833/j.issn.2095-0756.20240356
    基金项目:  安徽省自然科学基金资助项目(1608085MC61)
    作者简介:

    朱梦飞 (ORCID: 0009-0006-6726-0351),从事森林资源与开发利用研究。E-mail: 1178585479@qq.com

    通信作者: 师雪芹 (ORCID: 0000-0003-1742-9578),副教授,博士,从事苔藓植物多样性及保护研究。E-mail: baiyunsxq@163.com
  • 中图分类号: Q75

摘要:   目的  新绒苔Neotrichocolea bissetii为东亚特有植物,被世界自然保护联盟(IUCN)列为易危植物。阐明新绒苔叶绿体基因组结构特征及系统进化地位,可为新绒苔的物种鉴定、资源保护和系统进化提供理论参考。  方法  以野外采集的新绒苔为材料,进行DNA提取、测序和组装,分析叶绿体基因组结构、重复序列、密码子偏好性,并结合其余18种苔藓植物叶绿体基因组序列构建系统发育关系。  结果  新绒苔叶绿体全基因组序列全长为118 423 bp,包括1对反向重复区(IR,9 031 bp)、1个大单拷贝区(LSC,80 837 bp)和1个小单拷贝区(SSC,19 524 bp);包含79个蛋白质编码基因,8个核糖体RNA (rRNA)和36个转移RNA (tRNA)。新绒苔叶绿体全基因组中共检测到56个简单重复序列(SSR),大部分为AT/AT二核苷酸序列。密码子偏好性分析表明其密码子偏好以A/U结尾。除了少数可变区域外,新绒苔叶绿体基因组的IR边界区域非常保守。系统发育树表明该种与囊绒苔Trichocoleopsis sacculata亲缘关系最密切,两者隶属于新绒苔科。  结论  新绒苔叶绿体基因组为典型的四分体结构,基因组相对保守。系统发育树分析表明新绒苔与囊绒苔聚合成同一分支结构。图5表3参36

English Abstract

魏亚楠, 龚明贵, 白娜, 等. 梁山慈竹叶绿体基因组密码子偏好性分析[J]. 浙江农林大学学报, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
引用本文: 朱梦飞, 胡迎峰, 师雪芹. 濒危植物新绒苔叶绿体基因组特征及系统发育位置分析[J]. 浙江农林大学学报, 2025, 42(1): 55−63 doi:  10.11833/j.issn.2095-0756.20240356
WEI Ya’nan, GONG Minggui, BAI Na, et al. Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus[J]. Journal of Zhejiang A&F University, 2024, 41(4): 696-705. DOI: 10.11833/j.issn.2095-0756.20230498
Citation: ZHU Mengfei, HU Yingfeng, SHI Xueqin. Characterization and phylogenetic location analysis of chloroplast of the endangered plant Neotrichocolea bissetii[J]. Journal of Zhejiang A&F University, 2025, 42(1): 55−63 doi:  10.11833/j.issn.2095-0756.20240356
  • 叶绿体是细胞中具有独立基因组的细胞器,其结构简单、分子量相对较小、进化速率较慢、具有良好的保守性,在物种鉴定和系统发育分析中得到了广泛的应用[1]。在大多数植物中,叶绿体基因组的突出特征是存在1个大的倒置重复序列区(IR),IR被1个大单拷贝区(LSC)和1个小单拷贝区(SSC)隔开,叶绿体DNA大小变化大多可以通过IR区域长度的变化来解释[23]。目前,叶绿体基因组已广泛应用于苔藓植物的系统发育研究中[45]。与核基因组和线粒体基因组相比,叶绿体基因组结构简单且保守,全序列易获得,相对于多片段研究也有更好的解析[67]

    新绒苔Neotrichocolea bissetii隶属于新绒苔属 Neotrichocolea,该属仅包含新绒苔1种,为东亚特有属。新绒苔植物体绒毛状,深绿色或黄绿色,有光泽;茎匍匐或倾斜,3至4回羽状分枝,长达10 cm;通常生长在潮湿的石头上或林下溪边的潮湿土壤上,偶见于腐木;主要分布在中国、日本[8]和朝鲜半岛[9]。依据中国苔藓植物濒危等级的评估原则,该种在整个分布区范围内种群变化不详,在黄山已被证实种群数量急剧减少,目前被列为易危物种(VU)[10],该种也被《世界自然保护联盟濒危物种红色名录》列为易危物种。

    早期基于形态学的研究,新绒苔被分别放在毛叶苔科Ptilidiaceae[11]或新绒苔科Neotrichocoleaceae[12]。LIU等[13]基于基因片段分析,深入研究了新绒苔属和囊绒苔属Trichocoleopsis的系统发育关系及分类位置,研究结果支持新绒苔放置在新绒苔科,但需要注意的是,其系统进化树中的分支支持率并不高。最新的苔藓植物系统发育研究中均未包含新绒苔的叶绿体基因组数据。鉴于叶绿体基因组信息更系统全面,本研究将基于叶绿体基因组数据,进一步明确新绒苔的系统位置。

    本研究利用新一代测序技术(NGS)对新绒苔进行测序,通过组装和注释获得完整的叶绿体基因组序列,分析了新绒苔基因组的序列特征,并结合17种已发表的苔藓植物序列构建了系统发育树,明确了新绒苔的系统位置,为新绒苔的物种鉴定、资源保护和系统进化研究提供了科学依据。

    • 新绒苔标本采集于安徽黄山(30°14′N,118°16′E),凭证标本(20220715-76A)经硅胶干燥后保存于安徽师范大学生命科学学院植物标本馆。使用改良十六烷基三甲基溴化铵(CTAB)法提取和纯化叶片组织的总DNA[14]。通过琼脂糖凝胶电泳和分光光度法测定DNA产物的质量和浓度。所有合格的DNA样本送往中国西南野生生物种质资源库分子生物学实验中心进行建库和测序。

    • 使用SOAPnuke Toolkit v.1.3.0[15]过滤原始序列(raw reads)获得高质量序列(clean reads)用于后续分析。通过GetOrganelle v1.7[16]组装叶绿体基因组。将组装结果导入Bandage v.8.1[17]中可视化叶绿体基因组结构,去除低覆盖率的低质量片段,得到单倍体叶绿体的全基因组环结构。使用在线工具CPGAVAS2进行注释[18]。用在线程序Organellar Genome DRAW绘制叶绿体的全基因组物理图谱[19]

    • 使用在线程序MIcroSAtellite对新绒苔叶绿体中的简单重复序列(SSR)进行分析[20]。采用CodonW软件[21]分析密码子的使用情况。使用REPuter在线网站[22]分析叶绿体基因组序列,共检测到4种类型的长重复序列:正向重复、反向重复、回文重复和互补重复。

    • 利用新测序的新绒苔、囊绒苔T. sacculata与美国国家生物技术信息中心(NCBI)数据库中公布的5种苔藓植物(登录号分别为NC_010359、NC_019628、NC_019628、NC_043786、NC_043789)的叶绿体基因组序列进行比较,分析叶绿体基因组的总基因数、GC含量、LSC、SSC和IR。利用在线工具IRscope可视化叶绿体基因组的LSC/IR/SSC边界变化[23]

    • 基于苔藓植物系统发育纲要[4]和YU等[5]的研究,以爪哇裸蒴苔Haplomitrium blumei (NC_043789)为外类群,基于新绒苔、囊绒苔和NCBI数据库下载已公布的17种苔藓植物(表1)的叶绿体基因组序列构建系统发育树。这17种苔藓植物均属于叶苔纲Jungermanniopsida,包含了其下的3个亚纲代表类群:叉苔亚纲Metzgeriidae的绿片苔Aneura pinguisA. mirabilis,溪苔亚纲Pelliidae的异溪苔Pellia endiviifolia,其余14种为叶苔亚纲Jungermanniidae。

      表 1  17种苔藓植物样本信息

      Table 1.  Information of 17 samples of bryophytes

      物种 GenBank 登录号 物种 GenBank 登录号
      Aneura mirabilis NC_010359 四齿异萼苔Heteroscyphus argutus NC_043788
      绿片苔Aneura pinguis NC_035617 毛耳苔Jubula hutchinsiae NC_043782
      东亚鞭苔Bazzania praerupta NC_043785 异溪苔Pellia endiviifolia NC_019628
      护蒴苔Calypogeia fissa NC_043757 中华羽苔Plagiochila chinensis NC_043784
      白鳞苔Cheilolejeunea xanthocarpa NC_043777 毛边光萼苔Porella perrottetiana NC_043780
      狭瓣疣鳞苔Cololejeunea lanciloba NC_043778 深裂毛叶苔Ptilidium pulcherrimum NC_015402
      厚角耳叶苔Frullania nodulosa NC_043783 日本扁萼苔Radula japonica NC_043781
      全萼苔Gymnomitrion concinnatum NC_040133 刺边合叶苔Scapania ciliata NC_043786
      爪哇裸蒴苔Haplomitrium blumei NC_043789

      利用MAFFT程序对新绒苔和其他苔藓植物的叶绿体基因组进行全基因组比较[2425]。使用PhyloSuite v.1.2.2[26]的ModelFinder插件分别计算最大似然(ML)和贝叶斯推断(BI)树模型。ML树和BI树分别使用RAxML v.7.2.8[27]和MrBayes v.3.1.2[28]构建。

    • 新绒苔叶绿体基因组为典型的四分体结构,总长度为118 423 bp,其中包括1对IR (9 031 bp)、1个LSC (80 837 bp)和1个SSC (19 524 bp)(图1)。全基因组GC含量为33.3%,IR的GC含量(47.0%)高于SSC (31.2%)和LSC (29.3%)。新绒苔叶绿体基因组序列共编码132个基因,其中蛋白编码基因87个,rRNA基因8个,tRNA基因37个。

      图  1  新绒苔叶绿体基因组基因图谱

      Figure 1.  Chloroplast genome gene map of N. bissetii

      按照基因功能,主要分为光合作用、转录和未知功能基因,未发现转录起始因子infA。叶绿体基因内含子分析显示:10个基因含有内含子,clpP蛋白编码基因含有2个内含子(表2)。

      表 2  新绒苔叶绿体基因组编码的基因

      Table 2.  Genes encoded by the chloroplast genome of N. bissetii

      基因类别 基因功能 基因名称
      光合作用 ATP合酶亚基 atpA, atpB, atpE, atpH, atpI
      光系统Ⅰ psaA, psaB, psaC, psaJ
      光系统Ⅱ psbA, psbB, psbC, psbD, psbE, psbL, psbN, psbT, psbZ, ycf3
      NADH-脱氢酶亚基 ndhA*, ndhB*, ndhC, ndhD, ndhE, ndhF, ndhH, ndhI, ndhJ, ndhK
      细胞色素复合物b/f亚基 petA, petB *, petD, petG
      Rubisco酶亚基 rbcL
      复制基因 核糖体大亚基 rpl14, rpl16, rpl2*, rpl20, rpl22, rpl33, rpl36
      DNA依赖核酸聚合酶 rpoA, rpoB, rpoC1*, rpoC2
      核糖体小亚基 rps12*, rps19, rps2, rps3, rps4, rps8
      核糖体RNA基因 rrn16S (×2), rrn23S (×2), rrn4.5S (×2), rrn5S (×2)
      转运RNA基因 trnA-UGC (×2)*, trnC-GCA, trnD-GUC, trnE-UUC, trnE-UUC (×2)*, trnF-GAA, trnG-GCC (×2)*, trnH-GUG, trnK-UUU (×2)*, trnL-CAA, trnL-UAA*, trnL-UAG, trnM-CAU (×2), trnN-GUU (×2), trnP-UGG, trnQ-UUG, trnR-ACG (×2), trnR-UCU, trnS-GCU, trnS-GGA, trnS-UGA, trnT-CGU*, trnT-GGU, trnT-UGU, trnV-GAC (×2), trnW-CCA, trnY-GUA
      其他基因 乙酰辅酶A羧化酶亚基
      c型细胞色素合成基因
      accD
      ccsA
      蛋白酶
      包裹膜蛋白
      成熟酶
      clpP**
      cemA
      matK
      保守开放性阅读框 ycf1,ycf2 (×2),ycf66
        说明:*和**标记的分别为含有单内含子和双内含子的基因。位于IR的重复基因标记为(×2)。
    • 新绒苔叶绿体基因组共检测到56个SSR,包括21个单核苷酸重复序列、20个二核苷酸重复序列、9个三核苷酸重复序列、5个四核苷酸重复序列和1个五核苷酸重复序列。SSR最丰富的类型是单核苷酸重复序列,单核苷酸重复序列以A和T碱基为主。此外,A/T、AT/AT和AAAT/ATTT重复序列占66.07%,说明新绒苔的SSR偏好使用A和T碱基(图2)。

      图  2  新绒苔叶绿体基因组SSR信息

      Figure 2.  SSR information in chloroplast genome of N. bissetii

      通过分析新绒苔的长重复序列,在叶绿体基因组中鉴定出35个重复序列,其中正向重复6个,回文重复28个,反向重复1个。与NCBI数据库中的毛边光萼苔、毛耳苔、厚角耳叶苔、细光萼苔Porella gracillima (NC_082430)、巨瓣光萼苔Porella grandiloba (NC_072065)在重复数和重复类型上存在差异。新绒苔、毛边光萼苔和厚角耳叶苔未检测到互补重复序列,其余均含有4个重复序列。除巨瓣光萼苔外,其他6种植物重复序列中,回文重复比例最高(图3)。

      图  3  7种苔藓植物叶绿体基因组长重复序列分析

      Figure 3.  Long repeats of chloroplast genome in 7 bryophytes

    • 新绒苔叶绿体基因组中共发现39 474个编码密码子,其中编码亮氨酸的密码子最多,共有4 136个;编码色氨酸的密码子最少,共有475个。64种密码子共编码20种氨基酸,终止密码子为UAA、UAG和UGA。对该叶绿体基因组的相对同义密码子使用度(RSCU)进行分析,RSCU≥1.00的密码子有33个,以A/U结尾的高频密码子28个,以C/G结尾的密码子5个。此外,新绒苔叶绿体基因组偏好密码子多以A/U结尾,与GC含量较低的基因组一致(表3)。

      表 3  新绒苔叶绿体基因组密码子使用分析

      Table 3.  Analysis of chloroplast genome codon usage in N. bissetii

      氨基酸密码子数量RSCU氨基酸密码子数量RSCU氨基酸密码子数量RSCU氨基酸密码子数量RSCU
      PheUUU21661.36TyrUAU13791.42GluGAG4110.62AlaGCC1770.69
      PheUUC10270.64TyrUAC5660.58SerUCU6371.21AlaGCA3071.20
      LeuUUA11961.74TerUAA12991.47SerUCC4960.94AlaGCG1670.65
      LeuUUG8341.21TerUAG6080.69SerUCA6501.23CysUGU4701.14
      LeuCUU7461.08TerUGA7390.84SerUCG4430.84CysUGC3530.86
      LeuCUC4220.61HisCAU6441.40SerAGU4950.94TrpUGG4751.00
      LeuCUA5710.83HisCAC2770.60SerAGC4370.83ArgCGU2690.75
      LeuCUG3670.53GlnCAA7991.32ProCCU3831.12ArgCGC1460.41
      IleAUU16261.36GlnCAG4100.68ProCCC3140.92ArgCGA3951.11
      IleAUC6860.58AsnAAU16271.42ProCCA4701.38ArgCGG2040.57
      IleAUA12641.06AsnAAC6580.58ProCCG1960.58ArgAGA7202.02
      MetAUG6091.00LysAAA20991.46ThrACU4901.16ArgAGG4041.13
      ValGUU6261.45LysAAG7820.54ThrACC4251.01GlyGGU4111.13
      ValGUC2500.58AspGAU6411.43ThrACA4751.13GlyGGC2070.57
      ValGUA5581.30AspGAC2570.57ThrACG2930.70GlyGGA5261.44
      ValGUG2880.67GluGAA9171.38AlaGCU3741.46GlyGGG3160.87
    • 对新绒苔等7种苔藓植物叶绿体基因组的IR边界收缩扩张进行分析(图4),结果表明:7种苔藓植物的叶绿体基因组长度从Aneura mirabilis的108 007 bp到爪哇裸蒴苔的128 728 bp不等。IR长度为16 480~21 856 bp,LSC长度为77 553~88 291 bp,SSC长度为13 974~19 854 bp。trnVtrnLndhF、16SchlL是位于IR边界附近的主要基因。在这7个物种中,rps12、rpl23和trnL基因均位于LSC,trnV基因位于IRa。除爪哇裸蒴苔外,其余物种LSC与IRb之间的连接位点(JSB)的边界基因均为ndhF。新绒苔囊绒苔、A. mirabilis、异溪苔爪哇裸蒴苔在叶绿体基因组中IRa与LSC之间的连接位点(JLA)边界未注释到16S基因。新绒苔和囊绒苔在叶绿体基因组中LSC与IRb之间的连接位点(JLB)边界附近缺失trnL基因,明显有别于其他5个物种。

      图  4  7种苔藓植物叶绿体基因组边界分析

      Figure 4.  Chloroplast genome boundary analysis of 7 bryophytes

    • 基于19种苔藓植物叶绿体基因组构建的BI树和ML树在拓扑结构上一致,各分支节点的支持率大部分为100%,可靠性较高。从系统发育树(图5)上看,叉苔亚纲的绿片苔和A. mirabilis最先分离出来,接着是溪苔亚纲的异溪苔,叶苔亚纲的14个种形成一支,内部包括2个姐妹分支:一支是广义叶苔目Jungermanniales s.l.,包括东亚鞭苔、护蒴苔、全萼苔、四齿异萼苔、中华羽苔和刺边合叶苔;另一支是广义光萼苔目Porellales s.l.和毛叶苔目Ptilidiales,前者包括白鳞苔、狭瓣疣鳞苔、厚角耳叶苔、毛耳苔、毛边光萼苔和日本扁萼苔,后者包括深裂毛叶苔、囊绒苔和新绒苔。新绒苔和囊绒苔形成1支,与深裂毛叶苔形成姐妹支,支持率为100%,说明其亲缘关系最密切。

      图  5  基于19种苔藓植物叶绿体基因组序列构建的系统发育树

      Figure 5.  Phylogenetic tree based on chloroplast genome sequences of 19 bryophytes

    • 新绒苔作为东亚特有的濒危苔藓植物,本研究首次对其叶绿体基因组进行测序、组装和分析。新绒苔叶绿体基因组总长度为118 423 bp,呈现典型的环状四分体结构,GC含量为33.3%,共编码了132个基因,与细光萼苔、巨瓣光萼苔、厚角耳叶苔、毛耳苔、尖瓣合叶苔Scapania ampliata植物叶绿体基因组特征相似[5, 29],表明苔藓植物叶绿体基因组进化相对保守。

      SSR技术具有简便、快速、稳定性高和等位基因多样性高等特点,在基因组研究中,已经作为主要的分子标记技术广泛应用于比较基因组研究和系统学研究等领域[30]。重复序列分析显示:新绒苔叶绿体基因组有56个SSR,最丰富的类型是单核苷酸重复序列,单核苷酸重复序列以 A和T碱基为主。这与许多其他藓类植物物种报道的结果一致[7]

      植物在进化过程中,密码子的使用会受到自然选择、碱基突变、遗传漂变等因素的影响而产生偏好性[31]。植物叶绿体基因的RSCU可以确定密码子偏好性,RSCU≥1.00的密码子为高频率密码子,RSCU<1.00,则表示该密码子较少使用[32]。新绒苔 RSCU≥1.00的密码子有33个,其中以A、U结尾的密码子占84.8%,说明偏好以A、U结尾。与张家榕等[33]对18 种苔藓植物rbcL基因的密码子偏好分析结果相同。

      IR和SSC边界的扩张和收缩导致相关基因拷贝数变化或边界区域假基因产生,这是叶绿体基因组进化过程中都存在的现象,也是其长度变化的主要原因[34]。本研究中,位于IR边界的基因包括trnVtrnLndhF、16SchlL,且所有物种的IRb与SSC之间的连接位点均在ndhF基因内,且新绒苔的IR边界相对保守,只有极个别基因出现了缺失,如在JLB边界附近缺失trnL基因。新绒苔与囊绒苔同属于新绒苔科,叶绿体基因组特征和边界比较分析表明:除trnM基因外,其余基因位置一致,说明新绒苔与囊绒苔亲缘关系较近;二者在IRb均不含trnL基因,区别于其他目植物,说明二者与其余物种亲缘关系较远[35]

      本研究利用19种苔藓植物叶绿体基因组构建的系统发育树与近期研究一致[4-5, 36],支持了新绒苔科(包括新绒苔属和囊绒苔属)的成立,新绒苔科与毛叶苔科共同构成毛叶苔目,并与广义光萼苔目形成姐妹关系。

    • 新绒苔的叶绿体基因组为典型的四分体结构,叶绿体全基因组序列全长为118 423 bp,包含79个蛋白质编码基因,8个rRNA和36个tRNA,系统发育分析显示新绒苔属和囊绒苔属为姐妹关系,共同构成了新绒苔科。本研究丰富了新绒苔属分子生物学资源,研究结果可为新绒苔及其近缘种的物种鉴定、资源保护和系统进化提供理论参考。

参考文献 (36)

目录

/

返回文章
返回