-
重瓣榆叶梅Prunus triloba ‘Multiplex’属蔷薇科Rosaceae李属Prunus灌木或小乔木,早春开花,是中国特有园林植物[1−2]。重瓣榆叶梅具有较强的抗盐碱能力,广泛栽培于中国东北、华北和西北地区[3];重瓣榆叶梅花和花粉富含蛋白质、生物酶、多糖、脂肪、氨基酸和维生素等物质,可以用作保健品、药品、食品和营养性化妆品的原材料[4−5]。种仁含油量较高,可代郁李仁入药[6]。重瓣榆叶梅于1855年被引入欧洲、美洲、大洋洲[7],广泛用于园林绿化。研究发现:榆叶梅P. triloba与近缘种桃P. persica的核不对称性较接近,榆叶梅为八倍体(2n=64),核型分类为2B或2A,核不对称系数高达63.08%[2]。但榆叶梅的物种发生还尚不清楚,关于重瓣榆叶梅和榆叶梅系统发育关系仍是空白。
叶绿体基因组是植物叶绿体的独立遗传系统,重组率低且保守,一般为四分体结构,由大单拷贝区(LSC)、双向重复区(IR)和小单拷贝区(SSC)组成,在植物物种鉴定、物种分化、DNA条形码开发和系统分类研究中具备可信度[8-11]。已有研究通过对46个类群的叶绿体atpB-rbcL构建进化树,明确了小麦族猬草属Hystrix和赖草属Leymus的系统发育关系[12];基于rbcL + matK + trnH-psbA组合序列和叶绿体全基因组研究白头翁属Pulsatilla物种的系统发育关系,发现变异热点在物种识别和系统发育分析中建树结果相似[13];基于叶绿体psbD 基因构建的进化树表明:花叶矢竹Pseudosasa japonica f. akebonosuji与毛竹Phyllostachys edulis的亲缘关系较近[14]。目前,已获得野生榆叶梅叶绿体基因组序列[3],但未见关于重瓣榆叶梅的叶绿体基因组序列报道。本研究通过 Illumina NovaSeq高通量测序平台,成功组装了重瓣榆叶梅叶绿体全基因组序列结构并分析其遗传多样性,以期为重瓣榆叶梅系统发育、物种鉴定、资源开发研究提供理论依据。
-
重瓣榆叶梅全叶绿体基因组总长度为157 827 bp,数据已上传至 GeneBank,登录号为MT937181。基于Illumina NovaSeq 6000测序平台表明,重瓣榆叶梅(MT937181)的读取总和(ReadSum)、基本总和(BaseSum)分别为15 307 141、4 592 142 300 bp,Q20和Q30分别为97.91%和93.90%。重瓣榆叶梅全叶绿体基因组为经典的四分体结构,由1个大单拷贝区域(LSC),1个小单拷贝区域(SSC)及反向重复区域(IRa/IRb)构成(表1~2和图1),其序列长度分别为86 032、19 023、26 386 bp。重瓣榆叶梅全叶绿体基因组中GC和AT的总占比分别为 36.80%和63.20%,GC占比在 IR、LSC 和SSC区域存在较大的差异,IR区域GC占比最高可达42.58%;LSC 次之,GC占比34.64%;SSC中GC占比最低仅30.48%(表1)。
表 1 重瓣榆叶梅叶绿体基因组结构组成
Table 1. Structure and composition of P. triloba ‘Multiplex’ chloroplast genome
区域 全叶绿体基因组 大单拷贝区(LSC) 小单拷贝区(SSC) 反向重复区(IRa) 反向重复区(IRb) 数量 占比/% 数量 占比/% 数量 占比/% 数量 占比/% 数量 占比/% A 49 091 31.10 27 334 31.77 6 606 34.73 7 588 28.76 7 563 28.66 C 29 663 18.79 15 381 17.88 3 047 16.02 5 416 20.53 5 819 22.05 G 28 410 18.00 14 423 16.76 2 752 14.47 5 819 22.05 5 416 20.53 T 50 663 32.10 28 894 33.59 6 618 34.79 7 563 28.66 7 588 28.76 GC 58 073 36.80 29 804 34.64 5 799 30.48 11 235 42.58 11 235 42.58 总计 157 827 100.00 86 032 100.00 19 023 100.00 26 386 100.00 26 386 100.00 重瓣榆叶梅全叶绿体基因组中注释了132个基因(图1和表2),LSC区、IR区和SSC区的基因数量分别为82个(62.12%)、19个(14.39%)和12个(9.09%),蛋白编码基因有87个,占比65.91%,核糖体RNA(rRNA)数量为8个,占比6.06%,转运RNA(tRNA)数量为37个,占比28.03%。重瓣榆叶梅全叶绿体基因组序列的基因中, ycf2长度为6 834 bp,ycf1为5 589 bp,rpoC2为4 107 bp,是排名在前3位的最大基因。rRNA 基因rrn4.5、rrn16、rrn5、rrn23在IRs区,均有2个拷贝,其基因长度分别为103、1 491、121和2 809 bp。
重瓣榆叶梅全叶绿体基因组与其他植物的叶绿体基因类似,大多数基因均不存在内含子且基因数量为1。重瓣榆叶梅全叶绿体基因组有19个双拷贝类型基因,占比为14.39%,包括:5个自我复制类型基因,即ndhB(NADH脱氢酶亚基基因)、rpl2、rpl23、rps12、rps7;4个rRNA基因,即rrn16、rrn23、rrn4.5、rrn5;7个tRNA基因,即trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC;3个未知功能蛋白基因,即ycf1、ycf2和ycf15。除atpF、ndhA、ndhB、petB、petD、rpl16、rpl2、rpoC1、rps12、rps16、trnA-UGC、trnG-GCC、trnI-GAU、trnK-UUU、trnL-UAA、trnV-UAC等16个基因各含1个内含子,clpP、ycf3基因含2个内含子,其余大部分基因不含内含子(表2)。
表 2 重瓣榆叶梅叶绿体全基因组所编码基因
Table 2. List of genes present in P. triloba ‘Multiplex’ chloroplast genome
基因分类 基因分组 基因名称 光合作用相关基因 光合系统Ⅰ基因 psaA、psaB、psaC、psaI、psaJ 光合系统Ⅱ基因 psbA、psbB、psbC、psbD、psbE、psbF、psbH、psbI、psbJ、psbK、psbL、psbM、psbN、psbT、psbZ NADH脱氢酶基因 ndhA*、ndhB*(2)、ndhC、ndhD、ndhE、ndhF、ndhG、ndhH、ndhI、ndhJ、ndhK 细胞色素复合物基因 petA、petB*、petD*、petG、petL、petN ATP合酶基因 atpA、atpB、atpE、atpF*、atpH、atpI 二磷酸核酮糖羧化酶大亚基基因 rbcL 自我复制相关基因 核糖体大亚基基因 rpl14、rpl16*、rpl2*(2)、rpl20、rpl22、rpl23(2)、rpl32、rpl33、rpl36 核糖体小亚基基因 rps11、rps12**(2)、rps14、rps15、rps16*、rps18、rps19、rps2、rps3、rps4、rps7(2)、rps8 RNA聚合酶亚基基因 rpoA、rpoB、rpoC1*、rpoC2 核糖体RNA基因 rrn16(2)、rrn23(2)、rrn4.5(2)、rrn5(2) 转运RNA基因 trnA-UGC*(2)、trnC-GCA、trnD-GUC、trnE-UUC、trnF-GAA、trnG-GCC*、trnG-UCC、trnH-GUG、trnI-CAU(2)、trnI-GAU*(2)、trnK-UUU*、trnL-CAA(2)、trnL-UAA*、trnL-UAG、trnM-CAU、trnN-GUU(2)、trnP-UGG、trnQ-UUG、trnR-ACG(2)、trnR-UCU、trnS-GCU、trnS-GGA、trnS-UGA、trnT-GGU、trnT-UGU、trnV-GAC(2)、trnV-UAC*、trnW-CCA、trnY-GUA、trnfM-CAU 其他基因 成熟酶基因 matK 依赖ATP的蛋白酶单元p基因 clpP** 包裹膜蛋白基因 cemA 乙酰辅酶A羧化酶亚基基因 accD c型细胞色素合成基因 ccsA 未知功能基因 保守开放阅读框 ycf1(2)、ycf15(2)、ycf2(2)、ycf3**、ycf4 说明:* 代表基因有1个内含子;**代表基因有2个内含子;(2)代表基因的拷贝数为2。 -
MT937181中发现共有26 678个编码密码子(表3)。其中,亮氨酸(Leu)的编码密码子数量最多,达2 792个;蛋氨酸(Met)的编码密码子有AUG、AUU、CUG、GUG和UUG等,其中AUU和UUG数量最少,均只有1个。重瓣榆叶梅全叶绿体基因组的编码异亮氨酸(Ile)的AUU数量最多,达1 108个。编码Leu的密码子最多,占总量的10.47%;而最少的色氨酸(Trp)仅占1.70%。此外,31种密码子的相对同义密码子使用度(RSCU)>1,表明它们在重瓣榆叶梅全叶绿体基因组中是偏好密码子。在偏好密码子中有29种都是以A或者U结尾,占RSCU>1的密码子总量93.55%,只有编码Leu的UUG和编码Met的AUG这2种偏好密码子是以G结尾,偏好密码子多选择密码子第3位是 A或者T,体现出密码子A/T偏好性。RSCU<1的密码子有36个,其中以G/C碱基结尾的有33个,说明RSCU<1的重瓣榆叶梅全叶绿体基因组的密码子更倾向以G/C碱基结尾;Trp的RSCU=1,无密码子偏好性。
表 3 重瓣榆叶梅叶绿体基因组中的编码密码子
Table 3. Codon usage of P. triloba ‘Multiplex’
符号 氨基酸 密码子 数量/个 RSCU 符号 氨基酸 密码子 数量/个 RSCU * Ter UAA 52 1.793 1 M Met GUG 2 0.016 0 * Ter UAG 21 0.724 2 M Met UUG 1 0.008 0 * Ter UGA 14 0.482 7 M Met AUG 620 0.495 2 A Ala GCA 385 1.096 8 N Asn AAC 308 0.470 2 A Ala GCC 226 0.644 0 N Asn AAU 1002 1.529 8 A Ala GCG 155 0.441 6 P Pro CCA 313 1.137 2 A Ala GCU 638 1.817 6 P Pro CCC 208 0.755 6 C Cys UGC 78 0.500 0 P Pro CCG 151 0.548 4 C Cys UGU 234 1.500 0 P Pro CCU 429 1.558 4 D Asp GAC 213 0.393 4 Q Gln CAA 725 1.547 4 D Asp GAU 870 1.606 6 Q Gln CAG 212 0.452 6 E Glu GAA 1 041 1.476 6 R Arg AGA 503 1.880 4 E Glu GAG 369 0.523 4 R Arg AGG 176 0.658 2 F Phe UUC 524 0.688 2 R Arg CGA 358 1.338 6 F Phe UUU 999 1.311 8 R Arg CGC 111 0.415 2 G Gly GGA 728 1.621 2 R Arg CGG 118 0.441 0 G Gly GGC 174 0.387 6 R Arg CGU 339 1.267 2 G Gly GGG 303 0.674 8 S Ser AGC 140 0.412 8 G Gly GGU 591 1.316 4 S Ser AGU 398 1.174 2 H His CAC 152 0.471 4 S Ser UCA 414 1.221 0 H His CAU 493 1.528 6 S Ser UCC 327 0.964 8 I Ile AUA 732 0.959 1 S Ser UCG 187 0.551 4 I Ile AUC 450 0.589 5 S Ser UCU 568 1.675 8 I Ile AUU 1 108 1.451 4 T Thr ACA 422 1.241 2 K Lys AAA 1 080 1.505 2 T Thr ACC 250 0.735 2 K Lys AAG 355 0.494 8 T Thr ACG 151 0.444 0 L Leu CUA 367 0.788 4 T Thr ACU 537 1.5796 L Leu CUC 186 0.399 6 V Val GUA 557 1.537 6 L Leu CUG 188 0.403 8 V Val GUC 161 0.444 4 L Leu CUU 580 1.246 2 V Val GUG 206 0.568 8 L Leu UUA 909 1.953 6 V Val GUU 525 1.449 2 L Leu UUG 562 1.207 8 W Trp UGG 454 1.000 0 M Met AUU 1 0.008 0 Y Tyr UAC 205 0.400 0 M Met CUG 2 0.016 0 Y Tyr UAU 820 1.600 0 -
采用MISA软件对重瓣榆叶梅叶绿体基因组进行了SSR分析(图2和表4)。在重瓣榆叶梅叶绿体基因组中共查找到 236个符合条件的SSR位点。单核苷酸重复单元有146个,双核苷酸重复单元有12 个,三核苷酸重复单元有62个,四核苷酸重复单元有8个,五核苷酸重复单元有1个,其他核苷酸重复单元有7个。叶绿体不同区域的SSR分布情况有差异,大部分SSR位于LSC,一部分在 IRs 区域内,少数位于 SSC区域。分布在IR、LSC、SSC区域的SSR位点分别为38、158、40个,占比分别为16.10%、66.95%、16.95%。SSR位点在不同功能的基因间分布也不均:114个位于基因间隔区(IGS), 82个SSR位于外显子,40个SSR位于内含子。从分布情况发现,SSR多位于 LSC和基因间隔区。从碱基的组成上看,SSR 中重 复 占 比最 大 的 是 单核苷 酸 , 约 61.86%。重瓣榆叶梅叶绿体基因组中的SSR主要是由A和 T组成的,占所有重复序列的 72.46%,其中 A/T 碱基构成的单核苷酸重复序列137条,AT/TA组成的二核苷酸重复序列 11条,A与T组成的三核苷酸重复序列18 条,A与T 组成的四核苷酸重复序列5条。
图 2 重瓣榆叶梅叶绿体基因组中 SSR 位点类型及数量
Figure 2. Type and number of SSR loci of P. triloba ‘Multiplex’ chloroplast genome
表 4 重瓣榆叶梅叶绿体基因组中SSR位点所在区域情况
Table 4. Region of SSR loci of P. triloba ‘Multiplex’ chloroplast genome
区域 数量/个 占比/% 外显子/个 内含子/个 基因间区/个 IR 38 16.10 21 4 13 LSC 158 66.90 35 33 90 SSC 40 16.90 26 3 11 总计 236 100.00 82 40 114 重瓣榆叶梅SSR位点在叶绿体基因组中多态性较高,具有A/T碱基偏好性。SSR主要是A或T、ATA、ATTA/TAAT/AT复合重复、TTA /TAT或AT/TA,为SSR分子标记的开发打下基础。
-
选择重瓣榆叶梅与东京樱花P. yedoensis、扁桃P. dulcis、麦李P. glandulosa 和中国李P. salicina的叶绿体基因组进行Mauve比对(图3),结果表明:重瓣榆叶梅全叶绿体基因组与其余4个物种序列有良好的共线性关系,叶绿体基因组未检测到大片段的基因重排。5个物种的基因组序列横向均分为3个部分(各物种序列长度与图中序列长度不同),从左到右为LSC/IR/SSC,纵向有一直竖线,说明5个物种叶绿体基因组的基因组成和排列十分相似。LSC和SSC中粉色局块斑纹较多,白色多为IR区,几乎为空白,说明IR区域十分保守。76 915~81 087 bp局块区间,5个物种的对比差异性最大。
重瓣榆叶梅全叶绿体基因组与已经公布的其他植物的叶绿体序列构建系统进化树(图4)。结果发现:进化树上各节点和分支聚类的支持率较高,检验分值可达 100% ,说明聚类结果的可靠性较高。由聚类图可知重瓣榆叶梅与榆叶梅聚合在一个分支,和长柄扁桃P. pedunculata亲缘关系最近。基于单拷贝核基因 RPB2、Leafy内含子序列对榆叶梅及其近缘种系统发育学分析,发现桃P. persica、普通扁桃P. dulcis、蒙古扁桃P. mongolica 聚为一个类群;榆叶梅、长柄扁桃、矮扁桃P. tenella聚为一个类群。矮扁桃的系统发育地位有争议,可能与矮扁桃的取样和命名有极大关系,需要进一步探讨。核基因和叶绿体基因组共同认为榆叶梅和长柄扁桃具有同源最近亲缘关系,在进行榆叶梅品种选育和育苗育种时,可充分考虑榆叶梅与长柄扁桃的系统发育关系。
Genetic characteristics of whole chloroplast genome in Prunus triloba ‘Multiplex’
-
摘要:
目的 对重瓣榆叶梅 Prunus triloba ‘Multiplex’ 全叶绿体基因组序列进行测序,探究其系统发育位置并分析其叶绿体基因组成特点。 方法 以重瓣榆叶梅叶片为材料,采用2×CTAB法提取叶绿体DNA,利用Illumina NovaSeq 平台进行叶绿体基因组的测序,组装、注释并分析其叶绿体基因组遗传特征。联合美国国家生物技术信息中心(NCBI)数据库数据,基于全叶绿体基因组序列构建了重瓣榆叶梅系统进化关系。 结果 重瓣榆叶梅叶绿体基因组全长为 157 827 bp,NCBI登录号 MT937181,其结构为经典的四分体结构,由1个大单拷贝区域(LSC),1个小单拷贝区域(SSC)及反向重复区域(IRa/IRb)构成,其序列长度分别为86 032、19 023、26 386 bp。GC和AT的总占比分别为36.80%和63.20%。重瓣榆叶梅的完整叶绿体基因组序列注释到132个基因,包括tRNA基因、编码蛋白基因、rRNA基因,分别为37、87、8个。重瓣榆叶梅叶绿体基因组共编码 26 678个密码子和236个符合条件的SSR位点。SSR 位点中A/T碱基占优势,碱基偏好性十分明显。 结论 系统进化树分析表明,重瓣榆叶梅和榆叶梅P. triloba 聚合成一分支结构,与同属植物长柄扁桃P. pedunculata亲缘关系较近。图4表4参26 Abstract:Objective To investigate the phylogenetic location of Prunus triloba ‘Multiplex’ and analyze its chloroplast gene composition characteristics, the whole chloroplast genome sequence of P. triloba ‘Multiplex’ was sequenced. Method The leaves of P. triloba ‘Multiplex’ were used as materials to extract chloroplast DNA using 2×CTAB method. The whole chloroplast genome was sequenced by Illumina NovaSeq platform. We then assembled, annotated, and analyzed the genetic characteristics of the chloroplast genomic sequence. Combined with the NCBI database data, the phylogenetic relationship of P. triloba ‘Multiplex’ was constructed based on the whole chloroplast genome sequence. Result The total length of the chloroplast genome of P. triloba ‘Multiplex’ is 157 827 bp, with NCBI registration number MT937181. The structure is a classic tetrad structure, consisting of 1 LSC (large single copy region), 1 SSC (small single copy region), and IRa/IRb (reverse repeat region), with sequence lengths of 86 032, 19 023 and 26 386 bp, respectively. The total content of GC and AT is 36.80% and 63.20%, respectively. The complete chloroplast genome sequence of P. triloba ‘Multiplex’ was annotated to 132 genes, including 37 tRNA genes, 87 coding protein genes, and 8 rRNA genes, respectively. The chloroplast genome of P. triloba ‘Multiplex’ encodes a total of 26 678 codons and 236 eligible SSR loci. The A/T base is dominant in the SSR site, and the base preference is very obvious. Conclusion The phylogenetic tree analysis showed that P. triloba ‘Multiplex’ and P. triloba aggregate into a branch structure, and are closely related to P. pedunculata in the same genus. The results of this study will provide new evidence and basic experimental data for species identification, phylogenetic evolution, and breeding and selection of P. triloba ‘Multiplex’. [Ch, 4 fig. 4 tab. 26 ref.] -
Key words:
- Prunus triloba ‘Multiplex’ /
- whole chloroplast genome /
- codon preference /
- repeated sequence /
- phylogeny
-
表 1 重瓣榆叶梅叶绿体基因组结构组成
Table 1. Structure and composition of P. triloba ‘Multiplex’ chloroplast genome
区域 全叶绿体基因组 大单拷贝区(LSC) 小单拷贝区(SSC) 反向重复区(IRa) 反向重复区(IRb) 数量 占比/% 数量 占比/% 数量 占比/% 数量 占比/% 数量 占比/% A 49 091 31.10 27 334 31.77 6 606 34.73 7 588 28.76 7 563 28.66 C 29 663 18.79 15 381 17.88 3 047 16.02 5 416 20.53 5 819 22.05 G 28 410 18.00 14 423 16.76 2 752 14.47 5 819 22.05 5 416 20.53 T 50 663 32.10 28 894 33.59 6 618 34.79 7 563 28.66 7 588 28.76 GC 58 073 36.80 29 804 34.64 5 799 30.48 11 235 42.58 11 235 42.58 总计 157 827 100.00 86 032 100.00 19 023 100.00 26 386 100.00 26 386 100.00 表 2 重瓣榆叶梅叶绿体全基因组所编码基因
Table 2. List of genes present in P. triloba ‘Multiplex’ chloroplast genome
基因分类 基因分组 基因名称 光合作用相关基因 光合系统Ⅰ基因 psaA、psaB、psaC、psaI、psaJ 光合系统Ⅱ基因 psbA、psbB、psbC、psbD、psbE、psbF、psbH、psbI、psbJ、psbK、psbL、psbM、psbN、psbT、psbZ NADH脱氢酶基因 ndhA*、ndhB*(2)、ndhC、ndhD、ndhE、ndhF、ndhG、ndhH、ndhI、ndhJ、ndhK 细胞色素复合物基因 petA、petB*、petD*、petG、petL、petN ATP合酶基因 atpA、atpB、atpE、atpF*、atpH、atpI 二磷酸核酮糖羧化酶大亚基基因 rbcL 自我复制相关基因 核糖体大亚基基因 rpl14、rpl16*、rpl2*(2)、rpl20、rpl22、rpl23(2)、rpl32、rpl33、rpl36 核糖体小亚基基因 rps11、rps12**(2)、rps14、rps15、rps16*、rps18、rps19、rps2、rps3、rps4、rps7(2)、rps8 RNA聚合酶亚基基因 rpoA、rpoB、rpoC1*、rpoC2 核糖体RNA基因 rrn16(2)、rrn23(2)、rrn4.5(2)、rrn5(2) 转运RNA基因 trnA-UGC*(2)、trnC-GCA、trnD-GUC、trnE-UUC、trnF-GAA、trnG-GCC*、trnG-UCC、trnH-GUG、trnI-CAU(2)、trnI-GAU*(2)、trnK-UUU*、trnL-CAA(2)、trnL-UAA*、trnL-UAG、trnM-CAU、trnN-GUU(2)、trnP-UGG、trnQ-UUG、trnR-ACG(2)、trnR-UCU、trnS-GCU、trnS-GGA、trnS-UGA、trnT-GGU、trnT-UGU、trnV-GAC(2)、trnV-UAC*、trnW-CCA、trnY-GUA、trnfM-CAU 其他基因 成熟酶基因 matK 依赖ATP的蛋白酶单元p基因 clpP** 包裹膜蛋白基因 cemA 乙酰辅酶A羧化酶亚基基因 accD c型细胞色素合成基因 ccsA 未知功能基因 保守开放阅读框 ycf1(2)、ycf15(2)、ycf2(2)、ycf3**、ycf4 说明:* 代表基因有1个内含子;**代表基因有2个内含子;(2)代表基因的拷贝数为2。 表 3 重瓣榆叶梅叶绿体基因组中的编码密码子
Table 3. Codon usage of P. triloba ‘Multiplex’
符号 氨基酸 密码子 数量/个 RSCU 符号 氨基酸 密码子 数量/个 RSCU * Ter UAA 52 1.793 1 M Met GUG 2 0.016 0 * Ter UAG 21 0.724 2 M Met UUG 1 0.008 0 * Ter UGA 14 0.482 7 M Met AUG 620 0.495 2 A Ala GCA 385 1.096 8 N Asn AAC 308 0.470 2 A Ala GCC 226 0.644 0 N Asn AAU 1002 1.529 8 A Ala GCG 155 0.441 6 P Pro CCA 313 1.137 2 A Ala GCU 638 1.817 6 P Pro CCC 208 0.755 6 C Cys UGC 78 0.500 0 P Pro CCG 151 0.548 4 C Cys UGU 234 1.500 0 P Pro CCU 429 1.558 4 D Asp GAC 213 0.393 4 Q Gln CAA 725 1.547 4 D Asp GAU 870 1.606 6 Q Gln CAG 212 0.452 6 E Glu GAA 1 041 1.476 6 R Arg AGA 503 1.880 4 E Glu GAG 369 0.523 4 R Arg AGG 176 0.658 2 F Phe UUC 524 0.688 2 R Arg CGA 358 1.338 6 F Phe UUU 999 1.311 8 R Arg CGC 111 0.415 2 G Gly GGA 728 1.621 2 R Arg CGG 118 0.441 0 G Gly GGC 174 0.387 6 R Arg CGU 339 1.267 2 G Gly GGG 303 0.674 8 S Ser AGC 140 0.412 8 G Gly GGU 591 1.316 4 S Ser AGU 398 1.174 2 H His CAC 152 0.471 4 S Ser UCA 414 1.221 0 H His CAU 493 1.528 6 S Ser UCC 327 0.964 8 I Ile AUA 732 0.959 1 S Ser UCG 187 0.551 4 I Ile AUC 450 0.589 5 S Ser UCU 568 1.675 8 I Ile AUU 1 108 1.451 4 T Thr ACA 422 1.241 2 K Lys AAA 1 080 1.505 2 T Thr ACC 250 0.735 2 K Lys AAG 355 0.494 8 T Thr ACG 151 0.444 0 L Leu CUA 367 0.788 4 T Thr ACU 537 1.5796 L Leu CUC 186 0.399 6 V Val GUA 557 1.537 6 L Leu CUG 188 0.403 8 V Val GUC 161 0.444 4 L Leu CUU 580 1.246 2 V Val GUG 206 0.568 8 L Leu UUA 909 1.953 6 V Val GUU 525 1.449 2 L Leu UUG 562 1.207 8 W Trp UGG 454 1.000 0 M Met AUU 1 0.008 0 Y Tyr UAC 205 0.400 0 M Met CUG 2 0.016 0 Y Tyr UAU 820 1.600 0 表 4 重瓣榆叶梅叶绿体基因组中SSR位点所在区域情况
Table 4. Region of SSR loci of P. triloba ‘Multiplex’ chloroplast genome
区域 数量/个 占比/% 外显子/个 内含子/个 基因间区/个 IR 38 16.10 21 4 13 LSC 158 66.90 35 33 90 SSC 40 16.90 26 3 11 总计 236 100.00 82 40 114 -
[1] 俞德浚, 陆玲娣, 谷粹芝, 等. 中国植物志: 第38卷[M]. 北京: 科学出版社, 1986. YU Dejun, LU Lingdi, GU Cuizhi, et al. Flora of China: Volume 38 [M]. Beijing: Science Press, 1986. [2] 董山平, 罗乐, 钟军珺, 等. 榆叶梅及其部分近缘种的染色体核型分析[J]. 西北植物学报, 2015, 35(3): 608 − 613. DONG Shanping, LUO Le, ZHONG Junjun, et al. Analysis of karyotypes of Prunus triloba and four related species [J]. Acta Botanica Boreali-Occidentalia Sinica, 2015, 35(3): 608 − 613. [3] DUAN Chunyan, SHEN Yehua, ZHAO Guifang. Complete chloroplast genome characteristics of Prunus triloba Lindl [J]. Mitochond DNA Part B Resources, 2020, 5(1): 504 − 505. [4] 李姣姣, 陈媛梅. 重瓣榆叶梅花中多糖提取工艺及动态含量研究[J]. 中国农业大学学报, 2018, 23(1): 71 − 79. LI Jiaojiao, CHEN Yuanmei. Optimal extraction technology and the dynamic content of polysaccharide in Amygdalus triloba f. multiplex flowers [J]. Journal of China Agricultural University, 2018, 23(1): 71 − 79. [5] 徐毅励, 陈媛梅. 重瓣榆叶梅花中蛋白质提取工艺及动态含量研究[J]. 西北林学院学报, 2015, 30(3): 191 − 196. XU Yili, CHEN Yuanmei. Optimal extraction technology and dynamic content of protein in the flower of Amygdalus triloba f. multiplex [J]. Journal of Northwest Forestry University, 2015, 30(3): 191 − 196. [6] 周保昌, 贺斌, 李烨, 等. 经典名方中郁李仁的本草考证[J]. 中国实验方剂学杂志, 2023, 29(11): 1 − 11. ZHOU Baochang, HE Bin, LI Ye, et al. Herbal textual research on pruni semen in famous classical formulas [J]. Chinese Journal of Experimental Traditional Medical Formulae, 2023, 29(11): 1 − 11. [7] 张强英, 张启翔, 程堂仁. 榆叶梅野生群体表型多样性的研究[J]. 中南林业科技大学学报, 2012, 32(5): 155 − 160. ZHANG Qiangying, ZHANG Qixiang, CHENG Tangren. Study on phenotypic diversity of Prunus triloba wild populations [J]. Journal of Central South University of Forestry &Technology, 2012, 32(5): 155 − 160. [8] 洪森荣, 张牧彤, 徐子林, 等. ‘怀玉山’高山马铃薯叶绿体基因组特征及密码子使用偏好性分析[J]. 浙江农林大学学报, 2024, 41(1): 92 − 103. HONG Senrong, ZHANG Mutong, XU Zilin, et al. Chloroplast genome characteristics and codon usage preference of Solanum tuberosum var. cormosus ‘Huaiyushan’ [J]. Journal of Zhejiang A&F University, 2024, 41(1): 92 − 103. [9] 赵祺, 余佳兴, 秦宇雯, 等. 基于高通量测序的菜头肾叶绿体基因组的组装及序列分析[J]. 中草药, 2021, 52(6): 1744 − 1750. ZHAO Qi, YU Jiaxing, QIN Yuwen, et al. Assembly and sequence analysis of chloroplast genome of Championella sarcorrhiza based on high-throughput sequencing [J]. Chinese Traditional and Herbal Drugs, 2021, 52(6): 1744 − 1750. [10] 钱方, 高作敏, 胡利娟, 等. 海甘蓝(Crambe abyssinica)叶绿体基因组特征及其系统发育研究[J]. 生物技术通报, 2022, 38(6): 174 − 186. QIAN Fang, GAO Zuomin, HU Lijuan, et al. Characteristics of Crambe abyssinica chloroplast genome and its phylogenetic relationship in Brassicaceae [J]. Biotechnology Bulletin, 2022, 38(6): 174 − 186. [11] 龚意辉, 周桂花, 李丽梅, 等. 黄桃叶绿体基因组的组装与序列分析[J]. 热带作物学报, 2022, 43(8): 1545 − 1553. GONG Yihui, ZHOU Guihua, LI Limei, et al. Assembly and sequence analysis of chloroplast genome of Amygdalus persica [J]. Chinese Journal of Tropical Crops, 2022, 43(8): 1545 − 1553. [12] 刘静, 张海琴, 凡星, 等. 基于叶绿体atpB-rbcL序列探讨猬草属和赖草属植物的系统发育和母系起源[J]. 草业学报, 2012, 21(5): 77 − 85. LIU Jing, ZHANG Haiqin, FAN Xing, et al. Phylogenetic relationships and maternal donor of Hystrix and Leymus species as revealed by chloroplast at atpB-rbcL sequence [J]. Acta Prataculturae Sinica, 2012, 21(5): 77 − 85. [13] LI Qiujie, SU Na, ZHANG Ling, et al. Chloroplast genomes elucidate diversity, phylogeny, and taxonomy of Pulsatilla (Ranunculaceae) [J/OL]. Scientific reports, 2020, 10(1): 19781[2023-08-20]. doi: 10.1038/s41598-020-76699-7. [14] 许冰清, 安苗苗, 姜可以, 等. 花叶矢竹叶绿体psbD基因的克隆与功能分析[J]. 浙江农林大学学报, 2015, 32(4): 557 − 565. XU Bingqing, AN Miaomiao, JIANG Keyi, et al. Cloning and functional analysis of the chloroplast psbD gene of Phyllostachys japonicus [J]. Journal of Zhejiang A&F University, 2015, 32(4): 557 − 565. [15] 闫玖英, 马长青, 常博, 等. 改良CTAB 法用于苹果果实基因组DNA的提取[J]. 分子植物育种, 2017, 15(9): 3610 − 3615. YAN Jiuying, MA Changqing, CHANG Bo, et al. A modified CTAB method for genomic DNA extraction from apple fruit [J]. Molecular Plant Breeding, 2017, 15(9): 3610 − 3615. [16] BANKEVICH A, NURK S, ANTIPOV D, et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing [J]. Journal of Computational Biology, 2012, 19(5): 455 − 477. [17] WYMAN S K, JANSEN R K, BOORE J L. Automatic annotation of organellar genomes with DOGMA [J]. Bioinformatics, 2004, 20(17): 3252 − 3255. [18] LIU Chang, SHI Linchun, ZHU Yingjie, et al. CpGAVAS, an integrated web server for the annotation, visualization, analysis, and GenBank submission of completely sequenced chloroplast genome sequences [J/OL]. BMC Genomics, 2012, 13: 715[2023-08-25]. doi:10.1186/1471-2164-13-715. [19] BEIER S, THIEL T, MNCH T, et al. MISA-web: a web server for microsatellite prediction [J]. Bioinformatics, 2017, 33(16): 2853 − 2858. [20] KATOH K, STANDLEY D M. MAFFT multiple sequence alignment software version 7: improvements in performance and usability [J]. Molecular Biology and Evolution, 2013, 30(4): 772 − 780. [21] 富贵, 刘晶, 李军乔. 密花香薷叶绿体基因组结构及系统进化分析[J]. 中草药, 2022, 53(6): 1844 − 1853. FU Gui, LIU Jing, LI Junqiao. Characterization of chloroplast genome structure and phyletic evolution of Elsholtzia densa [J]. Chinese Traditional and Herbal Drugs, 2022, 53(6): 1844 − 1853. [22] 黄琼林. 高良姜叶绿体基因组测序与特征分析[J]. 热带作物学报, 2021, 42(1): 1 − 6. HUANG Qionglin. Complete sequencing and analysis of chloroplast genome from Alpinia officinarum Hance [J]. Chinese Journal of Tropical Crops, 2021, 42(1): 1 − 6. [23] SHI Cao, LIU Yuan, HUANG Hui, et al. Contradiction between plastid gene transcription and function due to complex post transcriptional splicing: an exemplary study of ycf15 function and evolution in angiosperms [J/OL]. PLoS One, 2013, 8(3): e59620[2023-08-25]. doi: 10.1371/journal.pone.0059620. [24] 段春燕, 张凯, 段义忠. 长柄扁桃叶绿体基因组比较[J]. 生物工程学报, 2020, 36(12): 2850 − 2859. DUAN Chunyan, ZHANG Kai, DUAN Yizhong. Comparison of complete chloroplast genome sequences of Amygdalus pedunculata Pall [J]. Chinese Journal of Biotechnology, 2020, 36(12): 2850 − 2859. [25] 赵一之. 关于榆叶梅的系统位置[J]. 内蒙古大学学报(自然科学版), 1996, 27(1): 70 − 71. ZHAO Yizhi. On systematic position of Cerasus triloba, [J]. Journal of Inner Mongolia University Natural Science Edition, 1996, 27(1): 70 − 71. [26] WANG Li, GUO Zhihong, SHANG Qianhan, et al. The complete chloroplast genome of Prunus triloba var. plena and comparative analysis of Prunus species: genome structure, sequence divergence, and phylogenetic analysis [J]. Brazilian Journal of Botany, 2021, 44: 85 − 95. -
链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20230489