-
叶绿体为植物细胞质体之一,是植物进行光合作用的特有细胞器,内部具有独立而完整的基因组[1]。植物叶绿体基因组一般由1个大单拷贝区(LSC)、1个小单拷贝区(SSC)、2个反向重复区(IRs)组成的环状四分体结构[2],序列长度约120~160 kb[3],含有大量可以自我调节的蛋白编码基因、rRNA编码基因以及tRNA编码基因[4],遵循单亲遗传规律,结构简单且总体保守,进化速率也相对适中。随着基因测序技术的快速发展,基于植物叶绿体基因组的研究已被广泛应用于系统进化[5]、物种鉴别[6]、转基因[7]以及核质协作[8]等领域。
黄连木属Pistacia是漆树科Anacardiaceae的关键演化分支,全球约10个物种[9],中国主要有中国黄连木P. chinensis、清香木P. weinmaniifolia、阿月浑子P. vera[10]。中国黄连木分布于南北干旱丘陵区,成熟种子富含油脂(含油率>40%)[11],是一种潜在的生物能源树种[12];清香木生于云南、四川等喀斯特地貌区,叶片富含抗菌活性的挥发性萜烯类化合物[13],是传统药用植物;阿月浑子原产于中亚,在中国新疆地区已形成独特的栽培种群,是世界第五大坚果[14]。然而,生长于中国的黄连木属植物受不同地区气候变化和人为干扰的影响,导致部分野生种群萎缩,亟需通过叶绿体基因组研究指导种质资源保护与利用。因此,本研究拟选取中国黄连木、清香木、阿月浑子这3种黄连木属植物,解析叶绿体基因组的结构分化,为黄连木属植物的系统分类和进化历史提供科学依据。
-
从美国国家生物技术信息中心(NCBI)数据库,搜索并下载已公布的中国黄连木(MK738124)、清香木(MF630953)、阿月浑子(MN551174)叶绿体基因组序列信息展开分析。
-
利用Geneious Prime软件统计黄连木属叶绿体基因组的各项参数,包括基因组大小、各区序列长度、GC含量、基因总数、蛋白编码序列(CDS)数量、核糖体RNA (rRNA)数量、转运RNA (tRNA)数量,并在Chloroplot在线程序[15]绘制叶绿体基因组图谱。
-
利用MISA在线工具[16]计算黄连木属叶绿体基因组中的简单重复序列数量(simple sequence repeat,SSR),最小重复单元设置:单核苷酸重复为10,二核苷酸重复为5,三核苷酸重复为4,四核苷酸重复为3,五核苷酸重复为3,六核苷酸重复为3,重复序列之间的最小间隔为100 bp。利用REPuter在线工具[17]检测不同的散在重复序列类型,包括回文重复(P)、互补重复(C)、正向重复(F)和反向重复(R),参数设置:最大重复距离为5 000 bp,最小重复长度为30 bp,海明距离为3。
-
以中国黄连木为参考,利用mVISTA在线工具[18]选择Shuffle-LAGAN模式对黄连木属叶绿体基因组开展结构可视化差异分析;利用CPJSdraw软件[19]完成四分体边界差异分析。
-
利用DnaSP V6软件[20]检测黄连木属叶绿体基因组的核苷酸多态性(Pi),参数设置:窗口长度为600 bp,序列步长为200 bp。
-
选择盐肤木属Rhus植物旁遮普麸杨R. punjabensis (MT230555)、盐肤木R. chinensis (OP326720)为外类群,另收集其他国外黄连木属叶绿体基因组信息,包括大西洋黄连木P. atlantica (PP101613)、埃及黄连木P. khinjuk (PP101614),利用MAFFT V7在线工具[21]完成叶绿体全基因组对比,再通过MEGA 7.0软件[22]以邻接法(neighbor-joining)构建系统进化树。
-
由图1可见:3种黄连木属叶绿体基因组均由1个大单拷贝区域(LSC)、1个小单拷贝区域(SSC)和2个反向重复区域(IRs,包括IRa和IRb)组成的四分体环状结构。3种黄连木属叶绿体基因组的长度为160 618~160 767 bp (GC为37.87%~37.90%),其中LSC为88 371~88 402 bp (GC为36.00%~36.04%),IRs为26 595~26 618 bp (GC为42.93%~42.95%),SSC为19 057~19 129 bp (GC为32.42%~32.45%),且在蛋白编码序列数量(87个)、核糖体RNA数量(8个)和转运RNA数量(37个)保持一致(表1)。
物种 全基因组 大单拷贝区 反向重复区 小单拷贝区 基因总
数/个蛋白编码序
列数量/个核糖体RNA
数量/个转运RNA
数量/个长度/bp GC含量/% 长度/bp GC含量/% 长度/bp GC含量/% 长度/bp GC含量/% 中国黄连木 160 618 37.90 88 371 36.04 26 595 42.95 19 057 32.45 132 87 8 37 清香木 160 767 37.87 88 402 36.00 26 618 42.93 19 129 32.42 132 87 8 37 阿月浑子 160 654 37.89 88 376 36.04 26 596 42.95 19 086 32.41 132 87 8 37 Table 1. Basic characteristic information of the chloroplast genomes of 3 Pistacia species
-
利用MISA在线工具在3种黄连木属植物叶绿体基因组中筛选出5种简单重复序列类型,共有262个潜在的简单重复序列位点,但未检测到六核苷酸。从图2A可知:在这些潜在的简单重复序列位点中,单核苷酸中的A或T重复单元的数量最多,占比分别为34.35%、39.69%,其次是二核苷酸中的AT或TA重复单元,占比分别为3.44%、2.67%,其他重复单元的数量总体差异不大且占比很低。
Figure 2. Simple repeat sequence (A) and scattered repeat sequence (B) statistics of chloroplast genomes of 3 Pistacia species
散在重复序列经REputer在线工具统计结果(图2B)显示:3种黄连木属植物叶绿体基因组中共检测到184个散在重复序列位点,且同类型重复在各物种之间无明显差异,其中回文重复数量最多(105个),其次是正向重复(76个),互补重复最少(3个),各物种均未检测到反向重复序列。
-
黄连木属植物叶绿体基因组的全序列差异对比结果(图3)显示:3种黄连木属植物叶绿体基因组的转运/核糖体RNA (t/rRNA)、外显子(exon)的序列总体保持较高的保守性,而基因间隔区(CNS)序列发生不同程度的变异,集中在LSC区与SSC区,其中trnS-GGA~rps4、ccsA~ndhD等序列区域差异较为明显。四分体边界对比结果(图4)显示:ndhF、ycf1分别位于JSB、JSA边界线上,rpl2基因位于IR区且其3'端距离JSB/JSA边界线为116~140 bp,表明3种黄连木属植物在IRs区边界(JLB、JSB、JSA、JLA)附近的基因在收缩或扩张上无明显差异。
-
核苷酸多态性(Pi)分析结果(图5)表明:3种黄连木属植物叶绿体基因组共包含了535个多态性位点,Pi为0~0.02,平均为0.002 23,并检测到matK (2 830~3 829 bp)、trnG-UCC~trnR-UCU (11 112~11 911 bp)、trnT-UGU~trnL-UAA (49 664~50 487 bp)、petD~rpoA (81 644~82 650 bp)、rpl22~rpl2 (88 121~88 932 bp)等5个高变序列(Pi>0.01),除了rpl22~rpl2序列跨越LSC与IRb区,其余都位于LSC区内。
-
以2种盐肤木属植物为外类群,另加入其他黄连木属植物。植物系统发育树结果(图6)显示:黄连木属与盐肤木属外类群分割开,清香木与中国黄连木的亲缘关系比较相近,而阿月浑子与大西洋黄连木以100%的支持率可单独划分一支。
-
与万寿菊属Tagetes[23]、大百合属Cardiocrinum[24]等陆生植物叶绿体基因组一样,3种黄连木属植物叶绿体基因组也均为闭合环状四分体结构,且在基因长度、基因顺序和GC含量等方面具有高度的保守性[25−26]。GC含量在3种黄连木属叶绿体基因组的不同区域呈不均等分布,IRs区的GC含量(42.93%~42.95%)明显高于LSC区(36.00%~36.04%)和SSC区(32.41%~42.45%),可能是IRs区存在4个高GC含量的RNA基因(rrn4.5、rrn5、rrn16、rrn23)[27−28],不过IRs区的高GC含量也有助于叶绿体基因组的稳定性[29]。此外,本研究还发现叶绿体各种类型基因数量保持一致,表明了3种黄连木属植物在基因组成方面有较高的相似性,也是黄连木属植物难分类的重要因素之一。
叶绿体基因组中的重复序列具有较高的多态性,是植物群体遗传和进化研究的重要分子标记[30−31]。本研究在检测3种黄连木属植物的所有散在重复序列类型中,发现回文重复与正向重复比例较大,与楠属Phoebe[32]、石蒜属Lycoris[33]等植物的结果基本一致。在黄连木属植物叶绿体基因组的简单重复序列类型中,单核苷酸的A或T重复单元所占比例最高,在忍冬属Lonicera[34]、紫麻属Oreocnide[35]等植物也有类似报道。A/T重复频率高的1个潜在原因是叶绿体基因组中的mRNA末端发生聚腺苷酸化[36]。另外,在质体复制过程中,A/T碱基的链比G/C碱基更容易分离,导致滑链错配[37]。这些分析所得到的重复序列位点代表了黄连木属植物丰富的变异,有助于检测居群、种内和栽培品种水平的遗传多态性,以及比较更远的亲缘关系。
研究叶绿体四分体不同区域的基因分布、边界信息、变异序列,对了解叶绿体基因组结构的差异、物种进化等具有重要意义。本研究表明:3种黄连木属植物叶绿体基因组具有很高的序列相似性,且IRs区序列变异程度很低,差异表现集中于LSC、SSC区的非编码区,这与紫薇属Lagerstroemia[38]、栎属Quercus[39]等的植物表现一致。虽然IRs区序列在大多数植物,特别在同一属内表现高度保守,但IRs区的边界普遍存在扩张或收缩现象,是导致不同植物群体的整个叶绿体基因组长度差异的主要因素[40]。通过比较3种黄连木属植物,发现四分体IRs边界没有明显的扩张或收缩差异,表明了3种黄连木属植物叶绿体基因组大小具有高度保守性。此外,本研究3种黄连木属植物叶绿体基因组的核苷酸多态性分析检测到5个变异序列(matK、trnG-UCC~trnR-UCU、trnT-UGU~trnL-UAA、petD~rpoA、rpl22~rpl2),这些高度变异序列可作为鉴定黄连木属的候选分子标记,特别是编码成熟蛋白酶的相关基因matK,具有相对较快的突变率[41],正成为研究多数被子植物系统学和进化的潜在候选基因[42−44]。
明确黄连木属植物及其近缘属在系统进化中的生态位置,对于理解共同进化背景下黄连木属植物不同种的适应性进化及生物多样性具有重要意义。本研究系统发育树结果表明:黄连木属与盐肤木属在遗传进化上明确了两者的属级分类,与早期基于核糖体基因内的转录间隔区(ITS)序列构建的系统发育结果一致[45];从黄连木属分支距离来看,中国黄连木与清香木在遗传进化中表现亲近,而阿月浑子与大西洋黄连木关系更为密切,这可能与地理距离及环境差异相关联。遗传分化是环境压力所施加的选择或遗传漂变的影响以及地理隔离限制部分群体基因交流的结果[46]。原产东亚的中国黄连木与清香木叶绿体基因组的亲近性暗示两者仍保留较高的母系基因交流历史。相比之下,产于中亚的阿月浑子与分布地中海的大西洋黄连木的密切关系反映了其共同祖先可能在气候干旱化过程中分化出适应不同干旱生态位的类群。这一结果为研究不同地域的黄连木属植物的“抗旱性”进化策略提供新的思路,也为黄连木属植物种质资源保护提供参考依据。
-
本研究发现:3种黄连木属植物叶绿体基因组都是序列长度在160 618~160 767 bp的环状四分体,序列结构类似且相对保守;简单重复序列以单核苷酸中的A或T重复单元为主,散在重复序列以回文重复与正向重复为主。检测到5个高变序列(matK、trnG-UCC~trnR-UCU、trnT-UGU~trnL-UAA、petD~rpoA、rpl22~rpl2)可作为黄连木属植物的潜在分子标记。基于全叶绿体基因比较,中国黄连木与清香木在遗传距离上相近,而阿月浑子与前两者相对疏远。
Structural characteristics and genetic relationship of chloroplast genomes of 3 Pistacia species
doi: 10.11833/j.issn.2095-0756.20250221
- Received Date: 2025-03-24
- Accepted Date: 2025-11-04
- Rev Recd Date: 2025-10-30
- Available Online: 2026-04-02
- Publish Date: 2026-04-02
-
Key words:
- Pistacia /
- chloroplast genome /
- sequence repeat /
- genetic relationship
Abstract:
| Citation: | ZHOU Zelin, XIANG Changwu, ZHANG Shaojun, et al. Structural characteristics and genetic relationship of chloroplast genomes of 3 Pistacia species[J]. Journal of Zhejiang A&F University, 2026, 43(2): 331−339 doi: 10.11833/j.issn.2095-0756.20250221 |
DownLoad: