留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

毛竹长末端重复序列反转录转座子的全基因组特征及进化分析

陈娅欣 周明兵

陈娅欣, 周明兵. 毛竹长末端重复序列反转录转座子的全基因组特征及进化分析[J]. 浙江农林大学学报, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
引用本文: 陈娅欣, 周明兵. 毛竹长末端重复序列反转录转座子的全基因组特征及进化分析[J]. 浙江农林大学学报, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
CHEN Yaxin, ZHOU Mingbing. Genome-wide characteristics and evolution analysis of long terminal repeat retrotransposons in Phyllostachys edulis[J]. Journal of Zhejiang A&F University, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
Citation: CHEN Yaxin, ZHOU Mingbing. Genome-wide characteristics and evolution analysis of long terminal repeat retrotransposons in Phyllostachys edulis[J]. Journal of Zhejiang A&F University, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458

毛竹长末端重复序列反转录转座子的全基因组特征及进化分析

doi: 10.11833/j.issn.2095-0756.20200458
基金项目: 国家自然科学基金资助项目(31870656,31470615);浙江自然科学基金资助项目(LZ19C160001)
详细信息
    作者简介: 陈娅欣(ORCID: 0000-0003-3889-2502),从事毛竹LTR反转录转座子在非生物胁迫下的研究。E-mail: 2849124318@qq.com
    通信作者: 周明兵(ORCID: 0000-0001-5674-4410),教授,博士,从事竹子生长发育表观遗传学和竹子快速生长机制研究。E-mail: zhoumingbing@zafu.edu.cn
  • 中图分类号: Q753;S795.7

Genome-wide characteristics and evolution analysis of long terminal repeat retrotransposons in Phyllostachys edulis

  • 摘要:   目的   研究毛竹Phyllostachys edulis基因组中的长末端重复序列反转录转座子(long terminal repeat retrotransposons, LTR-REs)的特征,为今后利用LTR反转录转座子对毛竹基因组的功能和对竹种资源遗传多样性的研究奠定基础。   方法   通过生物信息学方法,利用LTRharvest和RepeatMakser软件对第2版毛竹基因组中的LTR反转录转座子进行全面注释与分类,并对得到的LTR反转录转座子的分布特征、进化特性和插入时间进行分析。   结果   在毛竹基因组中共注释得到1 014 565个LTR反转录转座子,1 562个家族,占毛竹基因组的54.97%。其中solo LTR反转录转座子与完整LTR反转录转座子(S/F)的比例较高(约1.77∶1.00),表明在毛竹LTR反转录转座子中可能发生了相对较高频率的非法重组和不平衡重组。毛竹LTR反转录转座子分为Ty1-copia和Ty3-gypsy超家族,Tork、Reftrofit、Sire、Oryco、Del、Reina、Crm、Tat、Galadriel、Athila等10个谱系。毛竹LTR反转录转座子的Ty1-copia和Ty3-gypsy超家族对PBS位点的偏好性呈相反趋势,较长的LTR反转录转座子具有更长的LTR序列,结构也更加完整。毛竹LTR反转录转座子的插入时间主要集中在0~2.0 Ma,且还处于不断缓慢增长的状态。   结论   第2版毛竹基因组的高质量组装,能更好地注释和分析毛竹基因组中的LTR反转录转座子。基于结构预测的LTRharvest法,能更精准地预测毛竹LTR反转录转座子。不同谱系的毛竹LTR反转录转座子在进化过程中具有不同的分化和扩增活性。毛竹LTR反转录转座子总体上处于不断扩增状态,这是导致毛竹基因组较大的主要原因之一。图3表3参52
  • 图  1  LTR反转录转座子全长与LTR序列长度的相关性

    Figure  1  Correlation of length between LTR and LTR retrotransposons

    图  2  毛竹LTR反转录转座子各个谱系的插入时间

    Figure  2  Insertion time distribution of different lineages of moso bamboo LTR retrotransposons

    图  3  毛竹LTR反转录转座子超家族的插入时间

    Figure  3  Insertion times of superfumily of moso bamboo LTR retrotransposons

    表  1  毛竹LTR反转录转座子超家族分类

    Table  1.   Classification of LTR retrotransposons superfamily of moso bamboo genome

    超家族谱系家族a结构数量/个全长/bp百分比b/%
    Ty1-copiaTork236GAG-PR-INT-RT-RH145 708124 219 9956.51
    Retrofit342GAG-PR-INT-RT-RH41 96543 615 8152.29
    Sire136GAG-PR-INT-RT-RH-ENV223 386210 097 73411.01
    Oryco105GAG-PR-INT-RT-RH22 07822 854 5911.20
    合计819433 137400 788 13521.01
    Ty3-gypsyDel207GAG-PR-RT-RH-INT-CHR295 222334 005 91617.51
    Reina249GAG-PR-RT-RH-INT-CHR27 80339 235 9392.06
    Crm47GAG-PR-RT-RH-INT40 78144 298 9552.32
    Tat238GAG-PR-RT-RH-INT217 288230 055 05312.06
    Galadriel1GAG-PR-RT-RH-INT-CHR2351 2480.00
    Athila1GAG-PR-RT-RH-INT-ENV311257 9700.01
    合计743581 428647 905 08133.96
    总计1 5621 014 5651 048 693 21654.97
      说明:a表示每个谱系的数量;b表示在毛竹基因组中LTR反转录转座子所占的比例
    下载: 导出CSV

    表  2  毛竹LTR反转录转座子谱系特征

    Table  2.   Structure of LTR retrotransposon family of moso bamboo

    谱系家族a百分比c/%全长LTRdSolo LTRe全长LTR/Solo LTR全长 LTR+Solo LTR百分比f/%
    Tork23628.821 1691 4921.282 66128.76
    Retrofit34241.763021 1583.831 46015.78
    Sire13616.614643 1396.773 60338.95
    Oryco10512.825211 0061.931 52716.51
    Ty1-copia819100.002 4566 7952.779 251100.00
    Del20727.862 1022 9921.425 09441.97
    Reina24933.514951 2452.521 74014.34
    Crm476.335101 3522.651 86215.34
    Tat23832.032 1681 2510.583 41928.17
    Galadriel10.1307070.06
    Athila10.130140140.12
    Ty3-gypsy743100.005 2756 8611.3012 136100.00
    总计1 562100.007 73113 6561.7721 387100.00
      说明:a表示每个谱系的数量;c表示每个谱系在超家族中所占的比例;d表示结构完整的LTR反转录转座子(full-length LTR),包含     两端LTR序列和完整的编码结构域[44];e表示仅含有两端LTR序列,编码结构域有缺失的LTR反转录转座子(solo LTR)[44];f表     示每个谱系中full-length LTR和solo LTR在超家族中所占的比例
    下载: 导出CSV

    表  3  LTR反转录转座子PBS使用统计

    Table  3.   Usage status of PBS in LTR retrotransposons

    tRNA数量/个百分比/%Ty1-copia
    使用比例/%
    Ty3-gypsy
    使用比例/%
    MetCAT241 3834.051.700.83
    LysTTT4861.420.001.10
    LysTTT102850.830.310.03
    LeuAAG211310.380.000.15
    LysTTT31110.320.160.01
    LeuTAG9660.190.070.01
    下载: 导出CSV
  • [1] 殷豪. 梨基因组 LTR 反转座子注释及进化分析研究[D]. 南京: 南京农业大学, 2014.

    YIN Hao. Genome-wide Annotation and Evolutionary Analysis of Long Terminal Repeat Retrotransposons in Pear (Pyrus bretschneideri Rehd.)[D]. Nanjing: Nanjing Agricultural University, 2014.
    [2] NIE Qiong, QIAO Guang, PENG Lei, et al. Transcriptional activation of long terminal repeat retrotransposon sequences in the genome of pitaya under abiotic stress [J]. Plant Physiol Biochem, 2019, 135: 460 − 468. doi:  10.1016/j.plaphy.2018.11.014
    [3] 蒋爽. 基于反转录转座子标记的梨属植物亲缘关系研究[D]. 杭州: 浙江大学, 2015.

    JIANG Shuang. Studies on Genetic Relationships of Pyrus Species and Cultivars based on Retrotransposons Markers[D]. Hangzhou: Zhejiang University, 2015.
    [4] 汪浩. 植物基因组 LTR 反转录转座子注释和比较研究[D]. 上海: 复旦大学, 2008.

    WANG Hao. Annotation and Comparative Study of LTR Retrotransposons in Plant Genomes[D]. Shanghai: Fudan University, 2008.
    [5] KOBAYASHI S, GOTO-YAMAMOTO N, HIROCHIKA H. Retrotransposon-induced mutations in grape skin color[J]. Science, 2004, 304(5673): 982. doi:  10.1126/science.1095011.
    [6] ZHOU Mingbing, LIANG Linlin, HANNINEN H. A transposition-active Phyllostachys edulis long terminal repeat (LTR) retrotransposon [J]. J Plant Res, 2018, 131(2): 203 − 210. doi:  10.1007/s10265-017-0983-8
    [7] JIANG Shuag, TENG Yuanwen, ZONG Yu, et al. Review of LTR retrotransposons in plants [J]. Acta Bot Boreali-Occident Sin, 2013, 33(11): 2354 − 2360.
    [8] 张赞一. 毛竹 LTR 反转录转座子-PHRE6 的克隆与转座活性鉴定以及转座监测系统的构建[D]. 杭州: 浙江农林大学, 2018.

    ZHANG Zanyi. Phyllostachys edulis LTR Transposon-cloning and Transposition Activity Identification of PHRE6 and Construction of Transposition Monitoring System[D]. Hangzhou: Zhejiang A&F University, 2018.
    [9] 吴骏澜. 长末端重复序列反转录转座子分析流程构建及应用[D]. 合肥: 安徽农业大学, 2017.

    WU Julan. Construction and Application of Identification and Analysis Process of Full-length LTR-retrotransposons[D]. Hefei: Anhui Agricultural University, 2017.
    [10] ROY N S, CHOI J Y, LEE S I, et al. Marker utility of transposable elements for plant genetics, breeding, and ecology: a review [J]. Genes Genomics, 2015, 37(2): 141 − 151. doi:  10.1007/s13258-014-0252-3
    [11] 周鹏. 梨 Ty1-copia 反转录转座子的分子特性研究[D]. 杨凌: 西北农林科技大学, 2013.

    ZHOU PENG. Molecular Character of Novel Ty1-copia Retrotransposons in Pear[D]. Yangling: Northwest A&F University, 2013.
    [12] 马赑. 桑树全基因组转座子的鉴定及特征分析[D]. 重庆: 西南大学, 2014.

    MA Bi. Genome-wide Identification and Characterization of Transposable Elements in Mulberry (Morus notabilis)[D]. Chongqing: Southwest University, 2014.
    [13] 侯菲. 蔷薇目 7 个物种间 LTR 反转录转座子水平转移的鉴定以及转座活性分析[D]. 重庆: 西南大学, 2018.

    HOU Fei. Horizontal Transfers and Activity Analysis of LTR Retrotransposons in Seven Rosales Species[D]. Chongqing: Southwest University, 2018.
    [14] FINATTO T, de OLIVEIRA A C, CHAPARRO C, et al. Abiotic stress and genome dynamics: specific genes and transposable elements response to iron excess in rice [J]. Rice, 2015, 8: 13. doi: 10.1186/s12284-015-0045-6.
    [15] GALINDO-GONZALEZ L, MHIRI C, DEYHOLOS M K, et al. LTR-retrotransposons in plants: engines of evolution [J]. Gene, 2017, 626: 14 − 25. doi:  10.1016/j.gene.2017.04.051
    [16] WICKER T, SABOT F, HUA-VAN A, et al. A unified classification system for eukaryotic transposable elements [J]. Nat Rev Genet, 2007, 8(12): 973 − 982. doi:  10.1038/nrg2165
    [17] SHINGOTE P R, MITHRA S V A, SHARMA P, et al. LTR retrotransposons and highly informative ISSRs in combination are potential markers for genetic fidelity testing of tissue culture-raised plants in sugarcane [J]. Mol Breed, 2019, 39(2): 25. doi:  10.1007/s11032-019-0931-5
    [18] SAZE H, KAKUTANI T. Differentiation of epigenetic modifications between transposons and genes [J]. Curr Opin Plant Biol, 2011, 14(1): 81 − 87. doi:  10.1016/j.pbi.2010.08.017
    [19] DU Jianchang, TIAN Zhixi, BOWEN N J, et al. Bifurcation and enhancement of autonomous-nonautonomous retrotransposon partnership through LTR swapping in soybean [J]. Plant Cell, 2010, 22(1): 48 − 61. doi:  10.1105/tpc.109.068775
    [20] LLORENS C, MUNOZ-POMER A, BERNAD L, et al. Network dynamics of eukaryotic LTR retroelements beyond phylogenetic trees [J]. Biol Dir, 2009, 4(12): 41 − 72.
    [21] 虞洪杰. 植物 LTR 反转录转座子的预测和注释及邻聚法构建系统进化树研究[D]. 杭州: 浙江大学, 2011.

    YU Hongjie. Prediction and Annotation of LTR Retrotranspons in Plant and a New Method to Construct Phylogeneic Trees[D]. Hangzhou: Zhejiang University, 2011.
    [22] XU Ling, ZHANG Yue, SU Yuan, et al. Structure and evolution of full-length LTR retrotransposons in rice genome [J]. Plant Syst Evol, 2010, 287(1/2): 19 − 28. doi:  10.1007/s00606-010-0285-2
    [23] WANG Qinghua, DOONER H K. Dynamic evolution of bz orthologous regions in the Andropogoneae and other grasses [J]. Plant J, 2012, 72(2): 212 − 221. doi:  10.1111/j.1365-313X.2012.05059.x
    [24] LAVERGNE S, MUENKE N J, MOLOFSKY J. Genome size reduction can trigger rapid phenotypic evolution in invasive plants [J]. Ann Bot, 2010, 105(1): 109 − 116. doi:  10.1093/aob/mcp271
    [25] ELLINGHAUS D, KURTZ S, WILLHOEFT U. LTRharvest, an efficient and flexible software for de novo detection of LTR retrotransposons[J]. BMC Bioinf, 2008, 9(1). doi:  10.1186/1471-2105-9-18.
    [26] WANG Hao, LIU Jinsong. LTR retrotransposon landscape in Medicago truncatula: more rapid removal than in rice [J]. BMC Genomics, 2008, 9(1). doi: 10.1186/1471-2164-9-382.
    [27] LERAT E. Identifying repeats and transposable elements in sequenced genomes: how to find your way through the dense forest of programs [J]. Heredity, 2010, 104(6): 520 − 533. doi:  10.1038/hdy.2009.165
    [28] SU Shuai, CUI Ning, SUN Aijun, et al. Sequence analysis of the whole genome of a recombinant Marek’s disease virus strain, GX0101, with a reticuloendotheliosis virus LTR insert [J]. Arch Virol, 2013, 158(9): 2007 − 2014. doi:  10.1007/s00705-013-1671-1
    [29] LIAN Shuaibin, CHEN Xinwu, WANG Peng, et al. A complete and accurate Ab initio repeat finding algorithm [J]. Interdisciplinary Sci Comput Life Sci, 2016, 8(1): 75 − 83. doi:  10.1007/s12539-015-0119-6
    [30] OU Shujun, JIANG Ning. LTR_FINDER_parallel: parallelization of LTR_FINDER enabling rapid identification of long terminal repeat retrotransposons[J]. Mobile DNA, 2019, 10(6403). doi: 10.11011722736.
    [31] BEDELL J A, KORF I, GISH W, et al. MaskerAid: a performance enhancement to RepeatMaskerf [J]. Broinformatics, 2000, 16(11): 1040 − 1041. doi:  10.1093/bioinformatics/16.11.1040
    [32] 周敏. 竹子 LINEs, Ty3-gypsy 类转座子的克隆、鉴定及特性分析[D]. 杭州: 浙江农林大学, 2014.

    ZHOU Min. Cloning, Identification and Analysis Characteristics of LINEs and Ty3-gypsy Retrotransposons from Bamboo[D]. Hangzhou: Zhejiang A&F University, 2014.
    [33] PENG Zhenhua, LU Yuying, LI Lubin, et al. The draft genome of the fast-growing non-timber forest species moso bamboo (Phyllostachys heterocycla) [J]. Nat Genet, 2013, 45(4): 456 − 461. doi:  10.1038/ng.2569
    [34] ZHAO Hansheng, GAO Zhimin, WANG Le, et al. Chromosome-level reference genome and alternative splicing atlas of moso bamboo (Phyllostachys edulis)[J]. GigaScience, 2018, 7(10): giy115. doi: 10.1093/gigascience/giy115.
    [35] MONAT C, TANDO N, TRANCHANT-DUBREUIL C, et al. LTRclassifier: a website for fast structural LTR retrotransposons classification in plants[J]. Mobile Genet Elem, 2016, 6(6). doi: 10.1080/2159256X.2016.1241050.
    [36] BERNARD H R, WUTICH A, RYAN G W. Analyzing Qualitative Data: Systematic Approaches[M]. New York: SAGE Publications, 2016.
    [37] MA Jianxin, BENNETZEN J L. Rapid recent growth and divergence of rice nuclear genomes [J]. Proc Nat Acad Sci, 2004, 101(34): 12404 − 12410. doi:  10.1073/pnas.0403715101
    [38] EDGAR R C. MUSCLE: a multiple sequence alignment method with reduced time and space complexity [J]. BMC Bioinf, 2004, 5(1): 113. doi:  10.1186/1471-2105-5-113.
    [39] KIMURA M, OHTA T. On the stochastic model for estimation of mutational distance between homologous proteins [J]. J Mol Evol, 1972, 2(1): 87 − 90. doi:  10.1007/BF01653945
    [40] PATERSON A H, BOWERS J E, BRUGGMANN R, et al. The Sorghum bicolor genome and the diversification of grasses [J]. Nature, 2009, 457(7229): 551 − 556.
    [41] WANG Hao, XU Zhao, YU Hongjie. LTR retrotransposons reveal recent extensive inter-subspecies nonreciprocal recombination in Asian cultivated rice [J]. BMC Genomics, 2008, 9(1): 1 − 13. doi:  10.1186/1471-2164-9-1
    [42] HAVECKER E R, GAO Xiang, VOYTAS D F. The Sireviruses, a plant-specific lineage of the Ty1/copia retrotransposons, interact with a family of proteins related to dynein light chain 8 [J]. Plant Physiol, 2005, 139(2): 857 − 868. doi:  10.1104/pp.105.065680
    [43] CHADHA S, SHARMA M. Genetic differentiation and phylogenetic potential of Ty3/Gypsy LTR retrotransposon markers in soil and plant pathogenic fungi [J]. J Basic Microbiol, 2020, 60(6): 508 − 516. doi:  10.1002/jobm.201900487
    [44] BENNETZEN J L. Transposable element contributions to plant gene and genome evolution [J]. Plant Mol Biol, 2000, 42(1): 251 − 269. doi:  10.1023/A:1006344508454
    [45] PICAULT N, CHAPARRO C, PIEGU B, et al. Identification of an active LTR retrotransposon in rice [J]. Plant J, 2009, 58(5): 754 − 765. doi:  10.1111/j.1365-313X.2009.03813.x
    [46] HU Bingjie, ZHOU Mingbing, ZHU Yihang. Genome-wide characterization and evolution analysis of long terminal repeat retroelements in moso bamboo (Phyllostachys edulis)[J]. Tree Genet Genomes, 2017, 13(2): 43. doi:  10.1007/s11295-017-1114-3.
    [47] PENG Yu, ZHANG Yingying, GUI Yijie, et al. Elimination of a retrotransposon for quenching genome instability in modern rice [J]. Mol Plant, 2019, 12(10): 1395 − 1407. doi:  10.1016/j.molp.2019.06.004
    [48] WAGNER A. Distribution of transcription factor binding sites in the yeast genome suggests abundance of coordinately regulated genes [J]. Genomics, 1998, 50(2): 293 − 295. doi:  10.1006/geno.1998.5303
    [49] LOCKTON S, GAUT B S. The contribution of transposable elements to expressed coding sequence in Arabidopsis thaliana [J]. J Mol Evol, 2009, 68(1): 80 − 89. doi:  10.1007/s00239-008-9190-5
    [50] FESCHOTTE C, JIANG N, WESSLER S R. Plant transposable elements: where genetics meets genomics [J]. Nat Rev Genet, 2002, 3(5): 329 − 341. doi:  10.1038/nrg793
    [51] KASHKUSH K, FELDMAN M, LEVY A A. Transcriptional activation of retrotransposons alters the expression of adjacent genes in wheat [J]. Nat Genet, 2003, 33(1): 102 − 106. doi:  10.1038/ng1063
    [52] HE Ningjia, ZHANG Chi, QI Xiwu, et al. Draft genome sequence of the mulberry tree Morus notabilis [J]. Nat Commun, 2013, 4(1): 1 − 9.
  • [1] 王灵杰, 栗青丽, 高培军, 韦赛君, 吕嘉欣, 高岩, 张汝民.  毛竹茎秆快速生长期光合关键酶活性及基因表达分析 . 浙江农林大学学报, 2021, 38(1): 84-92. doi: 10.11833/j.issn.2095-0756.20200277
    [2] 娄永峰, 高志民.  毛竹早期光诱导蛋白基因克隆及功能分析 . 浙江农林大学学报, 2021, 38(1): 93-102. doi: 10.11833/j.issn.2095-0756.20200237
    [3] 阮诗雨, 张智俊, 陈家璐, 马瑞芳, 朱丰晓, 刘笑雨.  毛竹GRF基因家族全基因组鉴定与表达分析 . 浙江农林大学学报, 2021, 38(4): 792-801. doi: 10.11833/j.issn.2095-0756.20200544
    [4] 卜柯丽, 傅卢成, 王灵杰, 栗青丽, 王柯杨, 马元丹, 高岩, 张汝民.  毛竹茎秆快速生长期PeATG1/PeATG4基因表达分析 . 浙江农林大学学报, 2020, 37(1): 43-50. doi: 10.11833/j.issn.2095-0756.2020.01.006
    [5] 白天, 何叶艳, 高旭龙, 赵阿勇, 何珂.  网纹蟒非入侵式采样和线粒体基因组分析 . 浙江农林大学学报, 2019, 36(3): 444-450. doi: 10.11833/j.issn.2095-0756.2019.03.003
    [6] 蒋政勤, 周明兵, 郑浩, 季航, 徐芷馨.  毛竹Phyllostachys edulis retrotransposon 7(PHRE7)转座子的克隆与鉴定 . 浙江农林大学学报, 2019, 36(5): 917-927. doi: 10.11833/j.issn.2095-0756.2019.05.010
    [7] 李黎, 宋帅杰, 方小梅, 杨丽芝, 邵珊璐, 应叶青.  高温干旱及复水对毛竹实生苗保护酶和脂质过氧化的影响 . 浙江农林大学学报, 2017, 34(2): 268-275. doi: 10.11833/j.issn.2095-0756.2017.02.010
    [8] 李丹丹, 许馨露, 翟建云, 孙建飞, 曹友志, 高岩, 张汝民.  毛竹笋竹快速生长期可溶性糖质量分数与PeTPS1/PeSnRK1基因表达分析 . 浙江农林大学学报, 2017, 34(6): 1016-1023. doi: 10.11833/j.issn.2095-0756.2017.06.007
    [9] 程占超, 侯丹, 马艳军, 高健.  毛竹生长素反应因子基因的生物信息学分析及差异表达 . 浙江农林大学学报, 2017, 34(4): 574-580. doi: 10.11833/j.issn.2095-0756.2017.04.002
    [10] 程占超, 马艳军, 侯丹, 刘俊, 高健.  毛竹PheMADS15基因的克隆及功能分析 . 浙江农林大学学报, 2017, 34(3): 421-426. doi: 10.11833/j.issn.2095-0756.2017.03.006
    [11] 李秀云, 陈晓沛, 徐英武, 曹友志.  毛竹生长过程中纤维素合成酶基因的时空表达和功能预测 . 浙江农林大学学报, 2017, 34(4): 565-573. doi: 10.11833/j.issn.2095-0756.2017.04.001
    [12] 黄笑宇, 许在恩, 郭小勤.  基于全基因组的毛竹同义密码子使用偏好性分析 . 浙江农林大学学报, 2017, 34(1): 120-128. doi: 10.11833/j.issn.2095-0756.2017.01.017
    [13] 屈亚平, 张智俊, 王超莉, 王蕾, 吴林军.  毛竹阿拉伯糖-5-磷酸异构酶的基因克隆、原核表达及纯化 . 浙江农林大学学报, 2016, 33(6): 928-934. doi: 10.11833/j.issn.2095-0756.2016.06.002
    [14] 黄梦雪, 张文标, 张晓春, 余文军, 李文珠, 刘贤淼, 戴春平, 汪孙国.  毛竹材玻璃化转变温度的影响因素 . 浙江农林大学学报, 2015, 32(6): 897-902. doi: 10.11833/j.issn.2095-0756.2015.06.011
    [15] 王超莉, 张智俊, 屈亚平, 王蕾.  毛竹丙酮酸磷酸双激酶调节蛋白基因克隆、原核表达及纯化 . 浙江农林大学学报, 2015, 32(5): 749-755. doi: 10.11833/j.issn.2095-0756.2015.05.014
    [16] 张凤雪, 徐英武, 张智俊, 肖冬长, 王超莉, 屈亚平.  毛竹KDO8PS的原核表达纯化及晶体生长 . 浙江农林大学学报, 2014, 31(4): 515-520. doi: 10.11833/j.issn.2095-0756.2014.04.004
    [17] 王策, 秦静静, 甘红豪1, 李红, 罗志斌.  毛果杨全基因组磷酸根转运蛋白家族成员序列分析 . 浙江农林大学学报, 2012, 29(4): 516-526. doi: 10.11833/j.issn.2095-0756.2012.04.006
    [18] 管雨, 杨洋, 张智俊, 罗淑萍, 汤定钦.  毛竹大片段双元细菌人工染色体基因组文库的构建 . 浙江农林大学学报, 2011, 28(4): 527-532. doi: 10.11833/j.issn.2095-0756.2011.04.001
    [19] 何祯祥, 施季森, 邱进清, 肖石海.  林木遗传图谱构建的技术与策略 . 浙江农林大学学报, 1998, 15(2): 151-157.
    [20] 吴鸿, 方志刚.  浙江古田山昆虫区系研究 . 浙江农林大学学报, 1995, 12(1): 63-72.
  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20200458

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2021/3/455

图(3) / 表(3)
计量
  • 文章访问数:  290
  • HTML全文浏览量:  50
  • PDF下载量:  34
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-07-15
  • 修回日期:  2021-01-04
  • 网络出版日期:  2021-06-09
  • 刊出日期:  2021-06-09

毛竹长末端重复序列反转录转座子的全基因组特征及进化分析

doi: 10.11833/j.issn.2095-0756.20200458
    基金项目:  国家自然科学基金资助项目(31870656,31470615);浙江自然科学基金资助项目(LZ19C160001)
    作者简介:

    陈娅欣(ORCID: 0000-0003-3889-2502),从事毛竹LTR反转录转座子在非生物胁迫下的研究。E-mail: 2849124318@qq.com

    通信作者: 周明兵(ORCID: 0000-0001-5674-4410),教授,博士,从事竹子生长发育表观遗传学和竹子快速生长机制研究。E-mail: zhoumingbing@zafu.edu.cn
  • 中图分类号: Q753;S795.7

摘要:    目的   研究毛竹Phyllostachys edulis基因组中的长末端重复序列反转录转座子(long terminal repeat retrotransposons, LTR-REs)的特征,为今后利用LTR反转录转座子对毛竹基因组的功能和对竹种资源遗传多样性的研究奠定基础。   方法   通过生物信息学方法,利用LTRharvest和RepeatMakser软件对第2版毛竹基因组中的LTR反转录转座子进行全面注释与分类,并对得到的LTR反转录转座子的分布特征、进化特性和插入时间进行分析。   结果   在毛竹基因组中共注释得到1 014 565个LTR反转录转座子,1 562个家族,占毛竹基因组的54.97%。其中solo LTR反转录转座子与完整LTR反转录转座子(S/F)的比例较高(约1.77∶1.00),表明在毛竹LTR反转录转座子中可能发生了相对较高频率的非法重组和不平衡重组。毛竹LTR反转录转座子分为Ty1-copia和Ty3-gypsy超家族,Tork、Reftrofit、Sire、Oryco、Del、Reina、Crm、Tat、Galadriel、Athila等10个谱系。毛竹LTR反转录转座子的Ty1-copia和Ty3-gypsy超家族对PBS位点的偏好性呈相反趋势,较长的LTR反转录转座子具有更长的LTR序列,结构也更加完整。毛竹LTR反转录转座子的插入时间主要集中在0~2.0 Ma,且还处于不断缓慢增长的状态。   结论   第2版毛竹基因组的高质量组装,能更好地注释和分析毛竹基因组中的LTR反转录转座子。基于结构预测的LTRharvest法,能更精准地预测毛竹LTR反转录转座子。不同谱系的毛竹LTR反转录转座子在进化过程中具有不同的分化和扩增活性。毛竹LTR反转录转座子总体上处于不断扩增状态,这是导致毛竹基因组较大的主要原因之一。图3表3参52

English Abstract

陈娅欣, 周明兵. 毛竹长末端重复序列反转录转座子的全基因组特征及进化分析[J]. 浙江农林大学学报, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
引用本文: 陈娅欣, 周明兵. 毛竹长末端重复序列反转录转座子的全基因组特征及进化分析[J]. 浙江农林大学学报, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
CHEN Yaxin, ZHOU Mingbing. Genome-wide characteristics and evolution analysis of long terminal repeat retrotransposons in Phyllostachys edulis[J]. Journal of Zhejiang A&F University, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
Citation: CHEN Yaxin, ZHOU Mingbing. Genome-wide characteristics and evolution analysis of long terminal repeat retrotransposons in Phyllostachys edulis[J]. Journal of Zhejiang A&F University, 2021, 38(3): 455-463. doi: 10.11833/j.issn.2095-0756.20200458
  • 转座子(transposable elements, TEs)是一种自私的基因组“寄生虫”,能够增加拷贝数并改变其在宿主基因组中的位置[1]。转座子由于具有突变的可能,会对邻近基因表达产生潜在的危害,并导致染色体重排,对基因组的稳定性构成威胁[2-4]。转座子根据其转座中间产物被分为2类,其中Ⅰ类转座子包括复制黏贴式反转录转座子(retrotransposons, REs)[5],Ⅱ类转座子包括剪切黏贴式转座子[6]。Ⅰ类转座子根据其内部的结构可以分为LTR类(long terminal repeat retrotransposons)[6]、DIRS类(dictyostelium intermediate repeat sequence elements)[7]、PLE类(penelope-like elements)[8]、LINE类(long interspersed nuclear elements)[9]、SINE类(short interspersed nuclear elements)[10]。其中LTR反转录转座子是至今为止研究最多的一类[6]。LTR反转录转座子具有4个结构特点。第一,在序列两端有1对靶位点重复序列(target site repeats,TSD),约4~6 bp[11];第二,5′端和3′端有1对长为几十到几千bp不等高度相似的长末端重复序列[12];第三,LTR主要包括GAG衣壳蛋白编码区和POL多蛋白编码区(polyprotien),其中POL包括RH核糖核苷酸酶(ribonuclease h,RNaseH)、RT反转录酶(reverse transcriptase)、INT整合酶(integrase)和AP蛋白酶(aspartic proteinase)。还有一些Retrovirus和ENV超家族(superfamily)的LTR含有ENV序列(envelope protein, EN或ENV)[13];第四,在5′端附近有1个引物结合位点(primer binding site,PBS),可调控其基因组RNA反转录所必需的tRNA引物,它以染色体外线性DNA(extrachromosomal linear DNA, eclDNA)的形式产生LTR反转录转座子生命周期中间体。在3′端附近有1个富嘌呤位点(poly purine trait,PPT)[14],协助反转录的完成。根据LTR反转录转座子开放阅读框(open reading frames,ORF)的完整性分为自主LTR反转录转座子和非自主LTR反转录转座子[15]。自主LTR反转录转座子又可以根据POL中RT、INT和RH编码序列的排列方式,分为Ty1-copia 超家族(5′-INT-RT-RH-3′)和Ty3-gypsy超家族(5′-RH-RH-INT-3′)[16]。根据每个超家族的序列同源性(80-80-80的分类规则[17])可以分为不同的家族。根据LTR反转录转座子的同源性、蛋白结构、进化关系可以划分为不同的谱系,如梨Pyrus基因组中被划分为Ale、Ivana、Bianca、Angela、Tar、Tat、Athila、Renia、Crm、Galadriel、Tekay等11个谱系[18]。LTR反转录转座子的活性包括转录活性和转座活性。转录是转座的第1步,许多LTR反转录转座子在植物杂交、多倍体化或在环境挑战下发生去甲基化,被转录激活[19]。转座活性不仅包括转录活性,还受转录后调控,如植物基因组为了抑制转座子的活性通过转录基因沉默(transcriptional gene silencing, TGS)机制抑制它们的能力[20]。如果TGS得到缓解,则受21~22个核苷酸作用的转录后基因沉默机制(post-transcriptional gene silencing, PTGS)会将靶向转座子转录物进行降解[21],所以在实验条件下LTR反转录转座子很难被转座激活。在整个植物王国中LTR反转录转座子的进化特别成功,不断复制转座,导致基因组大小增加,基因组尺寸产生差异。在被子植物基因组之间由于几个LTR反转录转座子家族的扩增,产生一些巨大的基因组。例如2 400 Mb玉米Zea mays[22]和400 Mb水稻Oryza sativa[23]的基因组中LTR反转录转座子家族数相同,但是玉米基因组中5个谱系的LTR反转录转座子拷贝数较高。即使是亲缘关系很近的品种,LTR反转录转座子也会促使它们的基因结构产生巨大差异。如玉米与大刍草Zea mexicana是近亲,但是大刍草的基因组比玉米大1倍[24]。LTR反转录转座子在植物基因组中处于动态变化的过程,不仅会扩增,也会丢失,不平衡重组(illegitimate recombination)和非法重组(unequal recombination)活动就是丢失的主要原因[25-26]。不平衡重组和非法重组的产物主要包括含有TSD位点的solo LTR,不含TSD位点的Truncated LTR[27]。预测LTR反转录转座子可以通过4种方式[28]:比较基因组法(comparative genomic methods)[29]、重复序列从头算起法(de novo repeat discovery)[30]、同源比对法(homology-based methods)[31]、基于结构预测法(structure-based methods)。基于结构预测法是通过LTR反转录转座子的序列结构和转座机制分析来捕获,如LTR_STRUC、LTR_FINDER、LTRharvest、LTR_par、LTR_Rho等[32]。毛竹Phyllostachys edulis具有较高的经济和生态价值,其种植面积在中国的竹子总种植面积(443 万hm2)中占73.76%[33]。2018年第2版毛竹基因组的公布[34]为深入分析毛竹基因组中LTR反转座子提供了良好的条件。本研究运用了LTRharvest的方法[35],对第2版毛竹基因组中的LTR反转录转座进行预测,并对LTR反转录转座子的结构、在基因组中的分布特征、插入时间等进行系统分析,以期能了解毛竹LTR反转录转座子对基因组的影响。

    • 第2版毛竹基因组序列、基因组注释文件来自毛竹基因组数据库(http://bamboo.bamboogdb.org/#/download)[34]。先利用LTRharvest软件[35]预测毛竹基因组LTR反转录转座子,利用cd-hit根据80-80-80的分类规则[17]进行序列同源性聚类,然后利用LTRdigestion[36]注释各个LTR反转录转座子结构域。接着根据LTR反转录转座子的POL编码区RT、INT和RH的顺序将其分为Ty1-Copia(INT-RT-RH)和Ty3-Gypsy (RT-RH-INT)2个超家族[16]。根据序列中的GAG和POL编码区与Gypsy Database 2.0网站中(http://gydb.org/index.php/Phylogeny: POL_LTR_retroelements)植物典型的Tork、Reftrofit、Sire、Oryco、Del、Reina、Crm、Tat、Galadriel和Athila 谱系对应编码区的同源性,进一步将2个超家族分为10个谱系[35]。最后利用RepeatMakser软件分析LTR反转录转座子在毛竹基因组中的含量[31]

    • 使用MA等[37]对每条结构完整的毛竹LTR反转录转座子的插入时间进行计算:①对每条结构完整的LTR反转录转座子的两端LTR序列利用MUSCLE软件[38](使用默认参数)进行比对;②利用JUCKES-CANTOR的方法[39]计算碱基突变频率(K);③利用公式T=K/(2r)计算插入时间,T表示时间,r表示生物钟,r=1.3×10−8 bp·a−1[37]

    • 表1所示:得到1 014 565条LTR反转录转座子,占整个毛竹基因组的54.97%。毛竹中LTR反转录转座子比例与其他基因组相比,低于玉米基因组的70.1%[22],相近于高粱Sorghum bicolor基因组的55%[40],远高于水稻基因组的26%[23]。其中两端具有完整LTR序列,编码结构域完整的LTR反转录转座子(full-length LTR)有7 731条,两端具有完整LTR序列,编码结构域不完整的LTR反转录转座子(solo LTR)有13 656条(其余不含TSD位点的LTR反转录转座子忽略不计)。然后按照WICKER等[16]提出的真核生物转座子的分类方法,将blastn(all-vs-all)的方法和80-80-80的规则相结合,对7 731条完整的LTR反转录转座子进行分类,共分为1 562个家族。

      表 1  毛竹LTR反转录转座子超家族分类

      Table 1.  Classification of LTR retrotransposons superfamily of moso bamboo genome

      超家族谱系家族a结构数量/个全长/bp百分比b/%
      Ty1-copiaTork236GAG-PR-INT-RT-RH145 708124 219 9956.51
      Retrofit342GAG-PR-INT-RT-RH41 96543 615 8152.29
      Sire136GAG-PR-INT-RT-RH-ENV223 386210 097 73411.01
      Oryco105GAG-PR-INT-RT-RH22 07822 854 5911.20
      合计819433 137400 788 13521.01
      Ty3-gypsyDel207GAG-PR-RT-RH-INT-CHR295 222334 005 91617.51
      Reina249GAG-PR-RT-RH-INT-CHR27 80339 235 9392.06
      Crm47GAG-PR-RT-RH-INT40 78144 298 9552.32
      Tat238GAG-PR-RT-RH-INT217 288230 055 05312.06
      Galadriel1GAG-PR-RT-RH-INT-CHR2351 2480.00
      Athila1GAG-PR-RT-RH-INT-ENV311257 9700.01
      合计743581 428647 905 08133.96
      总计1 5621 014 5651 048 693 21654.97
        说明:a表示每个谱系的数量;b表示在毛竹基因组中LTR反转录转座子所占的比例

      毛竹LTR反转录转座子分为Ty1-copia和Typ3-gypsy 2个超家族,在1 562个LTR反转录转座子家族中有819个家族属于Ty1-Copia 超家族,共包括433 137条序列,长度为400 788 135 bp,占毛竹基因组的21.01%。743个家族属于Ty3-Gypsy超家族,共包括581 429条序列,长度为647 905 081 bp,占毛竹基因组的33.96%(表2)。Ty3-gypsy与Ty1-copia数量之比为1.3∶1.0,低于大豆Glycine max(1.4∶1.0)[19]和玉米(1.6∶1.0)[22],远低于水稻(4.9∶1.0)[41]和高粱(3.7∶1.0)[40],但远高于苜蓿Medicago sativa(0.3∶1.0)[42]

      表 2  毛竹LTR反转录转座子谱系特征

      Table 2.  Structure of LTR retrotransposon family of moso bamboo

      谱系家族a百分比c/%全长LTRdSolo LTRe全长LTR/Solo LTR全长 LTR+Solo LTR百分比f/%
      Tork23628.821 1691 4921.282 66128.76
      Retrofit34241.763021 1583.831 46015.78
      Sire13616.614643 1396.773 60338.95
      Oryco10512.825211 0061.931 52716.51
      Ty1-copia819100.002 4566 7952.779 251100.00
      Del20727.862 1022 9921.425 09441.97
      Reina24933.514951 2452.521 74014.34
      Crm476.335101 3522.651 86215.34
      Tat23832.032 1681 2510.583 41928.17
      Galadriel10.1307070.06
      Athila10.130140140.12
      Ty3-gypsy743100.005 2756 8611.3012 136100.00
      总计1 562100.007 73113 6561.7721 387100.00
        说明:a表示每个谱系的数量;c表示每个谱系在超家族中所占的比例;d表示结构完整的LTR反转录转座子(full-length LTR),包含     两端LTR序列和完整的编码结构域[44];e表示仅含有两端LTR序列,编码结构域有缺失的LTR反转录转座子(solo LTR)[44];f表     示每个谱系中full-length LTR和solo LTR在超家族中所占的比例

      根据LTR反转录转座子不同家族之间的进化关系和结构特征,Ty1-copia超家族和Ty3-gypsy超家族可以被分为多个不同的谱系[42-43]。根据Gypsy Database2.0[37]中植物典型的谱系序列特征,对毛竹LTR反转录转座子进行分类,将Ty1-copia超家族分为4个谱系,分别为Tork、Retrofit、Sire、Oryco;Ty3-gypsy超家族分为6个谱系,分别为Del、Reina、Crm、Tat、Galadriel、Athila。其中Tork包含236个家族,Reftrofit包含342个家族,Sire包含136个家族,Oryco包含105个家族,Del包含207个家族,Reina包含249个家族,Crm包含47个家族,Tat包含238个家族,Galadriel包含1个家族,Athila包含1个家族。在Ty1-copia超家族的4个谱系中,Sire的含量最高(达11.01%),紧随其后的是Tork(6.51%)。在Ty3-gypsy超家族的4个谱系中,Del的含量最高(达17.51%),紧随其后的是Tat(12.06%)(表1)。Tat和Del在植物中普遍存在并且是植物所特有的。ENV域在Sire中被识别,CHR域在Del和Reina中被识别(表1~2)。

    • 在转座过程中,PBS是LTR反转录转座子反转录开始的重要位点,因为LTR反转录转座子开始反转录时tRNA会结合到RNA的PBS处,然后通过反转录酶合成cDNA[45]。不同超家族和谱系的LTR反转录转座子对PBS具有不同的偏好性。由表3所示:MetCAT24是转座子反转过程中使用频率最高的PBS位点,占4.05%,比其他的位点要高,其次是LysTTT和LysTTT10。表3中Ty1-copia和Ty3-gypsy超家族对PBS位点的偏好性呈相反趋势,MetCAT24是Ty1-copia超家族中使用最多的PBS位点,LysTTT是Ty3-gypsy超家族使用最多的PBS位点,但在Ty1-copia超家族中频率很低,仅有1个。LTR序列是LTR反转录转座子中特有的,它们位于LTR反转录转座子的5′端和3′端,是一对高度相似的序列,通常较长的LTR反转录转座子具有更长的LTR序列,结构也更加完整。所以把5′端LTR作为参照,对LTR序列长度进行统计,结果如图1显示。对LTR反转录转座子而言,LTR序列长度与其全长序列的长度成正比。

      表 3  LTR反转录转座子PBS使用统计

      Table 3.  Usage status of PBS in LTR retrotransposons

      tRNA数量/个百分比/%Ty1-copia
      使用比例/%
      Ty3-gypsy
      使用比例/%
      MetCAT241 3834.051.700.83
      LysTTT4861.420.001.10
      LysTTT102850.830.310.03
      LeuAAG211310.380.000.15
      LysTTT31110.320.160.01
      LeuTAG9660.190.070.01

      图  1  LTR反转录转座子全长与LTR序列长度的相关性

      Figure 1.  Correlation of length between LTR and LTR retrotransposons

    • 对21 387个含有TSD位点的毛竹LTR反转录转座子的插入时间进行统计,如图2图3所示。毛竹LTR反转录转座子的插入时间集中于0~2.0 Ma,其中插入最旺盛的是在1.0~1.5 Ma,有4 426 个,占21.06%,插入较少的是在3.0 Ma之前,有891个,仅占2.61%,插入时间为0的有508个(占1.4%),说明这部分LTR反转录转座子可能还具有转座潜力。Del转座频率最高,有4 777个拷贝,占22.62%,且在0.5~1.5 Ma转座活动最为旺盛,其次为Sire和Tat。而Retrofit、Oryco、Reina、Crm转座频率都较低,Retrofit最低,仅有1 527个拷贝,占6.91%。以上数据说明毛竹基因组中LTR反转录转座子在0~2.0 Ma内大量复制增长,且还处于不断增长的状态,但增长趋势在减弱。

      图  2  毛竹LTR反转录转座子各个谱系的插入时间

      Figure 2.  Insertion time distribution of different lineages of moso bamboo LTR retrotransposons

      图  3  毛竹LTR反转录转座子超家族的插入时间

      Figure 3.  Insertion times of superfumily of moso bamboo LTR retrotransposons

    • HU等[46]利用第1版毛竹基因组数据分析了LTR反转录转座子的分布结构和进化模式。但由于第1版毛竹基因组数据的碎片化严重,限制了对LTR反转录转座子的完整预测。毛竹第2版基因数据的覆盖范围、精准度都有所提高,完整性达95.2%[34],相比玉米(92.2%)[22]要高,与水稻(95.6%)[23]接近,所以本研究的结果准确性较高。然而,LTR反转录转座子是一种重复序列[47],软件无法准确逐条识别,产生假阴性。在不同的基因组中LTR反转录转座子所占的比例不同,如在酵母基因组中占3%[48],在玉米基因组中占70.1%[22],分布特点也有所差异,且基因组中还存在其他重复序列,所以也很容易产生假阳性。因此,利用较完整的毛竹第2版基因组,能在一定程度上避免误差。

      在本研究中,通过对第2版毛竹基因组的注释共得到1 014 565条LTR反转录转座子(表1),占基因组的54.7%,较对第1版毛竹基因组注释的结果(1 954 616,39.83%,不包括未知LTR)数量有所下降,比例有所上升。对7 731条结构完整的LTR反转录转座子进行家族分类,共划分为1 562个家族,较第1版(959个)也有所上升。通过对LTR反转录转座子的结构完整性判断,solo-LTR较完整LTR反转录转座子比例更高(S/F为1.77),说明可能毛竹LTR反转录转座子不平衡重组和非法重组的活动频率较高,这可能是由于毛竹基因组在不断进化的过程中对转座子产生抑制,碎片化严重。但在第1版毛竹基因组中完整的LTR反转录转座子的占比更高(S/F为0.28),这是由于第1版基因组不完整所以信息显示不全面。总的来说,第2版毛竹基因组在转座子的注释、鉴定、家族和超家族的分类等方面都相比第1版毛竹基因组更加准确,但是依然存在数万条短的组装碎片,因此本研究对毛竹LTR反转录转座子的注释仍是保守值,随着毛竹基因组的更加完善会有更多的LTR反转录转座子被发现。

    • 根据Gypsy Database 2.0网站中植物典型的谱系序列特征,毛竹LTR反转录转座子共分为Sire、Oryco、Retrofit、Tork、Crm、Del、Reina、Tatol、Galadriel、Athila等10个谱系。其中Retrofit、Reina和Tat是数量最多的3个谱系。Galadriel和Athila在植物界中虽然广泛存在[15],但在毛竹基因组发现较少。一方面可能是Athila的大小通常为8.5~12.0 kb,并且具有相对较长的LTR序列(1.5~2.5 kb),很难被LTRhavest程序识别[35];另一方面,毛竹基因组的不完整和碎片化,可能会遗漏Galadriel和Athila。

      将毛竹LTR反转录转座子的谱系与水稻[47]、拟南芥Arabidopsis thaliana[49]进行比较,发现毛竹的10个谱系包含了双子叶植物和单子叶植物共同的进化特征,这是它们分裂后分化的结果[50],其中Tork是例外,它在毛竹、水稻、拟南芥中并无明显差异,这表明Tork相对其他谱系更加保守。并且毛竹与水稻亚科在LTR反转录转座子都为多拷贝和多进化谱系并存,而拟南芥的谱系数则相对较少[49],这可能是由于不同进化速率导致的结果。

      在不同谱系之间,LTR反转录转座子增殖差异较大。在毛竹Ty1-copia超家族中,Retrofit的LTR反转录转座子家族数量最多(342个),但拷贝数仅占15.78%,相比之下,Sire只有136个家族,拷贝数却达11.1%,占比最高。这种情况在Ty3-gypsy超家族更为显著,Reina包含249个家族,拷贝数却仅占2.06%,Crm只有47个家族,拷贝数所占比例比Reina还高一些。各谱系中LTR反转录转座子的数量反映了它们最近的扩增情况,而各谱系中家族的数量则代表了历史上不同的分化情况。因此,不同谱系的LTR反转录转座子在进化过程中具有不同的分化和扩增活性。

    • LTR反转录转座子两端的LTR序列是相同的,但在不断转座过程中,LTR序列会发生突变并分化,根据剪辑替换速率,可以得出LTR反转录转座子的插入时间[31]。毛竹LTR反转录转座子的插入时间在0~1.5 Ma呈直线式递增,但在大于1.5 Ma呈指数衰减,总体上呈现抛物线形式,与小麦Triticum aestivum [51]、桑树Morus notabilis[52]类似,这说明毛竹LTR反转录转座子的插入时间主要集中于0~2.0 Ma,在1.5 Ma处于转座活动爆发期,但其增长趋势处于回缩的状态。

      毛竹LTR反转录转座子在大于5.0 Ma区域缺失,可能原因:第一,5.0 Ma之前的老LTR反转录转座子与年轻的LTR反转录转座子发生重组,所以无法识别[42];第二,根据PENG等[33]的研究,在7.0~12.0 Ma中,毛竹基因组发生了四倍体事件,之后又不断进化为二倍体,在这个过程中毛竹基因组经历了较大的选择压力,所以5.0 Ma之前的毛竹LTR反转录转座子在基因组中被删除或严重破坏,无法通过结构预测和同源性比对来鉴定。

参考文献 (52)

目录

    /

    返回文章
    返回