-
转座子(transposable elements, TEs)是一种自私的基因组“寄生虫”,能够增加拷贝数并改变其在宿主基因组中的位置[1]。转座子由于具有突变的可能,会对邻近基因表达产生潜在的危害,并导致染色体重排,对基因组的稳定性构成威胁[2-4]。转座子根据其转座中间产物被分为2类,其中Ⅰ类转座子包括复制黏贴式反转录转座子(retrotransposons, REs)[5],Ⅱ类转座子包括剪切黏贴式转座子[6]。Ⅰ类转座子根据其内部的结构可以分为LTR类(long terminal repeat retrotransposons)[6]、DIRS类(dictyostelium intermediate repeat sequence elements)[7]、PLE类(penelope-like elements)[8]、LINE类(long interspersed nuclear elements)[9]、SINE类(short interspersed nuclear elements)[10]。其中LTR反转录转座子是至今为止研究最多的一类[6]。LTR反转录转座子具有4个结构特点。第一,在序列两端有1对靶位点重复序列(target site repeats,TSD),约4~6 bp[11];第二,5′端和3′端有1对长为几十到几千bp不等高度相似的长末端重复序列[12];第三,LTR主要包括GAG衣壳蛋白编码区和POL多蛋白编码区(polyprotien),其中POL包括RH核糖核苷酸酶(ribonuclease h,RNaseH)、RT反转录酶(reverse transcriptase)、INT整合酶(integrase)和AP蛋白酶(aspartic proteinase)。还有一些Retrovirus和ENV超家族(superfamily)的LTR含有ENV序列(envelope protein, EN或ENV)[13];第四,在5′端附近有1个引物结合位点(primer binding site,PBS),可调控其基因组RNA反转录所必需的tRNA引物,它以染色体外线性DNA(extrachromosomal linear DNA, eclDNA)的形式产生LTR反转录转座子生命周期中间体。在3′端附近有1个富嘌呤位点(poly purine trait,PPT)[14],协助反转录的完成。根据LTR反转录转座子开放阅读框(open reading frames,ORF)的完整性分为自主LTR反转录转座子和非自主LTR反转录转座子[15]。自主LTR反转录转座子又可以根据POL中RT、INT和RH编码序列的排列方式,分为Ty1-copia 超家族(5′-INT-RT-RH-3′)和Ty3-gypsy超家族(5′-RH-RH-INT-3′)[16]。根据每个超家族的序列同源性(80-80-80的分类规则[17])可以分为不同的家族。根据LTR反转录转座子的同源性、蛋白结构、进化关系可以划分为不同的谱系,如梨Pyrus基因组中被划分为Ale、Ivana、Bianca、Angela、Tar、Tat、Athila、Renia、Crm、Galadriel、Tekay等11个谱系[18]。LTR反转录转座子的活性包括转录活性和转座活性。转录是转座的第1步,许多LTR反转录转座子在植物杂交、多倍体化或在环境挑战下发生去甲基化,被转录激活[19]。转座活性不仅包括转录活性,还受转录后调控,如植物基因组为了抑制转座子的活性通过转录基因沉默(transcriptional gene silencing, TGS)机制抑制它们的能力[20]。如果TGS得到缓解,则受21~22个核苷酸作用的转录后基因沉默机制(post-transcriptional gene silencing, PTGS)会将靶向转座子转录物进行降解[21],所以在实验条件下LTR反转录转座子很难被转座激活。在整个植物王国中LTR反转录转座子的进化特别成功,不断复制转座,导致基因组大小增加,基因组尺寸产生差异。在被子植物基因组之间由于几个LTR反转录转座子家族的扩增,产生一些巨大的基因组。例如2 400 Mb玉米Zea mays[22]和400 Mb水稻Oryza sativa[23]的基因组中LTR反转录转座子家族数相同,但是玉米基因组中5个谱系的LTR反转录转座子拷贝数较高。即使是亲缘关系很近的品种,LTR反转录转座子也会促使它们的基因结构产生巨大差异。如玉米与大刍草Zea mexicana是近亲,但是大刍草的基因组比玉米大1倍[24]。LTR反转录转座子在植物基因组中处于动态变化的过程,不仅会扩增,也会丢失,不平衡重组(illegitimate recombination)和非法重组(unequal recombination)活动就是丢失的主要原因[25-26]。不平衡重组和非法重组的产物主要包括含有TSD位点的solo LTR,不含TSD位点的Truncated LTR[27]。预测LTR反转录转座子可以通过4种方式[28]:比较基因组法(comparative genomic methods)[29]、重复序列从头算起法(de novo repeat discovery)[30]、同源比对法(homology-based methods)[31]、基于结构预测法(structure-based methods)。基于结构预测法是通过LTR反转录转座子的序列结构和转座机制分析来捕获,如LTR_STRUC、LTR_FINDER、LTRharvest、LTR_par、LTR_Rho等[32]。毛竹Phyllostachys edulis具有较高的经济和生态价值,其种植面积在中国的竹子总种植面积(443 万hm2)中占73.76%[33]。2018年第2版毛竹基因组的公布[34]为深入分析毛竹基因组中LTR反转座子提供了良好的条件。本研究运用了LTRharvest的方法[35],对第2版毛竹基因组中的LTR反转录转座进行预测,并对LTR反转录转座子的结构、在基因组中的分布特征、插入时间等进行系统分析,以期能了解毛竹LTR反转录转座子对基因组的影响。
-
由表1所示:得到1 014 565条LTR反转录转座子,占整个毛竹基因组的54.97%。毛竹中LTR反转录转座子比例与其他基因组相比,低于玉米基因组的70.1%[22],相近于高粱Sorghum bicolor基因组的55%[40],远高于水稻基因组的26%[23]。其中两端具有完整LTR序列,编码结构域完整的LTR反转录转座子(full-length LTR)有7 731条,两端具有完整LTR序列,编码结构域不完整的LTR反转录转座子(solo LTR)有13 656条(其余不含TSD位点的LTR反转录转座子忽略不计)。然后按照WICKER等[16]提出的真核生物转座子的分类方法,将blastn(all-vs-all)的方法和80-80-80的规则相结合,对7 731条完整的LTR反转录转座子进行分类,共分为1 562个家族。
表 1 毛竹LTR反转录转座子超家族分类
Table 1. Classification of LTR retrotransposons superfamily of moso bamboo genome
超家族 谱系 家族a 结构 数量/个 全长/bp 百分比b/% Ty1-copia Tork 236 GAG-PR-INT-RT-RH 145 708 124 219 995 6.51 Retrofit 342 GAG-PR-INT-RT-RH 41 965 43 615 815 2.29 Sire 136 GAG-PR-INT-RT-RH-ENV 223 386 210 097 734 11.01 Oryco 105 GAG-PR-INT-RT-RH 22 078 22 854 591 1.20 合计 819 433 137 400 788 135 21.01 Ty3-gypsy Del 207 GAG-PR-RT-RH-INT-CHR 295 222 334 005 916 17.51 Reina 249 GAG-PR-RT-RH-INT-CHR 27 803 39 235 939 2.06 Crm 47 GAG-PR-RT-RH-INT 40 781 44 298 955 2.32 Tat 238 GAG-PR-RT-RH-INT 217 288 230 055 053 12.06 Galadriel 1 GAG-PR-RT-RH-INT-CHR 23 51 248 0.00 Athila 1 GAG-PR-RT-RH-INT-ENV 311 257 970 0.01 合计 743 581 428 647 905 081 33.96 总计 1 562 1 014 565 1 048 693 216 54.97 说明:a表示每个谱系的数量;b表示在毛竹基因组中LTR反转录转座子所占的比例 毛竹LTR反转录转座子分为Ty1-copia和Typ3-gypsy 2个超家族,在1 562个LTR反转录转座子家族中有819个家族属于Ty1-Copia 超家族,共包括433 137条序列,长度为400 788 135 bp,占毛竹基因组的21.01%。743个家族属于Ty3-Gypsy超家族,共包括581 429条序列,长度为647 905 081 bp,占毛竹基因组的33.96%(表2)。Ty3-gypsy与Ty1-copia数量之比为1.3∶1.0,低于大豆Glycine max(1.4∶1.0)[19]和玉米(1.6∶1.0)[22],远低于水稻(4.9∶1.0)[41]和高粱(3.7∶1.0)[40],但远高于苜蓿Medicago sativa(0.3∶1.0)[42]。
表 2 毛竹LTR反转录转座子谱系特征
Table 2. Structure of LTR retrotransposon family of moso bamboo
谱系 家族a 百分比c/% 全长LTRd Solo LTRe 全长LTR/Solo LTR 全长 LTR+Solo LTR 百分比f/% Tork 236 28.82 1 169 1 492 1.28 2 661 28.76 Retrofit 342 41.76 302 1 158 3.83 1 460 15.78 Sire 136 16.61 464 3 139 6.77 3 603 38.95 Oryco 105 12.82 521 1 006 1.93 1 527 16.51 Ty1-copia 819 100.00 2 456 6 795 2.77 9 251 100.00 Del 207 27.86 2 102 2 992 1.42 5 094 41.97 Reina 249 33.51 495 1 245 2.52 1 740 14.34 Crm 47 6.33 510 1 352 2.65 1 862 15.34 Tat 238 32.03 2 168 1 251 0.58 3 419 28.17 Galadriel 1 0.13 0 7 0 7 0.06 Athila 1 0.13 0 14 0 14 0.12 Ty3-gypsy 743 100.00 5 275 6 861 1.30 12 136 100.00 总计 1 562 100.00 7 731 13 656 1.77 21 387 100.00 说明:a表示每个谱系的数量;c表示每个谱系在超家族中所占的比例;d表示结构完整的LTR反转录转座子(full-length LTR),包含 两端LTR序列和完整的编码结构域[44];e表示仅含有两端LTR序列,编码结构域有缺失的LTR反转录转座子(solo LTR)[44];f表 示每个谱系中full-length LTR和solo LTR在超家族中所占的比例 根据LTR反转录转座子不同家族之间的进化关系和结构特征,Ty1-copia超家族和Ty3-gypsy超家族可以被分为多个不同的谱系[42-43]。根据Gypsy Database2.0[37]中植物典型的谱系序列特征,对毛竹LTR反转录转座子进行分类,将Ty1-copia超家族分为4个谱系,分别为Tork、Retrofit、Sire、Oryco;Ty3-gypsy超家族分为6个谱系,分别为Del、Reina、Crm、Tat、Galadriel、Athila。其中Tork包含236个家族,Reftrofit包含342个家族,Sire包含136个家族,Oryco包含105个家族,Del包含207个家族,Reina包含249个家族,Crm包含47个家族,Tat包含238个家族,Galadriel包含1个家族,Athila包含1个家族。在Ty1-copia超家族的4个谱系中,Sire的含量最高(达11.01%),紧随其后的是Tork(6.51%)。在Ty3-gypsy超家族的4个谱系中,Del的含量最高(达17.51%),紧随其后的是Tat(12.06%)(表1)。Tat和Del在植物中普遍存在并且是植物所特有的。ENV域在Sire中被识别,CHR域在Del和Reina中被识别(表1~2)。
-
在转座过程中,PBS是LTR反转录转座子反转录开始的重要位点,因为LTR反转录转座子开始反转录时tRNA会结合到RNA的PBS处,然后通过反转录酶合成cDNA[45]。不同超家族和谱系的LTR反转录转座子对PBS具有不同的偏好性。由表3所示:MetCAT24是转座子反转过程中使用频率最高的PBS位点,占4.05%,比其他的位点要高,其次是LysTTT和LysTTT10。表3中Ty1-copia和Ty3-gypsy超家族对PBS位点的偏好性呈相反趋势,MetCAT24是Ty1-copia超家族中使用最多的PBS位点,LysTTT是Ty3-gypsy超家族使用最多的PBS位点,但在Ty1-copia超家族中频率很低,仅有1个。LTR序列是LTR反转录转座子中特有的,它们位于LTR反转录转座子的5′端和3′端,是一对高度相似的序列,通常较长的LTR反转录转座子具有更长的LTR序列,结构也更加完整。所以把5′端LTR作为参照,对LTR序列长度进行统计,结果如图1显示。对LTR反转录转座子而言,LTR序列长度与其全长序列的长度成正比。
表 3 LTR反转录转座子PBS使用统计
Table 3. Usage status of PBS in LTR retrotransposons
tRNA 数量/个 百分比/% Ty1-copia
使用比例/%Ty3-gypsy
使用比例/%MetCAT24 1 383 4.05 1.70 0.83 LysTTT 486 1.42 0.00 1.10 LysTTT10 285 0.83 0.31 0.03 LeuAAG21 131 0.38 0.00 0.15 LysTTT3 111 0.32 0.16 0.01 LeuTAG9 66 0.19 0.07 0.01 -
对21 387个含有TSD位点的毛竹LTR反转录转座子的插入时间进行统计,如图2和图3所示。毛竹LTR反转录转座子的插入时间集中于0~2.0 Ma,其中插入最旺盛的是在1.0~1.5 Ma,有4 426 个,占21.06%,插入较少的是在3.0 Ma之前,有891个,仅占2.61%,插入时间为0的有508个(占1.4%),说明这部分LTR反转录转座子可能还具有转座潜力。Del转座频率最高,有4 777个拷贝,占22.62%,且在0.5~1.5 Ma转座活动最为旺盛,其次为Sire和Tat。而Retrofit、Oryco、Reina、Crm转座频率都较低,Retrofit最低,仅有1 527个拷贝,占6.91%。以上数据说明毛竹基因组中LTR反转录转座子在0~2.0 Ma内大量复制增长,且还处于不断增长的状态,但增长趋势在减弱。
Genome-wide characteristics and evolution analysis of long terminal repeat retrotransposons in Phyllostachys edulis
-
摘要:
目的 研究毛竹Phyllostachys edulis基因组中的长末端重复序列反转录转座子(long terminal repeat retrotransposons, LTR-REs)的特征,为今后利用LTR反转录转座子对毛竹基因组的功能和对竹种资源遗传多样性的研究奠定基础。 方法 通过生物信息学方法,利用LTRharvest和RepeatMakser软件对第2版毛竹基因组中的LTR反转录转座子进行全面注释与分类,并对得到的LTR反转录转座子的分布特征、进化特性和插入时间进行分析。 结果 在毛竹基因组中共注释得到1 014 565个LTR反转录转座子,1 562个家族,占毛竹基因组的54.97%。其中solo LTR反转录转座子与完整LTR反转录转座子(S/F)的比例较高(约1.77∶1.00),表明在毛竹LTR反转录转座子中可能发生了相对较高频率的非法重组和不平衡重组。毛竹LTR反转录转座子分为Ty1-copia和Ty3-gypsy超家族,Tork、Reftrofit、Sire、Oryco、Del、Reina、Crm、Tat、Galadriel、Athila等10个谱系。毛竹LTR反转录转座子的Ty1-copia和Ty3-gypsy超家族对PBS位点的偏好性呈相反趋势,较长的LTR反转录转座子具有更长的LTR序列,结构也更加完整。毛竹LTR反转录转座子的插入时间主要集中在0~2.0 Ma,且还处于不断缓慢增长的状态。 结论 第2版毛竹基因组的高质量组装,能更好地注释和分析毛竹基因组中的LTR反转录转座子。基于结构预测的LTRharvest法,能更精准地预测毛竹LTR反转录转座子。不同谱系的毛竹LTR反转录转座子在进化过程中具有不同的分化和扩增活性。毛竹LTR反转录转座子总体上处于不断扩增状态,这是导致毛竹基因组较大的主要原因之一。图3表3参52 Abstract:Objective This study aims to analyze the characteristics of long terminal repeat retrotransposons (LTR-REs) in moso bamboo genome, so as to promote the research on the function of LTR-REs in moso bamboo genome and the genetic diversity of bamboo resources. Method Based on bioinformatics methods, LTR retrotransposons in the second edition of moso bamboo genome were annotated and classified by LTRharvest and RepeatMakser software, and the distribution characteristics, evolution characteristics and insertion time of the obtained LTR retrotransposons were analyzed. Result A total of 1 014 565 LTR retrotransposons and 1 562 families were identified, accounting for 54.97% of moso bamboo genome. Among them, the ratio of solo LTR retrotransposons to intact LTR retrotransposons (S/F) was relatively high (about 1.77∶1.00), indicating that a higher frequency of illegitimate recombination and unbalanced recombination might have occurred in the LTR-REs of moso bamboo genome. LTR retrotransposons were divided into Ty1-copia and Ty3-gypsy superfamilies, and ten lineages included Tork, Reftrofit, Sire, Oryco, Del, Reina, Crm, Tat, Galadriel, and Athila. The preference of Ty1-copia and Ty3-gypsy superfamiles for PBS sites showed an opposite tendency. The longer LTR retrotransposons had longer LTR sequences and more complete structures. The insertion time of LTR retrotransposon in moso bamboo was mainly concentrated in the 0−2.0 Ma region, and it was still in a state of slow growth. Conclusion The high-quality assembly of the second edition of moso bamboo genome can better annotate and analyze the LTR retrotransposons in moso bamboo genome. The LTR harvest method based on structure prediction can more accurately predict the LTR retrotransposons of moso bamboo. The LTR retrotransposons of different lineages have different differentiation and amplification activities during evolution. LTR retrotransposons are generally in a state of continuous amplification, which is one of the reasons for the large genome of moso bamboo. [Ch, 3 fig. 3 tab. 52 ref.] -
Key words:
- LTR retrotransposons /
- Phyllostachys edulis /
- genome /
- evolution
-
表 1 毛竹LTR反转录转座子超家族分类
Table 1. Classification of LTR retrotransposons superfamily of moso bamboo genome
超家族 谱系 家族a 结构 数量/个 全长/bp 百分比b/% Ty1-copia Tork 236 GAG-PR-INT-RT-RH 145 708 124 219 995 6.51 Retrofit 342 GAG-PR-INT-RT-RH 41 965 43 615 815 2.29 Sire 136 GAG-PR-INT-RT-RH-ENV 223 386 210 097 734 11.01 Oryco 105 GAG-PR-INT-RT-RH 22 078 22 854 591 1.20 合计 819 433 137 400 788 135 21.01 Ty3-gypsy Del 207 GAG-PR-RT-RH-INT-CHR 295 222 334 005 916 17.51 Reina 249 GAG-PR-RT-RH-INT-CHR 27 803 39 235 939 2.06 Crm 47 GAG-PR-RT-RH-INT 40 781 44 298 955 2.32 Tat 238 GAG-PR-RT-RH-INT 217 288 230 055 053 12.06 Galadriel 1 GAG-PR-RT-RH-INT-CHR 23 51 248 0.00 Athila 1 GAG-PR-RT-RH-INT-ENV 311 257 970 0.01 合计 743 581 428 647 905 081 33.96 总计 1 562 1 014 565 1 048 693 216 54.97 说明:a表示每个谱系的数量;b表示在毛竹基因组中LTR反转录转座子所占的比例 表 2 毛竹LTR反转录转座子谱系特征
Table 2. Structure of LTR retrotransposon family of moso bamboo
谱系 家族a 百分比c/% 全长LTRd Solo LTRe 全长LTR/Solo LTR 全长 LTR+Solo LTR 百分比f/% Tork 236 28.82 1 169 1 492 1.28 2 661 28.76 Retrofit 342 41.76 302 1 158 3.83 1 460 15.78 Sire 136 16.61 464 3 139 6.77 3 603 38.95 Oryco 105 12.82 521 1 006 1.93 1 527 16.51 Ty1-copia 819 100.00 2 456 6 795 2.77 9 251 100.00 Del 207 27.86 2 102 2 992 1.42 5 094 41.97 Reina 249 33.51 495 1 245 2.52 1 740 14.34 Crm 47 6.33 510 1 352 2.65 1 862 15.34 Tat 238 32.03 2 168 1 251 0.58 3 419 28.17 Galadriel 1 0.13 0 7 0 7 0.06 Athila 1 0.13 0 14 0 14 0.12 Ty3-gypsy 743 100.00 5 275 6 861 1.30 12 136 100.00 总计 1 562 100.00 7 731 13 656 1.77 21 387 100.00 说明:a表示每个谱系的数量;c表示每个谱系在超家族中所占的比例;d表示结构完整的LTR反转录转座子(full-length LTR),包含 两端LTR序列和完整的编码结构域[44];e表示仅含有两端LTR序列,编码结构域有缺失的LTR反转录转座子(solo LTR)[44];f表 示每个谱系中full-length LTR和solo LTR在超家族中所占的比例 表 3 LTR反转录转座子PBS使用统计
Table 3. Usage status of PBS in LTR retrotransposons
tRNA 数量/个 百分比/% Ty1-copia
使用比例/%Ty3-gypsy
使用比例/%MetCAT24 1 383 4.05 1.70 0.83 LysTTT 486 1.42 0.00 1.10 LysTTT10 285 0.83 0.31 0.03 LeuAAG21 131 0.38 0.00 0.15 LysTTT3 111 0.32 0.16 0.01 LeuTAG9 66 0.19 0.07 0.01 -
[1] 殷豪. 梨基因组 LTR 反转座子注释及进化分析研究[D]. 南京: 南京农业大学, 2014. YIN Hao. Genome-wide Annotation and Evolutionary Analysis of Long Terminal Repeat Retrotransposons in Pear (Pyrus bretschneideri Rehd.)[D]. Nanjing: Nanjing Agricultural University, 2014. [2] NIE Qiong, QIAO Guang, PENG Lei, et al. Transcriptional activation of long terminal repeat retrotransposon sequences in the genome of pitaya under abiotic stress [J]. Plant Physiol Biochem, 2019, 135: 460 − 468. [3] 蒋爽. 基于反转录转座子标记的梨属植物亲缘关系研究[D]. 杭州: 浙江大学, 2015. JIANG Shuang. Studies on Genetic Relationships of Pyrus Species and Cultivars based on Retrotransposons Markers[D]. Hangzhou: Zhejiang University, 2015. [4] 汪浩. 植物基因组 LTR 反转录转座子注释和比较研究[D]. 上海: 复旦大学, 2008. WANG Hao. Annotation and Comparative Study of LTR Retrotransposons in Plant Genomes[D]. Shanghai: Fudan University, 2008. [5] KOBAYASHI S, GOTO-YAMAMOTO N, HIROCHIKA H. Retrotransposon-induced mutations in grape skin color[J]. Science, 2004, 304(5673): 982. doi: 10.1126/science.1095011. [6] ZHOU Mingbing, LIANG Linlin, HANNINEN H. A transposition-active Phyllostachys edulis long terminal repeat (LTR) retrotransposon [J]. J Plant Res, 2018, 131(2): 203 − 210. [7] JIANG Shuag, TENG Yuanwen, ZONG Yu, et al. Review of LTR retrotransposons in plants [J]. Acta Bot Boreali-Occident Sin, 2013, 33(11): 2354 − 2360. [8] 张赞一. 毛竹 LTR 反转录转座子-PHRE6 的克隆与转座活性鉴定以及转座监测系统的构建[D]. 杭州: 浙江农林大学, 2018. ZHANG Zanyi. Phyllostachys edulis LTR Transposon-cloning and Transposition Activity Identification of PHRE6 and Construction of Transposition Monitoring System[D]. Hangzhou: Zhejiang A&F University, 2018. [9] 吴骏澜. 长末端重复序列反转录转座子分析流程构建及应用[D]. 合肥: 安徽农业大学, 2017. WU Julan. Construction and Application of Identification and Analysis Process of Full-length LTR-retrotransposons[D]. Hefei: Anhui Agricultural University, 2017. [10] ROY N S, CHOI J Y, LEE S I, et al. Marker utility of transposable elements for plant genetics, breeding, and ecology: a review [J]. Genes Genomics, 2015, 37(2): 141 − 151. [11] 周鹏. 梨 Ty1-copia 反转录转座子的分子特性研究[D]. 杨凌: 西北农林科技大学, 2013. ZHOU PENG. Molecular Character of Novel Ty1-copia Retrotransposons in Pear[D]. Yangling: Northwest A&F University, 2013. [12] 马赑. 桑树全基因组转座子的鉴定及特征分析[D]. 重庆: 西南大学, 2014. MA Bi. Genome-wide Identification and Characterization of Transposable Elements in Mulberry (Morus notabilis)[D]. Chongqing: Southwest University, 2014. [13] 侯菲. 蔷薇目 7 个物种间 LTR 反转录转座子水平转移的鉴定以及转座活性分析[D]. 重庆: 西南大学, 2018. HOU Fei. Horizontal Transfers and Activity Analysis of LTR Retrotransposons in Seven Rosales Species[D]. Chongqing: Southwest University, 2018. [14] FINATTO T, de OLIVEIRA A C, CHAPARRO C, et al. Abiotic stress and genome dynamics: specific genes and transposable elements response to iron excess in rice [J]. Rice, 2015, 8: 13. doi: 10.1186/s12284-015-0045-6. [15] GALINDO-GONZALEZ L, MHIRI C, DEYHOLOS M K, et al. LTR-retrotransposons in plants: engines of evolution [J]. Gene, 2017, 626: 14 − 25. [16] WICKER T, SABOT F, HUA-VAN A, et al. A unified classification system for eukaryotic transposable elements [J]. Nat Rev Genet, 2007, 8(12): 973 − 982. [17] SHINGOTE P R, MITHRA S V A, SHARMA P, et al. LTR retrotransposons and highly informative ISSRs in combination are potential markers for genetic fidelity testing of tissue culture-raised plants in sugarcane [J]. Mol Breed, 2019, 39(2): 25. [18] SAZE H, KAKUTANI T. Differentiation of epigenetic modifications between transposons and genes [J]. Curr Opin Plant Biol, 2011, 14(1): 81 − 87. [19] DU Jianchang, TIAN Zhixi, BOWEN N J, et al. Bifurcation and enhancement of autonomous-nonautonomous retrotransposon partnership through LTR swapping in soybean [J]. Plant Cell, 2010, 22(1): 48 − 61. [20] LLORENS C, MUNOZ-POMER A, BERNAD L, et al. Network dynamics of eukaryotic LTR retroelements beyond phylogenetic trees [J]. Biol Dir, 2009, 4(12): 41 − 72. [21] 虞洪杰. 植物 LTR 反转录转座子的预测和注释及邻聚法构建系统进化树研究[D]. 杭州: 浙江大学, 2011. YU Hongjie. Prediction and Annotation of LTR Retrotranspons in Plant and a New Method to Construct Phylogeneic Trees[D]. Hangzhou: Zhejiang University, 2011. [22] XU Ling, ZHANG Yue, SU Yuan, et al. Structure and evolution of full-length LTR retrotransposons in rice genome [J]. Plant Syst Evol, 2010, 287(1/2): 19 − 28. [23] WANG Qinghua, DOONER H K. Dynamic evolution of bz orthologous regions in the Andropogoneae and other grasses [J]. Plant J, 2012, 72(2): 212 − 221. [24] LAVERGNE S, MUENKE N J, MOLOFSKY J. Genome size reduction can trigger rapid phenotypic evolution in invasive plants [J]. Ann Bot, 2010, 105(1): 109 − 116. [25] ELLINGHAUS D, KURTZ S, WILLHOEFT U. LTRharvest, an efficient and flexible software for de novo detection of LTR retrotransposons[J]. BMC Bioinf, 2008, 9(1). doi: 10.1186/1471-2105-9-18. [26] WANG Hao, LIU Jinsong. LTR retrotransposon landscape in Medicago truncatula: more rapid removal than in rice [J]. BMC Genomics, 2008, 9(1). doi: 10.1186/1471-2164-9-382. [27] LERAT E. Identifying repeats and transposable elements in sequenced genomes: how to find your way through the dense forest of programs [J]. Heredity, 2010, 104(6): 520 − 533. [28] SU Shuai, CUI Ning, SUN Aijun, et al. Sequence analysis of the whole genome of a recombinant Marek’s disease virus strain, GX0101, with a reticuloendotheliosis virus LTR insert [J]. Arch Virol, 2013, 158(9): 2007 − 2014. [29] LIAN Shuaibin, CHEN Xinwu, WANG Peng, et al. A complete and accurate Ab initio repeat finding algorithm [J]. Interdisciplinary Sci Comput Life Sci, 2016, 8(1): 75 − 83. [30] OU Shujun, JIANG Ning. LTR_FINDER_parallel: parallelization of LTR_FINDER enabling rapid identification of long terminal repeat retrotransposons[J]. Mobile DNA, 2019, 10(6403). doi: 10.11011722736. [31] BEDELL J A, KORF I, GISH W, et al. MaskerAid: a performance enhancement to RepeatMaskerf [J]. Broinformatics, 2000, 16(11): 1040 − 1041. [32] 周敏. 竹子 LINEs, Ty3-gypsy 类转座子的克隆、鉴定及特性分析[D]. 杭州: 浙江农林大学, 2014. ZHOU Min. Cloning, Identification and Analysis Characteristics of LINEs and Ty3-gypsy Retrotransposons from Bamboo[D]. Hangzhou: Zhejiang A&F University, 2014. [33] PENG Zhenhua, LU Yuying, LI Lubin, et al. The draft genome of the fast-growing non-timber forest species moso bamboo (Phyllostachys heterocycla) [J]. Nat Genet, 2013, 45(4): 456 − 461. [34] ZHAO Hansheng, GAO Zhimin, WANG Le, et al. Chromosome-level reference genome and alternative splicing atlas of moso bamboo (Phyllostachys edulis)[J]. GigaScience, 2018, 7(10): giy115. doi: 10.1093/gigascience/giy115. [35] MONAT C, TANDO N, TRANCHANT-DUBREUIL C, et al. LTRclassifier: a website for fast structural LTR retrotransposons classification in plants[J]. Mobile Genet Elem, 2016, 6(6). doi: 10.1080/2159256X.2016.1241050. [36] BERNARD H R, WUTICH A, RYAN G W. Analyzing Qualitative Data: Systematic Approaches[M]. New York: SAGE Publications, 2016. [37] MA Jianxin, BENNETZEN J L. Rapid recent growth and divergence of rice nuclear genomes [J]. Proc Nat Acad Sci, 2004, 101(34): 12404 − 12410. [38] EDGAR R C. MUSCLE: a multiple sequence alignment method with reduced time and space complexity [J]. BMC Bioinf, 2004, 5(1): 113. doi: 10.1186/1471-2105-5-113. [39] KIMURA M, OHTA T. On the stochastic model for estimation of mutational distance between homologous proteins [J]. J Mol Evol, 1972, 2(1): 87 − 90. [40] PATERSON A H, BOWERS J E, BRUGGMANN R, et al. The Sorghum bicolor genome and the diversification of grasses [J]. Nature, 2009, 457(7229): 551 − 556. [41] WANG Hao, XU Zhao, YU Hongjie. LTR retrotransposons reveal recent extensive inter-subspecies nonreciprocal recombination in Asian cultivated rice [J]. BMC Genomics, 2008, 9(1): 1 − 13. [42] HAVECKER E R, GAO Xiang, VOYTAS D F. The Sireviruses, a plant-specific lineage of the Ty1/copia retrotransposons, interact with a family of proteins related to dynein light chain 8 [J]. Plant Physiol, 2005, 139(2): 857 − 868. [43] CHADHA S, SHARMA M. Genetic differentiation and phylogenetic potential of Ty3/Gypsy LTR retrotransposon markers in soil and plant pathogenic fungi [J]. J Basic Microbiol, 2020, 60(6): 508 − 516. [44] BENNETZEN J L. Transposable element contributions to plant gene and genome evolution [J]. Plant Mol Biol, 2000, 42(1): 251 − 269. [45] PICAULT N, CHAPARRO C, PIEGU B, et al. Identification of an active LTR retrotransposon in rice [J]. Plant J, 2009, 58(5): 754 − 765. [46] HU Bingjie, ZHOU Mingbing, ZHU Yihang. Genome-wide characterization and evolution analysis of long terminal repeat retroelements in moso bamboo (Phyllostachys edulis)[J]. Tree Genet Genomes, 2017, 13(2): 43. doi: 10.1007/s11295-017-1114-3. [47] PENG Yu, ZHANG Yingying, GUI Yijie, et al. Elimination of a retrotransposon for quenching genome instability in modern rice [J]. Mol Plant, 2019, 12(10): 1395 − 1407. [48] WAGNER A. Distribution of transcription factor binding sites in the yeast genome suggests abundance of coordinately regulated genes [J]. Genomics, 1998, 50(2): 293 − 295. [49] LOCKTON S, GAUT B S. The contribution of transposable elements to expressed coding sequence in Arabidopsis thaliana [J]. J Mol Evol, 2009, 68(1): 80 − 89. [50] FESCHOTTE C, JIANG N, WESSLER S R. Plant transposable elements: where genetics meets genomics [J]. Nat Rev Genet, 2002, 3(5): 329 − 341. [51] KASHKUSH K, FELDMAN M, LEVY A A. Transcriptional activation of retrotransposons alters the expression of adjacent genes in wheat [J]. Nat Genet, 2003, 33(1): 102 − 106. [52] HE Ningjia, ZHANG Chi, QI Xiwu, et al. Draft genome sequence of the mulberry tree Morus notabilis [J]. Nat Commun, 2013, 4(1): 1 − 9. -
链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20200458