-
CONSTANS-like是植物中保守的一类锌指蛋白转录因子,N端含有1个或2个由2个半胱氨酸组成C-X2-C-X16-C-X2-C(C为半胱氨酸,X为可变氨基酸)介导蛋白互作的B-box结构域[1],C端包含1个由43个氨基酸组成参与蛋白核定位的CCT(CONSTANS、CONSTANS-like、TOC1)结构域[2-3]。CO/CO-like(COL)基因家族已在多个物种中进行了报道,拟南芥Arabidopsis thaliana中鉴定到17个CONSTANS-like成员[2],水稻Oryza sativa中有17个[4],甜菜Beta vulgaris中有13个[5],大麦Hordeum vulgare中有9个[4],甘蓝型油菜Brassica napus中有4个[6],小麦Triticum aestivum中有3个[7],挪威云杉Picea abies中含有2个COL成员[8]。
研究表明:COL基因具有功能多样性,特别是在光响应介导的开花和生长调控方面[2, 4-5, 9] 。CO基因的表达和蛋白稳定受生物钟和光周期调节;长日照条件下,CO与FLOWERING LOCUS T (FT)启动子结合,诱导FT基因表达,促进拟南芥提前开花[10-11],CO通过调节TERMINAL FLOWER 1 (TFL1)的表达,抑制FT诱导开花[12]。AtCOL9通过抑制CO基因表达,减缓FT转录,延迟开花[13]。在水稻中,超表达OsCOL15通过上调开花抑制因子Ghd7 (grain number, plant height and heading date 7),下调激活因子RID1 (rice indeterminate 1)、Ehd1 (early heading date 1)、Hd3a (heading date 3a)、FLT1 (FLOWERING LOCUS T1),导致开花延迟[14]。在长日照条件下,过表达甘菊Chrysanthemum lavandulifolium 的 ClCOL5诱导转基因拟南芥提前开花[15]。大部分PheCOLs在毛竹Phyllostachys edulis叶片中表达量最高,具有显著的光周期响应模式[16];在早竹Ph. violascens中,PvCO1和PvCO2主要在叶片中表达[17]。毛果杨Populus trichocarpa的PtCOLs优先在叶片中表达[18];银杏Ginkgo biloba中GbCO基因主要在叶片和茎尖表达[19]。超表达PhCOL16提高转基因矮牵牛Petunia corollas叶绿素含量,正调控叶绿素生物合成[20]。COL不仅参与开花调控,在植物发育和逆境胁迫中也发挥重要作用。AtCOL4提高转基因植株盐和脱落酸 (abscisic acid, ABA)耐受性[21],AtCOL7促进拟南芥侧枝形成和下胚轴伸长[22]。
杜仲Eucommia ulmoides是单科、单属、单种植物,雌雄异株,广泛分布于陕西、河南、四川、贵州、云南等地,是中国特有的经济树种。因杜仲树皮、根、叶、花和果实中均含有大量的白色丝状杜仲橡胶,被誉为优质的天然橡胶树种[23]。COL蛋白在植物生长发育的多个方面发挥重要作用,具有重要的药用价值和橡胶用价值。杜仲COL基因家族系统进化及其在杜仲叶片生长发育和杜仲胶形成中的表达模式尚未报道。本研究以杜仲基因组数据为基础,利用生物信息学分析方法,对杜仲CONSTANS-like基因家族进行全基因组鉴定、理化性质和系统进化分析,初步鉴定EuCOLs基因在杜仲叶片生长发育及杜仲胶生物合成中的功能,为进一步探索EuCOLs基因的功能提供理论依据。
-
通过Genome Warehouse数据库,从杜仲基因组中共查找到8个EuCOLs基因,利用Pfam和NCBI的Conserved Domain Search软件,验证EuCOLs蛋白保守结构域。结果显示:8个EuCOLs蛋白均含有B-box和CCT结构域,分别命名为EuCOL1~EuCOL8。通过ExPASy工具,对EuCOL家族成员进行理化性质分析,EuCOL3蛋白序列最长,编码469个氨基酸,EuCOL7序列最短,编码315个氨基酸,分子量分布区域为35.21~52.65 kDa,等电点范围是5.10 (EuCOL1)~6.47 (EuCOL6),亚细胞定位预测结果显示:EuCOLs均定位在细胞核中(表1),属于疏水性蛋白,8个EuCOLs分布于8条scaffolds。
基因ID 基因名 染色体定位 位置/bp CDS长度/bp 蛋白质序列/个 分子量/kDa 等电点 亚细胞定位 EUC17024-RA EuCOL1 Super-Scaffold_183 1 758 965~1 761 661 1 128 375 41.70 5.10 细胞核 EUC14665-RA EuCOL2 Super-Scaffold_127 1 395 219~1 398 047 1 287 428 47.26 5.25 细胞核 EUC14912-RA EuCOL3 Super-Scaffold_121 1 876 239~1 890 694 1 410 469 52.65 5.95 细胞核 EUC04726-RA EuCOL4 Super-Scaffold_3 2 229 604~2 240 203 1 155 384 42.06 5.85 细胞核 EUC01228-RA EuCOL5 scaffold416_obj 336 319~340 482 1 038 345 39.01 6.47 细胞核 EUC13984-RA EuCOL6 scaffold20_obj 133 259~134 581 972 323 35.50 5.52 细胞核 EUC15205-RA EuCOL7 Super-Scaffold_275 13 124~15 540 948 315 35.21 5.59 细胞核 EUC06371-RA EuCOL8 Super-Scaffold_162 322 024~324 298 1 347 448 49.49 5.71 细胞核 Table 1. Sequence characteristics and predicted subcellular location of E. ulmoides CO-like proteins
-
为了分析杜仲EuCOL基因家族的进化关系,将8个EuCOLs蛋白与17个拟南芥AtCOLs、水稻OsCOLs、ZmCOLs和14个毛果杨PtCOLs[18]导入MEGA 6.0软件,通过邻接法构建系统发育树,73个COLs蛋白分为3个亚家族(分别是群组 Ⅰ、群组 Ⅱ和群组 Ⅲ)(图1)。群组Ⅰ亚家族包含2个B-box和1个CCT结构域,由28个COLs蛋白组成,包含2个EuCOLs蛋白(EuCOL6和EuCOL7);群组Ⅱ亚家族含有1个B-box、1个CCT和1个分化的锌指结构域,所含COLs蛋白数量最少,有15个COLs蛋白,分别含有4个AtCOLs,3个PtCOLs蛋白和OsCOLs蛋白,5个ZmCOLs蛋白,不含EuCOLs蛋白;群组Ⅲ亚家族由1个B-box和1个CCT结构域组成,所含蛋白数量最多,包含30个COLs蛋白,有6个EuCOLs蛋白,进化关系显示杜仲与毛果杨亲缘关系最近。
-
为了进一步分析EuCOLs基因的保守性和多样性,对EuCOLs基因结构及蛋白基序进行了分析,结果显示:EuCOLs基因结构较为简单(图2),EuCOL1和EuCOL6分别含有2个和3个外显子,4个EuCOLs基因含有4个外显子,EuCOL2和EuCOL3外显子数目最多,含有6个外显子。
利用MEME在线软件,对EuCOLs家族进行保守基序分析,基序鉴定个数设置为20,分别命名为motif 1~motif 20。结果如图3所示:motif 1和motif 2为EuCOLs蛋白的特征性结构域,存在于所有EuCOLs蛋白中。只有EuCOL7含有1个B-box结构域,其余EuCOLs蛋白均由2个B-box组成,这与图2蛋白序列比对结果一致。同一亚家族EuCOLs基序具有高度相似性,其中motif 1包含1个典型的由C-X2-C-X16-C-X2-C编码的GATA锌指结构域。不同亚家族基序存在显著差异,例如:motif 7和motif 14只存在于群组Ⅲ亚家族,motif 12只在群组Ⅱ亚家族中存在。EuCOLs蛋白之间基序也有差异,只有EuCOL1和EuCOL4含有motif 5、motif 7和motif 9,motif 10仅存在于EuCOL2,推测基因功能差异可能与基序有关。
-
利用Plant CARE软件对EuCOLs起始密码子(ATG)上游2 000 bp序列进行顺式作用元件分析(图4)。EuCOLs启动子中不仅包含基本顺式作用元件,还存在3种类型元件。①胁迫响应元件,如干旱胁迫响应元件MBS;低温响应元件LTR;厌氧胁迫相关元件ARE等。②光响应元件,如Box 4、G-box、G-Box、GT1-motif、I-box、GATA-motif、TCCC-motif等。③激素响应元件,如赤霉素响应元件ABRE;生长素响应元件AuxRR-core;水杨酸响应元件CGTCA-motif等。推测EuCOLs可能参与杜仲生长发育、胁迫响应以及光周期调控。EuCOLs基因中光响应元件数量最多,共79个,包含18个Box 4,G-box和GT1-motif均有12个,暗示EuCOLs基因的转录可能受光周期调控。EuCOLs启动子区域含有16个ABRE和14个ARE元件(图4B),推测EuCOLs可能参与ABA调节和厌氧调控。
-
为了探索EuCOLs基因在杜仲叶片发育中的功能,利用杜仲叶片不同发育时期的转录组数据,进行表达模式分析。图5显示:EuCOLs在杜仲叶片发育中转录水平较低,大部分基因FPKM值小于1,EuCOL6在杜仲叶片中不表达,暗示EuCOLs在杜仲叶片中发挥作用较小,EuCOL5在叶片中的转录水平相对较高,并且随着叶片发育,转录水平逐渐升高,推测EuCOL5在杜仲叶片中可能发挥正调控作用。
利用高产胶杜仲品种‘秦仲2号’和低产胶杜仲品种‘小叶’成熟叶片转录组数据,检测EuCOLs基因的表达水平,结果如图6所示。大部分EuCOLs转录水平较低,只有EuCOL5和EuCOL7的表达量较高,EuCOL7在各样品中的FPKM值大于150,并且高胶含量叶片中的转录水平高于低胶含量叶片,推测EuCOL7在杜仲胶形成过程中发挥正调控作用,相反EuCOL5在‘小叶’中的转录水平高于‘秦仲2号’,暗示EuCOL5在杜仲胶形成中可能发挥负调控作用。
为了验证EuCOLs基因在杜仲叶片发育中的表达模式 ,以‘紫叶’杜仲不同发育阶段的叶片为材料,通过qRT-PCR检测EuCOLs基因的表达水平。结果显示:EuCOLs在杜仲叶片中差异表达(图7),EuCOL1和EuCOL4在叶芽中表达量最高,随着叶片发育,表达水平逐渐降低,嫩叶中降为最低,暗示EuCOL1和EuCOL4在杜仲叶片发育的起始阶段发挥重要作用;相反EuCOL7随着叶片发育转录水平逐渐升高,嫩叶中的表达量是叶芽中的5.8倍,推测EuCOL7在杜仲成熟叶片中扮演重要角色。5个EuCOLs基因(EuCOL2、EuCOL3、EuCOL5、EuCOL6和EuCOL8)在幼叶中表达量最高,在叶片发育中,呈现先升高后降低的表达趋势。
-
表达模式分析显示:EuCOL7在杜仲叶片发育和杜仲胶形成中均具有较高表达量,暗示EuCOL7在叶片发育和杜仲胶形成中发挥重要作用。利用STRING软件,预测EuCOL7与其他蛋白质的互作关系。结果显示:EuCOL7可以与10个蛋白质发生相互作用(图8),其中3个属于BBX蛋白质家族,LHY、CCA和JAC家族各有1个,7个蛋白质(LNK2、LHY、CCA、RVE、COL、BBX25和BBX19)参与光周期响应。
Genome-wide identification, system evolution and expression pattern analysis of CONSTANS-like in Eucommia ulmoides
doi: 10.11833/j.issn.2095-0756.20210385
- Received Date: 2021-05-20
- Accepted Date: 2021-12-14
- Rev Recd Date: 2021-12-09
- Available Online: 2022-05-23
- Publish Date: 2022-05-23
-
Key words:
- Eucommia ulmoides /
- CONSTANS-like /
- bioinformatics /
- expression pattern analysis
Abstract:
Citation: | LIU Jun, LI Long, CHEN Yulong, LIU Yan, WU Yaosong, REN Shanshan. Genome-wide identification, system evolution and expression pattern analysis of CONSTANS-like in Eucommia ulmoides[J]. Journal of Zhejiang A&F University, 2022, 39(3): 475-485. doi: 10.11833/j.issn.2095-0756.20210385 |