留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

荆芥HD-Zip基因家族的全基因组鉴定及分析

周佩娜 党静洁 邵永芳 石遵睿 张琳 刘潺潺 吴啟南

周佩娜, 党静洁, 邵永芳, 等. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. DOI: 10.11833/j.issn.2095-0756.20220390
引用本文: 周佩娜, 党静洁, 邵永芳, 等. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. DOI: 10.11833/j.issn.2095-0756.20220390
HAO Yanmin, CHEN Keli, FENG Lijun, et al. Cloning and functional analysis of SvAPETALA1 in Senecio vulgaris[J]. Journal of Zhejiang A&F University, 2022, 39(4): 821-829. DOI: 10.11833/j.issn.2095-0756.20210651
Citation: ZHOU Peina, DANG Jingjie, SHAO Yongfang, et al. Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia[J]. Journal of Zhejiang A&F University, 2023, 40(1): 12-21. DOI: 10.11833/j.issn.2095-0756.20220390

荆芥HD-Zip基因家族的全基因组鉴定及分析

DOI: 10.11833/j.issn.2095-0756.20220390
基金项目: 国家自然科学基金面上项目(81973435);国家自然科学基金青年科学基金项目(81903756);江苏省研究生科研与实践创新计划项目(KYCX21_1759,KYCX22_2031)
详细信息
    作者简介: 周佩娜(ORCID: 0000-0002-5475-3863),博士研究生,从事中药资源品质评价研究。E-mail: 20203098@njucm.edu.cn
    通信作者: 吴啟南(ORCID: 0000-0001-9730-8279),教授,从事中药资源生产与品质评价研究。E-mail: wuqn@njucm.edu.cn
  • 中图分类号: Q781;S567

Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia

  • 摘要:   目的  鉴定荆芥Schizonepeta tenuifolia的HD-Zip基因家族,利用生物信息学方法分析其在全基因组中的分布和相关特征以及在不同时期中的表达规律,为该家族基因的进一步研究奠定基础。  方法  根据已经表征的HD-Zip基因,筛选荆芥基因组内的HD-Zip基因序列,利用MEME、PlantCARE、NCBI、MEGA X、MCScanX、Circos等在线网站及软件对蛋白序列进行基本理化性质分析、进化树构建、染色体定位、基因结构分析、共线性基因分析等。  结果  在荆芥全基因组中共鉴定到42条HD-Zip基因序列,它们可被分为4个亚家族,分别含有16、7、5、14个基因,亚家族之间的基因长度、结构及保守基序差异显著,但在亚家族内部保守,荆芥基因组与拟南芥Arabidopsis thaliana基因组共线性分析发现有37对基因,可能具有相似的生物学功能。荆芥的4个亚家族基因的顺式元件中均高频出现了光响应、脱落酸响应、MeJA响应等元件,在不同生长时期的叶片及部位的转录组数据中具有不同的表达趋势,Ⅰ亚家族主要在幼叶中表达,Ⅱ和Ⅲ亚家族主要在根中在表达,Ⅳ亚家族主要在叶中表达。  结论  在荆芥基因组中共获得42条HD-Zip基因序列,被分为4个亚家族(HD-ZipⅠ~Ⅳ),亚家族内部高度保守,亚家族之间差异显著,其基因结构、保守结构域及表达模式不同。亚家族Ⅰ和Ⅱ,亚家族Ⅲ和Ⅳ亲缘关系更近,HD-Zip基因具有组织表达差异性,协同调控了荆芥的生长发育和次生代谢。图9表1参25
  • 园林绿化废弃物资源化利用[1-2]已成为研究热点,其中堆肥化是一种比较理想的处理方式。由于园林绿化废弃物木质素含量较高、起始微生物数量较少等原因,堆肥效率较低,因此如何提高堆肥过程中的微生物数量成为推进园林绿化废弃物堆肥的关键[3-4]。添加微生物菌剂是提高堆体微生物数量最直接的方式之一。目前,针对木质素降解的菌剂较少,且多集中于液体菌剂。然而液体菌剂对无菌条件要求较高,运输及产品储存有诸多不便[5]。固体菌剂在生产和储存方面能弥补液体菌剂的不足,同时,固体菌剂生产成本更低、生产工艺也相对简单,对促进园林绿化废弃物堆肥化过程的优势更明显[6]。生产固体菌剂,除了设计固体发酵的培养基,还要优化其发酵条件,主要流程为试验设计、数学建模和优化设计3个部分[7]。合理的试验设计能用较少的试验数据进行建模,从而获取各因素范围内的最优解。已有研究对于固态发酵的优化多是使用响应面法[8-9]。但是有研究发现[10]:人工神经网络算法优化培养基比响应面法优化培养基验证结果更准确,误差更小。本研究拟采用单因素试验和正交试验确定作为固态发酵培养基碳源、氮源的较优种类和水平,然后根据碳氮源优化结果,通过单因素试验确定外加营养组分种类,最后采用均匀实验结合人工神经网络建模与优化,寻找2株木质素降解菌的外加营养组分接种量和最佳固体培养基发酵条件,以期得到最大发酵生物量,制作高效固体菌剂用于园林绿化废弃物堆肥。

    菌株A为构巢曲霉Aspergillus nidulans、菌株Q为栓菌属1种Trametes sp.,均由北京林业大学土壤生物学实验室分离并保藏。

    PDA培养基:马铃薯浸汁(200.000 g土豆去皮去芽,切成小块,加蒸馏水1 L保持微沸30 min后过滤),葡萄糖 20.000 g,蛋白胨15.000 g,琼脂 20.000 g,pH自然。PDB液体培养基:马铃薯浸汁(同PDA培养基),葡萄糖 20.000 g,蛋白胨15.000 g,pH自然。以上所有培养基均121 ℃高压蒸汽灭菌30 min。

    1.2.1   菌株培养

    ①菌株活化。将接种环置于酒精灯上燃烧,待冷却后挑取PDA斜面上的少许菌株接种至PDA培养基,封口后置于恒温培养箱活化。②液体菌种培养。将活化后纯培养的目标菌株的PDA培养基接至放有玻璃碎片的PDB液体培养基的三角瓶中,在IS-RDD3台式恒温振荡器中以25 ℃、200 r·min−1条件下培养5 d。③固态发酵。以30.000 g麸皮为发酵基质,添加碳氮源以及外加营养组分,于121 ℃高压蒸汽灭菌30 min后,冷却至室温备用。将液体菌种按20%的接种量(物料干质量)加入无菌水中混匀,接入物料,调节料水比,搅拌均匀后置于25 ℃条件下培养7 d,重复3次。

    1.2.2   制作固态发酵培养基

    ①碳氮源筛选。采用单因素试验筛选固体发酵培养基的碳氮源种类。以麸皮为发酵基质,在米糠、木质素磺酸钠、玉米粉、蔗糖中筛选碳源,在豆饼粉、蛋白胨、酒石酸胺、尿素中筛选氮源,比较不同碳氮源对2株木质素降解菌生物量的影响,以选择能促进菌体生长发育的最佳碳氮源。采用L9(34)正交试验确定最佳添加量。根据最佳碳氮源的筛选结果,选择3个吸光度D(260)相对较高的添加量梯度进行L9(34)正交试验,探究碳氮源添加量对2株木质素降解菌生物量的影响,优化固态发酵基质配方。②外加营养组分筛选。采用单因素试验确定添加物质种类。以麸皮为发酵基质,在最佳碳氮源的基础上中添加营养组分:硫酸钙(CaSO4)、硫酸镁(MgSO4)、磷酸二氢钾(KH2PO4)、硫酸亚铁(FeSO4·7H2O)、氯化钠(NaCl)进行外加营养组分筛选,重复3次,选择3个D(260)最大的作为外加营养组分的种类,确定外加钙盐、镁盐、磷酸盐等对菌株A和菌株Q生长的影响。③培养基配方优化。采用均匀实验设计结合人工神经网络建模,进一步优化固态发酵培养基的外加营养组分添加量及其他发酵条件。

    1.2.3   菌丝生物量的测定

    将液体菌种用纱布过滤,同时以无菌水充分洗涤过滤物,过滤物即为纯菌体,在65 ℃的条件下烘干至恒量,留存备用。精密称取纯菌体0.010、0.030、0.050、0.100、0.150和0.200 g,加入25.000 mL体积分数为5%三氯乙酸溶液,80 ℃恒温水浴中搅拌提取25 min,取出后冰浴冷却,在4 ℃、8000 r·min−1条件下离心15 min,稀释2倍,以体积分数为5%的三氯乙酸为对照,用分光光度计测定D(260),构建标准回归曲线。发酵物置于65 ℃条件下烘干至恒量,取0.500 g烘干至恒量的固态发酵物测定D(260)(与上述提取纯菌体中核酸的方式相同)。同时,以发酵7 d但未接种种子液的固态发酵物作为空白对照,在260 nm处测定提取液的D(260),通过标准回归曲线预测菌丝干质量。

    1.2.4   数据统计与分析

    ①数据采用Excel 2007和SPSS 22.0处理。碳氮源优化用单因素方差分析法,平均值多重比较用LSD最小显著性差异法(P<0.05)。②采用均匀实验实现人工神经网络建模与优化。其一,基于Smooth L1损失函数的人工神经网络构建。该网络借鉴U-Net架构设计了编码器和解码器,添加了残差连接[11],以缓解网络退化问题[12],并采用Smooth L1损失函数[13]最小化观察值与模型预测值的误差。损失函数如下所示:SmoothL1(x)$ = \left\{ {\begin{array}{*{20}{c}} {\begin{array}{*{20}{l}} {0.5{x^2}}\\ {|x| - 0.5} \end{array}}&{\begin{array}{*{20}{c}} {{\text{假如}}\;|x| {\text{<}} 1}\\ {{\text{否则}}} \end{array}} \end{array}} \right.$。其二,基于AdamW算法[14]寻优。神经网络、AdamW算法基于Pytorch[15]实现。

    图1可知:2株木质素降解菌菌丝中的核酸量与菌丝干质量在测试的范围之内可呈现良好的线性关系,说明通过测定D(260)来确定2株木质素降解菌固态发酵生物量的方法可行。菌株Q的线性方程为yQ=4.349 3x+0.044 6,R2=0.998 6;菌株A的线性方程为yA=4.081 4x+0.046 3,R2=0.995 7。

    图 1  菌丝中核酸量与菌丝干质量的关系
    Figure 1  Relationship between the amount of nucleic acid in mycelium and the amount of mycelium
    2.2.1   碳源对2株木质素降解菌生物量的影响

    图2可知:菌株A的4种碳源处理的D(260)差异不显著(P>0.05),但木质素磺酸钠的D(260)最高,分别较米糠、玉米粉和蔗糖处理高出14.900%、8.800%和8.200%。菌株Q的3种碳源处理的D(260)差异不显著(P>0.05),但玉米粉的D(260)最高,分别较木质素磺酸钠、米糠和蔗糖处理高出6.900%、3.600%和0.900%。菌株A为构巢曲霉,分泌的木质素降解相关酶系降解木质素效果显著[16-17],同时木质素磺酸钠是木质素磺化改性得到的衍生化产品,因此,相比其他3种碳源,木质素磺酸钠更有利于促进菌株A细胞的快速生长,获得较高的菌丝生物量[18]。菌株Q在以玉米粉为碳源时的生物量最高,可能是因为玉米粉中含有大量的糖分、淀粉、多种矿质元素和维生素, 这些营养物质有利于菌株Q的生长繁殖[19]。因此,选择木质素磺酸钠作为菌株A的碳源,选用玉米粉作为菌株Q的碳源。

    图 2  碳源对2株木质素降解菌生物量的影响
    Figure 2  Effect of carbon source on the biomass of two lignin-degrading bacteria
    2.2.2   氮源对2株木质素降解菌生物量的影响

    图3可知:菌株A的4种氮源处理的D(260)差异不显著(P>0.05),但豆饼粉的D(260)最高,分别较蛋白胨、酒石酸胺和尿素处理高出4.300%、3.000%和15.600%。菌株Q的D(260)在以豆饼粉为氮源时最高,且与其他处理差异显著(P<0.05),分别较蛋白胨、酒石酸胺和尿素处理高出6.700%、8.200%和14.400%。豆饼粉含大量碳水化合物、蛋白质及少量异黄酮类物质和可溶性多糖,可作为发酵的氮源及生长因子,有利于生物量的积累[20-21]。同时,豆饼粉来源稳定,价格低廉,能够快速被微生物利用,因此,选用豆饼粉为后续实验中菌株A和菌株Q的氮源。

    图 3  氮源对2株木质素降解菌生物量的影响
    Figure 3  Effect of nitrogen source on the biomass of two lignin-degrading bacteria
    2.2.3   碳氮源添加量对2株木质素降解菌生物量的影响

    图4所示:菌株A在以木质素磺酸钠为最佳碳源时,添加量为2.500%、5.000%、10.000%处理间的D(260)差异不显著(P>0.05),但是数值相对较高。因此,菌株A的木质素磺酸钠选用2.500%、5.000%、10.000%添加量进行正交试验。菌株Q在以玉米粉为最佳碳源时,添加量为5.000%时D(260)值最高,与其他处理差异显著(P<0.05),0.625%、2.500%的D(260)也相对较高,因此,菌株Q的玉米粉选用0.625%、2.500%、5.000%添加量进行正交试验。菌株Q在添加量为5.000%时生物量达到最高,可能是由于在培养空间一定时,玉米粉的添加量越多,通气量降低,导致生物量的积累下降从而使菌株Q的生长受到了一定的抑制[16]。由图5可知:菌株A以豆饼粉为最佳氮源时,5种不同添加量处理的D(260)差异不显著(P>0.05)。添加量为10.000%时D(260)最高,但是从经济角度考虑,最终选择豆饼粉添加量为1.250%、2.500%、5.000%进行正交试验。菌株Q以豆饼粉为最佳氮源时,添加量为1.250%、5.000%、10.000%时的D(260)显著高于另外2个添加量,因此选择这3个梯度进行正交试验。

    图 4  碳源添加量对2株木质素降解菌生物量的影响
    Figure 4  Effect of carbon source addition on the biomass of two lignin-degrading bacteria
    图 5  氮源接种量对2株木质素降解菌生物量的影响
    Figure 5  Effect of nitrogen source inoculum on the biomass of two lignin-degrading bacteria
    2.2.4   正交试验

    表1表2可知:菌株A的碳氮源添加量为木质素磺酸钠5.000%、豆饼粉5.000%时D(260)最大,高达0.249。菌株Q的碳氮源添加量为玉米粉0.625%、豆饼粉10.000%时D(260)最大,高达0.261。因此选定菌株A的碳氮源添加量为木质素磺酸钠5.000%和豆饼粉5.000%,菌株Q的碳氮源添加量为豆饼粉10.000%和玉米粉0.625%。

    表 1  菌株A正交设计试验L9(34)
    Table 1  Orthogonal design experiment of strain A L9 (34)
    处理豆饼粉/%木质素磺酸钠/%D(260)
    T1 1.250 2.500 0.228±0.009
    T2 1.250 5.000 0.241±0.001
    T3 1.250 10.000 0.207±0.018
    T4 2.500 2.500 0.216±0.007
    T5 2.500 5.000 0.213±0.008
    T6 2.500 10.000 0.245±0.010
    T7 5.000 2.500 0.237±0.010
    T8 5.000 5.000 0.249±0.003
    T9 5.000 10.000 0.241±0.007
    下载: 导出CSV 
    | 显示表格
    表 2  菌株Q正交设计试验L9(34)
    Table 2  Orthogonal design experiment of strain Q L9 (34)
    处理豆饼粉/%玉米粉/%D(260)
    T1 1.250 0.625 0.101±0.003
    T2 1.250 2.500 0.224±0.006
    T3 1.250 5.000 0.214±0.005
    T4 5.000 0.625 0.101±0.003
    T5 5.000 2.500 0.162±0.008
    T6 5.000 5.000 0.232±0.020
    T7 10.000 0.625 0.261±0.003
    T8 10.000 2.500 0.191±0.002
    T9 10.000 5.000 0.102±0.003
    下载: 导出CSV 
    | 显示表格

    图6表明:菌株A的5种外加营养组分处理的D(260)差异不显著(P>0.05),但外加CaSO4、MgSO4、KH2PO4时的D(260)值最大,因此,这3种被定为最佳外加营养组分。微生物除了碳源和氮源,还需要一定量的无机盐来调节其生长代谢。镁盐作为许多重要酶的激活剂能够影响蛋白质的合成以及基质氧化;磷则是核酸和蛋白质的重要组成成分,能够影响微生物的生长[22],这与本研究结果一致。

    图 6  菌株A和菌株Q在不同营养组分培养基上的生长
    Figure 6  Growth of strain A and strain Q on the medium with different nutrient components

    在以2.2.4和2.3实验结果为前提的条件下,设计6因素5水平10组的均匀实验。再通过神经网络对所有数据进行预测,得到实测值与仿真值的对比(表3表4)。结果发现:各观察值与测量值误差较小,基本相同。综上,该模型预测值具备参考性。

    表 3  菌株Q均匀实验设计及结果
    Table 3  Strain Q uniform test design and results
    试验号因素水平(实际用量/%)D(260)
    MgSO4KH2PO4FeSO4·7H2O接菌量料水比海藻糖
    实测值1 1(0.600) 2(0.800) 3(1.000) 5(25.000) 7(1.00∶0.50) 10(16.000) 0.4110
    仿真值1 1(0.600) 2(0.800) 3(1.000) 5(25.000) 7(1.00∶0.50) 10(16.000) 0.4109
    实测值2 2(0.800) 4(1.200) 6(0.600) 10(25.000) 3(1.00∶0.65) 9(12.000) 0.4500
    仿真值2 2(0.800) 4(1.200) 6(0.600) 10(25.000) 3(1.00∶0.65) 9(12.000) 0.4499
    实测值3 3(1.000) 6(0.600) 9(1.200) 4(20.000) 10(1.00∶0.95) 8(8.000) 0.4800
    仿真值3 3(1.000) 6(0.600) 9(1.200) 4(20.000) 10(1.00∶0.95) 8(8.000) 0.4801
    实测值4 4(1.200) 8(1.000) 1(0.600) 9(20.000) 6(1.00∶0.30) 7(4.000) 0.4430
    仿真值4 4(1.200) 8(1.000) 1(0.600) 9(20.000) 6(1.00∶0.30) 7(4.000) 0.4431
    实测值5 5(1.400) 10(1.400) 4(1.200) 3(15.000) 2(1.00∶0.50) 6(0.000) 0.3860
    仿真值5 5(1.400) 10(1.400) 4(1.200) 3(15.000) 2(1.00∶0.50) 6(0.000) 0.3859
    实测值6 6(0.600) 1(0.600) 7(0.800) 8(15.000) 9(1.00∶0.80) 5(16.000) 0.4620
    仿真值6 6(0.600) 1(0.600) 7(0.800) 8(15.000) 9(1.00∶0.80) 5(16.000) 0.4619
    实测值7 7(0.800) 3(1.000) 10(1.400) 2(10.000) 5(1.00∶0.95) 4(12.000) 0.4630
    仿真值7 7(0.800) 3(1.000) 10(1.400) 2(10.000) 5(1.00∶0.95) 4(12.000) 0.4635
    实测值8 8(1.000) 5(1.400) 2(0.800) 7(10.000) 1(1.00∶0.30) 3(8.000) 0.2930
    仿真值8 8(1.000) 5(1.400) 2(0.800) 7(10.000) 1(1.00∶0.30) 3(8.000) 0.2929
    实测值9 9(1.200) 7(0.800) 5(1.400) 1(5.000) 8(1.00∶0.65) 2(4.000) 0.4450
    仿真值9 9(1.200) 7(0.800) 5(1.400) 1(5.000) 8(1.00∶0.65) 2(4.000) 0.4453
    实测值10 10(1.400) 9(1.200) 8(1.000) 6(5.000) 4(1.00∶0.80) 1(0.000) 0.4230
    仿真值10 10(1.400) 9(1.200) 8(1.000) 6(5.000) 4(1.00∶0.80) 1(0.000) 0.4231
    下载: 导出CSV 
    | 显示表格
    表 4  菌株A均匀试验设计及结果
    Table 4  Strain A uniform test design and results
    试验号因素水平(实际用量/%)D(260)
    CaSO4MgSO4KH2PO4接菌料水比海藻糖
    实测值1 1(0.600) 2(0.800) 3(1.000) 5(25.000) 7(1.00∶0.50) 10(16.000) 0.3930
    仿真值1 1(0.600) 2(0.800) 3(1.000) 5(25.000) 7(1.00∶0.50) 10(16.000) 0.3930
    实测值2 2(0.800) 4(1.200) 6(0.600) 10(25.000) 3(1.00∶0.65) 9(12.000) 0.4020
    仿真值2 2(0.800) 4(1.200) 6(0.600) 10(25.000) 3(1.00∶0.65) 9(12.000) 0.4020
    实测值3 3(1.000) 6(0.600) 9(1.200) 4(20.000) 10(1.00∶0.95) 8(8.000) 0.4260
    仿真值3 3(1.000) 6(0.600) 9(1.200) 4(20.000) 10(1.00∶0.95) 8(8.000) 0.4260
    实测值4 4(1.200) 8(1.000) 1(0.600) 9(20.000) 6(1.00∶0.30) 7(4.000) 0.3930
    仿真值4 4(1.200) 8(1.000) 1(0.600) 9(20.000) 6(1.00∶0.30) 7(4.000) 0.3930
    实测值5 5(1.400) 10(1.400) 4(1.200) 3(15.000) 2(1.00∶0.50) 6(0.000) 0.3900
    仿真值5 5(1.400) 10(1.400) 4(1.200) 3(15.000) 2(1.00∶0.50) 6(0.000) 0.3900
    实测值6 6(0.600) 1(0.600) 7(0.800) 8(15.000) 9(1.00∶0.80) 5(16.000) 0.4320
    仿真值6 6(0.600) 1(0.600) 7(0.800) 8(15.000) 9(1.00∶0.80) 5(16.000) 0.4320
    实测值7 7(0.800) 3(1.000) 10(1.400) 2(10.000) 5(1.00∶0.95) 4(12.000) 0.4110
    仿真值7 7(0.800) 3(1.000) 10(1.400) 2(10.000) 5(1.00∶0.95) 4(12.000) 0.4110
    实测值8 8(1.000) 5(1.400) 2(0.800) 7(10.000) 1(1.00∶0.30) 3(8.000) 0.3650
    仿真值8 8(1.000) 5(1.400) 2(0.800) 7(10.000) 1(1.00∶0.30) 3(8.000) 0.3650
    实测值9 9(1.200) 7(0.800) 5(1.400) 1(5.000) 8(1.00∶0.65) 2(4.000) 0.3770
    仿真值9 9(1.200) 7(0.800) 5(1.400) 1(5.000) 8(1.00∶0.65) 2(4.000) 0.3770
    实测值10 10(1.400) 9(1.200) 8(1.000) 6(5.000) 4(1.00∶0.80) 1(0.000) 0.4210
    仿真值10 10(1.400) 9(1.200) 8(1.000) 6(5.000) 4(1.00∶0.80) 1(0.000) 0.4210
    下载: 导出CSV 
    | 显示表格

    表5所示:按照人工神经网络算法模型预测的优化后固体发酵培养基进行实验验证,该优化条件下菌株Q的D(260)为0.6020,实测值为0.5960,误差为1.000%;预测得到菌株A的D(260)为0.4850,实测值为0.4780,误差为1.500%。

    表 5  人工神经网络寻优结果
    Table 5  Optimization results of artificial neural network
    试验号实际用量/%D (260)
    MgSO4KH2PO4FeSO4·7H2O接菌量料水比海藻糖
    菌株Q仿真值1.4340.1151.4976.0001.000∶0.9921.0000.6020
    菌株Q实测值1.4340.1151.4976.0001.000∶0.9921.0000.5960
    菌株A仿真值0.1230.2131.28021.0001.000∶1.00019.0000.4850
    菌株A实测值0.1230.2131.28021.0001.000∶1.00019.0000.4780
    下载: 导出CSV 
    | 显示表格

    本研究结果表明:人工神经网络算法优化后菌株Q的预测值为0.6020,实测值为0.5960,误差为1.000%;菌株A的预测值为0.485,实测值为0.478,误差为1.500%。基于人工神经网络构建的模型拟合度较好。

    根据单因素试验和人工神经网络算法结果,确定了2株木质素降解菌的最优固体发酵条件。菌株Q:固体菌剂培养基基质为麸皮30.000 g作为基底,添加豆饼粉10.000%和玉米粉0.625%,外加营养组分为MgSO4 1.434%、KH2PO4 0.115%和FeSO7H2O 1.497%;接种条件为接菌量6.000%、料水比1.000∶0.992、保护剂1.000%。菌株A:固体菌剂培养基基质为麸皮30.000g作为基底,添加豆饼粉5.000%和木质素磺酸钠为5.000%,外加营养组分为MgSO4 0.123 %、KH2PO4 0.213 %、FeSO4·7H2O 1.280%;接种条件为接菌量21.000%、料水比1∶1、保护剂19.000%。

  • 图  1  荆芥HD-Zip基因家族的染色体定位

    Figure  1  Chromosome mapping of HD-Zip gene family in S. tenuifolia

    图  2  荆芥与拟南芥及其他物种HD-Zip基因家族的最大似然值进化树

    Figure  2  ML evolutionary tree of HD-Zip gene family between S. tenuifolia and A. thaliana and other species

    图  3  荆芥HD-Zip基因家族的基因结构分析

    Figure  3  Gene structure analysis of HD-Zip gene family in S. tenuifolia

    图  4  荆芥HD-Zip基因家族的保守基序分析

    Figure  4  Conservative motif analysis of HD-Zip gene family in S. tenuifolia       

    图  5  荆芥HD-Zip基因家族的顺式作用元件分布

    Figure  5  Distribution of cis-acting elements of HD-Zip gene family in S. tenuifolia

    图  6  荆芥HD-Zip基因家族的组内串联重复分析

    Figure  6  Tandem repeat analysis of HD-Zip gene family in genome of S. tenuifolia

    图  7  荆芥HD-Zip基因家族的组内共线性分析

    Figure  7  Intra-group collinearity analysis of HD-Zip gene family in S. tenuifolia

    图  8  荆芥HD-Zip与拟南芥基因组之间的共线性分析

    Figure  8  Collinear analysis of HD-Zip gene between S. tenuifolia and A. thaliana genomes

    图  9  HD-Zip家族基因表达模式

    Figure  9  HD-Zip family gene expression pattern

    表  1  荆芥HD-Zip基因家族的蛋白特征

    Table  1.   Protein characteristics of HD-Zip gene family in S. tenuifolia

    亚家族基因ID CDS长
    度/bp
    蛋白长
    度/个
    分子量/
    kDa
    等电点染色体亚家族基因ID CDS长
    度/bp
    蛋白长
    度/个
    分子量/
    kDa
    等电点染色体
    HD-Zip ⅠSch00000318190029933.8474.88Chr 01Sch00000383152817520.3318.58Chr 01
    Sch00001677789729834.3796.55Chr 04
    Sch00001948682227331.1004.59Chr 04HD-Zip ⅢSch000001735256285393.3065.74Chr 01
    Sch00002649892730835.3505.01Chr 06Sch000019857251183691.4615.94Chr 04
    Sch00000872582227331.0344.83Chr 02Sch000014693249383091.0215.84Chr 03
    Sch00000599791230334.3694.97Chr 02Sch000026324258686194.1836.14Chr 06
    Sch00002032896632135.7304.81Chr 04Sch000028231252984292.4346.17Chr 06
    Sch00001642486728832.6336.32Chr 04
    Sch00001790287929233.2076.07Chr 04HD-Zip ⅣSch000026062216672179.0715.98Chr 06
    Sch00000247487629132.5315.7Chr 01Sch000008059216372079.0566.23Chr 02
    Sch00000898369623126.8326.32Chr 02Sch000029960218172679.5265.64HiC_scaffold_8
    Sch00000683169323026.6156.96Chr 02Sch000011892241880587.9135.79Chr 03
    Sch00001927860019922.6738.44Chr 04Sch000009216219673179.8885.79Chr 02
    Sch00002165154618121.7885.84Chr 05Sch000019506240079987.0736.04Chr 04
    Sch00001373865421724.9347.59Chr 03Sch000012322249082991.5025.41Chr 03
    Sch00001671062120624.4725.44Chr 04Sch000012213249082991.5025.41Chr 03
    Sch000004651249082991.5025.41HiC_scaffold_100
    HD-Zip ⅡSch000028530891296327.3607.52Chr 06Sch000018911207068977.0616.28Chr 04
    Sch00001096687929232.6237.62Chr 03Sch000005323194464773.2647.27Chr 02
    Sch000019272795264294.9508.59Chr 04Sch000022402230776884.1805.81Chr 05
    Sch00000831678326029.0938.12Chr 02Sch000024046227475784.2796.15Chr 06
    Sch00002544787929232.3519.05Chr 06Sch000008675188462769.9056.18Chr 02
    Sch00001195164521424.3348.24Chr 03
      说明:CDS指蛋白编码区
    下载: 导出CSV
  • [1] 国家药典委员会. 中华人民共和国药典 (一部)[M]. 北京: 中国医药科技出版社, 2020: 243 − 244.

    National Pharmacopoeia Board. Chinese Pharmacopoeia (Volume Ⅰ)[M]. Beijing: China Medical Science Press, 2020: 243 − 244.
    [2] LIU C, SRIVIDYA N, PARRISH A N, et al. Morphology of glandular trichomes of Japanese catnip (Schizonepeta tenuifolia Briquet) and developmental dynamics of their secretary activity [J]. Phytochemistry, 2018, 150: 23 − 30.
    [3] 樊佳新, 王帅, 孟宪生, 等. HPLC法测定不同产地荆芥中6种黄酮类成分[J]. 中草药, 2017, 48(11): 2292 − 2295.

    FAN Jiaxin, WANG Shuai, MENG Xiansheng, et al. Determination of six flavonoids in Schizonepeta tenuifolia from different areas by HPLC [J]. Chinese Traditional and Herbal Drugs, 2017, 48(11): 2292 − 2295.
    [4] FEDERICO DA, PABLO A M, CARLOS A D, et al. The true story of the HD-Zip family [J]. Trends in Plant Science, 2007, 12(9): 419 − 426.
    [5] 李媛. 大麦HD-Zip基因家族分析及功能研究[D]. 西宁: 青海大学, 2020.

    LI Yuan. Analysis and Functional Study of HD-Zip Gene Family in Barley [D]. Xining: Qinghai University, 2020.
    [6] SESSA G, CARABELLUI M, POSSENTI M, et al. Multiple links between HD-Zip proteins and hormone networks[J/OL]. International Journal of Molecular Sciences, 2018, 19(12): 4047[2022-05-04]. doi: 10.3390/ijms19124047.
    [7] MIYUKI N, HIROSHI K, MITSUTOMO A, et al. Characterization of the class Ⅳ homeodomain-leucine zipper gene family in Arabidopsis [J]. Plant Physiology, 2006, 141(4): 1363 − 1375.
    [8] BRANDT R, CABEDO M, XIE Y, et al. Homeodomain leucine-zipper proteins and their role in synchronizing growth and development with the environment [J]. Journal of Integrative Plant Biology, 2014, 56(6): 518 − 526.
    [9] LI Yuxia, YANG Zongran, ZHANG Yuanyuan, et al. The roles of HD-ZIP proteins in plant a biotic stress tolerance[J/OL]. Frontiers in Plant Science, 2022, 13: 1027071[2022-05-04]. doi: 10.3389/fpls.2022.1027071.
    [10] YUE Hong, SHU Duntao, WANG Meng, et al. Genome-wide identification and expression analysis of the HD-Zip gene family in wheat (Triticum aestivum L. )[J/OL]. Genes, 2018, 9(2): 70[2022-05-02]. doi: 10.3390/genes9020070.
    [11] CHEN Chengjie, CHEN Hao, ZHANG Yi, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data [J]. Molecular Plant, 2020, 13(8): 1194 − 1202.
    [12] MA Gang, ZELMAN A K, APICELLA P V, et al. Genome-wide identification and expression analysis of homeodomain leucine zipper subfamily Ⅳ(HD-Zip Ⅳ) gene family in Cannabis sativa L. [J/OL]. Plants. 2022, 11(10): 1307[2022-05-02]. doi: 10.3390/plants11101307.
    [13] ZHAO Yang, ZHOU Yuqing, JIANG Haiyan, et al. Systematic analysis of sequences and expression patterns of drought-responsive members of the HD-Zip gene family in maize[J/OL]. PLoS One, 2011, 6(12): e28488[2022-05-02]. doi: 10.1371/journal.pone.0028488.
    [14] WANG Zhong, WANG Shanshan, XIAO Yansong, et al. Functional characterization of a HD-Zip Ⅳ transcription factor NtHDG2 in regulating flavonols biosynthesis in Nicotiana tabacum [J]. Plant Physiology and Biochemistry, 2020, 146: 259 − 268.
    [15] WAN Li, DONG Jieya, CAO Minxuan, et al. Genome-wide identification and characterization of HD-Zip genes in potato [J]. Genes, 2019, 697: 103 − 117.
    [16] SCHRICK K, NGUYEN D, KARLOWSKI W M, et al. START lipid/sterol-binding domains are amplified in plants and are predominantly associated with homeodomain transcription factors[J/OL]. Genome Biology, 2004, 5: R41[2022-05-02]. doi: 10.1186/gb-2004-5-6-r41.
    [17] MUKHERIEE K, BURGLIN TR, MEKHLA, a novel domain with similarity to PAS domains, is fused to plant homeodomain-leucine zipper Ⅲ proteins[J]. Plant Physiology, 2006, 140(4): 1142 − 1150.
    [18] GUO Qing, JIANG Jiahui, YAO Wenjing, et al. Genome-wide analysis of poplar HD-Zip family and over-expression of PsnHDZ63 confers salt tolerance in transgenic Populus simonii × P. nigra[J/OL]. Plant Science, 2021, 311: 111021[2022-11-21]. doi: 10.1016/j.plantsci.2021.111021.
    [19] 邵晨冰, 黄志楠, 白雪滢, 等. 辣椒HD-Zip基因家族鉴定、系统进化及表达分析[J]. 中国农业科学, 2020, 53(5): 1004 − 1017.

    SHAO Chenbing, HUANG Zhinan, BAI Xueying, et al. Identification, systematic evolution and expression analysis of HD-Zip gene family in Capsicum annuum [J]. Scientia Agricultura Sinica, 2020, 53(5): 1004 − 1017.
    [20] NAOKO K, HITOMI O, YOSHIBUMI K, et al. Mutations in epidermis-specific HD-Zip Ⅳ genes affect floral organ identity in Arabidopsis thaliana [J]. The Plant Journal, 2013, 75(3): 430 − 440.
    [21] CHALVIN C, DRE VENSK S, DRON M, et al. Genetic control of glandular trichome development [J]. Trends in Plant Science, 2020, 25(5): 477 − 487.
    [22] YAN Tingxiang, CHEN M, SHEN Q, et al. HOMEODOMAIN PROTEIN 1 is required for jasmonate-mediated glandular trichome initiation in Artemisia annua [J]. New Phytologist, 2017, 213(3): 1145 − 1155.
    [23] HULSKAMP M, MISRA S, JURGENS G. Genetic dissection of trichome cell development in Arabidopsis [J]. Cell, 1994, 76(3): 555 − 566.
    [24] 蒋征, 王红, 吴啟南, 等. 荆芥穗药材腺鳞内含物定性及3种主要萜类的定量研究[J]. 中药材, 2016, 39(1): 31 − 36.

    JIANG Zheng, WANG Hong, WU Qi’nan, et al. Qualitative and quantitative analysis of major constituents of gland products in peltate glandular trichomes of Schizonepetae Spica [J]. Journal of Chinese Medicinal Materials, 2016, 39(1): 31 − 36.
    [25] ZHOU Peina, DANG Jingjie, SHI Zunrui, et al. Identification and characterization of a novel gene involved in glandular trichome development in Nepeta tenuifolia[J/OL]. Frontiers in Plant Science, 2022, 13: 936244[2022-05-02]. doi: 10.3389/fpls.2022.936244.
  • [1] 应宇鑫, 陈俊宇, 姚玲窕, 许张婷, 俞振明, 开国银.  掌叶覆盆子RcF3H基因克隆及表达分析 . 浙江农林大学学报, 2024, 41(6): 1180-1188. doi: 10.11833/j.issn.2095-0756.20240326
    [2] 王书伟, 周明兵.  毛竹ICE基因家族的全基因组鉴定及低温胁迫下的表达模式分析 . 浙江农林大学学报, 2024, 41(3): 568-576. doi: 10.11833/j.issn.2095-0756.20230445
    [3] 杨勇, 张俊红, 韩潇, 张毓婷, 杨琪, 童再康.  闽楠bZIP基因家族鉴定和脱落酸处理下的表达分析 . 浙江农林大学学报, 2024, 41(2): 275-285. doi: 10.11833/j.issn.2095-0756.20230342
    [4] 孟超敏, 耿翡翡, 卿桂霞, 张富厚, 李雪林, 刘逢举.  陆地棉低磷胁迫应答基因GhGDPD1的克隆与表达分析 . 浙江农林大学学报, 2023, 40(4): 723-730. doi: 10.11833/j.issn.2095-0756.20220624
    [5] 尚林雪, 王群, 张国哲, 赵雨, 顾翠花.  紫薇LiCMB1基因的克隆及表达特性分析 . 浙江农林大学学报, 2023, 40(2): 330-337. doi: 10.11833/j.issn.2095-0756.20220333
    [6] 卓娟, 侯丹, 林新春.  毛竹PhebHLH6基因克隆及表达分析 . 浙江农林大学学报, 2023, 40(4): 731-737. doi: 10.11833/j.issn.2095-0756.20220553
    [7] 兰智鑫, 侯丹, 吴蔼民, 林新春.  毛竹PeCIGRs基因的克隆及表达分析 . 浙江农林大学学报, 2023, 40(5): 982-990. doi: 10.11833/j.issn.2095-0756.20220761
    [8] 洪方蕾, 陆瑶, 俞世姣, 胡芷诺, 缪云锋, 钟诗蔚, 赵宏波.  桂花OfABFs基因克隆和表达分析 . 浙江农林大学学报, 2023, 40(3): 481-491. doi: 10.11833/j.issn.2095-0756.20220264
    [9] 王绍良, 张雯宇, 高志民, 周明兵, 杨克彬, 宋新章.  毛竹磷转运蛋白Ⅰ家族基因鉴定及表达模式 . 浙江农林大学学报, 2022, 39(3): 486-494. doi: 10.11833/j.issn.2095-0756.20210471
    [10] 孟超敏, 耿翡翡, 卿桂霞, 周佳敏, 张富厚, 刘逢举.  陆地棉磷高效基因GhMGD3的克隆与表达分析 . 浙江农林大学学报, 2022, 39(6): 1203-1211. doi: 10.11833/j.issn.2095-0756.20220145
    [11] 王倩清, 张毓婷, 张俊红, 刘慧, 童再康.  闽楠PLR基因家族鉴定及响应激素的表达分析 . 浙江农林大学学报, 2022, 39(6): 1173-1182. doi: 10.11833/j.issn.2095-0756.20220351
    [12] 王楠楠, 董彬, 杨丽媛, 赵宏波.  梅花2个PmWRKY2基因克隆及在逆境胁迫下的表达模式 . 浙江农林大学学报, 2021, 38(4): 812-819. doi: 10.11833/j.issn.2095-0756.20200706
    [13] 庞天虹, 钱婕妤, 付建新, 顾翠花, 张超.  桂花己糖激酶基因家族成员的序列及表达分析 . 浙江农林大学学报, 2021, 38(2): 225-234. doi: 10.11833/j.issn.2095-0756.20200370
    [14] 黄元城, 郭文磊, 王正加.  薄壳山核桃全基因组LBD基因家族的生物信息学分析 . 浙江农林大学学报, 2021, 38(3): 464-475. doi: 10.11833/j.issn.2095-0756.20200454
    [15] 阮诗雨, 张智俊, 陈家璐, 马瑞芳, 朱丰晓, 刘笑雨.  毛竹GRF基因家族全基因组鉴定与表达分析 . 浙江农林大学学报, 2021, 38(4): 792-801. doi: 10.11833/j.issn.2095-0756.20200544
    [16] 蒋琦妮, 付建新, 张超, 董彬, 赵宏波.  桂花OfAP1基因的克隆及表达分析 . 浙江农林大学学报, 2019, 36(4): 664-669. doi: 10.11833/j.issn.2095-0756.2019.04.005
    [17] 李冰冰, 刘国峰, 魏书, 黄龙全, 张剑韵.  烟草NtPLR1基因克隆与表达分析 . 浙江农林大学学报, 2017, 34(4): 581-588. doi: 10.11833/j.issn.2095-0756.2017.04.003
    [18] 赵传慧, 周厚君, 童再康, 林二培, 黄华宏, 牛明月.  光皮桦成花相关MADS-box基因BlMADS1的克隆与表达 . 浙江农林大学学报, 2015, 32(2): 221-228. doi: 10.11833/j.issn.2095-0756.2015.02.008
    [19] 庞景, 童再康, 黄华宏, 林二培, 刘琼瑶.  杉木纤维素合成酶基因CesA的克隆及表达分析 . 浙江农林大学学报, 2015, 32(1): 40-46. doi: 10.11833/j.issn.2095-0756.2015.01.006
    [20] 杨希宏, 黄有军, 陈芳芳, 黄坚钦.  山核桃FLOWERING LOCUS C同源基因鉴定与表达分析 . 浙江农林大学学报, 2013, 30(1): 1-8. doi: 10.11833/j.issn.2095-0756.2013.01.001
  • 期刊类型引用(2)

    1. 韩姗姗,李忠玲,张红艳,戴佳锟,窦秉德,岳淑宁. 探究复合菌剂在奶牛粪污处理中的应用进展. 农学学报. 2024(04): 66-71 . 百度学术
    2. 常晓彤,李素艳,孙向阳,郝丹,李雅琳. 构巢曲霉冻干菌粉的制备及优化. 微生物学通报. 2022(11): 4674-4685 . 百度学术

    其他类型引用(1)

  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20220390

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2023/1/12

图(9) / 表(1)
计量
  • 文章访问数:  1114
  • HTML全文浏览量:  147
  • PDF下载量:  144
  • 被引次数: 3
出版历程
  • 收稿日期:  2022-06-13
  • 修回日期:  2022-11-21
  • 录用日期:  2022-11-22
  • 网络出版日期:  2023-01-17
  • 刊出日期:  2023-02-20

荆芥HD-Zip基因家族的全基因组鉴定及分析

doi: 10.11833/j.issn.2095-0756.20220390
    基金项目:  国家自然科学基金面上项目(81973435);国家自然科学基金青年科学基金项目(81903756);江苏省研究生科研与实践创新计划项目(KYCX21_1759,KYCX22_2031)
    作者简介:

    周佩娜(ORCID: 0000-0002-5475-3863),博士研究生,从事中药资源品质评价研究。E-mail: 20203098@njucm.edu.cn

    通信作者: 吴啟南(ORCID: 0000-0001-9730-8279),教授,从事中药资源生产与品质评价研究。E-mail: wuqn@njucm.edu.cn
  • 中图分类号: Q781;S567

摘要:   目的  鉴定荆芥Schizonepeta tenuifolia的HD-Zip基因家族,利用生物信息学方法分析其在全基因组中的分布和相关特征以及在不同时期中的表达规律,为该家族基因的进一步研究奠定基础。  方法  根据已经表征的HD-Zip基因,筛选荆芥基因组内的HD-Zip基因序列,利用MEME、PlantCARE、NCBI、MEGA X、MCScanX、Circos等在线网站及软件对蛋白序列进行基本理化性质分析、进化树构建、染色体定位、基因结构分析、共线性基因分析等。  结果  在荆芥全基因组中共鉴定到42条HD-Zip基因序列,它们可被分为4个亚家族,分别含有16、7、5、14个基因,亚家族之间的基因长度、结构及保守基序差异显著,但在亚家族内部保守,荆芥基因组与拟南芥Arabidopsis thaliana基因组共线性分析发现有37对基因,可能具有相似的生物学功能。荆芥的4个亚家族基因的顺式元件中均高频出现了光响应、脱落酸响应、MeJA响应等元件,在不同生长时期的叶片及部位的转录组数据中具有不同的表达趋势,Ⅰ亚家族主要在幼叶中表达,Ⅱ和Ⅲ亚家族主要在根中在表达,Ⅳ亚家族主要在叶中表达。  结论  在荆芥基因组中共获得42条HD-Zip基因序列,被分为4个亚家族(HD-ZipⅠ~Ⅳ),亚家族内部高度保守,亚家族之间差异显著,其基因结构、保守结构域及表达模式不同。亚家族Ⅰ和Ⅱ,亚家族Ⅲ和Ⅳ亲缘关系更近,HD-Zip基因具有组织表达差异性,协同调控了荆芥的生长发育和次生代谢。图9表1参25

English Abstract

周佩娜, 党静洁, 邵永芳, 等. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. DOI: 10.11833/j.issn.2095-0756.20220390
引用本文: 周佩娜, 党静洁, 邵永芳, 等. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. DOI: 10.11833/j.issn.2095-0756.20220390
HAO Yanmin, CHEN Keli, FENG Lijun, et al. Cloning and functional analysis of SvAPETALA1 in Senecio vulgaris[J]. Journal of Zhejiang A&F University, 2022, 39(4): 821-829. DOI: 10.11833/j.issn.2095-0756.20210651
Citation: ZHOU Peina, DANG Jingjie, SHAO Yongfang, et al. Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia[J]. Journal of Zhejiang A&F University, 2023, 40(1): 12-21. DOI: 10.11833/j.issn.2095-0756.20220390
  • 中药荆芥是唇形科Labiatae植物荆芥Schizonepeta tenuifolia干燥后的地上部分,有解表祛风、透疹止血等功效[1]。荆芥的挥发油、黄酮等活性成分被广泛用于医药、食品和化工等领域[2-3]

    HD-Zip (Homeodomain-leucine zipper protein)基因家族是植物界一类特有的转录因子,在植物的生长发育、适应环境及胁迫应答等方面起到重要作用。HD (Homeodomain)蛋白是由Homeobox (HB)基因编码的高度保守的蛋白质结构域,由60个氨基酸组成。该蛋白中存在1个特征性的三螺旋结构,可以特异结合DNA序列,以此对基因进行调控[45]。此外,HD-Zip基因家族还有1个亮氨酸拉链保守结构域(leucine zipper-loop-zipper,LZ),这是蛋白形成二聚体所必需的结构。根据蛋白的序列保守性、蛋白功能、基因结构等,将该家族分为4个亚家族:HD-Zip Ⅰ ~Ⅳ[6]。Ⅰ亚家族主要参与非生物胁迫及环境适应性;Ⅱ亚家族主要与生长素响应相关;Ⅲ亚家族主要参与不同的发育事件,例如顶端分生组织、维管束的发育,还与植物激素调控相关;Ⅳ亚家族主要在植物的表皮中特异性表达,主要调节表皮的分化、毛状体形成等[7]

    目前,HD-Zip基因家族在多种植物中被鉴定并表征,例如拟南芥Arabidopsis thaliana[8]、水稻Oryza sativa[9]、小麦Triticum aestivum[10]等,但尚未有荆芥HD-Zip基因家族的相关研究。本研究以荆芥的基因组作为基础,利用生物信息学方法系统鉴定荆芥HD-Zip基因家族成员,并对其蛋白质理化性质、染色体定位、基因结构、共线性分析以及不同时期的表达规律进行分析,为今后深入研究荆芥基因家族的功能和调控机制奠定基础。

    • 基于已知的HD-Zip基因家族的保守结构域,在荆芥基因组数据中进行初步筛选,利用TBtools (v1.98741)的“Blast Compare Two Seqs”,下载的蛋白序列为Query Seq,荆芥基因组的蛋白序列为Subject Seq,设置E-value为10−10进行比对[11]。根据HD-Zip基因家族在美国国家生物技术信息中心(NCBI)中的比对结果,得到目的基因编码蛋白的保守结构域,使用“Visualize NCBI CDD Domain Pattern”进行保守结构域的可视化。利用在线网站ExPASy (https://www.expasy.org/)对蛋白序列的基本理化性质,如氨基酸数目、等电点和分子质量等进行预测。

    • 在NCBI在线网站上下载已被表征的HD-Zip基因家族的蛋白序列。将经过筛选的荆芥HD-Zip蛋白序列与下载的蛋白序列利用MEGA X进行最大似然 (ML)进化树的构建。选择最优氨基酸替代模型,根据氨基酸模型结果构建ML树,设置bootstrap为1000,partial deletion为80%。利用在线网站iTOL (https://itol.embl.de/#)对进化树进行美化。

    • 在荆芥基因组中搜索HD-Zip基因在染色体上的具体位置和每条染色体的总长度,利用TBtools中的“Visualize Gene Structure (Basic)”功能,对筛选的基因ID进行基因结构的可视化。利用在线网站MEME (https://meme-suite.org/meme/tools/meme)对筛选的荆芥HD-Zip基因编码的蛋白序列进行蛋白保守基序预测,设置基序数量为10个,选择“Zero or One Occurence Per Sequence (zoops)”分布基序。采用TBtools中的“Visualize MEME/MSAT Motif Pattern”进行保守基序的可视化处理。

    • 利用TBtools的“Gene Location Visualize from GTF/GFF”进行基因在染色体分布的可视化。将筛选的基因序列利用TBtools中的“Gene Location Visualize fron GTF/GFF”功能进行染色体定位分析;提取荆芥HD-Zip基因序列的启动子部分(5′UTR上游2000 bp),利用PlantCARE在线网站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)预测顺式元件并整理结果,再利用TBtools中的“Gene Structure View (Advanced)”对其进行可视化处理。使用MCScanX软件进行基因组内荆芥HD-Zip基因的共线性分析以及与拟南芥基因组间的共线性分析,并利用Circos软件绘制基因组内和基因组之间的共线性图谱。

    • 根据HD-Zip基因ID于不同时期荆芥叶片(10、20、35 d)及根(35 d)的转录组数据中进行搜索,得到基因的FPKM (fragments per kilobase per million)值,利用TBtools的“HeatMap”绘制基因表达热图,探究HD-Zip基因家族的表达模式。

    • 荆芥基因组大小为798 Mb,Q20(碱基被测错的概率为1%)为94.67%,Q30(碱基被测错的概率为1‰)为89.41%,说明测序质量较好(Q20≥93%、Q30≥86%),GC含量为39.34%,经过Hi-C组装后,共有696 Mb的基因组序列被定位到6条染色体上(Chr 01~06),占比91.38%。以上数据说明荆芥的基因组质量较好,有助于完整地挖掘HD-Zip基因家族。为了鉴定荆芥中HD-Zip基因,根据4个亚家族HD-Zip Ⅰ、Ⅱ、Ⅲ、Ⅳ的蛋白保守结构域进行筛选,共筛选到42条可能的HD-Zip基因家族序列,其中HD-Zip Ⅰ亚家族16条,HD-Zip Ⅱ亚家族7条,HD-Zip Ⅲ亚家族5条,HD-Zip Ⅳ亚家族14条,并通过在线网站Expasy网站进行蛋白分子量和等电点的预测(表1)。其中40条基因全部定位到对应染色体(Chr 01~06),Sch000029960和Sch000004651未锚定在染色体上(图1)。荆芥HD-Zip基因仅在2~4号染色体上集中分布,说明该基因家族在染色体上分布不均匀。荆芥HD-Zip的基因长度为528~2586 bp;分子量为20.33~94.18 kDa;等电点为4.59~9.05。因此,HD-Zip的基因和蛋白长度跨度较大,HD-Zip Ⅲ和Ⅳ的基因长度约2000 bp,HD-Zip Ⅰ和Ⅱ在1000 bp以下,该结果与分子量具有相关性,而等电点主要取决于氨基酸中酸性氨基酸和碱性氨基酸的数量比,大多数蛋白(76.2%)等电点小于7.0,证明荆芥HD-Zip可能是一类酸性蛋白。

      表 1  荆芥HD-Zip基因家族的蛋白特征

      Table 1.  Protein characteristics of HD-Zip gene family in S. tenuifolia

      亚家族基因ID CDS长
      度/bp
      蛋白长
      度/个
      分子量/
      kDa
      等电点染色体亚家族基因ID CDS长
      度/bp
      蛋白长
      度/个
      分子量/
      kDa
      等电点染色体
      HD-Zip ⅠSch00000318190029933.8474.88Chr 01Sch00000383152817520.3318.58Chr 01
      Sch00001677789729834.3796.55Chr 04
      Sch00001948682227331.1004.59Chr 04HD-Zip ⅢSch000001735256285393.3065.74Chr 01
      Sch00002649892730835.3505.01Chr 06Sch000019857251183691.4615.94Chr 04
      Sch00000872582227331.0344.83Chr 02Sch000014693249383091.0215.84Chr 03
      Sch00000599791230334.3694.97Chr 02Sch000026324258686194.1836.14Chr 06
      Sch00002032896632135.7304.81Chr 04Sch000028231252984292.4346.17Chr 06
      Sch00001642486728832.6336.32Chr 04
      Sch00001790287929233.2076.07Chr 04HD-Zip ⅣSch000026062216672179.0715.98Chr 06
      Sch00000247487629132.5315.7Chr 01Sch000008059216372079.0566.23Chr 02
      Sch00000898369623126.8326.32Chr 02Sch000029960218172679.5265.64HiC_scaffold_8
      Sch00000683169323026.6156.96Chr 02Sch000011892241880587.9135.79Chr 03
      Sch00001927860019922.6738.44Chr 04Sch000009216219673179.8885.79Chr 02
      Sch00002165154618121.7885.84Chr 05Sch000019506240079987.0736.04Chr 04
      Sch00001373865421724.9347.59Chr 03Sch000012322249082991.5025.41Chr 03
      Sch00001671062120624.4725.44Chr 04Sch000012213249082991.5025.41Chr 03
      Sch000004651249082991.5025.41HiC_scaffold_100
      HD-Zip ⅡSch000028530891296327.3607.52Chr 06Sch000018911207068977.0616.28Chr 04
      Sch00001096687929232.6237.62Chr 03Sch000005323194464773.2647.27Chr 02
      Sch000019272795264294.9508.59Chr 04Sch000022402230776884.1805.81Chr 05
      Sch00000831678326029.0938.12Chr 02Sch000024046227475784.2796.15Chr 06
      Sch00002544787929232.3519.05Chr 06Sch000008675188462769.9056.18Chr 02
      Sch00001195164521424.3348.24Chr 03
        说明:CDS指蛋白编码区

      图  1  荆芥HD-Zip基因家族的染色体定位

      Figure 1.  Chromosome mapping of HD-Zip gene family in S. tenuifolia

    • 将以上42条蛋白序列与已知的HD-Zip蛋白序列进行ML树的构建(图2),可知:荆芥的HD-Zip和拟南芥及其他物种HD-Zip的蛋白序列被聚为四大支,与已表征HD-Zip基因家族的4个亚家族分类一致,且在荆芥基因组中,每个亚家族基因的占比与拟南芥的HD-Zip Ⅰ ~Ⅳ之间的比例相似,其中HD-Zip Ⅰ与Ⅳ占比最大,HD-Zip Ⅲ占比最少。从进化树中可以发现:HD-Zip Ⅲ先与Ⅳ聚为一支,再与HD-Zip Ⅰ和Ⅱ聚为一支,说明HD-Zip Ⅲ可能与Ⅳ的亲缘关系更近。

      图  2  荆芥与拟南芥及其他物种HD-Zip基因家族的最大似然值进化树

      Figure 2.  ML evolutionary tree of HD-Zip gene family between S. tenuifolia and A. thaliana and other species

    • 利用TBtools软件绘制荆芥HD-Zip基因结构图,分析基因内含子和外显子的分布情况。图3显示:HD-Zip Ⅰ与Ⅱ的基因长度较为相近,内含子1~3个(实线),外显子2~4个(黄色标识),基因结构比较简单。HD-Zip Ⅲ与Ⅳ基因长度较为接近,内含子8~17个,外显子9~17,其中HD-Zip Ⅲ的内含子和外显子的数量最多。以上基因结构和长度结果与ML进化树聚类结果较为一致。

      图  3  荆芥HD-Zip基因家族的基因结构分析

      Figure 3.  Gene structure analysis of HD-Zip gene family in S. tenuifolia

      利用在线网站MEME对42条HD-Zip基因家族的蛋白序列进行保守基序(Motif)的检索,一共确认了10个不同的基序(图4)。其中,所有蛋白均存在Motif 1~3,这3个保守基序构成了HD-Zip基因家族特征的保守基序HD、LZ。HD-Zip Ⅲ和Ⅳ的Motif 4、Motif 5构成HD-Zip Ⅲ和Ⅳ特有的START保守结构域。从Motif结构分布上看到,HD-ZipⅢ和Ⅳ的Motif最为丰富,可能具有多样的生物学功能,每个亚家族之间的Motif分布较为一致。

      图  4  荆芥HD-Zip基因家族的保守基序分析

      Figure 4.  Conservative motif analysis of HD-Zip gene family in S. tenuifolia       

    • 提取荆芥HD-Zip的5′UTR上游的2 kb序列为启动子序列,利用在线网站PlantCARE进行顺式元件的预测,其中光响应的顺式元件出现频率最高,其次为脱落酸响应元件,MeJA响应元件,厌氧感应元件以及MYB结合的位点(图5)。说明该基因家族可能与以上的生物学功能相关。

      图  5  荆芥HD-Zip基因家族的顺式作用元件分布

      Figure 5.  Distribution of cis-acting elements of HD-Zip gene family in S. tenuifolia

      对荆芥的42个HD-Zip家族基因进行基因组内串联重复分析,发现Sch000008983和Sch000006831在Chr 02上串联重复,Sch000012213与Sch000012322在Chr 03上串联重复(图6);经过基因组内的共线性分析发现,荆芥的9个HD-Zip家族基因在基因组内存在共线性,说明成对的共线性基因可能具有极为相似的功能(图7)。通过荆芥与拟南芥的基因组之间的共线性分析发现:一共有37对共线性的HD-Zip基因(图8)。综上,通过与拟南芥HD-Zip基因构建进化树分析及共线性分析,有助于利用拟南芥的基因功能推断荆芥HD-Zip中相应基因的功能。

      图  6  荆芥HD-Zip基因家族的组内串联重复分析

      Figure 6.  Tandem repeat analysis of HD-Zip gene family in genome of S. tenuifolia

      图  7  荆芥HD-Zip基因家族的组内共线性分析

      Figure 7.  Intra-group collinearity analysis of HD-Zip gene family in S. tenuifolia

      图  8  荆芥HD-Zip与拟南芥基因组之间的共线性分析

      Figure 8.  Collinear analysis of HD-Zip gene between S. tenuifolia and A. thaliana genomes

    • 根据课题组前期观察,10 d幼苗的叶子和茎具有丰富的指状腺毛,20 d幼苗的叶子和茎具有较多的头状腺毛和腺鳞,35 d幼苗的叶子和茎具有丰富的腺鳞。因此,对荆芥不同生长时期叶片(10、20、35 d)及根(35 d)进行转录组分析,发现HD-Zip Ⅰ主要在幼叶10 d中表达,HD-ZipⅡ和Ⅲ主要在根中表达,HD-Zip Ⅳ亚家族主要在叶中表达(图9)。研究发现:HD-Zip Ⅳ基因主要调节表皮的分化[12],结合荆芥腺毛的分布情况,推测荆芥的HD-Zip Ⅳ与荆芥腺毛和非腺毛的形成与分化相关。

      图  9  HD-Zip家族基因表达模式

      Figure 9.  HD-Zip family gene expression pattern

    • 本研究从全基因组水平对荆芥的HD-Zip基因家族进行了系统的研究,共鉴定到42个HD-Zip家族的基因,根据识别的DNA序列、结构域、蛋白功能,可将这些序列分为4个亚家族,分别为HD-Zip Ⅰ ~Ⅳ,这与拟南芥、小麦、水稻、玉米Zea mays、土豆Solanum tuberosum、烟草Nicotiana tabacum等中的分类一致[7-9, 13-15]。HD-Zip Ⅰ只含有高保守的HD结构域和位于HD结构域羧基端的LZ结构域;HD-Zip Ⅱ除了HD-Zip Ⅰ具有的HD和LZ保守结构域外,还存在1个高度保守的N-末端;HD-Zip Ⅲ具有HD和LZ保守结构域,以及类固醇合成急性调节蛋白相关的脂质转运结构域(START)和氨基酸序列羧基端的MEKHLA基序,其中START结构域的长度为220个氨基酸且可以结合并转移脂质,MEKHLA基序与许多非生物胁迫应答相关[16-17];HD-Zip Ⅳ结构与HD-Zip Ⅲ非常相似,具有HD、LZ、START结构域,但缺失了MEKHLA基序[18]。荆芥的HD-Zip Ⅰ和Ⅳ亚家族的基因所占比例最高,这与拟南芥HD-ZipⅠ和Ⅳ的比例相似。基因的进化树结果显示:HD-Zip Ⅰ与Ⅱ亲缘关系更近,HD-Zip Ⅲ与Ⅳ亲缘关系更近,由此可以推测以上2个分支可能是由相同的祖先进化而来,或者Ⅳ是由Ⅲ进化来,但在分化过程中丢失了MEKHLA基序[19]。结合基因的结构来看,HD-Zip Ⅲ和Ⅳ的结构比HD-Zip Ⅰ与Ⅱ的结构更为复杂,以上结果说明可能HD-Zip Ⅲ与Ⅳ相比于HD-ZipⅠ和Ⅱ进化程度更高,基因结构更为复杂,以上结果与保守结构域分析和进化树的分析结果一致。这说明HD-Zip家族在物种的亚群内部较为保守,但其具体的基因功能可能会由于基因复制或者进化,以及物种间的差异性从而出现一定的差异。

      分析启动子发现:在每个亚族内部的基因启动子区顺式作用元件类型基本相同,例如MYB结合位点、脱落酸响应元件以及MeJA响应元件在HD-Zip Ⅳ高频出现。同时,同一亚族基因编码蛋白的保守基序也基本相同,HD-Zip Ⅰ ~Ⅳ的表达分析发现:HD-Zip Ⅰ ~Ⅳ具有不同的表达偏好性,说明荆芥中不同HD-Zip家族不同亚家族可能具有不同的生物学功能,但同一亚族各基因的生物学功能基本相同。

      有研究表明:HD-Zip Ⅳ在表皮中特异表达,参与植物表皮细胞的分化,调节毛状体(腺毛和非腺毛)等形成与发育。如烟草中的NtHDG2,拟南芥的PDF2,黄花蒿Artemisia annua的AaHD1和AaHD8,番茄Solanum lycopersicum的SlCD2和SlWo均对毛状体具有调控作用,属于HD-Zip Ⅳ[14, 20-22]。本研究中发现荆芥的HD-Zip Ⅳ亚家族基因大部分在叶片表达,推测可能这些基因与毛状体的发育相关。结合拟南芥与荆芥HD-Zip基因家族的共线性分析,可以推测荆芥HD-Zip基因家族的生物学功能。结合文献,发现Sch000029960与AT4G21750.1及AT4G04890.2为同源基因,AT4G21750.1及AT4G04890.2分别编码拟南芥的GL2-like和PDF2,与拟南芥的表皮发育密切相关。Sch000024046与AT1G79840.2为同源基因,AT1G79840.2编码GL2,在拟南芥中影响表皮细胞的特性,包括毛状体、根毛发育等[23]。在荆芥的叶、茎、花穗等多个部位表面分布着多种腺毛及非腺毛,其中,盾状腺毛即腺鳞被认为是荆芥产生挥发油的“品质载体”[24-25],但是调控荆芥腺鳞生长发育的分子机制还未被报道,本研究中筛选的HD-Zip Ⅳ亚基因家族可能为腺鳞发育调控的候选基因。通过对候选基因功能的验证、共表达分析等为腺鳞生长发育分子机制的阐明提供线索,同时为提高荆芥药用品质提供理论基础。

    • 本研究在荆芥全基因水平上筛选到42条HD-Zip基因序列,并对以上序列的基因结构、保守基序、顺式作用元件等进行了分析。系统发育分析可将42条序列分为4个亚家族(HD-Zip Ⅰ ~Ⅳ)。通过与拟南芥基因组之间的共线性分析、表达模式分析等推测,荆芥的HD-Zip Ⅳ亚家族基因可能在毛状体发育过程中起到重要作用。这些结果为后续荆芥的HD-Zip基因家族的功能研究及表征提供了理论基础。

参考文献 (25)

目录

/

返回文章
返回