留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

荆芥HD-Zip基因家族的全基因组鉴定及分析

周佩娜 党静洁 邵永芳 石遵睿 张琳 刘潺潺 吴啟南

周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
引用本文: 周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
ZHOU Peina, DANG Jingjie, SHAO Yongfang, SHI Zunrui, ZHANG Lin, LIU Chanchan, WU Qi’nan. Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia[J]. Journal of Zhejiang A&F University, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
Citation: ZHOU Peina, DANG Jingjie, SHAO Yongfang, SHI Zunrui, ZHANG Lin, LIU Chanchan, WU Qi’nan. Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia[J]. Journal of Zhejiang A&F University, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390

荆芥HD-Zip基因家族的全基因组鉴定及分析

doi: 10.11833/j.issn.2095-0756.20220390
基金项目: 国家自然科学基金面上项目(81973435);国家自然科学基金青年科学基金项目(81903756);江苏省研究生科研与实践创新计划项目(KYCX21_1759,KYCX22_2031)
详细信息
    作者简介: 周佩娜(ORCID: 0000-0002-5475-3863),博士研究生,从事中药资源品质评价研究。E-mail: 20203098@njucm.edu.cn
    通信作者: 吴啟南(ORCID: 0000-0001-9730-8279),教授,从事中药资源生产与品质评价研究。E-mail: wuqn@njucm.edu.cn
  • 中图分类号: Q781;S567

Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia

  • 摘要:   目的  鉴定荆芥Schizonepeta tenuifolia的HD-Zip基因家族,利用生物信息学方法分析其在全基因组中的分布和相关特征以及在不同时期中的表达规律,为该家族基因的进一步研究奠定基础。  方法  根据已经表征的HD-Zip基因,筛选荆芥基因组内的HD-Zip基因序列,利用MEME、PlantCARE、NCBI、MEGA X、MCScanX、Circos等在线网站及软件对蛋白序列进行基本理化性质分析、进化树构建、染色体定位、基因结构分析、共线性基因分析等。  结果  在荆芥全基因组中共鉴定到42条HD-Zip基因序列,它们可被分为4个亚家族,分别含有16、7、5、14个基因,亚家族之间的基因长度、结构及保守基序差异显著,但在亚家族内部保守,荆芥基因组与拟南芥Arabidopsis thaliana基因组共线性分析发现有37对基因,可能具有相似的生物学功能。荆芥的4个亚家族基因的顺式元件中均高频出现了光响应、脱落酸响应、MeJA响应等元件,在不同生长时期的叶片及部位的转录组数据中具有不同的表达趋势,Ⅰ亚家族主要在幼叶中表达,Ⅱ和Ⅲ亚家族主要在根中在表达,Ⅳ亚家族主要在叶中表达。  结论  在荆芥基因组中共获得42条HD-Zip基因序列,被分为4个亚家族(HD-ZipⅠ~Ⅳ),亚家族内部高度保守,亚家族之间差异显著,其基因结构、保守结构域及表达模式不同。亚家族Ⅰ和Ⅱ,亚家族Ⅲ和Ⅳ亲缘关系更近,HD-Zip基因具有组织表达差异性,协同调控了荆芥的生长发育和次生代谢。图9表1参25
  • 图  1  荆芥HD-Zip基因家族的染色体定位

    Figure  1  Chromosome mapping of HD-Zip gene family in S. tenuifolia

    图  2  荆芥与拟南芥及其他物种HD-Zip基因家族的最大似然值进化树

    Figure  2  ML evolutionary tree of HD-Zip gene family between S. tenuifolia and A. thaliana and other species

    图  3  荆芥HD-Zip基因家族的基因结构分析

    Figure  3  Gene structure analysis of HD-Zip gene family in S. tenuifolia

    图  4  荆芥HD-Zip基因家族的保守基序分析

    Figure  4  Conservative motif analysis of HD-Zip gene family in S. tenuifolia       

    图  5  荆芥HD-Zip基因家族的顺式作用元件分布

    Figure  5  Distribution of cis-acting elements of HD-Zip gene family in S. tenuifolia

    图  6  荆芥HD-Zip基因家族的组内串联重复分析

    Figure  6  Tandem repeat analysis of HD-Zip gene family in genome of S. tenuifolia

    图  7  荆芥HD-Zip基因家族的组内共线性分析

    Figure  7  Intra-group collinearity analysis of HD-Zip gene family in S. tenuifolia

    图  8  荆芥HD-Zip与拟南芥基因组之间的共线性分析

    Figure  8  Collinear analysis of HD-Zip gene between S. tenuifolia and A. thaliana genomes

    图  9  HD-Zip家族基因表达模式

    Figure  9  HD-Zip family gene expression pattern

    表  1  荆芥HD-Zip基因家族的蛋白特征

    Table  1.   Protein characteristics of HD-Zip gene family in S. tenuifolia

    亚家族基因ID CDS长
    度/bp
    蛋白长
    度/个
    分子量/
    kDa
    等电点染色体亚家族基因ID CDS长
    度/bp
    蛋白长
    度/个
    分子量/
    kDa
    等电点染色体
    HD-Zip ⅠSch00000318190029933.8474.88Chr 01Sch00000383152817520.3318.58Chr 01
    Sch00001677789729834.3796.55Chr 04
    Sch00001948682227331.1004.59Chr 04HD-Zip ⅢSch000001735256285393.3065.74Chr 01
    Sch00002649892730835.3505.01Chr 06Sch000019857251183691.4615.94Chr 04
    Sch00000872582227331.0344.83Chr 02Sch000014693249383091.0215.84Chr 03
    Sch00000599791230334.3694.97Chr 02Sch000026324258686194.1836.14Chr 06
    Sch00002032896632135.7304.81Chr 04Sch000028231252984292.4346.17Chr 06
    Sch00001642486728832.6336.32Chr 04
    Sch00001790287929233.2076.07Chr 04HD-Zip ⅣSch000026062216672179.0715.98Chr 06
    Sch00000247487629132.5315.7Chr 01Sch000008059216372079.0566.23Chr 02
    Sch00000898369623126.8326.32Chr 02Sch000029960218172679.5265.64HiC_scaffold_8
    Sch00000683169323026.6156.96Chr 02Sch000011892241880587.9135.79Chr 03
    Sch00001927860019922.6738.44Chr 04Sch000009216219673179.8885.79Chr 02
    Sch00002165154618121.7885.84Chr 05Sch000019506240079987.0736.04Chr 04
    Sch00001373865421724.9347.59Chr 03Sch000012322249082991.5025.41Chr 03
    Sch00001671062120624.4725.44Chr 04Sch000012213249082991.5025.41Chr 03
    Sch000004651249082991.5025.41HiC_scaffold_100
    HD-Zip ⅡSch000028530891296327.3607.52Chr 06Sch000018911207068977.0616.28Chr 04
    Sch00001096687929232.6237.62Chr 03Sch000005323194464773.2647.27Chr 02
    Sch000019272795264294.9508.59Chr 04Sch000022402230776884.1805.81Chr 05
    Sch00000831678326029.0938.12Chr 02Sch000024046227475784.2796.15Chr 06
    Sch00002544787929232.3519.05Chr 06Sch000008675188462769.9056.18Chr 02
    Sch00001195164521424.3348.24Chr 03
      说明:CDS指蛋白编码区
    下载: 导出CSV
  • [1] 国家药典委员会. 中华人民共和国药典 (一部)[M]. 北京: 中国医药科技出版社, 2020: 243 − 244.

    National Pharmacopoeia Board. Chinese Pharmacopoeia (Volume Ⅰ)[M]. Beijing: China Medical Science Press, 2020: 243 − 244.
    [2] LIU C, SRIVIDYA N, PARRISH A N, et al. Morphology of glandular trichomes of Japanese catnip (Schizonepeta tenuifolia Briquet) and developmental dynamics of their secretary activity [J]. Phytochemistry, 2018, 150: 23 − 30. doi:  10.1016/j.phytochem.2018.02.018
    [3] 樊佳新, 王帅, 孟宪生, 等. HPLC法测定不同产地荆芥中6种黄酮类成分[J]. 中草药, 2017, 48(11): 2292 − 2295.

    FAN Jiaxin, WANG Shuai, MENG Xiansheng, et al. Determination of six flavonoids in Schizonepeta tenuifolia from different areas by HPLC [J]. Chinese Traditional and Herbal Drugs, 2017, 48(11): 2292 − 2295.
    [4] FEDERICO DA, PABLO A M, CARLOS A D, et al. The true story of the HD-Zip family [J]. Trends in Plant Science, 2007, 12(9): 419 − 426. doi:  10.1016/j.tplants.2007.08.003
    [5] 李媛. 大麦HD-Zip基因家族分析及功能研究[D]. 西宁: 青海大学, 2020.

    LI Yuan. Analysis and Functional Study of HD-Zip Gene Family in Barley [D]. Xining: Qinghai University, 2020.
    [6] SESSA G, CARABELLUI M, POSSENTI M, et al. Multiple links between HD-Zip proteins and hormone networks[J/OL]. International Journal of Molecular Sciences, 2018, 19(12): 4047[2022-05-04]. doi:  10.3390/ijms19124047.
    [7] MIYUKI N, HIROSHI K, MITSUTOMO A, et al. Characterization of the class Ⅳ homeodomain-leucine zipper gene family in Arabidopsis [J]. Plant Physiology, 2006, 141(4): 1363 − 1375. doi:  10.1104/pp.106.077388
    [8] BRANDT R, CABEDO M, XIE Y, et al. Homeodomain leucine-zipper proteins and their role in synchronizing growth and development with the environment [J]. Journal of Integrative Plant Biology, 2014, 56(6): 518 − 526. doi:  10.1111/jipb.12185
    [9] LI Yuxia, YANG Zongran, ZHANG Yuanyuan, et al. The roles of HD-ZIP proteins in plant a biotic stress tolerance[J/OL]. Frontiers in Plant Science, 2022, 13: 1027071[2022-05-04]. doi:  10.3389/fpls.2022.1027071.
    [10] YUE Hong, SHU Duntao, WANG Meng, et al. Genome-wide identification and expression analysis of the HD-Zip gene family in wheat (Triticum aestivum L. )[J/OL]. Genes, 2018, 9(2): 70[2022-05-02]. doi:  10.3390/genes9020070.
    [11] CHEN Chengjie, CHEN Hao, ZHANG Yi, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data [J]. Molecular Plant, 2020, 13(8): 1194 − 1202. doi:  10.1016/j.molp.2020.06.009
    [12] MA Gang, ZELMAN A K, APICELLA P V, et al. Genome-wide identification and expression analysis of homeodomain leucine zipper subfamily Ⅳ(HD-Zip Ⅳ) gene family in Cannabis sativa L. [J/OL]. Plants. 2022, 11(10): 1307[2022-05-02]. doi:  10.3390/plants11101307.
    [13] ZHAO Yang, ZHOU Yuqing, JIANG Haiyan, et al. Systematic analysis of sequences and expression patterns of drought-responsive members of the HD-Zip gene family in maize[J/OL]. PLoS One, 2011, 6(12): e28488[2022-05-02]. doi:  10.1371/journal.pone.0028488.
    [14] WANG Zhong, WANG Shanshan, XIAO Yansong, et al. Functional characterization of a HD-Zip Ⅳ transcription factor NtHDG2 in regulating flavonols biosynthesis in Nicotiana tabacum [J]. Plant Physiology and Biochemistry, 2020, 146: 259 − 268. doi:  10.1016/j.plaphy.2019.11.033
    [15] WAN Li, DONG Jieya, CAO Minxuan, et al. Genome-wide identification and characterization of HD-Zip genes in potato [J]. Genes, 2019, 697: 103 − 117.
    [16] SCHRICK K, NGUYEN D, KARLOWSKI W M, et al. START lipid/sterol-binding domains are amplified in plants and are predominantly associated with homeodomain transcription factors[J/OL]. Genome Biology, 2004, 5: R41[2022-05-02]. doi:  10.1186/gb-2004-5-6-r41.
    [17] MUKHERIEE K, BURGLIN TR, MEKHLA, a novel domain with similarity to PAS domains, is fused to plant homeodomain-leucine zipper Ⅲ proteins[J]. Plant Physiology, 2006, 140(4): 1142 − 1150.
    [18] GUO Qing, JIANG Jiahui, YAO Wenjing, et al. Genome-wide analysis of poplar HD-Zip family and over-expression of PsnHDZ63 confers salt tolerance in transgenic Populus simonii × P. nigra[J/OL]. Plant Science, 2021, 311: 111021[2022-11-21]. doi:  10.1016/j.plantsci.2021.111021.
    [19] 邵晨冰, 黄志楠, 白雪滢, 等. 辣椒HD-Zip基因家族鉴定、系统进化及表达分析[J]. 中国农业科学, 2020, 53(5): 1004 − 1017. doi:  10.3864/j.issn.0578-1752.2020.05.012

    SHAO Chenbing, HUANG Zhinan, BAI Xueying, et al. Identification, systematic evolution and expression analysis of HD-Zip gene family in Capsicum annuum [J]. Scientia Agricultura Sinica, 2020, 53(5): 1004 − 1017. doi:  10.3864/j.issn.0578-1752.2020.05.012
    [20] NAOKO K, HITOMI O, YOSHIBUMI K, et al. Mutations in epidermis-specific HD-Zip Ⅳ genes affect floral organ identity in Arabidopsis thaliana [J]. The Plant Journal, 2013, 75(3): 430 − 440. doi:  10.1111/tpj.12211
    [21] CHALVIN C, DRE VENSK S, DRON M, et al. Genetic control of glandular trichome development [J]. Trends in Plant Science, 2020, 25(5): 477 − 487. doi:  10.1016/j.tplants.2019.12.025
    [22] YAN Tingxiang, CHEN M, SHEN Q, et al. HOMEODOMAIN PROTEIN 1 is required for jasmonate-mediated glandular trichome initiation in Artemisia annua [J]. New Phytologist, 2017, 213(3): 1145 − 1155. doi:  10.1111/nph.14205
    [23] HULSKAMP M, MISRA S, JURGENS G. Genetic dissection of trichome cell development in Arabidopsis [J]. Cell, 1994, 76(3): 555 − 566. doi:  10.1016/0092-8674(94)90118-X
    [24] 蒋征, 王红, 吴啟南, 等. 荆芥穗药材腺鳞内含物定性及3种主要萜类的定量研究[J]. 中药材, 2016, 39(1): 31 − 36.

    JIANG Zheng, WANG Hong, WU Qi’nan, et al. Qualitative and quantitative analysis of major constituents of gland products in peltate glandular trichomes of Schizonepetae Spica [J]. Journal of Chinese Medicinal Materials, 2016, 39(1): 31 − 36.
    [25] ZHOU Peina, DANG Jingjie, SHI Zunrui, et al. Identification and characterization of a novel gene involved in glandular trichome development in Nepeta tenuifolia[J/OL]. Frontiers in Plant Science, 2022, 13: 936244[2022-05-02]. doi:  10.3389/fpls.2022.936244.
  • [1] 尚林雪, 王群, 张国哲, 赵雨, 顾翠花.  紫薇LiCMB1基因的克隆及表达特性分析 . 浙江农林大学学报, doi: 10.11833/j.issn.2095-0756.20220333
    [2] 刘俊, 李龙, 陈玉龙, 刘燕, 吴耀松, 任闪闪.  杜仲CONSTANS-like全基因组鉴定、系统进化及表达模式分析 . 浙江农林大学学报, 2022, 39(3): 475-485. doi: 10.11833/j.issn.2095-0756.20210385
    [3] 王绍良, 张雯宇, 高志民, 周明兵, 杨克彬, 宋新章.  毛竹磷转运蛋白Ⅰ家族基因鉴定及表达模式 . 浙江农林大学学报, 2022, 39(3): 486-494. doi: 10.11833/j.issn.2095-0756.20210471
    [4] 孟超敏, 耿翡翡, 卿桂霞, 周佳敏, 张富厚, 刘逢举.  陆地棉磷高效基因GhMGD3的克隆与表达分析 . 浙江农林大学学报, 2022, 39(6): 1203-1211. doi: 10.11833/j.issn.2095-0756.20220145
    [5] 王倩清, 张毓婷, 张俊红, 刘慧, 童再康.  闽楠PLR基因家族鉴定及响应激素的表达分析 . 浙江农林大学学报, 2022, 39(6): 1173-1182. doi: 10.11833/j.issn.2095-0756.20220351
    [6] 缪云锋, 周丹, 董彬, 赵宏波.  桂花OfNAC转录因子鉴定及在花开放阶段的表达分析 . 浙江农林大学学报, 2021, 38(3): 433-444. doi: 10.11833/j.issn.2095-0756.20200474
    [7] 娄永峰, 高志民.  毛竹早期光诱导蛋白基因克隆及功能分析 . 浙江农林大学学报, 2021, 38(1): 93-102. doi: 10.11833/j.issn.2095-0756.20200237
    [8] 王楠楠, 董彬, 杨丽媛, 赵宏波.  梅花2个PmWRKY2基因克隆及在逆境胁迫下的表达模式 . 浙江农林大学学报, 2021, 38(4): 812-819. doi: 10.11833/j.issn.2095-0756.20200706
    [9] 庞天虹, 钱婕妤, 付建新, 顾翠花, 张超.  桂花己糖激酶基因家族成员的序列及表达分析 . 浙江农林大学学报, 2021, 38(2): 225-234. doi: 10.11833/j.issn.2095-0756.20200370
    [10] 黄元城, 郭文磊, 王正加.  薄壳山核桃全基因组LBD基因家族的生物信息学分析 . 浙江农林大学学报, 2021, 38(3): 464-475. doi: 10.11833/j.issn.2095-0756.20200454
    [11] 阮诗雨, 张智俊, 陈家璐, 马瑞芳, 朱丰晓, 刘笑雨.  毛竹GRF基因家族全基因组鉴定与表达分析 . 浙江农林大学学报, 2021, 38(4): 792-801. doi: 10.11833/j.issn.2095-0756.20200544
    [12] 俞狄虎, 张迟, 柯甫志, 敬露阳, 顾雪娇, 吴宝玉, 张敏.  ‘无子瓯柑’CHS基因家族的克隆和表达分析 . 浙江农林大学学报, 2019, 36(5): 943-949. doi: 10.11833/j.issn.2095-0756.2019.05.013
    [13] 蒋琦妮, 付建新, 张超, 董彬, 赵宏波.  桂花OfAP1基因的克隆及表达分析 . 浙江农林大学学报, 2019, 36(4): 664-669. doi: 10.11833/j.issn.2095-0756.2019.04.005
    [14] 李冰冰, 刘国峰, 魏书, 黄龙全, 张剑韵.  烟草NtPLR1基因克隆与表达分析 . 浙江农林大学学报, 2017, 34(4): 581-588. doi: 10.11833/j.issn.2095-0756.2017.04.003
    [15] 刘健健, 刘俊丽, 季敏杰, 陈家栋, 杨晓峰, 陈爱群.  番茄质膜H+-ATPase家族基因的鉴定和表达分析 . 浙江农林大学学报, 2016, 33(5): 734-741. doi: 10.11833/j.issn.2095-0756.2016.05.002
    [16] 赵婷, 韩小娇, 刘明英, 乔桂荣, 蒋晶, 姜彦成, 卓仁英.  东南景天耐镉相关基因SaFer的克隆与功能初步分析 . 浙江农林大学学报, 2015, 32(1): 25-32. doi: 10.11833/j.issn.2095-0756.2015.01.004
    [17] 赵传慧, 周厚君, 童再康, 林二培, 黄华宏, 牛明月.  光皮桦成花相关MADS-box基因BlMADS1的克隆与表达 . 浙江农林大学学报, 2015, 32(2): 221-228. doi: 10.11833/j.issn.2095-0756.2015.02.008
    [18] 庞景, 童再康, 黄华宏, 林二培, 刘琼瑶.  杉木纤维素合成酶基因CesA的克隆及表达分析 . 浙江农林大学学报, 2015, 32(1): 40-46. doi: 10.11833/j.issn.2095-0756.2015.01.006
    [19] 沈辰, 裘佳妮, 黄坚钦.  山核桃COP1 E3连接酶的全长克隆及表达分析 . 浙江农林大学学报, 2014, 31(6): 831-837. doi: 10.11833/j.issn.2095-0756.2014.06.002
    [20] 杨希宏, 黄有军, 陈芳芳, 黄坚钦.  山核桃FLOWERING LOCUS C同源基因鉴定与表达分析 . 浙江农林大学学报, 2013, 30(1): 1-8. doi: 10.11833/j.issn.2095-0756.2013.01.001
  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20220390

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2023/1/12

图(9) / 表(1)
计量
  • 文章访问数:  16
  • HTML全文浏览量:  1
  • PDF下载量:  5
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-06-13
  • 录用日期:  2022-11-22
  • 修回日期:  2022-11-21
  • 网络出版日期:  2023-01-17
  • 刊出日期:  2023-01-17

荆芥HD-Zip基因家族的全基因组鉴定及分析

doi: 10.11833/j.issn.2095-0756.20220390
    基金项目:  国家自然科学基金面上项目(81973435);国家自然科学基金青年科学基金项目(81903756);江苏省研究生科研与实践创新计划项目(KYCX21_1759,KYCX22_2031)
    作者简介:

    周佩娜(ORCID: 0000-0002-5475-3863),博士研究生,从事中药资源品质评价研究。E-mail: 20203098@njucm.edu.cn

    通信作者: 吴啟南(ORCID: 0000-0001-9730-8279),教授,从事中药资源生产与品质评价研究。E-mail: wuqn@njucm.edu.cn
  • 中图分类号: Q781;S567

摘要:   目的  鉴定荆芥Schizonepeta tenuifolia的HD-Zip基因家族,利用生物信息学方法分析其在全基因组中的分布和相关特征以及在不同时期中的表达规律,为该家族基因的进一步研究奠定基础。  方法  根据已经表征的HD-Zip基因,筛选荆芥基因组内的HD-Zip基因序列,利用MEME、PlantCARE、NCBI、MEGA X、MCScanX、Circos等在线网站及软件对蛋白序列进行基本理化性质分析、进化树构建、染色体定位、基因结构分析、共线性基因分析等。  结果  在荆芥全基因组中共鉴定到42条HD-Zip基因序列,它们可被分为4个亚家族,分别含有16、7、5、14个基因,亚家族之间的基因长度、结构及保守基序差异显著,但在亚家族内部保守,荆芥基因组与拟南芥Arabidopsis thaliana基因组共线性分析发现有37对基因,可能具有相似的生物学功能。荆芥的4个亚家族基因的顺式元件中均高频出现了光响应、脱落酸响应、MeJA响应等元件,在不同生长时期的叶片及部位的转录组数据中具有不同的表达趋势,Ⅰ亚家族主要在幼叶中表达,Ⅱ和Ⅲ亚家族主要在根中在表达,Ⅳ亚家族主要在叶中表达。  结论  在荆芥基因组中共获得42条HD-Zip基因序列,被分为4个亚家族(HD-ZipⅠ~Ⅳ),亚家族内部高度保守,亚家族之间差异显著,其基因结构、保守结构域及表达模式不同。亚家族Ⅰ和Ⅱ,亚家族Ⅲ和Ⅳ亲缘关系更近,HD-Zip基因具有组织表达差异性,协同调控了荆芥的生长发育和次生代谢。图9表1参25

English Abstract

周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
引用本文: 周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南. 荆芥HD-Zip基因家族的全基因组鉴定及分析[J]. 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
ZHOU Peina, DANG Jingjie, SHAO Yongfang, SHI Zunrui, ZHANG Lin, LIU Chanchan, WU Qi’nan. Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia[J]. Journal of Zhejiang A&F University, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
Citation: ZHOU Peina, DANG Jingjie, SHAO Yongfang, SHI Zunrui, ZHANG Lin, LIU Chanchan, WU Qi’nan. Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia[J]. Journal of Zhejiang A&F University, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
  • 中药荆芥是唇形科Labiatae植物荆芥Schizonepeta tenuifolia干燥后的地上部分,有解表祛风、透疹止血等功效[1]。荆芥的挥发油、黄酮等活性成分被广泛用于医药、食品和化工等领域[2-3]

    HD-Zip (Homeodomain-leucine zipper protein)基因家族是植物界一类特有的转录因子,在植物的生长发育、适应环境及胁迫应答等方面起到重要作用。HD (Homeodomain)蛋白是由Homeobox (HB)基因编码的高度保守的蛋白质结构域,由60个氨基酸组成。该蛋白中存在1个特征性的三螺旋结构,可以特异结合DNA序列,以此对基因进行调控[45]。此外,HD-Zip基因家族还有1个亮氨酸拉链保守结构域(leucine zipper-loop-zipper,LZ),这是蛋白形成二聚体所必需的结构。根据蛋白的序列保守性、蛋白功能、基因结构等,将该家族分为4个亚家族:HD-Zip Ⅰ ~Ⅳ[6]。Ⅰ亚家族主要参与非生物胁迫及环境适应性;Ⅱ亚家族主要与生长素响应相关;Ⅲ亚家族主要参与不同的发育事件,例如顶端分生组织、维管束的发育,还与植物激素调控相关;Ⅳ亚家族主要在植物的表皮中特异性表达,主要调节表皮的分化、毛状体形成等[7]

    目前,HD-Zip基因家族在多种植物中被鉴定并表征,例如拟南芥Arabidopsis thaliana[8]、水稻Oryza sativa[9]、小麦Triticum aestivum[10]等,但尚未有荆芥HD-Zip基因家族的相关研究。本研究以荆芥的基因组作为基础,利用生物信息学方法系统鉴定荆芥HD-Zip基因家族成员,并对其蛋白质理化性质、染色体定位、基因结构、共线性分析以及不同时期的表达规律进行分析,为今后深入研究荆芥基因家族的功能和调控机制奠定基础。

    • 基于已知的HD-Zip基因家族的保守结构域,在荆芥基因组数据中进行初步筛选,利用TBtools (v1.98741)的“Blast Compare Two Seqs”,下载的蛋白序列为Query Seq,荆芥基因组的蛋白序列为Subject Seq,设置E-value为10−10进行比对[11]。根据HD-Zip基因家族在美国国家生物技术信息中心(NCBI)中的比对结果,得到目的基因编码蛋白的保守结构域,使用“Visualize NCBI CDD Domain Pattern”进行保守结构域的可视化。利用在线网站ExPASy (https://www.expasy.org/)对蛋白序列的基本理化性质,如氨基酸数目、等电点和分子质量等进行预测。

    • 在NCBI在线网站上下载已被表征的HD-Zip基因家族的蛋白序列。将经过筛选的荆芥HD-Zip蛋白序列与下载的蛋白序列利用MEGA X进行最大似然 (ML)进化树的构建。选择最优氨基酸替代模型,根据氨基酸模型结果构建ML树,设置bootstrap为1000,partial deletion为80%。利用在线网站iTOL (https://itol.embl.de/#)对进化树进行美化。

    • 在荆芥基因组中搜索HD-Zip基因在染色体上的具体位置和每条染色体的总长度,利用TBtools中的“Visualize Gene Structure (Basic)”功能,对筛选的基因ID进行基因结构的可视化。利用在线网站MEME (https://meme-suite.org/meme/tools/meme)对筛选的荆芥HD-Zip基因编码的蛋白序列进行蛋白保守基序预测,设置基序数量为10个,选择“Zero or One Occurence Per Sequence (zoops)”分布基序。采用TBtools中的“Visualize MEME/MSAT Motif Pattern”进行保守基序的可视化处理。

    • 利用TBtools的“Gene Location Visualize from GTF/GFF”进行基因在染色体分布的可视化。将筛选的基因序列利用TBtools中的“Gene Location Visualize fron GTF/GFF”功能进行染色体定位分析;提取荆芥HD-Zip基因序列的启动子部分(5′UTR上游2000 bp),利用PlantCARE在线网站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)预测顺式元件并整理结果,再利用TBtools中的“Gene Structure View (Advanced)”对其进行可视化处理。使用MCScanX软件进行基因组内荆芥HD-Zip基因的共线性分析以及与拟南芥基因组间的共线性分析,并利用Circos软件绘制基因组内和基因组之间的共线性图谱。

    • 根据HD-Zip基因ID于不同时期荆芥叶片(10、20、35 d)及根(35 d)的转录组数据中进行搜索,得到基因的FPKM (fragments per kilobase per million)值,利用TBtools的“HeatMap”绘制基因表达热图,探究HD-Zip基因家族的表达模式。

    • 荆芥基因组大小为798 Mb,Q20(碱基被测错的概率为1%)为94.67%,Q30(碱基被测错的概率为1‰)为89.41%,说明测序质量较好(Q20≥93%、Q30≥86%),GC含量为39.34%,经过Hi-C组装后,共有696 Mb的基因组序列被定位到6条染色体上(Chr 01~06),占比91.38%。以上数据说明荆芥的基因组质量较好,有助于完整地挖掘HD-Zip基因家族。为了鉴定荆芥中HD-Zip基因,根据4个亚家族HD-Zip Ⅰ、Ⅱ、Ⅲ、Ⅳ的蛋白保守结构域进行筛选,共筛选到42条可能的HD-Zip基因家族序列,其中HD-Zip Ⅰ亚家族16条,HD-Zip Ⅱ亚家族7条,HD-Zip Ⅲ亚家族5条,HD-Zip Ⅳ亚家族14条,并通过在线网站Expasy网站进行蛋白分子量和等电点的预测(表1)。其中40条基因全部定位到对应染色体(Chr 01~06),Sch000029960和Sch000004651未锚定在染色体上(图1)。荆芥HD-Zip基因仅在2~4号染色体上集中分布,说明该基因家族在染色体上分布不均匀。荆芥HD-Zip的基因长度为528~2586 bp;分子量为20.33~94.18 kDa;等电点为4.59~9.05。因此,HD-Zip的基因和蛋白长度跨度较大,HD-Zip Ⅲ和Ⅳ的基因长度约2000 bp,HD-Zip Ⅰ和Ⅱ在1000 bp以下,该结果与分子量具有相关性,而等电点主要取决于氨基酸中酸性氨基酸和碱性氨基酸的数量比,大多数蛋白(76.2%)等电点小于7.0,证明荆芥HD-Zip可能是一类酸性蛋白。

      表 1  荆芥HD-Zip基因家族的蛋白特征

      Table 1.  Protein characteristics of HD-Zip gene family in S. tenuifolia

      亚家族基因ID CDS长
      度/bp
      蛋白长
      度/个
      分子量/
      kDa
      等电点染色体亚家族基因ID CDS长
      度/bp
      蛋白长
      度/个
      分子量/
      kDa
      等电点染色体
      HD-Zip ⅠSch00000318190029933.8474.88Chr 01Sch00000383152817520.3318.58Chr 01
      Sch00001677789729834.3796.55Chr 04
      Sch00001948682227331.1004.59Chr 04HD-Zip ⅢSch000001735256285393.3065.74Chr 01
      Sch00002649892730835.3505.01Chr 06Sch000019857251183691.4615.94Chr 04
      Sch00000872582227331.0344.83Chr 02Sch000014693249383091.0215.84Chr 03
      Sch00000599791230334.3694.97Chr 02Sch000026324258686194.1836.14Chr 06
      Sch00002032896632135.7304.81Chr 04Sch000028231252984292.4346.17Chr 06
      Sch00001642486728832.6336.32Chr 04
      Sch00001790287929233.2076.07Chr 04HD-Zip ⅣSch000026062216672179.0715.98Chr 06
      Sch00000247487629132.5315.7Chr 01Sch000008059216372079.0566.23Chr 02
      Sch00000898369623126.8326.32Chr 02Sch000029960218172679.5265.64HiC_scaffold_8
      Sch00000683169323026.6156.96Chr 02Sch000011892241880587.9135.79Chr 03
      Sch00001927860019922.6738.44Chr 04Sch000009216219673179.8885.79Chr 02
      Sch00002165154618121.7885.84Chr 05Sch000019506240079987.0736.04Chr 04
      Sch00001373865421724.9347.59Chr 03Sch000012322249082991.5025.41Chr 03
      Sch00001671062120624.4725.44Chr 04Sch000012213249082991.5025.41Chr 03
      Sch000004651249082991.5025.41HiC_scaffold_100
      HD-Zip ⅡSch000028530891296327.3607.52Chr 06Sch000018911207068977.0616.28Chr 04
      Sch00001096687929232.6237.62Chr 03Sch000005323194464773.2647.27Chr 02
      Sch000019272795264294.9508.59Chr 04Sch000022402230776884.1805.81Chr 05
      Sch00000831678326029.0938.12Chr 02Sch000024046227475784.2796.15Chr 06
      Sch00002544787929232.3519.05Chr 06Sch000008675188462769.9056.18Chr 02
      Sch00001195164521424.3348.24Chr 03
        说明:CDS指蛋白编码区

      图  1  荆芥HD-Zip基因家族的染色体定位

      Figure 1.  Chromosome mapping of HD-Zip gene family in S. tenuifolia

    • 将以上42条蛋白序列与已知的HD-Zip蛋白序列进行ML树的构建(图2),可知:荆芥的HD-Zip和拟南芥及其他物种HD-Zip的蛋白序列被聚为四大支,与已表征HD-Zip基因家族的4个亚家族分类一致,且在荆芥基因组中,每个亚家族基因的占比与拟南芥的HD-Zip Ⅰ ~Ⅳ之间的比例相似,其中HD-Zip Ⅰ与Ⅳ占比最大,HD-Zip Ⅲ占比最少。从进化树中可以发现:HD-Zip Ⅲ先与Ⅳ聚为一支,再与HD-Zip Ⅰ和Ⅱ聚为一支,说明HD-Zip Ⅲ可能与Ⅳ的亲缘关系更近。

      图  2  荆芥与拟南芥及其他物种HD-Zip基因家族的最大似然值进化树

      Figure 2.  ML evolutionary tree of HD-Zip gene family between S. tenuifolia and A. thaliana and other species

    • 利用TBtools软件绘制荆芥HD-Zip基因结构图,分析基因内含子和外显子的分布情况。图3显示:HD-Zip Ⅰ与Ⅱ的基因长度较为相近,内含子1~3个(实线),外显子2~4个(黄色标识),基因结构比较简单。HD-Zip Ⅲ与Ⅳ基因长度较为接近,内含子8~17个,外显子9~17,其中HD-Zip Ⅲ的内含子和外显子的数量最多。以上基因结构和长度结果与ML进化树聚类结果较为一致。

      图  3  荆芥HD-Zip基因家族的基因结构分析

      Figure 3.  Gene structure analysis of HD-Zip gene family in S. tenuifolia

      利用在线网站MEME对42条HD-Zip基因家族的蛋白序列进行保守基序(Motif)的检索,一共确认了10个不同的基序(图4)。其中,所有蛋白均存在Motif 1~3,这3个保守基序构成了HD-Zip基因家族特征的保守基序HD、LZ。HD-Zip Ⅲ和Ⅳ的Motif 4、Motif 5构成HD-Zip Ⅲ和Ⅳ特有的START保守结构域。从Motif结构分布上看到,HD-ZipⅢ和Ⅳ的Motif最为丰富,可能具有多样的生物学功能,每个亚家族之间的Motif分布较为一致。

      图  4  荆芥HD-Zip基因家族的保守基序分析

      Figure 4.  Conservative motif analysis of HD-Zip gene family in S. tenuifolia       

    • 提取荆芥HD-Zip的5′UTR上游的2 kb序列为启动子序列,利用在线网站PlantCARE进行顺式元件的预测,其中光响应的顺式元件出现频率最高,其次为脱落酸响应元件,MeJA响应元件,厌氧感应元件以及MYB结合的位点(图5)。说明该基因家族可能与以上的生物学功能相关。

      图  5  荆芥HD-Zip基因家族的顺式作用元件分布

      Figure 5.  Distribution of cis-acting elements of HD-Zip gene family in S. tenuifolia

      对荆芥的42个HD-Zip家族基因进行基因组内串联重复分析,发现Sch000008983和Sch000006831在Chr 02上串联重复,Sch000012213与Sch000012322在Chr 03上串联重复(图6);经过基因组内的共线性分析发现,荆芥的9个HD-Zip家族基因在基因组内存在共线性,说明成对的共线性基因可能具有极为相似的功能(图7)。通过荆芥与拟南芥的基因组之间的共线性分析发现:一共有37对共线性的HD-Zip基因(图8)。综上,通过与拟南芥HD-Zip基因构建进化树分析及共线性分析,有助于利用拟南芥的基因功能推断荆芥HD-Zip中相应基因的功能。

      图  6  荆芥HD-Zip基因家族的组内串联重复分析

      Figure 6.  Tandem repeat analysis of HD-Zip gene family in genome of S. tenuifolia

      图  7  荆芥HD-Zip基因家族的组内共线性分析

      Figure 7.  Intra-group collinearity analysis of HD-Zip gene family in S. tenuifolia

      图  8  荆芥HD-Zip与拟南芥基因组之间的共线性分析

      Figure 8.  Collinear analysis of HD-Zip gene between S. tenuifolia and A. thaliana genomes

    • 根据课题组前期观察,10 d幼苗的叶子和茎具有丰富的指状腺毛,20 d幼苗的叶子和茎具有较多的头状腺毛和腺鳞,35 d幼苗的叶子和茎具有丰富的腺鳞。因此,对荆芥不同生长时期叶片(10、20、35 d)及根(35 d)进行转录组分析,发现HD-Zip Ⅰ主要在幼叶10 d中表达,HD-ZipⅡ和Ⅲ主要在根中表达,HD-Zip Ⅳ亚家族主要在叶中表达(图9)。研究发现:HD-Zip Ⅳ基因主要调节表皮的分化[12],结合荆芥腺毛的分布情况,推测荆芥的HD-Zip Ⅳ与荆芥腺毛和非腺毛的形成与分化相关。

      图  9  HD-Zip家族基因表达模式

      Figure 9.  HD-Zip family gene expression pattern

    • 本研究从全基因组水平对荆芥的HD-Zip基因家族进行了系统的研究,共鉴定到42个HD-Zip家族的基因,根据识别的DNA序列、结构域、蛋白功能,可将这些序列分为4个亚家族,分别为HD-Zip Ⅰ ~Ⅳ,这与拟南芥、小麦、水稻、玉米Zea mays、土豆Solanum tuberosum、烟草Nicotiana tabacum等中的分类一致[7-9, 13-15]。HD-Zip Ⅰ只含有高保守的HD结构域和位于HD结构域羧基端的LZ结构域;HD-Zip Ⅱ除了HD-Zip Ⅰ具有的HD和LZ保守结构域外,还存在1个高度保守的N-末端;HD-Zip Ⅲ具有HD和LZ保守结构域,以及类固醇合成急性调节蛋白相关的脂质转运结构域(START)和氨基酸序列羧基端的MEKHLA基序,其中START结构域的长度为220个氨基酸且可以结合并转移脂质,MEKHLA基序与许多非生物胁迫应答相关[16-17];HD-Zip Ⅳ结构与HD-Zip Ⅲ非常相似,具有HD、LZ、START结构域,但缺失了MEKHLA基序[18]。荆芥的HD-Zip Ⅰ和Ⅳ亚家族的基因所占比例最高,这与拟南芥HD-ZipⅠ和Ⅳ的比例相似。基因的进化树结果显示:HD-Zip Ⅰ与Ⅱ亲缘关系更近,HD-Zip Ⅲ与Ⅳ亲缘关系更近,由此可以推测以上2个分支可能是由相同的祖先进化而来,或者Ⅳ是由Ⅲ进化来,但在分化过程中丢失了MEKHLA基序[19]。结合基因的结构来看,HD-Zip Ⅲ和Ⅳ的结构比HD-Zip Ⅰ与Ⅱ的结构更为复杂,以上结果说明可能HD-Zip Ⅲ与Ⅳ相比于HD-ZipⅠ和Ⅱ进化程度更高,基因结构更为复杂,以上结果与保守结构域分析和进化树的分析结果一致。这说明HD-Zip家族在物种的亚群内部较为保守,但其具体的基因功能可能会由于基因复制或者进化,以及物种间的差异性从而出现一定的差异。

      分析启动子发现:在每个亚族内部的基因启动子区顺式作用元件类型基本相同,例如MYB结合位点、脱落酸响应元件以及MeJA响应元件在HD-Zip Ⅳ高频出现。同时,同一亚族基因编码蛋白的保守基序也基本相同,HD-Zip Ⅰ ~Ⅳ的表达分析发现:HD-Zip Ⅰ ~Ⅳ具有不同的表达偏好性,说明荆芥中不同HD-Zip家族不同亚家族可能具有不同的生物学功能,但同一亚族各基因的生物学功能基本相同。

      有研究表明:HD-Zip Ⅳ在表皮中特异表达,参与植物表皮细胞的分化,调节毛状体(腺毛和非腺毛)等形成与发育。如烟草中的NtHDG2,拟南芥的PDF2,黄花蒿Artemisia annua的AaHD1和AaHD8,番茄Solanum lycopersicum的SlCD2和SlWo均对毛状体具有调控作用,属于HD-Zip Ⅳ[14, 20-22]。本研究中发现荆芥的HD-Zip Ⅳ亚家族基因大部分在叶片表达,推测可能这些基因与毛状体的发育相关。结合拟南芥与荆芥HD-Zip基因家族的共线性分析,可以推测荆芥HD-Zip基因家族的生物学功能。结合文献,发现Sch000029960与AT4G21750.1及AT4G04890.2为同源基因,AT4G21750.1及AT4G04890.2分别编码拟南芥的GL2-like和PDF2,与拟南芥的表皮发育密切相关。Sch000024046与AT1G79840.2为同源基因,AT1G79840.2编码GL2,在拟南芥中影响表皮细胞的特性,包括毛状体、根毛发育等[23]。在荆芥的叶、茎、花穗等多个部位表面分布着多种腺毛及非腺毛,其中,盾状腺毛即腺鳞被认为是荆芥产生挥发油的“品质载体”[24-25],但是调控荆芥腺鳞生长发育的分子机制还未被报道,本研究中筛选的HD-Zip Ⅳ亚基因家族可能为腺鳞发育调控的候选基因。通过对候选基因功能的验证、共表达分析等为腺鳞生长发育分子机制的阐明提供线索,同时为提高荆芥药用品质提供理论基础。

    • 本研究在荆芥全基因水平上筛选到42条HD-Zip基因序列,并对以上序列的基因结构、保守基序、顺式作用元件等进行了分析。系统发育分析可将42条序列分为4个亚家族(HD-Zip Ⅰ ~Ⅳ)。通过与拟南芥基因组之间的共线性分析、表达模式分析等推测,荆芥的HD-Zip Ⅳ亚家族基因可能在毛状体发育过程中起到重要作用。这些结果为后续荆芥的HD-Zip基因家族的功能研究及表征提供了理论基础。

参考文献 (25)

目录

    /

    返回文章
    返回