-
中药荆芥是唇形科Labiatae植物荆芥Schizonepeta tenuifolia干燥后的地上部分,有解表祛风、透疹止血等功效[1]。荆芥的挥发油、黄酮等活性成分被广泛用于医药、食品和化工等领域[2-3]。
HD-Zip (Homeodomain-leucine zipper protein)基因家族是植物界一类特有的转录因子,在植物的生长发育、适应环境及胁迫应答等方面起到重要作用。HD (Homeodomain)蛋白是由Homeobox (HB)基因编码的高度保守的蛋白质结构域,由60个氨基酸组成。该蛋白中存在1个特征性的三螺旋结构,可以特异结合DNA序列,以此对基因进行调控[4−5]。此外,HD-Zip基因家族还有1个亮氨酸拉链保守结构域(leucine zipper-loop-zipper,LZ),这是蛋白形成二聚体所必需的结构。根据蛋白的序列保守性、蛋白功能、基因结构等,将该家族分为4个亚家族:HD-Zip Ⅰ ~Ⅳ[6]。Ⅰ亚家族主要参与非生物胁迫及环境适应性;Ⅱ亚家族主要与生长素响应相关;Ⅲ亚家族主要参与不同的发育事件,例如顶端分生组织、维管束的发育,还与植物激素调控相关;Ⅳ亚家族主要在植物的表皮中特异性表达,主要调节表皮的分化、毛状体形成等[7]。
目前,HD-Zip基因家族在多种植物中被鉴定并表征,例如拟南芥Arabidopsis thaliana[8]、水稻Oryza sativa[9]、小麦Triticum aestivum[10]等,但尚未有荆芥HD-Zip基因家族的相关研究。本研究以荆芥的基因组作为基础,利用生物信息学方法系统鉴定荆芥HD-Zip基因家族成员,并对其蛋白质理化性质、染色体定位、基因结构、共线性分析以及不同时期的表达规律进行分析,为今后深入研究荆芥基因家族的功能和调控机制奠定基础。
-
荆芥基因组大小为798 Mb,Q20(碱基被测错的概率为1%)为94.67%,Q30(碱基被测错的概率为1‰)为89.41%,说明测序质量较好(Q20≥93%、Q30≥86%),GC含量为39.34%,经过Hi-C组装后,共有696 Mb的基因组序列被定位到6条染色体上(Chr 01~06),占比91.38%。以上数据说明荆芥的基因组质量较好,有助于完整地挖掘HD-Zip基因家族。为了鉴定荆芥中HD-Zip基因,根据4个亚家族HD-Zip Ⅰ、Ⅱ、Ⅲ、Ⅳ的蛋白保守结构域进行筛选,共筛选到42条可能的HD-Zip基因家族序列,其中HD-Zip Ⅰ亚家族16条,HD-Zip Ⅱ亚家族7条,HD-Zip Ⅲ亚家族5条,HD-Zip Ⅳ亚家族14条,并通过在线网站Expasy网站进行蛋白分子量和等电点的预测(表1)。其中40条基因全部定位到对应染色体(Chr 01~06),Sch000029960和Sch000004651未锚定在染色体上(图1)。荆芥HD-Zip基因仅在2~4号染色体上集中分布,说明该基因家族在染色体上分布不均匀。荆芥HD-Zip的基因长度为528~2586 bp;分子量为20.33~94.18 kDa;等电点为4.59~9.05。因此,HD-Zip的基因和蛋白长度跨度较大,HD-Zip Ⅲ和Ⅳ的基因长度约2000 bp,HD-Zip Ⅰ和Ⅱ在1000 bp以下,该结果与分子量具有相关性,而等电点主要取决于氨基酸中酸性氨基酸和碱性氨基酸的数量比,大多数蛋白(76.2%)等电点小于7.0,证明荆芥HD-Zip可能是一类酸性蛋白。
亚家族 基因ID CDS长
度/bp蛋白长
度/个分子量/
kDa等电点 染色体 亚家族 基因ID CDS长
度/bp蛋白长
度/个分子量/
kDa等电点 染色体 HD-Zip Ⅰ Sch000003181 900 299 33.847 4.88 Chr 01 Sch000003831 528 175 20.331 8.58 Chr 01 Sch000016777 897 298 34.379 6.55 Chr 04 Sch000019486 822 273 31.100 4.59 Chr 04 HD-Zip Ⅲ Sch000001735 2562 853 93.306 5.74 Chr 01 Sch000026498 927 308 35.350 5.01 Chr 06 Sch000019857 2511 836 91.461 5.94 Chr 04 Sch000008725 822 273 31.034 4.83 Chr 02 Sch000014693 2493 830 91.021 5.84 Chr 03 Sch000005997 912 303 34.369 4.97 Chr 02 Sch000026324 2586 861 94.183 6.14 Chr 06 Sch000020328 966 321 35.730 4.81 Chr 04 Sch000028231 2529 842 92.434 6.17 Chr 06 Sch000016424 867 288 32.633 6.32 Chr 04 Sch000017902 879 292 33.207 6.07 Chr 04 HD-Zip Ⅳ Sch000026062 2166 721 79.071 5.98 Chr 06 Sch000002474 876 291 32.531 5.7 Chr 01 Sch000008059 2163 720 79.056 6.23 Chr 02 Sch000008983 696 231 26.832 6.32 Chr 02 Sch000029960 2181 726 79.526 5.64 HiC_scaffold_8 Sch000006831 693 230 26.615 6.96 Chr 02 Sch000011892 2418 805 87.913 5.79 Chr 03 Sch000019278 600 199 22.673 8.44 Chr 04 Sch000009216 2196 731 79.888 5.79 Chr 02 Sch000021651 546 181 21.788 5.84 Chr 05 Sch000019506 2400 799 87.073 6.04 Chr 04 Sch000013738 654 217 24.934 7.59 Chr 03 Sch000012322 2490 829 91.502 5.41 Chr 03 Sch000016710 621 206 24.472 5.44 Chr 04 Sch000012213 2490 829 91.502 5.41 Chr 03 Sch000004651 2490 829 91.502 5.41 HiC_scaffold_100 HD-Zip Ⅱ Sch000028530 891 296 327.360 7.52 Chr 06 Sch000018911 2070 689 77.061 6.28 Chr 04 Sch000010966 879 292 32.623 7.62 Chr 03 Sch000005323 1944 647 73.264 7.27 Chr 02 Sch000019272 795 264 294.950 8.59 Chr 04 Sch000022402 2307 768 84.180 5.81 Chr 05 Sch000008316 783 260 29.093 8.12 Chr 02 Sch000024046 2274 757 84.279 6.15 Chr 06 Sch000025447 879 292 32.351 9.05 Chr 06 Sch000008675 1884 627 69.905 6.18 Chr 02 Sch000011951 645 214 24.334 8.24 Chr 03 说明:CDS指蛋白编码区 Table 1. Protein characteristics of HD-Zip gene family in S. tenuifolia
-
将以上42条蛋白序列与已知的HD-Zip蛋白序列进行ML树的构建(图2),可知:荆芥的HD-Zip和拟南芥及其他物种HD-Zip的蛋白序列被聚为四大支,与已表征HD-Zip基因家族的4个亚家族分类一致,且在荆芥基因组中,每个亚家族基因的占比与拟南芥的HD-Zip Ⅰ ~Ⅳ之间的比例相似,其中HD-Zip Ⅰ与Ⅳ占比最大,HD-Zip Ⅲ占比最少。从进化树中可以发现:HD-Zip Ⅲ先与Ⅳ聚为一支,再与HD-Zip Ⅰ和Ⅱ聚为一支,说明HD-Zip Ⅲ可能与Ⅳ的亲缘关系更近。
-
利用TBtools软件绘制荆芥HD-Zip基因结构图,分析基因内含子和外显子的分布情况。图3显示:HD-Zip Ⅰ与Ⅱ的基因长度较为相近,内含子1~3个(实线),外显子2~4个(黄色标识),基因结构比较简单。HD-Zip Ⅲ与Ⅳ基因长度较为接近,内含子8~17个,外显子9~17,其中HD-Zip Ⅲ的内含子和外显子的数量最多。以上基因结构和长度结果与ML进化树聚类结果较为一致。
利用在线网站MEME对42条HD-Zip基因家族的蛋白序列进行保守基序(Motif)的检索,一共确认了10个不同的基序(图4)。其中,所有蛋白均存在Motif 1~3,这3个保守基序构成了HD-Zip基因家族特征的保守基序HD、LZ。HD-Zip Ⅲ和Ⅳ的Motif 4、Motif 5构成HD-Zip Ⅲ和Ⅳ特有的START保守结构域。从Motif结构分布上看到,HD-ZipⅢ和Ⅳ的Motif最为丰富,可能具有多样的生物学功能,每个亚家族之间的Motif分布较为一致。
-
提取荆芥HD-Zip的5′UTR上游的2 kb序列为启动子序列,利用在线网站PlantCARE进行顺式元件的预测,其中光响应的顺式元件出现频率最高,其次为脱落酸响应元件,MeJA响应元件,厌氧感应元件以及MYB结合的位点(图5)。说明该基因家族可能与以上的生物学功能相关。
对荆芥的42个HD-Zip家族基因进行基因组内串联重复分析,发现Sch000008983和Sch000006831在Chr 02上串联重复,Sch000012213与Sch000012322在Chr 03上串联重复(图6);经过基因组内的共线性分析发现,荆芥的9个HD-Zip家族基因在基因组内存在共线性,说明成对的共线性基因可能具有极为相似的功能(图7)。通过荆芥与拟南芥的基因组之间的共线性分析发现:一共有37对共线性的HD-Zip基因(图8)。综上,通过与拟南芥HD-Zip基因构建进化树分析及共线性分析,有助于利用拟南芥的基因功能推断荆芥HD-Zip中相应基因的功能。
-
根据课题组前期观察,10 d幼苗的叶子和茎具有丰富的指状腺毛,20 d幼苗的叶子和茎具有较多的头状腺毛和腺鳞,35 d幼苗的叶子和茎具有丰富的腺鳞。因此,对荆芥不同生长时期叶片(10、20、35 d)及根(35 d)进行转录组分析,发现HD-Zip Ⅰ主要在幼叶10 d中表达,HD-ZipⅡ和Ⅲ主要在根中表达,HD-Zip Ⅳ亚家族主要在叶中表达(图9)。研究发现:HD-Zip Ⅳ基因主要调节表皮的分化[12],结合荆芥腺毛的分布情况,推测荆芥的HD-Zip Ⅳ与荆芥腺毛和非腺毛的形成与分化相关。
Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia
doi: 10.11833/j.issn.2095-0756.20220390
- Received Date: 2022-06-13
- Accepted Date: 2022-11-22
- Rev Recd Date: 2022-11-21
- Available Online: 2023-01-17
- Publish Date: 2023-02-20
-
Key words:
- Schizonepeta tenuifolia /
- HD-Zip gene family /
- expression analysis /
- system evolution
Abstract:
Citation: | ZHOU Peina, DANG Jingjie, SHAO Yongfang, SHI Zunrui, ZHANG Lin, LIU Chanchan, WU Qi’nan. Genome-wide identification and expression analysis of HD-Zip gene family in Schizonepeta tenuifolia[J]. Journal of Zhejiang A&F University, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390 |