-
植物常遭受由生物或非生物环境因子所带来的伤害。胁迫因子在抑制植物生长发育的同时,亦触发其系统性防御反应。例如,为适应干旱胁迫,植物在漫长的进化过程中演化出一系列调控水分吸收、关闭气孔降低水分散失量等机制。深入了解植物对外界的防御反应,对提高植物抗性和农业生产具有十分重要的意义。目前,研究者已在不同植物中发现多个响应外界环境胁迫的基因家族,如荔枝Litchi chinensis Dof基因家族[1]、黄瓜 Cucumis sativus DnaJ基因家族[2]、水稻Oryza sativa ABC1基因家族[3]及MIP基因家族等。其中MIP家族的各种蛋白质成员具有独特和特定的运输功能,是近年来的研究热点。水通道蛋白(AQP)家族属于跨膜通道蛋白MIP超家族[4]。大量研究表明:AQP参与水分子跨膜、调节植物细胞渗透势及响应多种逆境胁迫。AQP已知分类主要为PIPs (plasma membrane intrinsic proteins)、TIPs (tonoplast intrinsic proteins)、NIPs (noduLin 26-like intrinsic proteins)、SIPs (small and basic intrinsic proteins)、XIPs (uncharacterized intrinsic proteins)以及HIPs (hybrid intrinsic proteins)、GIPs (glycerolfacilitato) [5]。 POU等[6]研究发现:拟南芥Arabidopsis thaliana中ATPIP2;7在盐胁迫后,表达丰度降低;烟草Nicotiana tabacum中NtPIP1;1和NtPIP2;1在植株根系的水分运输中起重要作用[7]; 拟南芥ATPIP2;1在胁迫条件下,其胞吞作用受到不同程度的影响[8];烟草NtAQP1参与二氧化碳的渗透[9];拟南芥[10]、玉米Zea mays[11]等植物的TIP亚家族参与植物跨细胞长距离运输水分的过程。随着越来越多物种的测序的完成,在拟南芥、水稻等模式植物上的AQP基因家族信息已比较明确,在番茄Lycopersicon esculentum [12]、龙眼Ferocactus viridescens[13]等植物中也识别出许多AQP基因家族。黄瓜是世界性的重要蔬菜作物,但因其根系分布较浅,因此对水分、盐渍化等胁迫敏感。本研究采用生物信息学方法得到33个CsAQP基因家族的氨基酸序列,在染色体上定位了CsAQP基因家族,对编码的蛋白质理化性质、结构特点等进行分析比较,并建立系统进化树,为CsAQP基因功能研究和响应逆境机制提供理论基础和参考。
-
通过黄瓜完备基因集与参考基因集BLAST比对,并利用Domain HMM模型进行HMMRER搜索,两者取并集[15]。筛选鉴定其含有特定结构域的序列,最终获得33个CsAQP基因家族成员。通过 ClustalW对黄瓜、拟南芥和水稻的AQP家族成员以及番茄、马铃薯XIPs序列进行比对并构建系统进化树,结果显示:CsAQP基因家族成员被分成5个亚家族,分别为PIP、NIP、TIP、SIP、XIP。其中,PIP亚族的CsAQP基因家族成员数量最多,有14个成员;NIP与TIP亚族的CsAQP基因家族成员数量等同,均为8个;SIP亚族有2个成员;XIP亚族的数量最少,仅1个成员。黄瓜水通道蛋白的系统进化聚类模式与参考植物相似,大部分CsAQP基因家族成员呈现出与同一亚家族中的其他成员聚集的趋势。根据多物种进化结果和黄瓜单物种进化结果,结合已有的同源基因对CsAQP基因家族成员命名。具体结果见表1。
基因名称 编码蛋白数量/个 分子量/kD 电荷残基数/个 分子式 理论等电点 (−) (+) CsNIP1;1 276 29.45 14 20 C1357H2126N346O373S6 9.58 CsNIP2;1 288 30.55 15 22 C1377H2170N368O391S13 9.40 CsNIP2;2 261 27.62 20 17 C1242H1956N324O359S14 6.05 CsNIP3;1 249 26.01 12 15 C1183H1877N311O327S10 8.86 CsNIP4;1 269 28.88 16 17 C1331H2100N326O358S15 7.67 CsNIP5;1 298 30.80 15 18 C1399H2200N366O394S11 8.63 CsNIP6;1 304 31.52 18 20 C1422H2263N369O413S12 8.26 CsNIP7;1 268 28.45 8 8 C1312H2018N320O360S13 6.88 CsPIP1;1 292 31.43 24 25 C1451H2228N370O395S8 7.67 CsPIP1;2 292 31.37 23 24 C1451H2225N367O392S9 7.68 CsPIP1;3 286 30.76 17 24 C1423H2188N364O380S9 9.23 CsPIP1;4 292 31.40 24 25 C1450H2225N369O395S8 7.67 CsPIP2;1 284 29.92 17 17 C1390H2107N347O374S8 7.04 CsPIP2;2 284 30.24 14 18 C1408H2132N354O371S9 8.78 CsPIP2;3 284 29.98 17 18 C1385H2132N348O377S9 7.64 CsPIP2;4 283 30.24 19 20 C1400H2143N353O377S9 7.63 CsPIP2;5 276 29.37 14 21 C1359H2101N351O356S10 9.36 CsPIP2;6 279 29.72 13 18 C1372H2131N351O368S9 8.97 CsPIP2;7 287 30.52 16 22 C1415H2152N362O377S8 9.11 CsPIP2;8 280 29.85 15 21 C1379H2123N357O368S8 9.24 CsPIP2;9 191 20.26 9 16 C939H1436N242O245S7 9.51 CsPIP2;10 290 31.25 15 21 C1439H2226N372O381S13 9.10 CsSIP1;1 243 25.59 7 12 C1206H1865N287O307S9 9.41 CsSIP2;1 238 25.93 11 21 C1213H1901N303O309S8 10.00 CsTIP1;1 250 25.72 12 8 C1202H1836N292O326S4 5.64 CsTIP1;2 253 26.29 11 8 C1248H1908N298O319S3 6.03 CsTIP1;3 254 26.53 14 8 C1238H1856N296O337S8 5.30 CsTIP2;1 248 25.44 10 7 C1195H1813N281O323S5 5.66 CsTIP2;2 250 25.09 10 7 C1177H1815N277O320S4 5.39 CsTIP3;1 289 30.66 18 18 C1425H2155N369O378S5 7.17 CsTIP4;1 247 25.72 12 8 C1206H1858N296O316S5 6.01 CsTIP5;1 255 26.12 9 9 C1193H1847N303O331S12 6.88 CsXIP1;1 319 34.47 20 23 C1581H2487N393O425S21 8.27 Table 1. Nomenclature and physicochemical properties analysis of CsAQP gene family
-
理化性质分析(表1和表2)发现:CsAQP家族成员编码191~319个氨基酸,分子量为20.26~34.47 kDa,仅CsNIP亚族的氨基酸数目与分子量呈正相关;其电荷残基数差异较大,理论等电点为5.30~10.00,多数CsAQP家族成员富含碱性氨基酸。除CsXIP1;1外,其余CsAQP家族成员蛋白质不稳定指数为23.72~39.31,小于40.00,为稳定蛋白。所有成员具有相对较高的脂肪系数,有利于其在应对环境变化中正常发挥功能。CsAQP家族成员含4~7个跨膜域,多数成员含6个。Plant-mPLoc 2.0预测结果显示:大部分成员主要定位于细胞膜,少数位于液泡,个别为两者皆有。SignalP-5.0和ExPASy-ProtScale在线预测结果表明:上述33个CsAQP家族基因均无信号肽,具疏水性。
基因名称 不稳定指数 脂肪系数 跨膜结构域 亚细胞定位 基因名称 不稳定指数 脂肪系数 跨膜结构域 亚细胞定位 CsNIP1;1 28.94 106.67 6 细胞膜 CsPIP2;6 33.09 111.61 6 细胞膜 CsNIP2;1 32.02 93.44 6 细胞膜 CsPIP2;7 29.96 94.91 6 细胞膜 CsNIP2;2 37.94 97.59 6 细胞膜 CsPIP2;8 33.56 101.11 6 细胞膜 CsNIP3;1 37.36 108.55 6 细胞膜 CsPIP2;9 26.40 93.04 4 细胞膜 CsNIP4;1 32.33 113.64 5 细胞膜 CsPIP2;10 35.24 103.90 6 细胞膜 CsNIP5;1 35.91 97.92 5 细胞膜 CsSIP1;1 32.96 113.74 6 细胞膜 CsNIP6;1 26.82 99.24 5 细胞膜 CsSIP2;1 26.14 113.91 5 细胞膜/液泡 CsNIP7;1 39.31 101.98 6 细胞膜 CsTIP1;1 24.91 110.52 7 液泡 CsPIP1;1 30.99 94.62 6 细胞膜 CsTIP1;2 25.33 120.36 7 液泡 CsPIP1;2 33.49 95.62 6 细胞膜 CsTIP1;3 27.98 99.13 6 液泡 CsPIP1;3 29.78 96.26 6 细胞膜 CsTIP2;1 31.99 111.33 6 液泡 CsPIP1;4 30.85 94.28 5 细胞膜 CsTIP2;2 30.49 118.32 6 液泡 CsPIP2;1 31.99 97.64 6 细胞膜 CsTIP3;1 29.98 102.39 5 液泡 CsPIP2;2 33.61 97.96 6 细胞膜 CsTIP4;1 23.72 123.24 7 液泡 CsPIP2;3 30.51 103.10 7 细胞膜 CsTIP5;1 34.10 103.37 6 细胞膜/液泡 CsPIP2;4 26.21 102.12 6 细胞膜 CsXIP1;1 46.41 108.15 7 细胞膜 CsPIP2;5 29.51 103.51 6 细胞膜 Table 2. Subcellular localization and transmembrane structure prediction of CsAQP gene family
-
蛋白质的二级结构是有规则重复的构象,预测所得结构单元有4种(图1),分别为α-螺旋、延伸链、β-转角、无规则卷曲。结果发现:33条氨基酸序列中,CsNIP4;1、CsPIP2;5、CsSIP1;1、CsSIP2;1、CsXIP1;1以α-螺旋为主要组成部分,其余28个成员则以无规则卷曲为主要组成部分,β-转角结构散布于CsAQP蛋白序列中。
蛋白质三维结构模型由软件SWISS-MODEL建立。通过SWISS-MODEL对黄瓜的33条氨基酸序列进行同源建模。结果表明:绝大多数CsAQP蛋白序列具有十分相似的三维结构,其结构模型如图2所示,各亚家族内成员的相似度较亚家族之间更高。
-
由图3可知:CsAQP基因家族成员映射于1~7号染色体,其中1号染色体上仅含CsTIP3;1;2号、4号、7号染色体各有2个水通道蛋白家族成员;5号染色体所含数量最多,定位到10个CsAQP基因家族成员;6号染色体次之,分布9个CsAQP家族基因。另外,5号染色体上的CsPIP1;1、CsPIP1;2和CsPIP1;4,6号染色体上的CsPIP2;1、CsPIP2;2、CsPIP2;3、CsPIP2;6和CsPIP2;9在各自染色体上形成基因簇,且这些基因之间的同源性较高,推测其功能相对保守。
-
为深入探究黄瓜AQP基因结构功能特征及其氨基酸序列的保守基序,对其33个家族成员进行内含子、外显子数目和位置及保守基序进行分析。结果如图4A所示:成员外显子数目为2~5:NIP亚家族中,除了CsNIP3;1和CsNIP5;1外显子数目为4个之外,其余外显子数目均为5个;PIP亚家族成员含3~4个外显子及2~4个内含子;SIP亚家族成员的外显子与内含子数目均为3个,表现出高度的一致性;TIP亚家族中,CsTIP1;1和CsTIP1;2的基因结构呈现“1个外显子+1个内含子+1个外显子”的模式,两者归属于同一亚家族的次级分组,推测这2个成员在功能及进化上有一定的相似性,其余6个亚家族成员均含有3个外显子;CsXIP1;1的基因结构与CsTIP1;1、CsTIP1;2类似。基因结构在不同亚家族之间存在明显差异,同一亚家族内的差异相对较小,反映出不同亚家族具有不同功能。
利用MEME 5.3.3对CsAQP基因家族进行保守基序分析,可视化结果如图4B,相关基序序列如表3。结果表明:Motif 4的保守序最强;除CsSIP亚族无Motif 1,其余成员均有Motif 1分布。有些Motifs为个别亚家族所特有,如Motif 3、Motif 5、Motif 10只分布于CsPIP亚族中,Motif 9仅为CsPIP亚族的分组1所特有;Motif 13仅存在于在CsTIP亚族中。上述结果表明:同一进化分支上的成员间保守结构域相似性更高。这些CsAQP基因家族成员间具有相同或特有的Motif,导致了它们之间相似或具备其特有的功能分化。
基序 基序序列 基序长度/个 Motif 1 GISGGHJNPAVTFGLFLARKISLVRAILYIIAQCLGAICAC 41 Motif 2 KRNARDSHVPVLAPJPIGFAVFLVHLATGPITGTSMNPARS 41 Motif 3 KDYKDPPPAPLIDPEELTKWSFYRAIIAEFVATLLFLYVTVLTVIGYNRQ 50 Motif 4 KAWDDHWIYWVGPFIGAAJAALYYQFILR 29 Motif 5 LVKAFQKAYYNRYGGGANSLADGYSKGTGLAAEIIGTFVLVYTVFSATDP 50 Motif 6 DGNTCGGVGILGIAWAFGGMIFVLVYCTA 29 Motif 7 RFEEATSPSAJRALLAEFISTFJLVFAGVGS 31 Motif 8 FGTAPGVSALQAFVLEIIITFGLVYVVY 28 Motif 9 MEGKEEDVRLGANKFNERQPI 21 Motif 10 AVKALGSFRSS 11 Motif 11 NQKYNGVVTLIGIAAVAGLIVMVMIYSVG 29 Motif 12 FGAAVIFN 8 Motif 13 KLTSDGAATPAGLVVAAIAHAFALFVAVS 29 Motif 14 TAAQSQDD 8 Motif 15 FTLKGVFHPIM 8 Table 3. MEME program recognizes CSAQP related base sequence information
-
利用DNAMAN对黄瓜水通道蛋白的氨基酸序列进行多序列比对,对其一致性分析,所有CsAQP成员序列、CsNIP序列、CsPIP序列、CsTIP序列、CsSIP序列一致性分别为35.04%、47.66%、73.38%、58.36%、29.27%。CsAQP蛋白具保守性,且有多个保守位点,总体而言其序列保留相对变异性。CsNIP中序列N-端保留变异性,而近C-端具有高度保守性。CsPIP序列的保守频率高于其他几个亚家族。CsTIP序列的N、C两端均具保守性,但近N-端有部分序列保留变异性。
-
为了进一步研究CsAQP基因启动子区的顺式作用元件,本研究使用PlantCARE在线工具分析了CsAQP基因家族转录起始位点的上游1 500 bp区域。鉴定出的元件与激素、光响应及抗逆性相关,大部分CsAQP基因家族含WUN-motif作用元件,且所有成员的转录起始位点上游均含TATA盒以及CAAT-box。其中,BOX 4、G-Box、GT1-motif、LAMP-element、ACE、GATA-motif、I-box、AE-box、TCCC-motif、chs-CMA1a、3-AF1 binding site、sp1、Box Ⅱ、CAG-motif、ACA-motif、GA-motif、L-box、MRE (与光反应相关的MYB结合位点)元件功能涉及调控植物光反应;ABRE为脱落酸应答元件;MBSI为MYB结合位点,参与植物体中类黄酮生物的合成;AUXRE(生长素相关)、AUXRR-CORE(生长素相关)、TGA-element(生长素相关)、GARE-motif(赤霉素相关)、P-box(赤霉素相关)、ERE(乙烯应答相关)、CGTCA(茉莉酸甲酯相关)、TCA-element(水杨酸反应相关)元件功能涉及植物激素调控;TC-rich repeats(参与防御和应激反应)、LTR(响应低温)、MBS(MYB结合位点,与干旱相关)、circadian(参与昼夜节律控制)、MSA-like(参与细胞周期调节)、HD-ZIP Ⅰ(参与栅栏叶肉组织的分化)、CAT-box(与分生组织表达有关)、motif I(调节根特异性)、RY-element(种子特异性调控相关)元件功能涉及植物的应激反应以及生长发育。
从元件类型来看,光响应元件种类最多,于各CsAQP基因启动子区域均有分布。从单个元件的具体分布来看,91%家族成员启动子区分布BOX 4;61%成员启动子区含ABRE元件。从单个基因家族成员来看,CsXIP1;1作为新成员,其基因启动子富含激素调控相关元件,例如ERE、P-box、TGACG元件,且含与胚乳表达相关的GCN4-motif元件;CsNIP2;1、CsNIP5;1、CsNIP6;1、CsNIP7;1、CsPIP1;2、CsPIP1;3、CsPIP2;7、CsPIP2;8、CsSIP1;1、CsTIP3;1含1~3个TC-rich repeats元件,涉及植物防御及应激;CsNIP1;1、CsNIP2;2、CsNIP3;1、CsNIP7;1、CsPIP1;3、CsPIP1;4、CsPIP2;1、CsPIP2;2、CsPIP2;3、CsPIP2;8、CsPIP2;9、CsTIP1;2、CsTIP1;3、CsTIP2;1基因启动子区域都含有MBS元件,表明这些基因有可能与MYB转录因子结合,参与响应干旱胁迫的调控。CsAQP基因启动子区的部分元件展示如图5。
-
已有文献表明:串联重复偏向于扩增膜蛋白功能基因以及与生物和非生物胁迫紧密相关的基因[17]。为探究黄瓜AQP基因家族在进化过程中因串联复制之后基因的偏向性保留和选择压力的形式,对33个家族成员进行分析。分析结果显示:黄瓜33个CsAQP基因家族成员之间,5号、6号这2条染色体上共有5对基因具有串联复制关系,分别为CsPIP1;2&CsPIP1;1、CsPIP1;2&CsPIP1;4、CsPIP1;1&CsPIP1;4、CsPIP2;6&CsPIP2;3、CsPIP2;2&CsPIP2;3。Ka/Ks分析(表4)发现:5个基因对的Ka/Ks均小于1,表明这些重复基因对经历纯化选择,消灭群体有害突变,且在进化中较为保守,结构较为稳定,功能具有一致性。
串联重复基因对 Ka Ks Ka/Ks 串联重复基因对 Ka Ks Ka/Ks CsPIP1;2&CsPIP1;1 0.040 0.610 0.659 CsPIP2;6&CsPIP2;3 0.135 0.692 0.196 CsPIP1;2&CsPIP1;4 0.360 0.656 0.055 CsPIP2;2&CsPIP2;3 0.073 1.046 0.070 CsPIP1;1&CsPIP1;4 0.005 0.053 0.096 Table 4. Amplification relationship and Ka/Ks ratio of CsAQP gene in Cucumber
-
为进一步了解CsAQP成员蛋白的互作关系,对33个成员的氨基酸序列进行蛋白质互作预测。结果如图6所示:CsPIP1;1、CsPIP1;2、CsPIP1;3、CsPIP1;4、CsTIP2;2均与CsNIP1;1存在互作关系,且关联性较强。另外,CsSIP2;1与CsTIP、CsPIP、CsNIP亚家族间也有一定的互作关系。上述结果表明:部分成员间存在互作关联性,但各成员间的具体网络机制并不清晰,仍需进一步研究。
Identification and bioinformatics analysis of AQP gene family in Cucumis sativus
doi: 10.11833/j.issn.2095-0756.20210361
- Received Date: 2021-05-10
- Rev Recd Date: 2021-10-13
- Available Online: 2022-03-25
- Publish Date: 2022-03-25
-
Key words:
- Cucumis sativus /
- aquaporin /
- gene family /
- whole genome identification
Abstract:
Citation: | LAI Mengxia, DU Changxia, FAN Huaifu. Identification and bioinformatics analysis of AQP gene family in Cucumis sativus[J]. Journal of Zhejiang A&F University, 2022, 39(2): 318-328. doi: 10.11833/j.issn.2095-0756.20210361 |