留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

黄瓜AQP基因家族的鉴定与生物信息学分析

赖梦霞 杜长霞 樊怀福

李兴鹏, 张杨, 王瑞珍, 等. 碳氮培养条件下伊氏杀线虫真菌的代谢组研究[J]. 浙江农林大学学报, 2022, 39(6): 1313-1320. DOI: 10.11833/j.issn.2095-0756.20210828
引用本文: 赖梦霞, 杜长霞, 樊怀福. 黄瓜AQP基因家族的鉴定与生物信息学分析[J]. 浙江农林大学学报, 2022, 39(2): 318-328. DOI: 10.11833/j.issn.2095-0756.20210361
LI Xingpeng, ZHANG Yang, WANG Ruizhen, et al. Metabolome of nematicidal fungus Esteya vermicola in carbon and nitrogen culture[J]. Journal of Zhejiang A&F University, 2022, 39(6): 1313-1320. DOI: 10.11833/j.issn.2095-0756.20210828
Citation: LAI Mengxia, DU Changxia, FAN Huaifu. Identification and bioinformatics analysis of AQP gene family in Cucumis sativus[J]. Journal of Zhejiang A&F University, 2022, 39(2): 318-328. DOI: 10.11833/j.issn.2095-0756.20210361

黄瓜AQP基因家族的鉴定与生物信息学分析

DOI: 10.11833/j.issn.2095-0756.20210361
基金项目: 浙江省自然科学基金资助项目(LY18C150004, LY18C150003)
详细信息
    作者简介: 赖梦霞(ORCID: 0000-0002-5622-2724),从事蔬菜分子生物学研究。E-mail: 2295803738@qq.com。通信作者:;樊怀福(ORCID: 0000-0002-7308-0094),教授,从事蔬菜逆境生物学研究。E-mail: fanhf@zafu.edu.cn
  • 中图分类号: S642.2

Identification and bioinformatics analysis of AQP gene family in Cucumis sativus

  • 摘要:   目的  深入研究黄瓜Cucumis sativus水通道蛋白(aquaporin, AQP)基因家族(CsAQP)的相关功能。  方法  通过全基因组分析技术鉴定其家族成员,对其蛋白质理化性质、系统进化关系、选择压力、基因结构、保守基序、顺式作用元件、蛋白质互作进行分析。  结果  黄瓜基因组共有33个AQP基因,含有2~5个数量不等的外显子,在染色体上不均匀分布;根据物种进化关系将黄瓜AQP基因家族划分为5个亚家族;基因组重复序列分析表明:5号和6号染色体上各有2~3对基因串联重复;计算这些基因的同义替换(synonymous, Ks)和非同义替换(nonSynonymous, Ka)的比率,结果显示均小于1,表明其进化受纯化选择作用;顺式作用调控元件分析发现,大部分基因启动子区所含元件与激素调节、光响应、胁迫密切相关。  结论  通过黄瓜全基因组扫描,获得黄瓜基因组的33个AQP家族成员,分属于5个亚族,映射于7条染色体上。上游启动子区含逆境相关作用元件,且部分基因参与串联复制,历经纯化选择。图6表4参26
  • 松材线虫Bursaphelenchus xylophilus病在亚洲和欧洲造成严重的生态和经济损失[1-2],伊氏杀线虫真菌Esteya vermicola (EV菌)是松材线虫的内寄生真菌,产生的新月形孢子能侵染并杀死松材线虫,在松材线虫的生物防治方面具有良好的应用前景[3]。同时,EV菌亦可侵染拟松材线虫B. mucronatus、水稻干尖线虫Aphelenchoides besseyi等线虫。研究表明:EV真菌胞内存在共生细菌[4],共生细菌对真菌的生物学和生态学具有重要的作用,如Rhizopus microsporus胞内的共生细菌Burkholderia能产生植物毒素根霉素,然后由宿主真菌分泌到环境中,导致水稻枯萎病[5]。菌丝内的共生微生物(细菌或病毒)是重要的能直接或间接改变真菌和宿主关系的互作生物[6-8],提高宿主真菌的生态适应性[9-10]。存在共生细菌的真菌对碳氮源如何响应,其代谢产物发生何种变化,目前尚未见相关报道。

    代谢组学是系统生物学研究中非常重要的一个环节,旨在研究生物体或组织,甚至单个细胞的全部小分子代谢物成分及其动态变化[11]。通过对代谢物质的分析,可以从生物样本中检测并筛选出具有重要生物学意义和显著差异的代谢物质,并以此为基础研究生物体的代谢过程和变化机制[12]。对EV菌在不同碳、氮培养条件下代谢物的变化进行分析,明确显著差异代谢物,特别是重要的信号分子,不仅为EV菌的应用提供重要理论基础,而且对深入研究内共生细菌在EV菌的功能亦具有重要意义。

    伊氏杀线虫真菌Esteya vermicola CBS115803购于荷兰菌物保存中心。

    碳培养基为24 g 马铃薯葡萄糖肉汤培养基(PDB,Becton, Dickinson and Company,美国)和10 g琼脂溶于1 L双蒸水。氮培养基为5 g酵母粉(OXOID公司,英国)和10 g琼脂溶于1 L双蒸水。

    Nano高分辨液质联用分析仪QE (Thermo Q-Exactive,德国);赛多利斯BSA124S电子天平;真空浓缩仪(Labogene MaixVac Alpha, 丹麦);Sigma 3-30KS高速离心机,KQ5 200DE型数控超声波清洗器(昆山市超声仪器有限公司,中国);色谱级甲醇(Fisher,美国)。

    配制碳、氮固体培养基,培养基凝固后放入已灭菌的尼龙膜(孔径3 μm,赛多利斯),接种EV菌后于25 ℃培养7 d。将长满菌丝和孢子的尼龙膜用无菌镊子取出,用超纯水冲洗尼龙膜,再用无菌的吸水纸吸掉尼龙膜接触培养基面的水分,而后将菌丝和孢子刮入2 mL圆底灭菌干燥离心管,装样品前后分别称量离心管的质量,迅速将样品管放入液氮中淬灭后于−80 ℃保存。每处理设置5次生物学重复,编号依次为C1~C5和N1~N5。加入冷冻洁净无菌的直径为3 mm的钢珠2个,液氮冷冻条件下使用莱驰RETSCH MM 400研磨2 min。将研磨好的样品管置于干冰上,加入2 mL预冷的体积分数为80%甲醇于−80 ℃冰箱静置1 h,4 ℃、14 000 g离心20 min后将上清液转移至另一相同体积离心管,真空浓缩干燥样品后于−80 ℃保存。用300 μL体积分数为90%甲醇超声复溶并经0.45 μm的滤膜过滤,完成亲水代谢产物提取。

    采用非靶标的高效液相色谱-质谱联用技术(HPLC-MS)对样品进行测定和代谢物识别。色谱柱:Waters ACQUITY UPLC®(2.1 mm×100.0 mm,1.7 μm)。流动相:0.1%甲酸-水溶液(A),0.1%甲酸-乙腈(B)。洗脱条件:0~0.5 min,95%B;0.5~7.0 min,95%~65% B;7.0~8.0 min,65%~40% B;8.0~9.0 min,40%B;9.0~9.1 min,40%~95%B;9.1~12.0 min,95%B。质谱参数条件:鞘气,310 275 Pa;辅助气,103 425 Pa;喷雾电压,4 000 V (正)/3 500 V (负);离子传输管温度:350 ℃。在采集软件(Xcalibur 4.0.27,Thermo)的控制下,采用一级质谱全扫描(全MS)结合自动触发二级质谱扫描(MS/MS)模式,使用阴、阳离子模式2种电离方式采集质谱数据。运行时间:0~18 min。分辨率:全MS,170000;MS/MS,17500。

    对原始数据进行基线过滤、峰识别、积分、保留时间校正、峰对齐和归一化,最终得到1个保留时间、质荷比和代谢物信号(峰面积)的数据矩阵。将处理后的代谢物信号与一级和二级数据库进行匹配,将其中二级得分<30的化合物可信予以剔除。分析时10份样品共插入3个质量对照(QC)样本以考察整个分析过程中仪器的稳定性,QC样本每种化合物的峰面积的变异系数若>30%,则予以剔除。未检出值设定为0,缺失值由其余重复样品的均值填补。

    由Metaboanalyst 4.0在线软件(https://www.metaboanalyst.ca/MetaboAnalyst/home.xhtml)完成。利用对数转换和pareto缩放对各代谢物相对含量进行标准化处理。使用主成分分析法(PCA)和偏最小二乘法判别法(PLS-DA)评估不同处理的分组情况。结合以下2个标准对2种培养基的阴阳离子模式的差异化合物进行筛选:经FDR (false discovery rate)校正的t检验的P<0.05;正交偏最小二乘判别分析(OPLS-DA)中变量投影重要性(variable influence on projection,VIP)得分>1。

    代谢通路分析由Metaboanalyst 4.0 (https://www.metaboanalyst.ca/MetaboAnalyst/upload/PathUploadView.xhtml)中的代谢通路分析模块(pathway analysis module)完成。该分析将选定的差异代谢物与KEGG (Kyoto encyclopedia of genes and genomes)数据库(2019年10月)和人类代谢组数据库(HMDB)进行匹配,然后选择酵母Saccharomyces cerevisiae的代谢通路库作为参照进行富集分析和拓扑分析。富集分析中采用参数超几何法(hypergeometric test)检验每个代谢通路的显著性(P<0.05);拓扑分析中差异显著性检验的方法为相对介数中心性(relative-betweeness centrality)。

    阳离子模式下鉴定到的化合物多于阴离子模式下鉴定的化合物。阴、阳离子模式分别检测出279和461种化合物,其中74种为2种模式共同检出,共计666种化合物。通过质量控制过滤处理,阴、阳离子模式分别有176和362种化合物,其中2种模式共同含有40种化合物,共计498种化合物。数据总的缺失值的比例平均为0.74%:阴离子模式下,碳和氮培养基下的代谢物缺失率均为0.23%;阳离子模式下,碳培养基下的缺失率为2.38%,高于氮培养基0.11%。

    阴离子和阳离子模式下EV菌菌丝体代谢物的主成分分析得分图(图1A~B)显示:前2个主成分分别解释了94.9% (主成分1为92.5%,主成分2为2.4%)和92.5% (主成分1为89.5%,主成分2为3.0%)的变异。2种离子模式下EV菌代谢谱在碳、氮培养基培养后差异大,分组明显。偏最小二乘法判别法的分组结果(图1C~D)与主成分分析法结果一致。

    图 1  碳、氮培养条件下EV菌代谢物的PCA和PLS-DA分析
    Figure 1  PCA and PLS-DA of EV metabolites under carbon and nitrogen culture conditions

    采用火山图的形式进行差异化合物展示,见图2t检验差异显著(P<0.05)的化合物共有444种,占总数的89.2%;阴离子和阳离子模式分别有162和310种,28种为2种模式共有。VIP>1的化合物共有469种,占总数的94.2%;阴离子和阳离子模式分别有167和334种,32种为2种模式共有。利用VIP>1筛选出的化合物包含t检验法的筛选结果,表明后者更严格,且更符合统计要求。

    图 2  碳、氮培养条件下EV菌的差异代谢物
    Figure 2  Differential metabolites of EV bacteria under carbon and nitrogen culture conditions

    以碳为对照组,在氮组中上调代谢物的数量是下调的3.4倍,分别为342和102种;上调和下调代谢物分别有309和86种匹配到HMDB数据库,有159和71种匹配到KEGG数据库。磷酸胍基乙酸酯和对甲酚硫酸盐是在氮培养下大量产生的特有代谢物,尿囊素、光色素、吲哚和海藻糖等是代谢物在氮培养条件下显著上调(表1)。

    表 1  部分差异化合物
    Table 1  Part of significantly different metabolites
    化合物名称质荷比保留时间/min二级数据库得分变化倍数PKEGG编号
    磷酸胍基乙酸酯 198.03 9.86 62 12.46 1.13×10−13 C03166
    对甲酚硫酸盐 187.01 6.17 53 12.41 8.88×10−15
    邻氨基苯甲酸酯 136.04 2.00 50 9.93 1.67×10−8 C00108
    尿酸 190.05 1.29 40 8.26 6.26×10−7 C01717
    尼古丁 163.12 4.68 44 5.51 1.14×10−6 C16150
    4-羟基-2-喹啉羧酸 188.03 5.76 30 5.48 9.62×10−8 C01717
    烟酸 124.04 3.50 41 5.17 1.71×10−7 C00253
    尿囊素 159.05 5.46 50 5.09 2.53×10−4 C01551
    吲哚丙烯酸 188.07 7.98 98 4.20 4.68×10−8
    2-吡咯烷酮 86.06 3.79 41 4.10 2.57×10−5 C11118
    咪唑乙酸 127.05 9.62 69 3.54 1.56×10−7 C02835
    组胺 112.09 5.74 45 3.34 2.79×10−8 C00388
    谷胱甘肽 306.08 1.02 58 3.26 5.97×10−4 C00051
    光色素 243.09 1.58 70 3.00 2.79×10−4 C01727
    肌肽 227.11 12.66 55 2.40 3.30×10−5 C00386
    甜菜碱醛 102.09 6.73 68 2.25 9.68×10−3 C00576
    吲哚 118.07 8.32 57 2.12 4.40×10−3 C00463
    苹果酸 133.01 0.90 43 1.90 2.86×10−5 C00711
    甜菜碱 118.09 8.30 51 1.88 2.79×10−8 C00719
    胍基乙酸d 118.06 8.26 38 1.87 1.19×10−3 C00581
    葫芦巴碱 138.06 9.05 38 1.59 1.71×10−7 C01004
    海藻糖 341.11 1.04 78 1.34 6.16×10−5 C01083
    左旋肉碱 162.11 9.31 72 1.34 2.97×10−6 C00318
    邻乙酰左旋肉碱 204.12 8.54 73 1.32 1.69×10−6 C02571
    茶碱 181.07 2.24 55 −1.64 6.07×10−7 C07130
    二乙醇胺 106.09 8.16 45 −1.73 1.42×10−4 C06772
    去甲肾上腺素 170.08 5.83 57 −2.40 1.52×10−5 C00547
    阿魏酸盐 193.05 5.36 32 −3.58 2.87×10−5 C01494
    核糖醇 151.06 1.01 46 −4.08 3.13×10−8 C00474
    甲基咪唑乙酸 141.07 9.52 41 −4.51 2.90×10−8 C05828
    赤藓糖醇 121.05 1.04 75 −5.20 2.80×10−5 C00503
    下载: 导出CSV 
    | 显示表格

    表2图3可见:利用KEGG数据库对氮培养中上调和下调的显著差异代谢产物进行富集分析。上调代谢产物主要富集到氨基酸代谢通路,包括氨酰基tRNA的生物合成,精氨酸和脯氨酸代谢,精氨酸生物合成,牛磺酸和低牛磺酸代谢,丙氨酸、天冬氨酸和谷氨酸代谢。下调的显著差异代谢产物主要涉及糖类代谢通路,包括氨基糖和核苷酸糖代谢、半乳糖代谢、戊糖和葡萄糖醛酸酯的相互转化、淀粉和蔗糖代谢。

    表 2  碳、氮培养条件下EV菌差异代谢物富集到的KEGG通路
    Table 2  Enriched KEGG pathways by differential metabolites of EV under carbon and nitrogen culture conditions
    代谢通路编号代谢通路名称匹配情况P影响大小
    上调 sce00970 氨酰基tRNA的生物合成 18/46 4.38×10−4 0.11
    sce00330 精氨酸和脯氨酸代谢 10/25 7.53×10−3 0.33
    sce00220 精氨酸生物合成 8/18 8.05×10−3 0.60
    sce00430 牛磺酸和低牛磺酸代谢 4/7 2.28×10−2 1.00
    sce00250 丙氨酸、天冬氨酸和谷氨酸代谢 8/22 3.06×10−2 0.81
    下调 sce00520 氨基糖和核苷酸糖代谢 8/24 3.41×10−4 0.48
    sce00052 半乳糖代谢 5/17 8.98×10−3 0.82
    sce00040 戊糖和葡萄糖醛酸的相互转化 4/12 1.22×10−2 0.27
    sce00500 淀粉和蔗糖代谢 4/15 2.79×10−2 0.35
      说明:匹配情况为匹配化合物个数/通路化合物总数
    下载: 导出CSV 
    | 显示表格
    图 3  差异代谢产物富集到的显著代谢通路
    Figure 3  Significant metabolic pathways enriched by differential metabolites

    本研究在代谢组水平探究含内共生细菌的生防真菌EV菌对不同碳氮培养基的化学响应,鉴定到一些差异显著的化合物,尤其是在氮源培养基中特有的代谢产物,并定位到重要代谢途径上。磷酸胍基乙酸酯和对甲酚硫酸盐是在氮培养下EV菌大量产生的特有代谢物,尿囊素、光色素、吲哚和海藻糖等是氮培养条件下显著上调的代谢物。对甲酚硫酸盐是细菌代谢酪氨酸的产物[13]。已有研究证实:拟杆菌科Bacteroidaceae、双歧杆菌科Bifidobacteriaceae、梭菌科Clostridiaceae、肠杆菌科Enterobacteriaceae、肠球菌科Enterococcaceae、优杆菌科Eubacteriaceae、梭杆菌科Fusobacteriaceae、毛螺菌科Lachnospiraceae、乳杆菌科Lactobacillaceae、紫单胞菌科Porphyromonadaceae、葡萄球菌科Staphylococcaceae、疣微菌科Ruminococcaceae和韦荣氏菌科Veillonellaceae等细菌是对甲酚硫酸盐的产生菌[14]。已有研究表明:细菌也可以降解对甲酚[15],真菌Trichosporon cutaneumAspergillus fumigatus也可以利用对甲酚作为碳源[16-17]。因此推测:对甲酚硫酸盐可能是在高氮源培养下,由于碳源严重缺乏,EV菌胞内共生细菌代谢酪氨酸产生对甲酚或对甲酚硫酸盐,从而将其做为碳源进一步利用。

    多种革兰氏阳性细菌和革兰氏阴性细菌(迄今为止共有85种)都会产生大量的吲哚。作为细胞间信号分子,吲哚控制细菌生理的多个方面,例如孢子形成、质粒稳定性、耐药性、生物膜形成和吲哚产生细菌的毒力[18]。在细菌中,吲哚由氨基酸色氨酸的降解产物产生。吲哚是细菌Ⅲ型分泌系统表达的信号分子[19]。EV真菌细菌共生体可产生吲哚,根据上述目前的研究只在细菌发现吲哚的产生,因此我们推测胞内细菌可能是吲哚的产生者,细菌可以利用吲哚这一信号分子协调两者行为,以在真菌胞内生存。

    前期研究表明:EV菌基因组中含有比其他杀线虫真菌,如Arthrobotrys oligosporaDactylellina haptotylaDrechmeria coniospora更多的尿囊素转运蛋白[20]。此外,EV菌胞内的共生细菌属于假单孢属Pseudomonas[6]。尿囊素是腺嘌呤和鸟嘌呤代谢的中间产物,尿囊素可以被某些真菌、细菌和植物用作碳和氮的来源,尿囊素或尿囊素通路的衍生物可能有助于提高真菌向宿主植物提供氮的能力[21]。如在一些外生菌根真菌中,已鉴定出尿囊素/尿囊酸转运蛋白[21-22]。研究发现:假单孢属的细菌和酵母Saccharomyces cerevisiae也可以降解尿囊素[23-24]。在氮源充足的氮培养条件下,尿囊素代谢产物约是碳培养条件下的32倍,因此,尿囊素很可能是EV菌供给胞内共生细菌氮源的一种形式。

    海藻糖在自然界中分布广泛,包括细菌、真菌、植物、无脊椎动物和哺乳动物。由于其特殊的物理特性,海藻糖能够保护细胞的完整性免受各种环境损害和营养限制。细菌可以使用海藻糖作为碳和能量的唯一来源,一些分枝杆菌中海藻糖可作为细胞壁的结构成分,而酵母细胞在很大程度上不能以海藻糖为碳源生长[25]。在根瘤菌-豆科Leguminosae植物共生期间,海藻糖在根瘤发育过程中被储存在根瘤中,并成为细菌的主要碳水化合物,而与所供应的碳源和氮源类型无关[26]。内源性海藻糖在碳缺乏或在给定培养基中碳源耗尽后被动员。海藻糖很可能是EV共生细菌的一种碳源,在碳源缺乏时作为储备能源(氮培养下产生的海藻糖是碳培养下的2.5倍)。

    光色素是核黄素的光敏分解产物。关于光色素的酶促转化路径已在假单胞菌等细菌中进行研究[27]。已有研究认为:光色素是细菌群感效应的信号分子[28],是能影响植物生长的细菌信号分子[29],同时也是共生的信号分子[30-31]。不同的营养条件(如氮和磷)可改变细菌产生光色素的浓度[30]。本研究使用的氮源是有机氮源。在该氮培养下产生的光色素是碳培养下的8倍,氮培养条件下光色素的产量远高于碳培养条件,不同于前人报道的高浓度硝酸盐降低光色素的产量[30]

    差异最显著的代谢物多数未能富集到显著的代谢通路,原因在于这些化合物的代谢通路尚未研究透彻,或者它们是EV菌的特异化合物,尚未包括在参照数据库中。无论以真菌还是细菌数据库为参照,富集到的显著代谢通路基本一致,均与氨基酸和糖类代谢相关,而这些通路是真菌和细菌共有的,无法区分内共生细菌对其真菌宿主代谢的影响。笔者曾试图利用多种抗生素去除内共生细菌以解决该问题,并未获得成功,需要更深入的研究。

  • 图  1  CsAQP的二级结构单元分布

    Figure  1  Secondary structure unit distribution of CsAQP

    图  2  CsAQP家族蛋白质的三级结构预测

    Figure  2  Prediction of tertiary structure of CsAQP family proteins

    图  3  CsAQP基因家族成员的染色体位置分布

    Figure  3  Chromosomal location distribution of CsAQP gene family members

    图  4  CsAQP家族成员的基因结构(A)及保守基序预测分析(B)

    Figure  4  Gene structure (A) and conserved motif prediction (B) of CSAQP family members

    图  5  CsAQP基因家族成员上游顺式元件预测

    Figure  5  Prediction of upstream cis elements of CsAQP gene family members

    图  6  CsAQP家族成员蛋白的互作预测

    Figure  6  Prediction of interaction of CsAQP family protein

    表  1  CsAQP基因家族的命名及理化性质分析

    Table  1.   Nomenclature and physicochemical properties analysis of CsAQP gene family

    基因名称编码蛋白数量/个分子量/kD电荷残基数/个分子式理论等电点
    (−)(+)
    CsNIP1;127629.451420C1357H2126N346O373S69.58
    CsNIP2;128830.551522C1377H2170N368O391S139.40
    CsNIP2;226127.622017C1242H1956N324O359S146.05
    CsNIP3;124926.011215C1183H1877N311O327S108.86
    CsNIP4;126928.881617C1331H2100N326O358S157.67
    CsNIP5;129830.801518C1399H2200N366O394S118.63
    CsNIP6;130431.521820C1422H2263N369O413S128.26
    CsNIP7;126828.4588C1312H2018N320O360S136.88
    CsPIP1;129231.432425C1451H2228N370O395S87.67
    CsPIP1;229231.372324C1451H2225N367O392S97.68
    CsPIP1;328630.761724C1423H2188N364O380S99.23
    CsPIP1;429231.402425C1450H2225N369O395S87.67
    CsPIP2;128429.921717C1390H2107N347O374S87.04
    CsPIP2;228430.241418C1408H2132N354O371S98.78
    CsPIP2;328429.981718C1385H2132N348O377S97.64
    CsPIP2;428330.241920C1400H2143N353O377S97.63
    CsPIP2;527629.371421C1359H2101N351O356S109.36
    CsPIP2;627929.721318C1372H2131N351O368S98.97
    CsPIP2;728730.521622C1415H2152N362O377S89.11
    CsPIP2;828029.851521C1379H2123N357O368S89.24
    CsPIP2;919120.26916C939H1436N242O245S79.51
    CsPIP2;1029031.251521C1439H2226N372O381S139.10
    CsSIP1;124325.59712C1206H1865N287O307S99.41
    CsSIP2;123825.931121C1213H1901N303O309S810.00
    CsTIP1;125025.72128C1202H1836N292O326S45.64
    CsTIP1;225326.29118C1248H1908N298O319S36.03
    CsTIP1;325426.53148C1238H1856N296O337S85.30
    CsTIP2;124825.44107C1195H1813N281O323S55.66
    CsTIP2;225025.09107C1177H1815N277O320S45.39
    CsTIP3;128930.661818C1425H2155N369O378S57.17
    CsTIP4;124725.72128C1206H1858N296O316S56.01
    CsTIP5;125526.1299C1193H1847N303O331S126.88
    CsXIP1;131934.472023C1581H2487N393O425S218.27
    下载: 导出CSV

    表  2  CsAQP基因家族的亚细胞定位及跨膜结构预测

    Table  2.   Subcellular localization and transmembrane structure prediction of CsAQP gene family

    基因名称不稳定指数脂肪系数跨膜结构域亚细胞定位基因名称不稳定指数脂肪系数跨膜结构域亚细胞定位
    CsNIP1;128.94106.676细胞膜CsPIP2;633.09111.616细胞膜  
    CsNIP2;132.0293.446细胞膜CsPIP2;729.9694.916细胞膜  
    CsNIP2;237.9497.596细胞膜CsPIP2;833.56101.116细胞膜  
    CsNIP3;137.36108.556细胞膜CsPIP2;926.4093.044细胞膜  
    CsNIP4;132.33113.645细胞膜CsPIP2;1035.24103.906细胞膜  
    CsNIP5;135.9197.925细胞膜CsSIP1;132.96113.746细胞膜  
    CsNIP6;126.8299.245细胞膜CsSIP2;126.14113.915细胞膜/液泡
    CsNIP7;139.31101.986细胞膜CsTIP1;124.91110.527液泡   
    CsPIP1;130.9994.626细胞膜CsTIP1;225.33120.367液泡   
    CsPIP1;233.4995.626细胞膜CsTIP1;327.9899.136液泡   
    CsPIP1;329.7896.266细胞膜CsTIP2;131.99111.336液泡   
    CsPIP1;430.8594.285细胞膜CsTIP2;230.49118.326液泡   
    CsPIP2;131.9997.646细胞膜CsTIP3;129.98102.395液泡   
    CsPIP2;233.6197.966细胞膜CsTIP4;123.72123.247液泡   
    CsPIP2;330.51103.107细胞膜CsTIP5;134.10103.376细胞膜/液泡
    CsPIP2;426.21102.126细胞膜CsXIP1;146.41108.157细胞膜  
    CsPIP2;529.51103.516细胞膜
    下载: 导出CSV

    表  3  MEME程序识别CsAQP相关基序信息

    Table  3.   MEME program recognizes CSAQP related base sequence information

    基序基序序列基序长度/个
    Motif 1 GISGGHJNPAVTFGLFLARKISLVRAILYIIAQCLGAICAC 41
    Motif 2 KRNARDSHVPVLAPJPIGFAVFLVHLATGPITGTSMNPARS 41
    Motif 3 KDYKDPPPAPLIDPEELTKWSFYRAIIAEFVATLLFLYVTVLTVIGYNRQ 50
    Motif 4 KAWDDHWIYWVGPFIGAAJAALYYQFILR 29
    Motif 5 LVKAFQKAYYNRYGGGANSLADGYSKGTGLAAEIIGTFVLVYTVFSATDP 50
    Motif 6 DGNTCGGVGILGIAWAFGGMIFVLVYCTA 29
    Motif 7 RFEEATSPSAJRALLAEFISTFJLVFAGVGS 31
    Motif 8 FGTAPGVSALQAFVLEIIITFGLVYVVY 28
    Motif 9 MEGKEEDVRLGANKFNERQPI 21
    Motif 10 AVKALGSFRSS 11
    Motif 11 NQKYNGVVTLIGIAAVAGLIVMVMIYSVG 29
    Motif 12 FGAAVIFN 8
    Motif 13 KLTSDGAATPAGLVVAAIAHAFALFVAVS 29
    Motif 14 TAAQSQDD 8
    Motif 15 FTLKGVFHPIM 8
    下载: 导出CSV

    表  4  CsAQP基因扩增关系及Ka/Ks比率

    Table  4.   Amplification relationship and Ka/Ks ratio of CsAQP gene in Cucumber

    串联重复基因对KaKsKa/Ks串联重复基因对KaKsKa/Ks
    CsPIP1;2&CsPIP1;10.0400.6100.659CsPIP2;6&CsPIP2;30.1350.6920.196
    CsPIP1;2&CsPIP1;40.3600.6560.055CsPIP2;2&CsPIP2;30.0731.0460.070
    CsPIP1;1&CsPIP1;40.0050.0530.096
    下载: 导出CSV
  • [1] 董晨, 魏永赞, 王弋, 等. 转录组荔枝Dof基因家族的鉴定及其表达[J]. 热带生物学报, 2021, 12(1): 7 − 14.

    DONG Chen, WEI Yongzan, WANG Yi, et al. Transcriptome-wide identification and analysis of the Dof gene family in Litchi chinensis Sonn. [J]. Acta Trop Biol Sin, 2021, 12(1): 7 − 14.
    [2] 宋蒙飞, 王星, 张开京, 等. 黄瓜DnaJ基因家族鉴定及对高温胁迫的表达响应[J]. 南京农业大学学报, 2021, 44(2): 267 − 277.

    SONG Mengfei, WANG Xing, ZHANG Kaijing, et al. Identification of DnaJ gene family in cucumber and its expression response to high temperature stress [J]. J Nanjing Agric Univ, 2021, 44(2): 267 − 277.
    [3] 高清松, 张丹, 徐亮, 等. 水稻ABC1基因家族的鉴定及在非生物胁迫下的表达分析[J]. 中国水稻科学, 2011, 25(1): 1 − 10.

    GAO Qingsong, ZHANG Dan, XU Liang, et al. Systematic identification of rice ABC1 genes and their expression analysis under abiotic stresses [J]. Chin J Rice Sci, 2011, 25(1): 1 − 10.
    [4] KAMMERLOHER W, FISCHER U, PIECHOTTKA G P, et al. Water channels in the plant plasma membrane cloned by immunoselection from a mammalian expression system [J]. Plant J, 1994, 6(2): 187 − 199.
    [5] 吴雪, 杜长霞, 杨冰冰, 等. 植物水通道蛋白研究综述[J]. 浙江农林大学学报, 2015, 32(5): 789 − 796.

    WU Xue, DU Changxia, YANG Bingbing, et al. Research progress in plant aquaporins [J]. J Zhejiang A&F Univ, 2015, 32(5): 789 − 796.
    [6] POU A, JEANGUENIN L, MILHIET T, et al. Salinity-mediated transcriptional and post-translational regulation of the Arabidopsis aquaporin PIP2;7 [J]. Plant Mol Biol, 2016, 92(6): 731 − 744.
    [7] MAHDIEH M, MOSTAJERAN A, HORIE T, et al. Drought stress alters water relations and expression of PIP-type aquaporin genes in Nicotiana tabacum plants [J]. Plant Cell Physiol, 2008, 49(5): 801 − 813.
    [8] 鲁雨晴, 崔亚宁, 张原, 等. 植物水通道蛋白PIPs亚细胞定位转运的研究进展[J]. 电子显微学报, 2020, 39(6): 779 − 786.

    LU Yuqing, CUI Yaning, ZHANG Yuan, et al. Advances in research on subcellular redistribution of plant plasma membrane aquaporin [J]. Acta Electron Sin, 2020, 39(6): 779 − 786.
    [9] UEHLEIN N, LOVISOLO C, SIEFRITZ F, et al. The tobacco aquapor in NtAQP1 is a membrane CO2 pore with physiological functions [J]. Nature, 2003, 425(6959): 734 − 737.
    [10] KALDENHOFF R, KÖLLING A, MEYERS J, et al. The blue light-responsive AthH2 gene of Arabidopsis thaliana is primarily expressed in expanding as well as in differentiating cells and encodes a putative channel protein of the plasmalemma [J]. Plant J, 1995, 7(1): 87 − 95.
    [11] YAMADA S, KATSUHARA M, KELLY W B, et al. A family of transcripts encoding water channel proteins: tissue-specific expression in the common ice plant [J]. Plant Cell, 1995, 7(8): 1129 − 1142.
    [12] 李菲, 何小红, 李育柯, 等. 番茄水通道蛋白基因家族的生物信息学分析[J]. 基因组学与应用生物学, 2018, 37(9): 3950 − 3957.

    LI Fei, HE Xiaohong, LI Yuke, et al. Bioinformatic analysis of tomato aquaporin gene family [J]. Genomics Appl Biol, 2018, 37(9): 3950 − 3957.
    [13] 赵鹏程, 徐小萍, 张春渝, 等. 龙眼Aquaporin家族的全基因组鉴定及其在体细胞胚发生早期的表达[J]. 应用与环境生物学报, 2021, 27(4): 1001 − 1012.

    ZHAO Pengcheng, XU Xiaoping, ZHANG Chunyu, et al. Genome-wide identification of Aquaporin family and expression during early somatic embryogenesis in Dimocarpus longan Lour. [J]. J Appl Environ Biol, 2021, 27(4): 1001 − 1012.
    [14] 黄元城, 郭文磊, 王正加. 薄壳山核桃全基因组LBD基因家族的生物信息学分析[J]. 浙江农林大学学报, 2021, 38(3): 464 − 475.

    HUANG Yuancheng, GUO Wenlei, WANG Zhengjia. Genome-wide identification and bioinformatics analysis of LBD family of transcription factors in Carya illinoensis [J]. J Zhejiang A&F Univ, 2021, 38(3): 464 − 475.
    [15] 吴向阳, 程朝泽, 吕高强, 等. 芝麻AQP家族的全基因组序列鉴定及其特征分析[J]. 中国农业科学, 2016, 49(10): 1844 − 1858.

    WU Xiangyang, CHENG Chaoze, LÜ Gaoqiang, et al. Identification and characterization of the AQP gene family in sesame [J]. Chin Agric Sci, 2016, 49(10): 1844 − 1858.
    [16] GU Zhenglong, CAVALCANTI A, CHEN Fengchi, et al. Extent of gene duplication in the genomes of drosophila, nematode, and yeast [J]. Mol Biol Evol, 2002, 19(3): 256 − 262.
    [17] DASSANAYAKE M, OH D H, HAAS J S, et al. The genome of the extremophile crucifer Thellungiella parvula [J]. Nat Genet, 2011, 43(9): 913 − 918.
    [18] 方璐, 程锋, 武剑, 等. 全基因组与串联复制后白菜基因的保留[J]. 生物技术通报, 2012(11): 9 − 14.

    FANG Lu, CHENG Feng, WU Jian, et al. Gene retention following whole genome duplication and tandem duplication in Brassica rapa [J]. Biotechnol Bull, 2012(11): 9 − 14.
    [19] 冉昆, 孙岩, 孙晓莉, 等. 西洋梨水孔蛋白基因家族的全基因组鉴定及表达分析[J]. 植物遗传资源学报, 2016, 17(2): 326 − 336.

    RAN Kun, SUN Yan, SUN Xiaoli, et al. Identification and expression analysis of the AQPs gene family in Pyrus communis [J]. J Plant Genet Resour, 2016, 17(2): 326 − 336.
    [20] 李乐, 许红亮, 杨兴露, 等. 大豆LEA基因家族全基因组鉴定、分类和表达[J]. 中国农业科学, 2011, 44(19): 3945 − 3954.

    LI Le, XU Hongliang, YANG Xinglu, et al. Genome-wide identification, classification and expression analysis of LEA gene family in soybean [J]. Chin Agric Sci, 2011, 44(19): 3945 − 3954.
    [21] JOHANSON U, KARLSSON M, JOHANSSON I, et al. The complete set of genes encoding major intrinsic proteins in Arabidopsis provides a framework for a new nomenclature for major intrinsic proteins in plants [J]. Plant Physiol, 2001, 126(4): 1358 − 1369.
    [22] ZHOU Yong, CHENG Yuan, WAN Chunpeng, et al. Genome-wide characterization and expression analysis of the Dof gene family related to abiotic stress in watermelon[J/OL]. Peer J, 2020, 8(8): e8358[2021-04-10]. doi: 10.7717/peerj.8358.
    [23] 李露露, 曲长凤, 郑洲, 等. 藻类水通道蛋白的研究进展[J]. 生物技术通报, 2017, 33(8): 1 − 6.

    LI Lulu, QU Changfeng, ZHENG Zhou, et al. Study advances on the algal aquaporins [J]. Biotechnol Bull, 2017, 33(8): 1 − 6.
    [24] 辛士超. 番茄SlAQP基因功能及互作蛋白的初步分析[D]. 北京: 中国农业科学院, 2014.

    XIN Shichao. Preliminary Analysis of Functions and Interaction Proteins of Tomato SlAQP Gene[D]. Beijing: Chinese Academy of Agricultural Sciences, 2014.
    [25] 孙天旭, 李玉花, 张旸. 逆境条件下水孔蛋白PIPs作用的研究进展[J]. 植物生理学报, 2014, 50(6): 749 − 757.

    SUN Tianxu, LI Yuhua, ZHANG Yang. Advance in a role of PIP aquaporins under adversity condition [J]. J Plant Physiol, 2014, 50(6): 749 − 757.
    [26] 陈露倩, 赖梦霞, 柴里昂, 等. 黄瓜PIP2;4基因生物信息学及干旱胁迫下的诱导表达分析[J]. 四川农业大学学报, 2020, 38(5): 538 − 544.

    CHEN Luqian, LAI Mengxia, CHAI Li’ang, et al. Induced expression in drought stress and bioinformatic analysis of PIP2;4 gene in cucumber [J]. J Sichuan Agric Univ, 2020, 38(5): 538 − 544.
  • [1] 陈梦瑶, 胡怡然, 郑志富, 潘天.  大豆IGT基因家族的全基因组鉴定及组织表达分析 . 浙江农林大学学报, 2025, 42(1): 64-73. doi: 10.11833/j.issn.2095-0756.20240354
    [2] 王书伟, 周明兵.  毛竹ICE基因家族的全基因组鉴定及低温胁迫下的表达模式分析 . 浙江农林大学学报, 2024, 41(3): 568-576. doi: 10.11833/j.issn.2095-0756.20230445
    [3] 郭玉婷, 杜长霞.  黄瓜R2R3-MYB亚家族鉴定及生物信息学分析 . 浙江农林大学学报, 2024, 41(2): 286-296. doi: 10.11833/j.issn.2095-0756.20230278
    [4] 周佩娜, 党静洁, 邵永芳, 石遵睿, 张琳, 刘潺潺, 吴啟南.  荆芥HD-Zip基因家族的全基因组鉴定及分析 . 浙江农林大学学报, 2023, 40(1): 12-21. doi: 10.11833/j.issn.2095-0756.20220390
    [5] 张耀, 王家璇, 蔡璇, 曾祥玲, 杨洁, 陈洪国, 邹晶晶.  桂花OfACOs基因家族鉴定及表达分析 . 浙江农林大学学报, 2023, 40(3): 492-501. doi: 10.11833/j.issn.2095-0756.20220783
    [6] 刘俊, 李龙, 陈玉龙, 刘燕, 吴耀松, 任闪闪.  杜仲CONSTANS-like全基因组鉴定、系统进化及表达模式分析 . 浙江农林大学学报, 2022, 39(3): 475-485. doi: 10.11833/j.issn.2095-0756.20210385
    [7] 王绍良, 张雯宇, 高志民, 周明兵, 杨克彬, 宋新章.  毛竹磷转运蛋白Ⅰ家族基因鉴定及表达模式 . 浙江农林大学学报, 2022, 39(3): 486-494. doi: 10.11833/j.issn.2095-0756.20210471
    [8] 陈雪冰, 刘聪, 程赫, 姜廷波, 夏德安, 魏志刚.  毛果杨ZHD家族全基因组水平鉴定及在干旱胁迫下的表达分析 . 浙江农林大学学报, 2022, 39(3): 465-474. doi: 10.11833/j.issn.2095-0756.20210373
    [9] 黄元城, 郭文磊, 王正加.  薄壳山核桃全基因组LBD基因家族的生物信息学分析 . 浙江农林大学学报, 2021, 38(3): 464-475. doi: 10.11833/j.issn.2095-0756.20200454
    [10] 阮诗雨, 张智俊, 陈家璐, 马瑞芳, 朱丰晓, 刘笑雨.  毛竹GRF基因家族全基因组鉴定与表达分析 . 浙江农林大学学报, 2021, 38(4): 792-801. doi: 10.11833/j.issn.2095-0756.20200544
    [11] 俞狄虎, 张迟, 柯甫志, 敬露阳, 顾雪娇, 吴宝玉, 张敏.  ‘无子瓯柑’CHS基因家族的克隆和表达分析 . 浙江农林大学学报, 2019, 36(5): 943-949. doi: 10.11833/j.issn.2095-0756.2019.05.013
    [12] 郝佳诗, 王愈, 尹建云, 杨虎清.  短波紫外线结合热处理对黄瓜冷害及抗氧化代谢的影响 . 浙江农林大学学报, 2018, 35(3): 476-482. doi: 10.11833/j.issn.2095-0756.2018.03.011
    [13] 陈文妃, 杜长霞, 金佩颖, 何亚妮, 樊怀福.  模拟干旱胁迫对黄瓜幼苗组织结构的影响 . 浙江农林大学学报, 2017, 34(6): 1149-1154. doi: 10.11833/j.issn.2095-0756.2017.06.024
    [14] 孙张晗, 樊怀福, 杜长霞, 黄玲英.  盐胁迫对黄瓜幼苗叶片、韧皮部渗出液和根系抗氧化酶同工酶表达的影响 . 浙江农林大学学报, 2016, 33(4): 652-657. doi: 10.11833/j.issn.2095-0756.2016.04.014
    [15] 蔡琼, 丁贵杰, 文晓鹏.  马尾松水通道蛋白PmPIP1基因克隆及在干旱胁迫下的表达分析 . 浙江农林大学学报, 2016, 33(2): 191-200. doi: 10.11833/j.issn.2095-0756.2016.02.002
    [16] 丁玲, 吴雪, 杜长霞, 徐艳丽, 樊怀福.  短期干旱胁迫对黄瓜幼苗叶片抗氧化系统的影响 . 浙江农林大学学报, 2015, 32(2): 285-290. doi: 10.11833/j.issn.2095-0756.2015.02.017
    [17] 吴雪, 杜长霞, 杨冰冰, 樊怀福.  植物水通道蛋白研究综述 . 浙江农林大学学报, 2015, 32(5): 789-796. doi: 10.11833/j.issn.2095-0756.2015.05.020
    [18] 姜晓玲, 黄秋娴, 李虹, 赵嘉平.  植物类甜蛋白基因家族研究进展 . 浙江农林大学学报, 2012, 29(2): 279-287. doi: 10.11833/j.issn.2095-0756.2012.02.019
    [19] 王策, 秦静静, 甘红豪1, 李红, 罗志斌.  毛果杨全基因组磷酸根转运蛋白家族成员序列分析 . 浙江农林大学学报, 2012, 29(4): 516-526. doi: 10.11833/j.issn.2095-0756.2012.04.006
    [20] 张昕, 张立钦, 林海萍, 张炳欣.  引入黄瓜根围的2株生防菌株的生态效应 . 浙江农林大学学报, 2007, 24(6): 649-653.
  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20210361

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2022/2/318

图(6) / 表(4)
计量
  • 文章访问数:  1464
  • HTML全文浏览量:  1104
  • PDF下载量:  156
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-05-10
  • 修回日期:  2021-10-13
  • 网络出版日期:  2022-03-25
  • 刊出日期:  2022-03-25

黄瓜AQP基因家族的鉴定与生物信息学分析

doi: 10.11833/j.issn.2095-0756.20210361
    基金项目:  浙江省自然科学基金资助项目(LY18C150004, LY18C150003)
    作者简介:

    赖梦霞(ORCID: 0000-0002-5622-2724),从事蔬菜分子生物学研究。E-mail: 2295803738@qq.com。通信作者:

    樊怀福(ORCID: 0000-0002-7308-0094),教授,从事蔬菜逆境生物学研究。E-mail: fanhf@zafu.edu.cn

  • 中图分类号: S642.2

摘要:   目的  深入研究黄瓜Cucumis sativus水通道蛋白(aquaporin, AQP)基因家族(CsAQP)的相关功能。  方法  通过全基因组分析技术鉴定其家族成员,对其蛋白质理化性质、系统进化关系、选择压力、基因结构、保守基序、顺式作用元件、蛋白质互作进行分析。  结果  黄瓜基因组共有33个AQP基因,含有2~5个数量不等的外显子,在染色体上不均匀分布;根据物种进化关系将黄瓜AQP基因家族划分为5个亚家族;基因组重复序列分析表明:5号和6号染色体上各有2~3对基因串联重复;计算这些基因的同义替换(synonymous, Ks)和非同义替换(nonSynonymous, Ka)的比率,结果显示均小于1,表明其进化受纯化选择作用;顺式作用调控元件分析发现,大部分基因启动子区所含元件与激素调节、光响应、胁迫密切相关。  结论  通过黄瓜全基因组扫描,获得黄瓜基因组的33个AQP家族成员,分属于5个亚族,映射于7条染色体上。上游启动子区含逆境相关作用元件,且部分基因参与串联复制,历经纯化选择。图6表4参26

English Abstract

李兴鹏, 张杨, 王瑞珍, 等. 碳氮培养条件下伊氏杀线虫真菌的代谢组研究[J]. 浙江农林大学学报, 2022, 39(6): 1313-1320. DOI: 10.11833/j.issn.2095-0756.20210828
引用本文: 赖梦霞, 杜长霞, 樊怀福. 黄瓜AQP基因家族的鉴定与生物信息学分析[J]. 浙江农林大学学报, 2022, 39(2): 318-328. DOI: 10.11833/j.issn.2095-0756.20210361
LI Xingpeng, ZHANG Yang, WANG Ruizhen, et al. Metabolome of nematicidal fungus Esteya vermicola in carbon and nitrogen culture[J]. Journal of Zhejiang A&F University, 2022, 39(6): 1313-1320. DOI: 10.11833/j.issn.2095-0756.20210828
Citation: LAI Mengxia, DU Changxia, FAN Huaifu. Identification and bioinformatics analysis of AQP gene family in Cucumis sativus[J]. Journal of Zhejiang A&F University, 2022, 39(2): 318-328. DOI: 10.11833/j.issn.2095-0756.20210361
  • 植物常遭受由生物或非生物环境因子所带来的伤害。胁迫因子在抑制植物生长发育的同时,亦触发其系统性防御反应。例如,为适应干旱胁迫,植物在漫长的进化过程中演化出一系列调控水分吸收、关闭气孔降低水分散失量等机制。深入了解植物对外界的防御反应,对提高植物抗性和农业生产具有十分重要的意义。目前,研究者已在不同植物中发现多个响应外界环境胁迫的基因家族,如荔枝Litchi chinensis Dof基因家族[1]、黄瓜 Cucumis sativus DnaJ基因家族[2]、水稻Oryza sativa ABC1基因家族[3]MIP基因家族等。其中MIP家族的各种蛋白质成员具有独特和特定的运输功能,是近年来的研究热点。水通道蛋白(AQP)家族属于跨膜通道蛋白MIP超家族[4]。大量研究表明:AQP参与水分子跨膜、调节植物细胞渗透势及响应多种逆境胁迫。AQP已知分类主要为PIPs (plasma membrane intrinsic proteins)、TIPs (tonoplast intrinsic proteins)、NIPs (noduLin 26-like intrinsic proteins)、SIPs (small and basic intrinsic proteins)、XIPs (uncharacterized intrinsic proteins)以及HIPs (hybrid intrinsic proteins)、GIPs (glycerolfacilitato) [5]。 POU等[6]研究发现:拟南芥Arabidopsis thalianaATPIP2;7在盐胁迫后,表达丰度降低;烟草Nicotiana tabacumNtPIP1;1和NtPIP2;1在植株根系的水分运输中起重要作用[7]; 拟南芥ATPIP2;1在胁迫条件下,其胞吞作用受到不同程度的影响[8];烟草NtAQP1参与二氧化碳的渗透[9];拟南芥[10]、玉米Zea mays[11]等植物的TIP亚家族参与植物跨细胞长距离运输水分的过程。随着越来越多物种的测序的完成,在拟南芥、水稻等模式植物上的AQP基因家族信息已比较明确,在番茄Lycopersicon esculentum [12]、龙眼Ferocactus viridescens[13]等植物中也识别出许多AQP基因家族。黄瓜是世界性的重要蔬菜作物,但因其根系分布较浅,因此对水分、盐渍化等胁迫敏感。本研究采用生物信息学方法得到33个CsAQP基因家族的氨基酸序列,在染色体上定位了CsAQP基因家族,对编码的蛋白质理化性质、结构特点等进行分析比较,并建立系统进化树,为CsAQP基因功能研究和响应逆境机制提供理论基础和参考。

    • 所用各物种AQP基因家族数据及黄瓜基因组数据集均来源于美国国家生物信息中心 (https://www.ncbi.nlm.nih.gov/),并从Pfam数据库中下载种子文件PF00230,于BIO-Linux系统中使用hmmsearch扫描黄瓜蛋白数据库,得到含MIP蛋白保守结构域的基因[14]。运用Perl程序对其进一步筛选(e值为1E−20),利用hmmbuild构建蛋白质特异保守结构域的隐马可夫模型。基于新隐马可夫模型,使用hmmsearch再次扫描黄瓜蛋白数据库,保留结果。同时,以拟南芥AQP基因家族序列及番茄、马铃薯Solanum tuberosum XIPs序列为检索靶标,BLAST搜索黄瓜基因组数据库(e值为1E−10)。两方面匹配所得的序列取并集(同一基因的不同转录本,仅择其一)当作CsAQP候选。所有候选AQP分别被提交至Interpro数据库及美国国家生物信息中心CDD数据库进行验证,剔除冗余和不匹配的氨基酸序列,最终获得CsAQP基因家族成员。

    • 通过ClustalW对黄瓜、模式植物拟南芥和水稻的AQP家族成员以及番茄、马铃薯XIPs序列进行比对[15],采用MEGA-7的最大似然法(maximum likelihood, ML),将自展法系数(Booststrap)设置为1 000次,进行重复实验,构建进化树。结合基因注释信息及物种进化结果,参考其他植物水通道蛋白命名法对CsAQP基因家族成员系统命名。

    • 通过筛选到的CsAQP基因的序列信息,利用MG2C软件将其定位于染色体上。采用ExPASy-ProtParam在线预测CsAQP蛋白的分子量、电荷残基数、分子式、理论等电点、不稳定指数及脂肪系数;利用ExPASy-ProtScale在线分析其亲/疏水性;使用Plant-mPLoc 2.0预测亚细胞定位;使用SignalP-5.0预测其信号肽;采用TMHMM-2.0预测分析其跨膜结构。

    • 使用SOPMA对其二级结构进行预测分析,并基于SWISS-MODEL进行蛋白质三维结构建模。

    • 通过GSDS 2.0可视化CsAQP基因家族成员的内含子-外显子的分布,并利用MEME 5.3.3在线工具对CsAQP家族蛋白的保守基序进行分析,限值为15。采用TBtools绘制示意图。

    • 利用DNAMAN对CsAQP蛋白成员进行多序列比对,并使用weblogo在线软件绘制seqlogo图,其特征高度反映相对的变化频率。

    • 从黄瓜基因组中提取CsAQP家族成员起始密码子上游1 500 bp的序列,利用Plant CARE数据库分析启动子顺式作用元件;利用TBtools对其结果可视化。

    • 提取转录本的CDS序列,建立目标序列数据库,多序列比对,构建索引,运行Perl程序,进一步筛选比对结果(筛选标准:序列两两之间的相似性大于75%,且2条序列比对上的长度大于较长序列的75%[16]),最终获得串联重复基因对。采用ClustalW对各对串联重复基因进行全序列比对,并使用KaKs_Calculator 2.0计算其同义替换和非同义替换间的比率。

    • 使用STRING对黄瓜AQP蛋白成员进行互作预测,选取模式植物拟南芥作为参考,探究CsAQP蛋白之间的作用关系。

    • 通过黄瓜完备基因集与参考基因集BLAST比对,并利用Domain HMM模型进行HMMRER搜索,两者取并集[15]。筛选鉴定其含有特定结构域的序列,最终获得33个CsAQP基因家族成员。通过 ClustalW对黄瓜、拟南芥和水稻的AQP家族成员以及番茄、马铃薯XIPs序列进行比对并构建系统进化树,结果显示:CsAQP基因家族成员被分成5个亚家族,分别为PIP、NIP、TIP、SIP、XIP。其中,PIP亚族的CsAQP基因家族成员数量最多,有14个成员;NIP与TIP亚族的CsAQP基因家族成员数量等同,均为8个;SIP亚族有2个成员;XIP亚族的数量最少,仅1个成员。黄瓜水通道蛋白的系统进化聚类模式与参考植物相似,大部分CsAQP基因家族成员呈现出与同一亚家族中的其他成员聚集的趋势。根据多物种进化结果和黄瓜单物种进化结果,结合已有的同源基因对CsAQP基因家族成员命名。具体结果见表1

      表 1  CsAQP基因家族的命名及理化性质分析

      Table 1.  Nomenclature and physicochemical properties analysis of CsAQP gene family

      基因名称编码蛋白数量/个分子量/kD电荷残基数/个分子式理论等电点
      (−)(+)
      CsNIP1;127629.451420C1357H2126N346O373S69.58
      CsNIP2;128830.551522C1377H2170N368O391S139.40
      CsNIP2;226127.622017C1242H1956N324O359S146.05
      CsNIP3;124926.011215C1183H1877N311O327S108.86
      CsNIP4;126928.881617C1331H2100N326O358S157.67
      CsNIP5;129830.801518C1399H2200N366O394S118.63
      CsNIP6;130431.521820C1422H2263N369O413S128.26
      CsNIP7;126828.4588C1312H2018N320O360S136.88
      CsPIP1;129231.432425C1451H2228N370O395S87.67
      CsPIP1;229231.372324C1451H2225N367O392S97.68
      CsPIP1;328630.761724C1423H2188N364O380S99.23
      CsPIP1;429231.402425C1450H2225N369O395S87.67
      CsPIP2;128429.921717C1390H2107N347O374S87.04
      CsPIP2;228430.241418C1408H2132N354O371S98.78
      CsPIP2;328429.981718C1385H2132N348O377S97.64
      CsPIP2;428330.241920C1400H2143N353O377S97.63
      CsPIP2;527629.371421C1359H2101N351O356S109.36
      CsPIP2;627929.721318C1372H2131N351O368S98.97
      CsPIP2;728730.521622C1415H2152N362O377S89.11
      CsPIP2;828029.851521C1379H2123N357O368S89.24
      CsPIP2;919120.26916C939H1436N242O245S79.51
      CsPIP2;1029031.251521C1439H2226N372O381S139.10
      CsSIP1;124325.59712C1206H1865N287O307S99.41
      CsSIP2;123825.931121C1213H1901N303O309S810.00
      CsTIP1;125025.72128C1202H1836N292O326S45.64
      CsTIP1;225326.29118C1248H1908N298O319S36.03
      CsTIP1;325426.53148C1238H1856N296O337S85.30
      CsTIP2;124825.44107C1195H1813N281O323S55.66
      CsTIP2;225025.09107C1177H1815N277O320S45.39
      CsTIP3;128930.661818C1425H2155N369O378S57.17
      CsTIP4;124725.72128C1206H1858N296O316S56.01
      CsTIP5;125526.1299C1193H1847N303O331S126.88
      CsXIP1;131934.472023C1581H2487N393O425S218.27
    • 理化性质分析(表1表2)发现:CsAQP家族成员编码191~319个氨基酸,分子量为20.26~34.47 kDa,仅CsNIP亚族的氨基酸数目与分子量呈正相关;其电荷残基数差异较大,理论等电点为5.30~10.00,多数CsAQP家族成员富含碱性氨基酸。除CsXIP1;1外,其余CsAQP家族成员蛋白质不稳定指数为23.72~39.31,小于40.00,为稳定蛋白。所有成员具有相对较高的脂肪系数,有利于其在应对环境变化中正常发挥功能。CsAQP家族成员含4~7个跨膜域,多数成员含6个。Plant-mPLoc 2.0预测结果显示:大部分成员主要定位于细胞膜,少数位于液泡,个别为两者皆有。SignalP-5.0和ExPASy-ProtScale在线预测结果表明:上述33个CsAQP家族基因均无信号肽,具疏水性。

      表 2  CsAQP基因家族的亚细胞定位及跨膜结构预测

      Table 2.  Subcellular localization and transmembrane structure prediction of CsAQP gene family

      基因名称不稳定指数脂肪系数跨膜结构域亚细胞定位基因名称不稳定指数脂肪系数跨膜结构域亚细胞定位
      CsNIP1;128.94106.676细胞膜CsPIP2;633.09111.616细胞膜  
      CsNIP2;132.0293.446细胞膜CsPIP2;729.9694.916细胞膜  
      CsNIP2;237.9497.596细胞膜CsPIP2;833.56101.116细胞膜  
      CsNIP3;137.36108.556细胞膜CsPIP2;926.4093.044细胞膜  
      CsNIP4;132.33113.645细胞膜CsPIP2;1035.24103.906细胞膜  
      CsNIP5;135.9197.925细胞膜CsSIP1;132.96113.746细胞膜  
      CsNIP6;126.8299.245细胞膜CsSIP2;126.14113.915细胞膜/液泡
      CsNIP7;139.31101.986细胞膜CsTIP1;124.91110.527液泡   
      CsPIP1;130.9994.626细胞膜CsTIP1;225.33120.367液泡   
      CsPIP1;233.4995.626细胞膜CsTIP1;327.9899.136液泡   
      CsPIP1;329.7896.266细胞膜CsTIP2;131.99111.336液泡   
      CsPIP1;430.8594.285细胞膜CsTIP2;230.49118.326液泡   
      CsPIP2;131.9997.646细胞膜CsTIP3;129.98102.395液泡   
      CsPIP2;233.6197.966细胞膜CsTIP4;123.72123.247液泡   
      CsPIP2;330.51103.107细胞膜CsTIP5;134.10103.376细胞膜/液泡
      CsPIP2;426.21102.126细胞膜CsXIP1;146.41108.157细胞膜  
      CsPIP2;529.51103.516细胞膜
    • 蛋白质的二级结构是有规则重复的构象,预测所得结构单元有4种(图1),分别为α-螺旋、延伸链、β-转角、无规则卷曲。结果发现:33条氨基酸序列中,CsNIP4;1、CsPIP2;5、CsSIP1;1、CsSIP2;1、CsXIP1;1以α-螺旋为主要组成部分,其余28个成员则以无规则卷曲为主要组成部分,β-转角结构散布于CsAQP蛋白序列中。

      图  1  CsAQP的二级结构单元分布

      Figure 1.  Secondary structure unit distribution of CsAQP

      蛋白质三维结构模型由软件SWISS-MODEL建立。通过SWISS-MODEL对黄瓜的33条氨基酸序列进行同源建模。结果表明:绝大多数CsAQP蛋白序列具有十分相似的三维结构,其结构模型如图2所示,各亚家族内成员的相似度较亚家族之间更高。

      图  2  CsAQP家族蛋白质的三级结构预测

      Figure 2.  Prediction of tertiary structure of CsAQP family proteins

    • 图3可知:CsAQP基因家族成员映射于1~7号染色体,其中1号染色体上仅含CsTIP3;1;2号、4号、7号染色体各有2个水通道蛋白家族成员;5号染色体所含数量最多,定位到10个CsAQP基因家族成员;6号染色体次之,分布9个CsAQP家族基因。另外,5号染色体上的CsPIP1;1、CsPIP1;2和CsPIP1;4,6号染色体上的CsPIP2;1、CsPIP2;2、CsPIP2;3、CsPIP2;6和CsPIP2;9在各自染色体上形成基因簇,且这些基因之间的同源性较高,推测其功能相对保守。

      图  3  CsAQP基因家族成员的染色体位置分布

      Figure 3.  Chromosomal location distribution of CsAQP gene family members

    • 为深入探究黄瓜AQP基因结构功能特征及其氨基酸序列的保守基序,对其33个家族成员进行内含子、外显子数目和位置及保守基序进行分析。结果如图4A所示:成员外显子数目为2~5:NIP亚家族中,除了CsNIP3;1和CsNIP5;1外显子数目为4个之外,其余外显子数目均为5个;PIP亚家族成员含3~4个外显子及2~4个内含子;SIP亚家族成员的外显子与内含子数目均为3个,表现出高度的一致性;TIP亚家族中,CsTIP1;1和CsTIP1;2的基因结构呈现“1个外显子+1个内含子+1个外显子”的模式,两者归属于同一亚家族的次级分组,推测这2个成员在功能及进化上有一定的相似性,其余6个亚家族成员均含有3个外显子;CsXIP1;1的基因结构与CsTIP1;1、CsTIP1;2类似基因结构在不同亚家族之间存在明显差异,同一亚家族内的差异相对较小,反映出不同亚家族具有不同功能。

      图  4  CsAQP家族成员的基因结构(A)及保守基序预测分析(B)

      Figure 4.  Gene structure (A) and conserved motif prediction (B) of CSAQP family members

      利用MEME 5.3.3对CsAQP基因家族进行保守基序分析,可视化结果如图4B,相关基序序列如表3。结果表明:Motif 4的保守序最强;除CsSIP亚族无Motif 1,其余成员均有Motif 1分布。有些Motifs为个别亚家族所特有,如Motif 3、Motif 5、Motif 10只分布于CsPIP亚族中,Motif 9仅为CsPIP亚族的分组1所特有;Motif 13仅存在于在CsTIP亚族中。上述结果表明:同一进化分支上的成员间保守结构域相似性更高。这些CsAQP基因家族成员间具有相同或特有的Motif,导致了它们之间相似或具备其特有的功能分化。

      表 3  MEME程序识别CsAQP相关基序信息

      Table 3.  MEME program recognizes CSAQP related base sequence information

      基序基序序列基序长度/个
      Motif 1 GISGGHJNPAVTFGLFLARKISLVRAILYIIAQCLGAICAC 41
      Motif 2 KRNARDSHVPVLAPJPIGFAVFLVHLATGPITGTSMNPARS 41
      Motif 3 KDYKDPPPAPLIDPEELTKWSFYRAIIAEFVATLLFLYVTVLTVIGYNRQ 50
      Motif 4 KAWDDHWIYWVGPFIGAAJAALYYQFILR 29
      Motif 5 LVKAFQKAYYNRYGGGANSLADGYSKGTGLAAEIIGTFVLVYTVFSATDP 50
      Motif 6 DGNTCGGVGILGIAWAFGGMIFVLVYCTA 29
      Motif 7 RFEEATSPSAJRALLAEFISTFJLVFAGVGS 31
      Motif 8 FGTAPGVSALQAFVLEIIITFGLVYVVY 28
      Motif 9 MEGKEEDVRLGANKFNERQPI 21
      Motif 10 AVKALGSFRSS 11
      Motif 11 NQKYNGVVTLIGIAAVAGLIVMVMIYSVG 29
      Motif 12 FGAAVIFN 8
      Motif 13 KLTSDGAATPAGLVVAAIAHAFALFVAVS 29
      Motif 14 TAAQSQDD 8
      Motif 15 FTLKGVFHPIM 8
    • 利用DNAMAN对黄瓜水通道蛋白的氨基酸序列进行多序列比对,对其一致性分析,所有CsAQP成员序列、CsNIP序列、CsPIP序列、CsTIP序列、CsSIP序列一致性分别为35.04%、47.66%、73.38%、58.36%、29.27%。CsAQP蛋白具保守性,且有多个保守位点,总体而言其序列保留相对变异性。CsNIP中序列N-端保留变异性,而近C-端具有高度保守性。CsPIP序列的保守频率高于其他几个亚家族。CsTIP序列的N、C两端均具保守性,但近N-端有部分序列保留变异性。

    • 为了进一步研究CsAQP基因启动子区的顺式作用元件,本研究使用PlantCARE在线工具分析了CsAQP基因家族转录起始位点的上游1 500 bp区域。鉴定出的元件与激素、光响应及抗逆性相关,大部分CsAQP基因家族含WUN-motif作用元件,且所有成员的转录起始位点上游均含TATA盒以及CAAT-box。其中,BOX 4、G-Box、GT1-motif、LAMP-element、ACE、GATA-motif、I-box、AE-box、TCCC-motif、chs-CMA1a、3-AF1 binding site、sp1、Box Ⅱ、CAG-motif、ACA-motif、GA-motif、L-box、MRE (与光反应相关的MYB结合位点)元件功能涉及调控植物光反应;ABRE为脱落酸应答元件;MBSI为MYB结合位点,参与植物体中类黄酮生物的合成;AUXRE(生长素相关)、AUXRR-CORE(生长素相关)、TGA-element(生长素相关)、GARE-motif(赤霉素相关)、P-box(赤霉素相关)、ERE(乙烯应答相关)、CGTCA(茉莉酸甲酯相关)、TCA-element(水杨酸反应相关)元件功能涉及植物激素调控;TC-rich repeats(参与防御和应激反应)、LTR(响应低温)、MBS(MYB结合位点,与干旱相关)、circadian(参与昼夜节律控制)、MSA-like(参与细胞周期调节)、HD-ZIP Ⅰ(参与栅栏叶肉组织的分化)、CAT-box(与分生组织表达有关)、motif I(调节根特异性)、RY-element(种子特异性调控相关)元件功能涉及植物的应激反应以及生长发育。

      从元件类型来看,光响应元件种类最多,于各CsAQP基因启动子区域均有分布。从单个元件的具体分布来看,91%家族成员启动子区分布BOX 4;61%成员启动子区含ABRE元件。从单个基因家族成员来看,CsXIP1;1作为新成员,其基因启动子富含激素调控相关元件,例如ERE、P-box、TGACG元件,且含与胚乳表达相关的GCN4-motif元件;CsNIP2;1、CsNIP5;1、CsNIP6;1、CsNIP7;1、CsPIP1;2、CsPIP1;3、CsPIP2;7、CsPIP2;8、CsSIP1;1、CsTIP3;1含1~3个TC-rich repeats元件,涉及植物防御及应激;CsNIP1;1、CsNIP2;2、CsNIP3;1、CsNIP7;1、CsPIP1;3、CsPIP1;4、CsPIP2;1、CsPIP2;2、CsPIP2;3、CsPIP2;8、CsPIP2;9、CsTIP1;2、CsTIP1;3、CsTIP2;1基因启动子区域都含有MBS元件,表明这些基因有可能与MYB转录因子结合,参与响应干旱胁迫的调控。CsAQP基因启动子区的部分元件展示如图5

      图  5  CsAQP基因家族成员上游顺式元件预测

      Figure 5.  Prediction of upstream cis elements of CsAQP gene family members

    • 已有文献表明:串联重复偏向于扩增膜蛋白功能基因以及与生物和非生物胁迫紧密相关的基因[17]。为探究黄瓜AQP基因家族在进化过程中因串联复制之后基因的偏向性保留和选择压力的形式,对33个家族成员进行分析。分析结果显示:黄瓜33个CsAQP基因家族成员之间,5号、6号这2条染色体上共有5对基因具有串联复制关系,分别为CsPIP1;2&CsPIP1;1、CsPIP1;2&CsPIP1;4、CsPIP1;1&CsPIP1;4、CsPIP2;6&CsPIP2;3、CsPIP2;2&CsPIP2;3。Ka/Ks分析(表4)发现:5个基因对的Ka/Ks均小于1,表明这些重复基因对经历纯化选择,消灭群体有害突变,且在进化中较为保守,结构较为稳定,功能具有一致性。

      表 4  CsAQP基因扩增关系及Ka/Ks比率

      Table 4.  Amplification relationship and Ka/Ks ratio of CsAQP gene in Cucumber

      串联重复基因对KaKsKa/Ks串联重复基因对KaKsKa/Ks
      CsPIP1;2&CsPIP1;10.0400.6100.659CsPIP2;6&CsPIP2;30.1350.6920.196
      CsPIP1;2&CsPIP1;40.3600.6560.055CsPIP2;2&CsPIP2;30.0731.0460.070
      CsPIP1;1&CsPIP1;40.0050.0530.096
    • 为进一步了解CsAQP成员蛋白的互作关系,对33个成员的氨基酸序列进行蛋白质互作预测。结果如图6所示:CsPIP1;1、CsPIP1;2、CsPIP1;3、CsPIP1;4、CsTIP2;2均与CsNIP1;1存在互作关系,且关联性较强。另外,CsSIP2;1与CsTIP、CsPIP、CsNIP亚家族间也有一定的互作关系。上述结果表明:部分成员间存在互作关联性,但各成员间的具体网络机制并不清晰,仍需进一步研究。

      图  6  CsAQP家族成员蛋白的互作预测

      Figure 6.  Prediction of interaction of CsAQP family protein

    • 本研究鉴定了黄瓜基因组中的33个CsAQP基因,CsAQP基因的数量与水稻及模式植物拟南芥的数量相似。这表明CsAQP基因在植物中有形成多基因家族的可能。基因进化的主要驱动力来源于基因扩增,而串联复制是基因扩增的方式之一。有研究表明:响应多种逆境胁迫的基因扩增与串联复制密切相关[17]。这类基因通常是剂量不敏感基因或位于代谢途径两端。方璐等[18]在白菜Brassica rapa中研究发现:与膜蛋白功能相关以及抗逆相关、新陈代谢相关的基因都发生了串联复制,这些相关基因在诱导防御反应机制中发挥作用。本研究发现:在黄瓜5号和6号染色体中共发现5对串联重复基因,这表明串联复制参与黄瓜CsAQP基因的扩增。

      系统进化分析表明:CsAQP基因可以清晰地分为5个亚家族,相对于拟南芥、水稻,多1个新成员(CsXIP1;1)。有研究表明:植物中XIPs序列的分析及其功能方面的鉴定有助于更好地探究AQPs进化过程的分类[19]。同时,外显子与内含子结构的分析也有益于探究植物基因家族内的进化关系[20]。从预测结果中可以看出:基因间结构差别明显,但聚类较近的CsAQP基因其结构存在相似。CsNIP亚家族含有的外显子数量相对多于其他4个亚家族,这与JOHANSON等[21]在拟南芥上的发现一致。基因家族成员在编码氨基酸数量、分子量、理论等电点等生理生化性质也随CsAQP基因编码序列的长短及碱基比例的不同而表现出一定差异。

      MEME (multiple EM for motif elicitation)分析发现:基序组成总体保守,例如所有的CsAQP基因都有一个共同的保守基序(KAWDDHWIYWVGPFIGAAJAALYYQFILR),但不同的亚家族之间也有其独特的保守基序,这为CsAQP基因家族的细分提供一定的依据。分别以限值10、15、20为条件,再次预测CsAQP基因家族的保守基序,在几个重复对之间均能发现某些Motif的得失,与ZHOU等[22]ClDof基因家族所得出的结论相似。初步分析这些Motif可能与CsAQP基因的功能分化相关。此外,CsAQP基因家族成员基因启动子的顺式调控元件种类丰富,包括黄瓜抗逆相关的元件以及黄瓜生长发育相关的作用元件,如所有CsAQP基因家族成员基因启动子区都含有多种与光响应相关的元件。因此,这33个基因可能参与黄瓜光反应调控。CsPIP1;2、CsNIP2;2、CsNIP3;1、CsTIP2;1、CsTIP3;1中含有HD-ZIP I元件,可能参与叶肉组织分化。

      水通道蛋白在低等植物和高等植物中均有所研究[23],其中高等植物水通道蛋白研究相对较多。拟南芥作为模式植物,其AQP在低温、干旱等逆境下的相关研究已被陆续报道。许多植物AQP成员间的互作关联性也得到了验证,如番茄[24]、水稻和玉米[25]。与这些植物AQP相比,CsAQP基因功能的研究相对缓慢但却取得了一定进展。已有研究显示:CsAQP在胁迫反应中可能发挥重要作用。陈露倩等[26]研究发现:CsPIP2;4于干旱胁迫处理下,其表达量在胁迫后2 h达到相对最高值,而随胁迫时间的延长,CsPIP2;4表达丰度显著下降。然而,目前对CsAQP基因的具体作用机制了解尚浅,尤其是不清楚CsAQP基因对非生物胁迫的调控机制。本研究通过对CsAQP基因结构、理化性质、保守基序、亚细胞定位与系统进化树等分析,将有助于鉴定其生物学功能,为进一步探究其功能特性提供了一定的理论依据。此外,对于CsAQP基因在整个生长发育中的调控网络以及与各种环境胁迫因子的关联性也有待探索。

参考文献 (26)

目录

/

返回文章
返回