留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析

洪森荣 曾清华 谭鑫 陈永华 郑亚娇 徐迎昕 邱梦琴

洪森荣, 曾清华, 谭鑫, 陈永华, 郑亚娇, 徐迎昕, 邱梦琴. 上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析[J]. 浙江农林大学学报, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
引用本文: 洪森荣, 曾清华, 谭鑫, 陈永华, 郑亚娇, 徐迎昕, 邱梦琴. 上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析[J]. 浙江农林大学学报, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
HONG Senrong, ZENG Qinghua, TAN Xin, CHEN Yonghua, ZHENG Yajiao, XU Yingxin, QIU Mengqin. Whole genome re-sequencing analysis of two cultivars ('Liuyuexue' and 'Huangpixiao') of Pyrus pyrifolia in Shangrao[J]. Journal of Zhejiang A&F University, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
Citation: HONG Senrong, ZENG Qinghua, TAN Xin, CHEN Yonghua, ZHENG Yajiao, XU Yingxin, QIU Mengqin. Whole genome re-sequencing analysis of two cultivars ('Liuyuexue' and 'Huangpixiao') of Pyrus pyrifolia in Shangrao[J]. Journal of Zhejiang A&F University, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003

上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析

doi: 10.11833/j.issn.2095-0756.2019.02.003
基金项目: 

2014年度江西省高等学校科技落地计划项目 KJLD14086

详细信息
    作者简介: 洪森荣, 教授, 从事植物生物技术研究。E-mail:hongsenrong@163.com
  • 中图分类号: S661.2

Whole genome re-sequencing analysis of two cultivars ('Liuyuexue' and 'Huangpixiao') of Pyrus pyrifolia in Shangrao

  • 摘要: 以上饶早梨Pyrus pyrifolia 2个品种‘六月雪’‘Liuyuexue’和‘黄皮消’‘Huangpixiao’试管苗为材料,进行全基因组重测序分析。结果表明:2个样本的总单核苷酸多态位点(SNP)数量分别为6 171 357和6 140 603个,编码区内无义突变位点(nsSNP)分别为335 659和332 280个。对nsSNP的常见变异(common variant,CV)分析发现,共有2 282个nsSNP关联了2 067个基因。2个样本的总插入缺失位点(INDEL)分别为800 388和799 603个,其中15 509和15 274个位于编码区,共5 115个差异INDEL关联到了3 682个基因,烟草花叶病毒(tobacco mosaic virus)耐药蛋白N,抗病蛋白等关键基因发生变异。差异nsSNP和差异INDEL富集得到的基因本体术语(GO terms)一致。本实验结果可为上饶早梨2个品种‘六月雪’和‘黄皮消’SNP和INDEL相关标记的开发、优异基因的挖掘提供参考。
  • 图  1  候选基因的nsSNP/同义SNP比例分布曲线图

    Figure  1  Curve map of nsSNP/synonymous SNP ratio distribution of candidate genes

    图  2  nsSNP关联的候选基因总体GO分布图

    Figure  2  Overall GO distribution of candidate gene (nsSNP)

    图  3  nsSNP关联的候选基因GO富集柱状图

    Figure  3  GO enriched histogram of candidate gene (nsSNP)

    图  4  INDEL关联的候选基因总体GO分布图

    Figure  4  Overall GO distribution of INDEL candidative gene

    图  5  NDEL关联的候选基因GO富集分布图

    Figure  5  GO enrichment distribution map of INDEL candidative gene

    表  1  nsSNP关联的候选基因及其功能的GO富集分析

    Table  1.   GO terms enriched by candidate gene (nsSNP)

    GO数据库中唯一的标记信息GO term类型GO功能的描述信息输入的具有GO term注释的候选基因数该GO term中基因总数富集分析统计学显著水平错误发现率
    GO:0043531分子功能FADP结合604159.20 E-139.60 E-10
    GO:0004713分子功能F蛋白酪氨酸激酶活性1451 6491.10 E-092.50 E-07
    GO:0032559分子功能F腺苷核糖核酸结合2973 9479.30 E-102.50 E-07
    GO:0001883分子功能F嘌呤核苷结合3104 1701.50 E-092.50 E-07
    GO:0001882分子功能F核苷结合3134 1816.50 E-102.50 E-07
    GO:0030554分子功能F腺苷核苷酸结合3104 1701.50 E-092.50 E-07
    GO:0006952生物学功能P防御响应524021.50 E-092.10 E-06
    GO:0004674分子功能F蛋白丝氨酸/苏氨酸激酶活性1181 3311.90 E-082.80 E-06
    GO:0016772分子功能F转移含磷基团的转移酶活性2132 7792.90 E-083.80 E-06
    GO:0032555分子功能F嘌呤核糖核酸结合3094 3204.50 E-084.70 E-06
    GO:0032553分子功能F核糖核酸结合3094 3204.50 E-084.70 E-06
    GO:0017076分子功能F嘌呤核苷酸结合3234 5525.10 E-084.90 E-06
    GO:0004672分子功能F蛋白激酶活性1531 9951.50 E-061.30 E-04
    GO:0003964分子功能FRNA导向的DNA聚合酶活性191061.70 E-061.40 E-04
    GO:0016773分子功能F以醇基为受体的磷酸转移酶活性1682 2462.20 E-061.50 E-04
    GO:0034061分子功能FDNA聚合酶活性221382.20 E-061.50 E-04
    GO:0006278生物学功能P依赖RNA的DNA复制191061.70 E-066.40 E-04
    GO:0043687生物学功能P蛋白质翻译后修饰1702 2651.60 E-066.40 E-04
    GO:0006468生物学功能P蛋白氨基酸磷酸化1531 9799.80 E-076.40 E-04
    GO:0006464生物学功能P蛋白质修饰过程1782 4293.80 E-061.10 E-03
    GO:0016301分子功能F激酶活性1642 2772.00 E-051.30 E-03
    GO:0005524分子功能FATP结合2403 5382.40 E-051.50 E-03
    GO:0016779分子功能F核苷酸转移酶活性363352.70 E-051.60 E-03
    GO:0005515分子功能F蛋白质结合3956 1823.30 E-051.80 E-03
    GO:0043412生物学功能P高分子修饰1802 5131.20 E-052.30 E-03
    GO:0006950生物学功能P胁迫响应768821.10 E-052.30 E-03
    GO:0016310生物学功能P磷酸化1582 1601.20 E-052.30 E-03
    GO:0030246分子功能F碳水化合物结合363538.00 E-054.20 E-03
    GO:0000166分子功能F核苷酸结合3625 7411.40 E-046.90 E-03
    GO:0016740分子功能F转移酶活性3034 7401.70 E-048.00 E-03
    GO:0006796生物学功能P磷酸盐代谢过程1632 3196.60 E-059.60 E-03
    GO:0006793生物学功能P磷代谢过程1632 3196.60 E-059.60 E-03
    GO:0051704生物学功能P多生物过程181291.10 E-041.40 E-02
    GO:0050896生物学功能P刺激响应871 1241.30 E-041.60 E-02
    GO:0009875生物学功能P花粉-雌蕊相互作用161225.00 E-044.60 E-02
    GO:0008037生物学功能P细胞识别161225.00 E-044.60 E-02
    GO:0048544生物学功能P花粉识别161225.00 E-044.60 E-02
    GO:0009856生物学功能P授粉161225.00 E-044.60 E-02
    下载: 导出CSV

    表  2  INDEL关联的候选基因及其功能的GO富集分析

    Table  2.   GO terms enriched by candidate gene (INDEL)

    GO数据库中唯一的标记信息GO term类型GO功能的描述信息输入的具有GO term注释的候选基因数该GO term中基因总数富集分析统计学显著水平错误发现率
    GO:0043531分子功能FADP结合604159.20 E-139.60 E-10
    GO:0004713分子功能F蛋白酪氨酸激酶活性1451 6491.10 E-092.50 E-07
    GO:0032559分子功能F腺苷核糖核酸结合2973 9479.30 E-102.50 E-07
    GO:0001883分子功能F嘌呤核苷结合3104 1701.50 E-092.50 E-07
    GO:0001882分子功能F核苷结合3134 1816.50 E-102.50 E-07
    GO:0030554分子功能F腺苷核苷酸结合3104 1701.50 E-092.50 E-07
    GO:0006952生物学功能P防御响应524021.50 E-092.10 E-06
    GO:0004674分子功能F蛋白丝氨酸/苏氨酸激酶活性1181 3311.90 E-082.80 E-06
    GO:0016772分子功能F转移含磷基团的转移酶活性2132 7792.90 E-083.80 E-06
    GO:0032555分子功能F嘌呤核糖核酸结合3094 3204.50 E-084.70 E-06
    GO:0032553分子功能F核糖核酸结合3094 3204.50 E-084.70 E-06
    GO:0017076分子功能F嘌呤核苷酸结合3234 5525.10 E-084.90 E-06
    GO:0004672分子功能F蛋白激酶活性1531 9951.50 E-061.30 E-04
    GO:0003964分子功能FRNA导向的DNA聚合酶活性191061.70 E-061.40 E-04
    GO:0016773分子功能F以醇基为受体的磷酸转移酶活性1682 2462.20 E-061.50 E-04
    GO:0034061分子功能FDNA聚合酶活性221382.20 E-061.50 E-04
    GO:0006278生物学功能P依赖RNA的DNA复制191061.70 E-066.40 E-04
    GO:0043687生物学功能P蛋白质翻译后修饰1702 2651.60 E-066.40 E-04
    GO:0006468生物学功能P蛋白氨基酸磷酸化1531 9799.80 E-076.40 E-04
    GO:0006464生物学功能P蛋白氨基酸磷酸化1782 4293.80 E-061.10 E-03
    GO:0016301分子功能F激酶活性1642 2772.00 E-051.30 E-03
    GO:0005524分子功能FATP结合2403 5382.40 E-051.50 E-03
    GO:0016779分子功能F核苷酸转移酶活性363352.70 E-051.60 E-03
    GO:0005515分子功能F蛋白质结合3956 1823.30 E-051.80 E-03
    GO:0043412生物学功能P高分子修饰1802 5131.20 E-052.30 E-03
    GO:0006950生物学功能P胁迫响应768821.10 E-052.30 E-03
    GO:0016310生物学功能P磷酸化1582 1601.20 E-052.30 E-03
    GO:0030246分子功能F碳水化合物结合363538.00 E-054.20 E-03
    GO:0000166分子功能F核苷酸结合3625 7411.40 E-046.90 E-03
    GO:0016740分子功能F转移酶活性3034 7401.70 E-048.00 E-03
    GO:0006796生物学功能P磷酸盐代谢过程1632 3196.60 E-059.60 E-03
    GO:0006793生物学功能P磷代谢过程1632 3196.60 E-059.60 E-03
    GO:0051704生物学功能P多生物过程181291.10 E-041.40 E-02
    GO:0050896生物学功能P刺激响应871 1241.30 E-041.60 E-02
    GO:0009875生物学功能P花粉-雌蕊相互作用161225.00 E-034.60 E-02
    GO:0008037生物学功能P细胞识别161225.00 E-034.60 E-02
    GO:0048544生物学功能P花粉识别161225.00 E-034.60 E-02
    GO:0009856生物学功能P授粉161225.00 E-034.60 E-02
    下载: 导出CSV
  • [1] 徐芬芬, 叶利民, 樊生树, 等. N, O-羧甲基壳聚糖在上饶早梨保鲜上的应用研究[J].北方园艺, 2015(21):137-139. http://d.old.wanfangdata.com.cn/Periodical/bfyany201521035

    XU Fenfen, YE Limin, FAN Shengshu, et al. Study on the application of N, O-carboxymethyl chitosan in the Shangrao early pear storage[J]. Northern Hortic, 2015(21):137-139. http://d.old.wanfangdata.com.cn/Periodical/bfyany201521035
    [2] 徐芬芬, 樊生树, 叶利民.采收期和贮藏温度对上饶早梨保鲜效果的影响[J].保鲜与加工, 2016, 16(3):11-15. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=bxyjg201603003

    XU Fenfen, FAN Shengshu, YE Limin. Effects of harvest time and storage temperature on the fresh-keeping effect of Shangrao early pears[J]. Storage Process, 2016, 16(3):11-15. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=bxyjg201603003
    [3] 洪森荣, 张铭心, 董雅凤, 等.上饶早梨嫩梢热处理嫁接苗脱毒效果分析[J].分子植物育种, 2017, 15(8):3388-3392. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=fzzwyz201708060

    HONG Senrong, ZHANG Mingxin, DONG Yafeng, et al. Virus-free effect analysis of grafted seedlings using heat-treated young shoots of early pear in Shangrao[J]. Mol Plant Breed, 2017, 15(8):3388-3392. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=fzzwyz201708060
    [4] 尹明华, 周宇瑶, 杨星鹏, 等.上饶早梨主栽品种病毒种类分析及其茎尖脱毒技术效率比较[J].浙江农业学报, 2017, 29(1):89-100. doi:  10.3969/j.issn.1004-1524.2017.01.13

    YIN Minghua, ZHOU Yuyao, YANG Xingpeng, et al. Analysis of virus species in main cultivars of early pear in Shangrao and the efficiency of their shoot tip virus-free techniques[J]. Acta Agric Zhejiang, 2017, 29(1):89-100. doi:  10.3969/j.issn.1004-1524.2017.01.13
    [5] 夏华炎, 徐路, 肖虹, 等.上饶早梨主栽品种离体快繁体系的建立[J].南方农业学报, 2016, 47(9):1547-1552. doi:  10.3969/jissn.2095-1191.2016.09.1547

    XIA Huayan, XU Lu, XIAO Hong, et al. Establishment of in vitro propagation system of main cultivars of Shangrao early pear[J]. J Southern Agric, 2016, 47(9):1547-1552. doi:  10.3969/jissn.2095-1191.2016.09.1547
    [6] 尹明华, 周宇瑶, 苏爱芳, 等.上饶早梨道地性农家种遗传多样性与亲缘关系的荧光AFLP分子标记分析[J].基因学与应用生物学, 2016, 35(11):3178-3188. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jyzxyyyswx201611050

    YIN Minghua, ZHOU Yuyao, SU Aifang, et al. Analysis of genetic diversity and genetic relationships of local genuine landraces of early pear in Shangrao by fluorescence AFLP molecular markers[J]. Genomics Appl Biol, 2016, 35(11):3178-3188. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jyzxyyyswx201611050
    [7] 尹明华, 何林森, 朱奇志, 等.上饶早梨品种鉴定及再生苗遗传稳定性SSR检测[J].分子植物育种, 2016, 14(11):3120-3129. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=fzzwyz201611028

    YIN Minghua, HE Linsen, ZHU Qizhi, et al. Identification of early pear main cultivars in Shangrao and genetic stability SSR analysis of their regenerated plants[J]. Mol Plant Breed, 2016, 14(11):3120-3129. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=fzzwyz201611028
    [8] 洪森荣, 周宇瑶, 黄慧.上饶早梨离体保存库再生苗遗传稳定性的同工酶分析[J].基因组学与应用生物学, 2016, 35(12):3552-3561. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jyzxyyyswx201612054

    HONG Senrong, ZHOU Yuyao, HUANG Hui. Isoenzyme analysis of genetic stability of the plantlets regenerated from conservation bank in vitro of early pear in Shangrao[J]. Genomics Appl Biol, 2016, 35(12):3552-3561. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jyzxyyyswx201612054
    [9] 袁金红, 李俊华, 黄小城, 等.基于全基因组重测序的SNP分析在作物基因定位中的研究进展[J].植物生理学报, 2015, 51(9):1400-1404. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zwslxtx201509007

    YUAN Jinhong, LI Junhua, HUANG Xiaocheng, et al. Advance of SNP analysis based on whole genome resequencing in crop gene mapping[J]. Plant Physiol J, 2015, 51(9):1400-1404. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zwslxtx201509007
    [10] QI Jianjian, LIU Xin, SHEN Di, et al. A genomic variation map provides insights into the genetic basis of cucumber domestication and diversity[J]. Nat Genet, 2013, 45(12):1510-1515. doi:  10.1038/ng.2801
    [11] WU Jun, WANG Zhiwen, SHI Zebin, et al. The genome of pear (Pyrus bretschneideri Rehd.)[J]. Genome Res, 2012, 23(2):396-408. https://www.ncbi.nlm.nih.gov/pubmed/23149293
    [12] 莫文娟, 袁德义, 段经华, 等.新高系梨9个品种SSR标记分析[J].浙江林学院学报, 2009, 26(5):639-645. doi:  10.3969/j.issn.2095-0756.2009.05.006

    MO Wenjuan, YUAN Deyi, DUAN Jinghua, et al. Simple sequence repeat analysis on pear cultivars in Niitaka line[J]. J Zhejiang For Coll, 2009, 26(5):639-645. doi:  10.3969/j.issn.2095-0756.2009.05.006
    [13] YAMAMOTO T, TERAKAMI S. Genomics of pear and other Rosaceae fruit trees[J]. Breed Sci, 2016, 66(1):148-159. doi:  10.1270/jsbbs.66.148
    [14] 周贺, 李浩男, 蔡斌华, 等.砂梨果皮转录组SNP位点发掘及其功能注释分析[J].青岛农业大学学报(自然科学版), 2014, 31(2):105-111. doi:  10.3969/J.ISSN.1674-148X.2014.02.006

    ZHOU He, LI Haonan, CAI Bihua, et al. SNP mining and functional annotation in transcriptome of sand pear[J]. J Qingdao Agric Univ Nat Sci, 2014, 31(2):105-111. doi:  10.3969/J.ISSN.1674-148X.2014.02.006
    [15] 李节法.赤霉素促进梨果实库强的转录组学和蛋白质组学研究[D].上海: 上海交通大学, 2015. http://cdmd.cnki.com.cn/Article/CDMD-10248-1016787737.htm

    LI Jiefa. Transcriptome and Proteomics Study of Gibberellin Promoting Pear Fruit Storehouse Strength[D]. Shanghai: Shanghai Jiao Tong University, 2015. http://cdmd.cnki.com.cn/Article/CDMD-10248-1016787737.htm
    [16] WU Jun, LI Leiting, LI Meng, et al. High-density genetic linkage map construction and identification of fruit-related QTLs in pear using SNP and SSR markers[J]. J Exp Bot, 2014, 65(20):5771-5781. doi:  10.1093/jxb/eru311
    [17] MONTANARI S, SAEED M, KNÄBEL M, et al. Identification of Pyrus single nucleotide polymorphisms (SNPs) and evaluation for genetic mapping in European pear and interspecific Pyrus hybrids[J]. PLoS One, 2013, 8(10):e77022. doi:10.1371/journal.pone. 0077022.
    [18] TERAKAMI S, NISHITANI C, YAMAMOTO T. Development of SNP markers for marker-assisted selection in pear[J]. Acta Hortic, 2013, 976(976):463-469. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dcdaaf5e998be20393093fe9ee153b81
    [19] ROBINSON M D, Mc CARTHY D J, SMYTH G K. EdgeR:a bioconductor package for differential expression analysis of digital gene expression data[J]. Bioinformatics, 2010, 26(1):139-140. doi:  10.1093/bioinformatics/btp616
    [20] LANGMEAD B, SALZBERG S L. Fast gapped-read alignment with Bowtie 2[J]. Nat Method, 2013, 9(4):357-359. http://d.old.wanfangdata.com.cn/OAPaper/oai_pubmedcentral.nih.gov_3322381
    [21] DePRISTO M A, BANKS E, POPLIN R, et al. A framework for variation discovery and genotyping using next-generation DNA sequencing data[J]. Nat Genet, 2011, 43(5):491-498. doi:  10.1038/ng.806
    [22] WANG Kai, LI Mingyao, HAKONARSON H. ANNOVAR:functional annotation of genetic variants from high-throughput sequencing data[J]. Nucleic Acid Res, 2010, 38(16):e164. doi: 10.1093/nar/gkq603.
    [23] SILVA J, SCHEFFLER B, SANABRIA Y, et al. Identification of candidate genes in rice for resistance to sheath blight disease by whole genome sequencing[J]. Theor Appl Genet, 2012, 124(1):63-74. doi:  10.1007/s00122-011-1687-4
    [24] DU Zhou, ZHOU Xin, LING Yi, et al. Agrigo:a GO analysis toolkit for the agricultural community[J]. Nucl Acid Res, 2010, 38(Web Server issue):W64-W70. doi: 10.1093/nar/gkq310.
    [25] KOBOLDT D C, ZHANG Qunyuan, LARSON D E, et al. VarScan 2:somatic mutation and copy number alteration discovery in cancer by exome sequencing[J]. Genome Res, 2012, 22(3):568-576. doi:  10.1101/gr.129684.111
    [26] OLSHEN A B, VENKATRAMAN E S, LUCITO R, et al. Circular binary segmentation for the analysis of array-based DNA copy number data[J]. Biostatistics, 2004, 5(4):557-572. doi:  10.1093/biostatistics/kxh008
    [27] SU Zhenqiang, NING Baitang, FANG Hong, et al. Next-generation sequencing and its applications in molecular diagnostics[J]. Exp Rev Mol Diagn, 2011, 11(3):333-343. doi:  10.1586/erm.11.3
    [28] SCHMID K J, SÖRENSEN T R, STRACKE R, et al. Large-scale identification and analysis of genome-wide single-nucleotide polymorphisms for mapping in Arabidopsis thaliana[J]. Genome Res, 2003, 13(6A):1250-1257. http://d.old.wanfangdata.com.cn/OAPaper/oai_pubmedcentral.nih.gov_403656
    [29] HUANG Xuehui, WEI Xinghua, SANG Tao, et al. Genome-wide association studies of 14 agronomic traits in rice landraces[J]. Nat Genet, 2010, 42(11):961-967. doi:  10.1038/ng.695
    [30] CABEZAS J A, IBÁÑEZ J, LIJAVETZKY D, et al. A 48 SNP set for grapevine cultivar identification[J]. BMC Plant Biol, 2011, 11(1):153. doi:  10.1186/1471-2229-11-153
    [31] LAI Jinsheng, LI Ruiqiang, XU Xun, et al. Genome-wide patterns of genetic variation among elite maize inbred lines[J]. Nat Genet, 2010, 42(11):1027-1030. doi:  10.1038/ng.684
    [32] BAI Hui, CAO Yinghao, QUAN Jianzhang, et al. Identifying the genome-wide sequence variations and developing new molecular markers for genetics research by re-sequencing a landrace cultivar of foxtail millet[J]. PLoS One, 2013, 8(9):e73514. doi:  10.1371/journal.pone.0073514
    [33] LIN Tao, ZHU Guangtao, ZHANG Junhong, et al. Genomic analyses provide insights into the history of tomato breeding[J]. Nat Genet, 2014, 46(11):1220-1226. doi:  10.1038/ng.3117
    [34] ZHOU Zhengkui, JIANG Yu, WANG Zheng, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean[J]. Nat Biotechnol, 2015, 33(4):408-414. doi:  10.1038/nbt.3096
    [35] 张彦威, 李伟, 张礼凤, 等.基于重测序的大豆新品种齐黄34的全基因组变异挖掘[J].中国油料作物学报, 2016, 38(2):150-158. http://d.old.wanfangdata.com.cn/Periodical/zgylzwxb201602003

    ZHANG Yanwei, LI Wei, ZHANG Lifeng, et al. Genome-wide variations of soybean cultivar Qihuang 34 by whole genome re-sequencing[J]. Chin J Oil Crop Sci, 2016, 38(2):150-158. http://d.old.wanfangdata.com.cn/Periodical/zgylzwxb201602003
    [36] 田义轲, 王彩虹, 白牡丹, 等.基于梨贝壳杉烯氧化酶基因PpKO序列的功能性SNP标记[J].园艺学报, 2012, 39(10):1876-1884. http://d.old.wanfangdata.com.cn/Periodical/yyxb201210002

    TIAN Yike, WANG Caihong, BAI Mudan, et al. Development of functional SNP markers anchored PpKO gene in pear[J]. Acta Hortic Sin, 2012, 39(10):1876-1884. http://d.old.wanfangdata.com.cn/Periodical/yyxb201210002
  • [1] 俞狄虎, 张迟, 柯甫志, 敬露阳, 顾雪娇, 吴宝玉, 张敏.  ‘无子瓯柑’CHS基因家族的克隆和表达分析 . 浙江农林大学学报, 2019, 36(5): 943-949. doi: 10.11833/j.issn.2095-0756.2019.05.013
    [2] 龚小强, 李素艳, 李燕, 孙向阳.  绿化废弃物好氧堆肥和蚯蚓堆肥作为蔬菜育苗基质研究 . 浙江农林大学学报, 2016, 33(2): 280-287. doi: 10.11833/j.issn.2095-0756.2016.02.013
    [3] 朱咪咪, 张迟, 常爱玲, 党婉誉, 周彩红, 俞狄虎, 吴莹莹, 张敏.  ‘无籽’瓯柑小孢子母细胞减数分裂特性基因RAD51和MS1的表达差异分析 . 浙江农林大学学报, 2016, 33(6): 921-927. doi: 10.11833/j.issn.2095-0756.2016.06.001
    [4] 雷燕, 李庆卫, 李文广, 景珊, 陈俊愉.  2个地被菊品种对不同遮光处理的生理适应性 . 浙江农林大学学报, 2015, 32(5): 708-715. doi: 10.11833/j.issn.2095-0756.2015.05.008
    [5] 王文鹏, 周莉花, 赵宏波, 包志毅.  蜡梅与光叶红蜡梅和夏蜡梅属间杂交亲和性初步研究 . 浙江农林大学学报, 2015, 32(5): 756-762. doi: 10.11833/j.issn.2095-0756.2015.05.015
    [6] 慎家辉, 秦安, 李甲明, 刘伦, 吴俊.  甲基磺酸乙酯诱变杜梨种子突变的鉴定与分析 . 浙江农林大学学报, 2014, 31(6): 892-897. doi: 10.11833/j.issn.2095-0756.2014.06.010
    [7] 张亚利, 王立翠, 李健, 刘炤, 奉树成.  部分茶花品种在上海的栽培土壤及生长状况分析 . 浙江农林大学学报, 2014, 31(1): 44-49. doi: 10.11833/j.issn.2095-0756.2014.01.007
    [8] 张敏, 刘志辉, 宋雪恩, 朱咪咪, 党婉誉, 颜福花, 张迟.  ‘无籽’瓯柑CsLTPCsLOX基因的克隆与表达分析 . 浙江农林大学学报, 2014, 31(6): 823-830. doi: 10.11833/j.issn.2095-0756.2014.06.001
    [9] 褚怡, 范义荣, 张韶伊, 孙玉芬, 宁惠娟.  大花蕙兰与国兰花粉活力及柱头可授性分析 . 浙江农林大学学报, 2013, 30(6): 950-954. doi: 10.11833/j.issn.2095-0756.2013.06.022
    [10] 王国立, 安华明, 秦巧平, 李孟娇, 刘真真, 陈佳莹, 周倩, 张岚岚.  柑橘果实成熟特异基因CsPMEI/InvI的克隆与序列分析 . 浙江农林大学学报, 2013, 30(3): 336-342. doi: 10.11833/j.issn.2095-0756.2013.03.005
    [11] 秦巧平, 林飞凡, 张岚岚.  枇杷果实糖酸积累的分子生理机制 . 浙江农林大学学报, 2012, 29(3): 453-457. doi: 10.11833/j.issn.2095-0756.2012.03.021
    [12] 庄倩, 赵利群, 朱松岩.  3个牡丹组内亚组间远缘杂交品种在东北地区的适应性 . 浙江农林大学学报, 2011, 28(6): 918-921. doi: 10.11833/j.issn.2095-0756.2011.06.013
    [13] 金潇潇, 陈发棣, 陈素梅, 房伟民.  20个菊花品种花瓣的营养品质分析 . 浙江农林大学学报, 2010, 27(1): 22-29. doi: 10.11833/j.issn.2095-0756.2010.01.004
    [14] 邵果园, 陆方方.  远缘植物试管嫁接及ISSR分析 . 浙江农林大学学报, 2010, 27(4): 630-634. doi: 10.11833/j.issn.2095-0756.2010.04.026
    [15] 郑勇平, 郑泉, 俞继英, 张瑛, 范文锋.  春石斛杂交育种及亲缘关系的AFLP分析 . 浙江农林大学学报, 2009, 26(1): 137-141.
    [16] 莫文娟, 袁德义, 段经华, 邹锋.  新高系梨9个品种SSR 标记分析 . 浙江农林大学学报, 2009, 26(5): 639-643.
    [17] 孟赐福, 曹志洪, 姜培坤, 徐秋芳, 周国模.  叶面施硼矫正杨梅缺硼的研究 . 浙江农林大学学报, 2008, 25(5): 543-547.
    [18] 周建, 袁德义, 张琳, 李佑武.  黄金梨叶片营养诊断及施肥标准 . 浙江农林大学学报, 2007, 24(1): 39-43.
    [19] 曾艳玲, 谭晓风, 张党权, 曾晓峰, 李秀根, 刘先雄.  5个中国砂梨品种S基因型的确定 . 浙江农林大学学报, 2007, 24(6): 654-660.
    [20] 王齐瑞, 谭晓风, 张琳.  覆草栽培对甜樱桃生长及光合速率的影响 . 浙江农林大学学报, 2006, 23(1): 24-28.
  • 加载中
  • 链接本文:

    http://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.2019.02.003

    http://zlxb.zafu.edu.cn/article/zjnldxxb/2019/2/227

图(5) / 表(2)
计量
  • 文章访问数:  1295
  • HTML全文浏览量:  201
  • PDF下载量:  98
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-02-26
  • 修回日期:  2018-07-10
  • 刊出日期:  2019-04-20

上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析

doi: 10.11833/j.issn.2095-0756.2019.02.003
    基金项目:

    2014年度江西省高等学校科技落地计划项目 KJLD14086

    作者简介:

    洪森荣, 教授, 从事植物生物技术研究。E-mail:hongsenrong@163.com

  • 中图分类号: S661.2

摘要: 以上饶早梨Pyrus pyrifolia 2个品种‘六月雪’‘Liuyuexue’和‘黄皮消’‘Huangpixiao’试管苗为材料,进行全基因组重测序分析。结果表明:2个样本的总单核苷酸多态位点(SNP)数量分别为6 171 357和6 140 603个,编码区内无义突变位点(nsSNP)分别为335 659和332 280个。对nsSNP的常见变异(common variant,CV)分析发现,共有2 282个nsSNP关联了2 067个基因。2个样本的总插入缺失位点(INDEL)分别为800 388和799 603个,其中15 509和15 274个位于编码区,共5 115个差异INDEL关联到了3 682个基因,烟草花叶病毒(tobacco mosaic virus)耐药蛋白N,抗病蛋白等关键基因发生变异。差异nsSNP和差异INDEL富集得到的基因本体术语(GO terms)一致。本实验结果可为上饶早梨2个品种‘六月雪’和‘黄皮消’SNP和INDEL相关标记的开发、优异基因的挖掘提供参考。

English Abstract

洪森荣, 曾清华, 谭鑫, 陈永华, 郑亚娇, 徐迎昕, 邱梦琴. 上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析[J]. 浙江农林大学学报, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
引用本文: 洪森荣, 曾清华, 谭鑫, 陈永华, 郑亚娇, 徐迎昕, 邱梦琴. 上饶早梨‘六月雪’和‘黄皮消’全基因组重测序分析[J]. 浙江农林大学学报, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
HONG Senrong, ZENG Qinghua, TAN Xin, CHEN Yonghua, ZHENG Yajiao, XU Yingxin, QIU Mengqin. Whole genome re-sequencing analysis of two cultivars ('Liuyuexue' and 'Huangpixiao') of Pyrus pyrifolia in Shangrao[J]. Journal of Zhejiang A&F University, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
Citation: HONG Senrong, ZENG Qinghua, TAN Xin, CHEN Yonghua, ZHENG Yajiao, XU Yingxin, QIU Mengqin. Whole genome re-sequencing analysis of two cultivars ('Liuyuexue' and 'Huangpixiao') of Pyrus pyrifolia in Shangrao[J]. Journal of Zhejiang A&F University, 2019, 36(2): 227-235. doi: 10.11833/j.issn.2095-0756.2019.02.003
  • 上饶早梨Pyrus pyrifolia是江西省上饶县花厅、田墩、五府山等11个乡镇的国家地理标志农产品,被认为是药食兼优的夏令佳品[1-2],栽培历史长,以‘黄皮消’‘Huangpixiao’和‘六月雪’‘Liuyuexue’2个品种品质最为优良[3]。对上饶早梨脱毒快繁[4-5]和品种鉴定[6-7]的研究表明:来源上饶县花厅镇的上饶早梨道地性农家种‘六月雪’和‘黄皮消’经简单重复序列标记(SSR)和扩增片段长度多态性(AFLP)分子标记的聚类分析聚为1类,但生物学性状、农艺性状和果实品质均有一定差异[8]。因此,找出两者基因差异对地方品种的育种选种工作十分重要。自2000年模式植物拟南芥Arabidopsis thaliana的基因组被完全解析后,已有越来越多的种质被全基因组测序[9];研究认为,野生种、农家种、栽培种的全基因组重测序是筛选重要性状关键基因的一个重要内容[10]。梨基因组测序的完成[11-13]和高通量测速技术的快速发展,使梨种质资源的全基因组变异分析成为可能,而全基因组单核苷酸多肽位点(SNP)和插入缺失位点(INDEL)相关标记的开发,对作物分子辅助育种和基因组学研究具有重要的作用。周贺等[14]对褐色砂梨‘黄花’Pyrus pyrifolia ‘Huanghua’色泽形成期的果皮转录组数据进行SNP分子标记开发,共筛选到1 178个可能与果皮色泽形成相关的SNP标记。李节法[15]以6年生砂梨品种‘翠冠’P. pyrifolia ‘Cuiguan’的果实膨大早期、中期和成熟期样品进行比较转录组学分析,鉴定到4 121个选择性剪切位点,30 560个SNP位点和7 443个SSR标记位点。WU等[16]、MONTANARI等[17]和TERAKAMI等[18]也通过SNP标记构建了梨遗传图谱。但梨的INDEL标记研究较少。本研究以上饶县花厅镇上饶早梨道地性农家种‘六月雪’和‘黄皮消’为材料,通过全基因组重测序,深度挖掘其基因组SNP,INDEL和结构变异位点(SV)等位点,为上饶早梨优质品种相关标记的开发、优异基因的挖掘提供参考。

    • 上饶县花厅镇上饶早梨道地性农家品种‘六月雪’和‘黄皮消’试管苗由上饶师范学院生命科学学院植物组织培养室提供。

    • 参照十六烷基三甲基溴化铵(CTAB)提取法提取样品DNA。

    • 以吸光度比值D(260)/D(280)和Qubit 2.0(Life technologies, USA),Bioanalyzer 2100(Agilent,Germany)软件分析完成总DNA样品的质量控制。称取1 μg基因组总DNA片段化处理至300~400 bp,进行末端修复、末端加‘A’处理、接头(Adapters)连接反应,连接至Illumina公司测序平台的测序接头后进行聚合酶链式反应(PCR)扩增。连接产物用质量分数2%的琼脂糖凝胶电泳,选择400~500 bp的片段,随后用连接介导PCR(LM-PCR)进行扩增获得DNA文库。按照Illumina公司HiSeq 2500测序系统(Hiseq 2500)的操作说明对形成的DNA文库进行双端125 bp的高通量测序。

    • 鉴于Illlumina Hiseq 2500错误率对结果的影响,对原始数据进行质量控制(QC)。参考数据库为西洋梨基因组Pyrus communis Genome v1.0数据库。分别对每个样本使用bowtie 2软件进行测序短序列匹配(reads mapping),并用UnifiedGenotyper软件进行SNP和INDEL的提取[19-21]。采用ANNOVAR软件对获得的SNP和INDEL进行功能注释[22]。SNP常见变异分析(common variation, CV)及差异INDEL分析首先获取2个样品相同位置的SNP/INDEL,再根据非同义SNP(nonsynonymous SNP,nsSNP)/INDEL获取相关基因[23]。将差异SNP和INDEL分别与转录组数据进行关联分析,分别考察差异SNP和INDEL相关的表达数据[24]。候选基因的富集分析递交至AgriGO软件用于富集基因本体术语(gene ontology terms)[25]。拷贝数变异位点(CNV)分析采用VarScan软件进行[26]

    • 以HiSeq 2500测序系统提供的起初测序数据为原始数据,即各样本测序得到的短序列(reads)数及碱基总数,共得到275 092 822个短序列和34 661 695 572个碱基,其中‘六月雪’中含短序列140 696 312个,碱基17 727 735 312个,‘黄皮消’中短序列134 396 510个,碱基16 933 960 260个。为剔除Illlumina Hiseq 2500错误率对结果的影响,需对原始数据进行质量控制,包括去除低质量序列,去除接头,以进行后续工作。质量控制后得到232 434 654个短序列和29 286 766 152个碱基,总有效数据比例为84.5%;其中‘六月雪’含短序列119 056 332个,碱基150 010 978 322个,有效数据比例为84.6%;‘黄皮消’含短序列113 378 320个,碱基14 285 668 320个,有效数据比例为84.4%。

    • 经过测序将短序列匹配至参考基因组。‘六月雪’组中总匹配的短序列数为68 859 074个,占所有短序列数的57.8%,含唯一匹配的短序列数为31 889 494个,占总匹配数的26.8%;覆盖全基因的深度为24.35,覆盖全基因组的百分比为93.0%;当覆盖深度≥3时,覆盖全基因组的百分比为89.4%。‘黄皮消’组总匹配的短序列数为66 580 757个,占所有短序列数的58.7%,含唯一匹配的短序列数为32 165 247个,占总匹配数的28.4%;覆盖全基因的深度为23.89,覆盖全基因组的百分比为93.0%,覆盖深度≥3时,覆盖全基因组的百分比为89.5%。

    • ‘六月雪’中共得到SNP 6 171 357个,在编码区的无义突变有335 659个,有义突变有281 871个;因SNP突变获得终止子6 001个,丢失终止子1 226个;在基因5'非翻译区(5'UTR内的SNP总数、在3'UTR内的SNP总数及位于5'UTR和3'UTR间的SNP总数均为0;在不同可变剪切的基因组区域内找到SNP 3 383个,内含子区域内找到1 298 966个,启动子区域内找到1 301 726个,基因间区域内找到2 942 525个。

      ‘黄皮消’中共得到SNP 6 140 603个,在编码区的无义突变有332 280个,有义突变有278 064个;因SNP突变获得终止子6 034个,丢失终止子1 210个;在基因5'非翻译区(5'UTR)内的SNP总数、在3'UTR内的SNP总数及位于5'UTR和3'UTR间的SNP总数均为0,在不同可变剪切的基因组区域内找到SNP 3 274个,内含子区域找到1 285 052个,启动子区域内找到1 291 598个,基因间区域内找到2 943 091个。

    • 对获得的335 659个(‘六月雪’)和332 280个(‘黄皮消’)nsSNP进行常见变异分析发现,2个品种共有2 282个nsSNP关联了2 067个基因,nsSNP对基因的平均关联频率超过了1。其中,烟草花叶病毒耐药蛋白N(PCP017781),假定的抗病RPP13样蛋白1(PCP007357),可能的抗病RPP8样蛋白2(PCP030706),可能的LRR类受体丝氨酸/苏氨酸蛋白激酶At3g47570(PCP021305),未注释蛋白1(PCP008176),烟草花叶病毒耐药蛋白N(PCP007457),烟草花叶病毒耐药蛋白N(PCP018815),未注释蛋白2(PCP021753),含重复锚蛋白的蛋白质At5g02620(PCP022078),烟草花叶病毒耐药蛋白N(PCP030478),抗病蛋白RGA2(PCP014224),可能的LRR类受体丝氨酸/苏氨酸蛋白激酶At1g53420(PCP031574),假定的抗病蛋白RGA3(PCP023580)等蛋白编码的基因则关联了10个以上nsSNP。为进一步研究候选基因的选择压力,对得到的2 067个基因的nsSNP与同义SNP的比值(nsSNP/synonymous SNP,r)进行考察,发现r的对数呈现正态分布(图 1),其值约为2,说明进化有一定的正向选择压力。

      图  1  候选基因的nsSNP/同义SNP比例分布曲线图

      Figure 1.  Curve map of nsSNP/synonymous SNP ratio distribution of candidate genes

    • 由于生物学定义混乱的原因,不同的生物学数据库可能会使用不同的术语。为了解决这个问题,基因本体联合会(Gene Onotology Consortium)建立了“基因本体论”(gene ontolog,GO)数据库,目的是通过利用统一化的、结构化的语言建立一个适用于不同物种的、对基因和蛋白质功能进行定义和描述,并且能够随着研究的不断深入而更新的语言词汇标准。GO数据库包含基因参与的生物过程、所处细胞位置及具有的分子功能3个方面信息,其注释信息可对基因功能进行预测。GO显著性富集分析以基因本体术语(GO term)为单位,确定差异表达基因行使的主要生物学功能。分析全局GO功能与候选基因所处的功能发现,刺激、结合反应等功能的基因相对于背景基因(1 306条)富集(图 2)。通过差异基因富集得到的GO terms(图 3表 1)可知,全部25 698条信息中,ADP结合、蛋白酪氨酸激酶活性、腺苷核糖核酸结合、嘌呤核苷结合、核苷结合、腺苷核苷酸结合、防御反应、蛋白丝氨酸/苏氨酸激酶活性、转移酶活性、转运含磷基团、嘌呤核糖裂解键、核糖核酸结合、嘌呤核苷酸结合、蛋白激酶活性、RNA导向的DNA聚合酶活性、磷酸转移酶活性、醇基作为受体、DNA聚合酶活性、RNA依赖性DNA复制、翻译后蛋白质修饰、脯氨酸氨基酸、磷酸化、蛋白质改性过程等GO terms具有显著性意义。

      图  2  nsSNP关联的候选基因总体GO分布图

      Figure 2.  Overall GO distribution of candidate gene (nsSNP)

      图  3  nsSNP关联的候选基因GO富集柱状图

      Figure 3.  GO enriched histogram of candidate gene (nsSNP)

      表 1  nsSNP关联的候选基因及其功能的GO富集分析

      Table 1.  GO terms enriched by candidate gene (nsSNP)

      GO数据库中唯一的标记信息GO term类型GO功能的描述信息输入的具有GO term注释的候选基因数该GO term中基因总数富集分析统计学显著水平错误发现率
      GO:0043531分子功能FADP结合604159.20 E-139.60 E-10
      GO:0004713分子功能F蛋白酪氨酸激酶活性1451 6491.10 E-092.50 E-07
      GO:0032559分子功能F腺苷核糖核酸结合2973 9479.30 E-102.50 E-07
      GO:0001883分子功能F嘌呤核苷结合3104 1701.50 E-092.50 E-07
      GO:0001882分子功能F核苷结合3134 1816.50 E-102.50 E-07
      GO:0030554分子功能F腺苷核苷酸结合3104 1701.50 E-092.50 E-07
      GO:0006952生物学功能P防御响应524021.50 E-092.10 E-06
      GO:0004674分子功能F蛋白丝氨酸/苏氨酸激酶活性1181 3311.90 E-082.80 E-06
      GO:0016772分子功能F转移含磷基团的转移酶活性2132 7792.90 E-083.80 E-06
      GO:0032555分子功能F嘌呤核糖核酸结合3094 3204.50 E-084.70 E-06
      GO:0032553分子功能F核糖核酸结合3094 3204.50 E-084.70 E-06
      GO:0017076分子功能F嘌呤核苷酸结合3234 5525.10 E-084.90 E-06
      GO:0004672分子功能F蛋白激酶活性1531 9951.50 E-061.30 E-04
      GO:0003964分子功能FRNA导向的DNA聚合酶活性191061.70 E-061.40 E-04
      GO:0016773分子功能F以醇基为受体的磷酸转移酶活性1682 2462.20 E-061.50 E-04
      GO:0034061分子功能FDNA聚合酶活性221382.20 E-061.50 E-04
      GO:0006278生物学功能P依赖RNA的DNA复制191061.70 E-066.40 E-04
      GO:0043687生物学功能P蛋白质翻译后修饰1702 2651.60 E-066.40 E-04
      GO:0006468生物学功能P蛋白氨基酸磷酸化1531 9799.80 E-076.40 E-04
      GO:0006464生物学功能P蛋白质修饰过程1782 4293.80 E-061.10 E-03
      GO:0016301分子功能F激酶活性1642 2772.00 E-051.30 E-03
      GO:0005524分子功能FATP结合2403 5382.40 E-051.50 E-03
      GO:0016779分子功能F核苷酸转移酶活性363352.70 E-051.60 E-03
      GO:0005515分子功能F蛋白质结合3956 1823.30 E-051.80 E-03
      GO:0043412生物学功能P高分子修饰1802 5131.20 E-052.30 E-03
      GO:0006950生物学功能P胁迫响应768821.10 E-052.30 E-03
      GO:0016310生物学功能P磷酸化1582 1601.20 E-052.30 E-03
      GO:0030246分子功能F碳水化合物结合363538.00 E-054.20 E-03
      GO:0000166分子功能F核苷酸结合3625 7411.40 E-046.90 E-03
      GO:0016740分子功能F转移酶活性3034 7401.70 E-048.00 E-03
      GO:0006796生物学功能P磷酸盐代谢过程1632 3196.60 E-059.60 E-03
      GO:0006793生物学功能P磷代谢过程1632 3196.60 E-059.60 E-03
      GO:0051704生物学功能P多生物过程181291.10 E-041.40 E-02
      GO:0050896生物学功能P刺激响应871 1241.30 E-041.60 E-02
      GO:0009875生物学功能P花粉-雌蕊相互作用161225.00 E-044.60 E-02
      GO:0008037生物学功能P细胞识别161225.00 E-044.60 E-02
      GO:0048544生物学功能P花粉识别161225.00 E-044.60 E-02
      GO:0009856生物学功能P授粉161225.00 E-044.60 E-02
    • ‘六月雪’样本共得到INDEL 800 388个,编码区内移码插入总数为6 092个,移码缺失总数8 884个;编码区内因INDEL突变获得终止子426个,丢失终止子107个;在基因5'UTR内的INDEL总数为31个,在基因3'UTR内的INDEL总数和位于5'UTR和3'UTR间的INDEL总数均为0,在不同可变剪切的基因组区域内找到INDEL 786个,内含子区域内找到201 635个,启动子区域内找到198 924个,基因间区域内找到383 503个。

      ‘黄皮消’样本共得到INDEL 799 603个,编码区内移码插入总数为6 021个,移码缺失总数8 708个;编码区内因INDEL突变获得终止子440个,丢失终止子105个;基因5'UTR内找到INDEL 26个,基因3'UTR内、不同基因的5'UTR和3'UTR间则未找到;在不同可变剪切的基因组区域内找到INDEL 758个,内含子区域内找到199 949个,启动子区域内找到198 089个,基因间区域内找到385 507个。

    • 2个样本共获得INDEL15 509和15 274个。对这些INDEL的差异分析发现,共有5 115个INDEL关联到了3 682个基因,其中24个终止子丢失(stop-loss)INDEL关联了24个基因,165个终止子获得(stop-gain)INDEL关联了160个基因,1 901个移码插入(frame-shift insertion)INDEL关联了1 629个基因,3 025个移码缺失(frame-shift deletion)INDEL关联了2 453个基因。分析发现1 276个基因内的INDEL数量超过1个;假定的抗病RPP13样蛋白1(PCP007357),烟草花叶病毒耐药蛋白N(PPCP015254),未注释蛋白1(PCP015680),烟草花叶病毒耐药蛋白N(PCP030478),假定的酰胺酶C869.01(PCP023678),ATP依赖的RNA解旋酶DHX36(PCP003694),甘露糖寡糖α-1, 2-甘露糖苷酶MNS1(PCP005093),未注释蛋白2(PCP017985),富有丝氨酸/精氨酸的分裂因子SC35(PCP000011),来自转座子逆转录病毒相关的Pol聚蛋白TNT 1-94(PCP032808),未注释蛋白3(PCP031973)等蛋白编码的基因均具有7个以上INDEL。

    • 分析全局GO功能发现,INDEL关联的候选基因中,刺激响应、结合、催化活性等功能相对于背景基因(1 306条)来说更加富集;INDEL关联的差异基因的富集分析(图 5表 2)结果与nsSNP关联的候选基因的GO富集分析一致,全部25 698条信息中。

      图  4  INDEL关联的候选基因总体GO分布图

      Figure 4.  Overall GO distribution of INDEL candidative gene

      图  5  NDEL关联的候选基因GO富集分布图

      Figure 5.  GO enrichment distribution map of INDEL candidative gene

      表 2  INDEL关联的候选基因及其功能的GO富集分析

      Table 2.  GO terms enriched by candidate gene (INDEL)

      GO数据库中唯一的标记信息GO term类型GO功能的描述信息输入的具有GO term注释的候选基因数该GO term中基因总数富集分析统计学显著水平错误发现率
      GO:0043531分子功能FADP结合604159.20 E-139.60 E-10
      GO:0004713分子功能F蛋白酪氨酸激酶活性1451 6491.10 E-092.50 E-07
      GO:0032559分子功能F腺苷核糖核酸结合2973 9479.30 E-102.50 E-07
      GO:0001883分子功能F嘌呤核苷结合3104 1701.50 E-092.50 E-07
      GO:0001882分子功能F核苷结合3134 1816.50 E-102.50 E-07
      GO:0030554分子功能F腺苷核苷酸结合3104 1701.50 E-092.50 E-07
      GO:0006952生物学功能P防御响应524021.50 E-092.10 E-06
      GO:0004674分子功能F蛋白丝氨酸/苏氨酸激酶活性1181 3311.90 E-082.80 E-06
      GO:0016772分子功能F转移含磷基团的转移酶活性2132 7792.90 E-083.80 E-06
      GO:0032555分子功能F嘌呤核糖核酸结合3094 3204.50 E-084.70 E-06
      GO:0032553分子功能F核糖核酸结合3094 3204.50 E-084.70 E-06
      GO:0017076分子功能F嘌呤核苷酸结合3234 5525.10 E-084.90 E-06
      GO:0004672分子功能F蛋白激酶活性1531 9951.50 E-061.30 E-04
      GO:0003964分子功能FRNA导向的DNA聚合酶活性191061.70 E-061.40 E-04
      GO:0016773分子功能F以醇基为受体的磷酸转移酶活性1682 2462.20 E-061.50 E-04
      GO:0034061分子功能FDNA聚合酶活性221382.20 E-061.50 E-04
      GO:0006278生物学功能P依赖RNA的DNA复制191061.70 E-066.40 E-04
      GO:0043687生物学功能P蛋白质翻译后修饰1702 2651.60 E-066.40 E-04
      GO:0006468生物学功能P蛋白氨基酸磷酸化1531 9799.80 E-076.40 E-04
      GO:0006464生物学功能P蛋白氨基酸磷酸化1782 4293.80 E-061.10 E-03
      GO:0016301分子功能F激酶活性1642 2772.00 E-051.30 E-03
      GO:0005524分子功能FATP结合2403 5382.40 E-051.50 E-03
      GO:0016779分子功能F核苷酸转移酶活性363352.70 E-051.60 E-03
      GO:0005515分子功能F蛋白质结合3956 1823.30 E-051.80 E-03
      GO:0043412生物学功能P高分子修饰1802 5131.20 E-052.30 E-03
      GO:0006950生物学功能P胁迫响应768821.10 E-052.30 E-03
      GO:0016310生物学功能P磷酸化1582 1601.20 E-052.30 E-03
      GO:0030246分子功能F碳水化合物结合363538.00 E-054.20 E-03
      GO:0000166分子功能F核苷酸结合3625 7411.40 E-046.90 E-03
      GO:0016740分子功能F转移酶活性3034 7401.70 E-048.00 E-03
      GO:0006796生物学功能P磷酸盐代谢过程1632 3196.60 E-059.60 E-03
      GO:0006793生物学功能P磷代谢过程1632 3196.60 E-059.60 E-03
      GO:0051704生物学功能P多生物过程181291.10 E-041.40 E-02
      GO:0050896生物学功能P刺激响应871 1241.30 E-041.60 E-02
      GO:0009875生物学功能P花粉-雌蕊相互作用161225.00 E-034.60 E-02
      GO:0008037生物学功能P细胞识别161225.00 E-034.60 E-02
      GO:0048544生物学功能P花粉识别161225.00 E-034.60 E-02
      GO:0009856生物学功能P授粉161225.00 E-034.60 E-02
    • 用VarScan软件对拷贝数变异(CNV)分析,共获得CNV 37 039个,其中缺失CNV(deletion CNV)20 629个,中性CNV(neutral CNV)7 577个,扩增CNV(amplification CNV)8 833个。

    • 近年来,迅猛发展的基因组测序技术已被广泛应用于植物基因组重测序等研究[27]。SNP是基因组DNA序列上广泛存在的最基本的变异形式[28],植物基因组上平均每数百bp就存在一个SNP[29]。将SNP和传统分子标记相结合用于分子辅助育种,通过全基因组重测序(WGR)得到测序数据,与参考基因组进行序列比对,可分析SNP遗传变异信息,开发出数量较为丰富的分子标记,实现遗传资源的高效利用[30]

      全基因组重测序为从基因组水平开发SNP标记提供了新的技术条件,将SNP识别、验证和基因型分析与传统分子标记相结合,能快速挖掘到候选基因和获得导致表型的SNP位点[9]。中国6个玉米Zea mays优良自交系的非重复区大约存在1 272 134个SNP和30 178个INDEL,其中68 966个SNP和571个INDEL位于功能基因内[31]。对梁Setaria italica ‘SLX’品种的全基因组重测序发现,‘SLX’基因组存在762 082个SNP,26 802个INDEL,10 109个SV[32];对包括野生种、培育种及改良品种在内的360份番茄Lycopersicon esculentum进行全基因组重测序,发现番茄的驯化和改良是2个相对独立的过程,影响果实颜色的主效基因是SlMYB12[33]。对302株大豆Glycine max进行全基因组重测序,检测到了162个受选择的拷贝数变异(CNV),并发现植株进化、发育性状与受选择区域相关[34]。大豆品种‘齐黄34’‘Qihuang34’经全基因组重测序检测到1 519 494个SNP,357 549个INDEL,4 506个SV,17 748个基因变异,其中转录、复制、重组、修复、信号传导机制等6个功能类序列存在较多的变异基因[35]。梨的全基因组重测序少见报道[11-13],大多是通过转录组分析来发掘SNP位点并进行功能注释。编码区内的SNP一般可分为同义SNP(synonymous SNP)和非同义SNP(non-synonymous SNP),其中同义SNP所致的编码序列的改变不会引起氨基酸序列变化,而非同义SNP会使氨基酸序列发生改变,最终影响蛋白质序列[36],因此认为非同义SNP是导致生物性状改变的直接原因,开发并研究这类SNP标记往往具有更为重要的生物学意义。本研究中,‘六月雪’和‘黄皮消’样本中总SNP数量分别为6 171 357和6 140 603个,编码区内无义突变内总数(nsSNP)分别为335 659和332 280个;对nsSNP的CV分析发现共有2 282个nsSNP关联了2 067个基因。2个样本的总INDEL数量分别为800 388和799 603个,位于编码区内的分别有15 509和15 274个;共5 115个差异INDEL关联到了3 682个基因,令烟草花叶病毒耐药蛋白N和抗病蛋白等关键基因发生变异。差异nsSNP基因和差异INDEL富集得到的GO terms一致。针对这些突变位点进行SNP和INDEL相关标记的开发、优异基因的挖掘将为分子标记辅助育种提供重要的标记资源,对上饶早梨‘六月雪’和‘黄皮消’育种研究具有重要的指导意义。

参考文献 (36)

目录

    /

    返回文章
    返回