留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于文献计量学和机器学习的小麦生物育种文献分析

郑倩

郑倩. 基于文献计量学和机器学习的小麦生物育种文献分析[J]. 浙江农林大学学报. doi: 10.11833/j.issn.2095-0756.20240485
引用本文: 郑倩. 基于文献计量学和机器学习的小麦生物育种文献分析[J]. 浙江农林大学学报. doi: 10.11833/j.issn.2095-0756.20240485
ZHENG Qian. Literature analysis of Triticum aestivum bio-breeding based on bibliometrics and machine learning[J]. Journal of Zhejiang A&F University. doi: 10.11833/j.issn.2095-0756.20240485
Citation: ZHENG Qian. Literature analysis of Triticum aestivum bio-breeding based on bibliometrics and machine learning[J]. Journal of Zhejiang A&F University. doi: 10.11833/j.issn.2095-0756.20240485

本文已在中国知网网络首发,可在知网搜索、下载并阅读全文。

基于文献计量学和机器学习的小麦生物育种文献分析

doi: 10.11833/j.issn.2095-0756.20240485
基金项目: CALIS全国农学文献信息中心研究项目(2023028)
详细信息
    作者简介: 郑倩(ORCID: 0000-0001-7846-1307),馆员,从事学科情报服务与研究。E-mail: qianzheng@mail.hzau.edu.cn
  • 中图分类号: S337

Literature analysis of Triticum aestivum bio-breeding based on bibliometrics and machine learning

  • 摘要:   目的  分析全球小麦Triticum aestivum生物育种研究进展,揭示其研究主题、核心知识元素和前沿热点,为小麦育种的理论研究和学科发展提供参考。  方法  从Web of Science (WoS)核心合集数据库检索2013—2024年全球小麦生物育种研究领域发表的文献,利用文献计量学方法分析该领域的发文量、学术影响力、发文主体等,利用VOSviewer生成国家合作网络和关键词共现网络,利用机器学习算法潜在狄利克雷分配(LDA)分析文献摘要,建立语言模型,识别研究主题。  结果  2013年以来全球小麦生物育种研究的科研产出大幅增加,共发表文献16 151篇。中国是全球在该领域发文最多的国家,其次是美国。关键词共现图谱显示,产量、数量性状位点、全基因组关联分析、干旱胁迫、基因表达、单核苷酸多态性是小麦生物育种研究的热点,而规律间隔成簇短回文重复序列(CRISPR)、基因组编辑、高通量表型分析、无人机、机器学习等是近年来兴起的研究领域。LDA分析结果显示:小麦生物育种可大致分为5个研究领域,包括遗传定位、基因组和育种、生物逆境、非生物逆境和产量形成。其中,小麦锈病、数量性状位点定位、面粉品质、干旱、基因组等是高度关注的研究主题。  结论  未来小麦生物育种需要充分利用包括组学、自动表型、人工智能、基因编辑、基因组育种等现代生物技术和信息技术,发掘和利用重要基因,开展智慧育种。图4表2参25
  • 图  1  小麦生物育种全球发文情况和被引频次

    Figure  1  Worldwide scientific production and citations in the research field of wheat bio-breeding

    图  2  小麦生物育种国家合作网络

    Figure  2  Country collaboration network visualization using VOSviewer

    图  3  小麦生物育种研究关键词共现图谱(A)和新兴关键词年度分布(B)

    Figure  3  Co-occurrence overlay visualization of author keyword (A) and yearly trends of newly emerging keywords (B) in the research field of wheat bio-breeding

    图  4  小麦生物育种研究LDA主题网络聚类分析(A)和年度发文量分析(B)

    Figure  4  Topic cluster network by LDA (A) and yearly trends of different research topics (B) in the research field of wheat bio-breeding

    表  1  小麦生物育种领域2013—2023年度发文量

    Table  1.   Annual publications of wheat bio-breeding during 2013-2023

    出版年份 发文量/篇 出版年份 发文量/篇 出版年份 发文量/篇 出版年份 发文量/篇
    2013 906 2016 1 113 2019 1 520 2022 1 931
    2014 1 013 2017 1 217 2020 1 671 2023 1 681
    2015 1 080 2018 1 297 2021 1 760
    下载: 导出CSV

    表  2  小麦生物育种领域的主要发文机构

    Table  2.   Most publishing institutions in the research field of wheat bio-breeding

    机构发文量/
    总被引
    频次/次
    篇均被引
    频次/次
    机构发文量/
    总被引
    频次/次
    篇均被引
    频次/次
    美国农业部1 14529 40725.7堪萨斯州立大学49820 78041.7
    中国农业科学院1 11525 66323.0四川农业大学4326 74215.6
    国际农业研究磋商组织97029 08030.0英联邦科学与工业研究组织42817 86141.7
    西北农林科技大学86117 80320.7法国国家农业食品与环境研究院38818 63948.0
    国际玉米小麦改良中心81826 10431.9埃及知识库3837 60819.9
    印度农业研究理事会73212 92617.7华盛顿州立大学3819 63925.3
    中国科学院70221 79431.0中国农业大学3779 91026.3
    中国农业与农村部60511 80619.5河南农业大学3717 50520.2
    英国研究与创新署50424 99549.6加拿大农业与农业食品部34810 43530.0
    生物技术与生物科学研究理事会50324 98049.7南京农业大学3286 90021.0
    下载: 导出CSV
  • [1] WALLACE J G, RODGERS-MELNICK E, BUCKLER E S. On the road to breeding 4.0: unraveling the good, the bad, and the boring of crop quantitative genomics [J]. Annual Review of Genetics, 2018, 52: 421 − 444.
    [2] 张健. 中国重要农作物生物育种产业化应用的展望[J]. 中国农业科技导报, 2022, 24(12): 15 − 24.

    ZHANG Jian. Prospects for commercialization of biotech breeding technology of important crops in China [J]. Journal of Agricultural Science and Technology, 2022, 24(12): 15 − 24.
    [3] 何中虎, 夏先春, 陈新民, 等. 中国小麦育种进展与展望[J]. 作物学报, 2011, 37(2): 202 − 215.

    HE Zhonghu, XIA Xianchun, CHEN Xinmin, et al. Progress of wheat breeding in China and the future perspective [J]. Acta Agronomica Sinica, 2011, 37(2): 202 − 215.
    [4] 贺志勇. 生物育种对国民经济与粮食安全的贡献分析[J]. 分子植物育种, 2024, 22(13): 4505 − 4510.

    HE Zhiyong. The contribution analysis of biobreeding to national economy and food security [J]. Molecular Plant Breeding, 2024, 22(13): 4505 − 4510.
    [5] 黄耀辉, 焦悦, 吴小智, 等. 生物育种对种业科技创新的影响[J]. 南京农业大学学报, 2022, 45(3): 413 − 421.

    HUANG Yaohui, JIAO Yue, WU Xiaozhi, et al. The influence of biological breeding on the science and technology innovation of seed industry [J]. Journal of Nanjing Agricultural University, 2022, 45(3): 413 − 421.
    [6] 邱均平, 段宇锋, 陈敬全, 等. 我国文献计量学发展的回顾与展望[J]. 科学学研究, 2003, 21(2): 143 − 148.

    QIU Junping, DUAN Yufeng, CHEN Jingquan. The retrospect and prospect on bibliometrics in China [J]. Studies in Science of Science, 2003, 21(2): 143 − 148.
    [7] 王瑞. 基于文献计量分析的小麦科研实力国际比较研究[D]. 合肥: 安徽农业大学, 2017.

    WANG Rui. International Comparison of Wheat Research Level Based on Bibliometric Analysis [D]. Hefei: Anhui Agricultural University, 2017.
    [8] GIRALDO P, BENAVENTE E, MANZANO-AGUGLIARO F, et al. Worldwide research trends on wheat and barley: a bibliometric comparative analysis [J/OL]. Agronomy, 2019, 9 (7): 352[2024-07-10]. doi:10.3390/agronomy9070352.
    [9] 孟静, 唐研, 徐淑良, 等. 基于文献计量的国内外小麦遗传育种研究进展[J]. 江苏农业科学, 2020, 48(3): 64 − 72.

    MENG Jing, TANG Yan, XU Shuliang, et al. Progress of genetic breeding research in wheat at home and abroad based on bibliometrics [J]. Jiangsu Agricultural Sciences, 2020, 48(3): 64 − 72.
    [10] International Wheat Genome Sequencing Consortium (IWGSC). Shifting the limits in wheat research and breeding using a fully annotated reference genome [J/OL]. Science, 2018, 361 (6403): eaar7191[2024-07-10]. doi: 10.1126/science.aar7191.
    [11] 李洪杰, 陈明, 李少雅, 等. 小麦生物育种: 进展、机遇和挑战[J]. 中国基础科学, 2022, 24(4): 1 − 8, 28.

    LI Hongjie, CHEN Ming, LI Shaoya, et al. Wheat biotech-breeding: progresses, opportunities and challenges [J]. China Basic Science, 2022, 24(4): 1 − 8, 28.
    [12] 梁爽, 刘小平. 基于文本挖掘的科技文献主题演化研究进展[J]. 图书情报工作, 2022, 66(13): 138 − 149.

    LIANG Shuang, LIU Xiaoping. Research progress on topic evolution of scientific and technical literatures based on text mining [J]. Library and Information Service, 2022, 66(13): 138 − 149.
    [13] ZHANG Yujie, YU Chaoran, ZHAO Feng, et al. Landscape of artificial intelligence in breast cancer (2000−2021): a bibliometric analysis [J/OL]. Frontiers in Bioscience-Landmark, 2022, 27 (8): 224[2024-07-10]. doi: 10.31083/j.fbl2708224.
    [14] ZHANG Zeyu, WANG Zhiming, HUANG Yun. A bibliometric analysis of 8 276 publications during the past 25 years on cholangiocarcinoma by machine learning [J/OL]. Frontiers in Oncology, 2021, 11 : 687904[2024-07-10]. doi: 10.3389/fonc.2021.687904.
    [15] SINGH K, SAINI D K, SARIPALLI G, et al. WheatQTLdb V2.0: A supplement to the database for wheat QTL [J/OL]. Molecular Breeding, 2022, 42 (10): 56[2024-07-10]. doi: 10.1007/s11032-022-01329-1.
    [16] MA Shengwei, WANG Meng, WU Jianhui, et al. WheatOmics: a platform combining multiple omics data to accelerate functional genomics studies in wheat [J]. Molecular Plant, 2021, 14(12): 1965 − 1968.
    [17] SONG Long, LIU Jie, CAO Beilu, et al. Reducing brassinosteroid signalling enhances grain yield in semi-dwarf wheat [J]. Nature, 2023, 617(7959): 118 − 124.
    [18] GAO Jie, HU Xin, GAO Chunyan, et al. Deciphering genetic basis of developmental and agronomic traits by integrating high-throughput optical phenotyping and genome-wide association studies in wheat [J]. Plant Biotechnology Journal, 2023, 21(10): 1966 − 1977.
    [19] ZHANG Zhen, QU Yunfeng, MA Feifei, et al. Integrating high-throughput phenotyping and genome-wide association studies for enhanced drought resistance and yield prediction in wheat [J]. New Phytologist, 2024, 243(5): 1758 − 1775.
    [20] ZHU Anting, LIU Mengmeng, TIAN Zhitao, et al. Chemical-tag-based semi-annotated metabolomics facilitates gene identification and specialized metabolic pathway elucidation in wheat [J]. The Plant Cell, 2024, 36(3): 540 − 558.
    [21] XIAO Qinlin, BAI Xiulin, ZHANG Chu, et al. Advanced high-throughput plant phenotyping techniques for genome-wide association studies: a review [J]. Journal of Advanced Research, 2022, 35: 215 − 230.
    [22] SINGH B, KUMAR S, ELANGOVAN A, et al. Phenomics based prediction of plant biomass and leaf area in wheat using machine learning approaches [J/OL]. Frontiers in Plant Science, 2023, 14 : 1214801[2024-07-10]. doi: 10.3389/fpls.2023.1214801.
    [23] PRASAD P, SAVADI S, BHARDWAJ S C, et al. The progress of leaf rust research in wheat [J]. Fungal Biology, 2020, 124(6): 537 − 550.
    [24] LANGRIDGE P, REYNOLDS M. Breeding for drought and heat tolerance in wheat [J]. Theoretical and Applied Genetics, 2021, 134(6): 1753 − 1769.
    [25] LI Zihan, ZHONG Fan, GUO Jianrong, et al. Improving wheat salt tolerance for saline agriculture [J]. Journal of Agricultural and Food Chemistry, 2022, 70(48): 14989 − 15006.
  • [1] 戎逸忠, 高俊杰, 程澍时, 张震, 张莉.  不同种植密度和施肥处理下优势杂草对小麦生长特征的影响 . 浙江农林大学学报, 2024, 41(6): 1252-1260. doi: 10.11833/j.issn.2095-0756.20240193
    [2] 颜统利, 何雨, 玛丽亚, 文爱秀, 钱峰, 周琬敏, 蒋玉蓉, 戎均康.  外源钙对盐胁迫下不同衰老类型小麦幼苗生长生理的缓解效应 . 浙江农林大学学报, 2023, 40(5): 991-998. doi: 10.11833/j.issn.2095-0756.20220677
    [3] 王宁, 付亚军, 邵靖, 薛云云.  土壤养分异质性对入侵植物节节麦与小麦竞争关系的影响 . 浙江农林大学学报, 2023, 40(2): 285-292. doi: 10.11833/j.issn.2095-0756.20220370
    [4] 刘婷婷, 杨晋帆, 周汝良, 刘琳.  基于地理栅格变量与机器学习的松材线虫病扩散风险分析 . 浙江农林大学学报, 2023, 40(3): 617-626. doi: 10.11833/j.issn.2095-0756.20220470
    [5] 李万源, 田佳, 马琴, 金学娟, 杨泽康, 杨鹏辉.  基于Google Earth Engine与机器学习的黄土梯田动态监测 . 浙江农林大学学报, 2021, 38(4): 730-736. doi: 10.11833/j.issn.2095-0756.20200673
    [6] 杜雨菲, 吴保国, 陈玉玲.  基于机器学习算法的广西桉树适宜性研究 . 浙江农林大学学报, 2020, 37(1): 122-128. doi: 10.11833/j.issn.2095-0756.2020.01.016
    [7] 王姗姗, 吴保国, 钱建平, 陈栋.  基于Flexsim的小麦粉生产过程仿真与优化 . 浙江农林大学学报, 2018, 35(5): 942-947. doi: 10.11833/j.issn.2095-0756.2018.05.020
    [8] 王宁, 袁美丽, 陈浩.  小麦水浸提液对节节麦种子萌发和幼苗生长的影响 . 浙江农林大学学报, 2018, 35(1): 112-120. doi: 10.11833/j.issn.2095-0756.2018.01.015
    [9] 王学勤.  竹子栽培文献计量分析与可视化图谱分析 . 浙江农林大学学报, 2016, 33(2): 330-339. doi: 10.11833/j.issn.2095-0756.2016.02.020
    [10] 魏玮, 李俊敏, 孙丽英, 戎均康, 周伟.  小麦黄花叶病抗性鉴定及抗性亲本简单重复序列 . 浙江农林大学学报, 2016, 33(1): 71-79. doi: 10.11833/j.issn.2095-0756.2016.01.010
    [11] 魏玮, 郭嘉莲, 万琳涛, 徐林峰, 丁明全, 周伟.  小麦粒重形成的分子调控机制研究综述 . 浙江农林大学学报, 2016, 33(2): 348-356. doi: 10.11833/j.issn.2095-0756.2016.02.022
    [12] 白彦锋, 姜春前, 张守攻, 雷静品.  木质林产品碳计量方法对比分析及应用的潜在影响 . 浙江农林大学学报, 2013, 30(3): 423-427. doi: 10.11833/j.issn.2095-0756.2013.03.020
    [13] 张振, 张含国, 张磊, 朱航勇, 李雪峰.  兴安落叶松基本群体与育种群体RAPD多样性分析 . 浙江农林大学学报, 2012, 29(1): 130-136. doi: 10.11833/j.issn.2095-0756.2012.01.022
    [14] 郑勇平, 郑泉, 俞继英, 张瑛, 范文锋.  春石斛杂交育种及亲缘关系的AFLP分析 . 浙江农林大学学报, 2009, 26(1): 137-141.
    [15] 涂洁, 刘琪璟, 简敏菲.  千烟洲湿地松中幼林树冠生物量及生长量分析 . 浙江农林大学学报, 2008, 25(2): 206-210.
    [16] 施春华.  11种草甘膦助剂除草活性筛选 . 浙江农林大学学报, 2007, 24(1): 86-90.
    [17] 李贵祥, 孟广涛, 方向京, 郎南军, 袁春明, 温绍龙.  滇中高原桤木人工林群落特征及生物量分析 . 浙江农林大学学报, 2006, 23(4): 362-366.
    [18] 卓仁英.  竹子生物技术育种研究进展 . 浙江农林大学学报, 2003, 20(4): 424-428.
    [19] 许翠华, 何福基, 徐尔娜.  林木育种研究文献分析 . 浙江农林大学学报, 1996, 13(1): 112-115.
    [20] 吕晓平, 金根明, 赵仁友, 章华祥.  鞭节华扁叶蜂生物学习性研究 . 浙江农林大学学报, 1993, 10(1): 16-22.
  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20240485

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2025/1/1

图(4) / 表(2)
计量
  • 文章访问数:  59
  • HTML全文浏览量:  18
  • PDF下载量:  2
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-08-10
  • 修回日期:  2024-10-29

基于文献计量学和机器学习的小麦生物育种文献分析

doi: 10.11833/j.issn.2095-0756.20240485
    基金项目:  CALIS全国农学文献信息中心研究项目(2023028)
    作者简介:

    郑倩(ORCID: 0000-0001-7846-1307),馆员,从事学科情报服务与研究。E-mail: qianzheng@mail.hzau.edu.cn

  • 中图分类号: S337

摘要:   目的  分析全球小麦Triticum aestivum生物育种研究进展,揭示其研究主题、核心知识元素和前沿热点,为小麦育种的理论研究和学科发展提供参考。  方法  从Web of Science (WoS)核心合集数据库检索2013—2024年全球小麦生物育种研究领域发表的文献,利用文献计量学方法分析该领域的发文量、学术影响力、发文主体等,利用VOSviewer生成国家合作网络和关键词共现网络,利用机器学习算法潜在狄利克雷分配(LDA)分析文献摘要,建立语言模型,识别研究主题。  结果  2013年以来全球小麦生物育种研究的科研产出大幅增加,共发表文献16 151篇。中国是全球在该领域发文最多的国家,其次是美国。关键词共现图谱显示,产量、数量性状位点、全基因组关联分析、干旱胁迫、基因表达、单核苷酸多态性是小麦生物育种研究的热点,而规律间隔成簇短回文重复序列(CRISPR)、基因组编辑、高通量表型分析、无人机、机器学习等是近年来兴起的研究领域。LDA分析结果显示:小麦生物育种可大致分为5个研究领域,包括遗传定位、基因组和育种、生物逆境、非生物逆境和产量形成。其中,小麦锈病、数量性状位点定位、面粉品质、干旱、基因组等是高度关注的研究主题。  结论  未来小麦生物育种需要充分利用包括组学、自动表型、人工智能、基因编辑、基因组育种等现代生物技术和信息技术,发掘和利用重要基因,开展智慧育种。图4表2参25

English Abstract

郑倩. 基于文献计量学和机器学习的小麦生物育种文献分析[J]. 浙江农林大学学报. doi: 10.11833/j.issn.2095-0756.20240485
引用本文: 郑倩. 基于文献计量学和机器学习的小麦生物育种文献分析[J]. 浙江农林大学学报. doi: 10.11833/j.issn.2095-0756.20240485
ZHENG Qian. Literature analysis of Triticum aestivum bio-breeding based on bibliometrics and machine learning[J]. Journal of Zhejiang A&F University. doi: 10.11833/j.issn.2095-0756.20240485
Citation: ZHENG Qian. Literature analysis of Triticum aestivum bio-breeding based on bibliometrics and machine learning[J]. Journal of Zhejiang A&F University. doi: 10.11833/j.issn.2095-0756.20240485
  • 小麦Triticum aestivum是世界范围内种植面积最广、产量最多的粮食作物之一。随着自然进化与人类科技进步,世界农业育种已经历了驯化育种、传统育种和分子育种3个时代[1]。目前,仅依靠常规育种技术,包括小麦在内的主要作物的产量已经达到了相当高的水平,但仍然不能满足未来需求[2]。小麦传统育种以杂交育种为中心,选育出了许多高产、稳产、高抗的优异品种。但传统育种周期长、效率低和遗传背景狭窄等问题日益突出[3]。基因组学、系统生物学、合成生物学和人工智能等前沿学科的交叉融合,催生了融合遗传学、细胞生物学、现代生物工程技术和信息技术等现代生物育种技术[45]

    文献计量学是以文献或文献相关媒介为研究对象,采用数学、统计学等计量方法,研究文献和文献工作系统的数量关系和规律,以及探讨科学技术动态特征的一门学科[6]。在小麦研究领域,王瑞[7]、GIRALDO等[8]和孟静等[9]分别对2018年以前发表的小麦相关学术文献或专利开展了文献计量学分析,并探索了小麦研究的不同研究主题和研究前沿。2014年国际小麦研究联盟发表了首个小麦基因组草图,2018年发布了第2版小麦基因组序列[10]。此后,人工智能、自动表型、基因组育种等现代生物技术得到了广泛应用,小麦生物育种进入了快速发展的时代[11]。因此,了解这个阶段小麦生物育种的发展过程和特点,有助于预测小麦生物育种的未来研究方向,对保障粮食安全至关重要。近年来,随着人工智能的发展,利用机器学习方法处理大量文字信息,建立文本模型的自然语言处理(NLP)被应用到医学研究和社会科学等领域[1213],然而该方法在农业生物领域应用较少。

    为全面了解小麦生物育种的发展态势和研究趋势,本研究基于Web of Science (WoS)核心合集数据库检索小麦生物育种相关文献,结合文献计量学和机器学习方法,分析了国内外小麦生物育种相关的学术文献,包括发文的年代分布特点、主要发文国家、发文机构、研究热点与前沿、研究主题等,旨在揭示小麦生物育种领域的学术研究态势,为小麦育种的理论研究和学科发展提供参考。

    • 本研究文献数据来源于Web of Science (WoS)核心合集数据库,引文索引数据库包括科学引文索引(SCIE)、社会科学引文索引(SSCI)、会议论文引文索引(CPCI-S、CPCI-SSH)和化学信息数据库(IC、CCR)。通过文献调研、专家咨询和多次试检索,本研究以转基因、基因组育种、基因编辑、合成生物学等生物育种关键技术在小麦中的应用为检索策略,检索年限为2013—2024,检索得到的16 151篇文献作为本研究的数据来源。检索日期为2024年8月31日。

    • 分析国家、研究机构、作者的发文量和影响力时,使用WoS数据库平台中自带的分析功能,并结合Excel软件进行分析。由于本研究数据来源截止到2024年8月31日,数据库中2024年的相关文献仍在更新中,所有年度趋势仅显示2013—2023的分析结果。使用VOSviewer 1.6.20构建知识图谱。在进行国家合作网络分析时,国家最少发文数量设为35篇。在对作者关键词进行共现网络分析时,关键词最小频次设为30次,分析前对关键词进行清洗,合并同义关键词。

      潜在狄利克雷分配(LDA)用于确定每篇文章中的研究主题[14]。LDA模型是一种非监督机器学习的文本挖掘方法,能够从大规模的文档集中识别出潜藏的主题信息。LDA算法的主题网络分析突出了相互关联的主题集群共同出现的区域,并将相似的主题进行聚类,突出主题之间的关系。通过分析所有索引文章的摘要来对主题进行建模,并将确定的主题数量设置为50。根据算法计算出每个主题的概率,最终确定每篇文章所属的主题,并进行手动检查来命名每个主题。通过计算每个文档中不同主题同时出现的次数,建立1个主题互作网络,明确主题之间的联系。所有R和Python代码参考文献[14]。

    • 2013—2024年小麦生物育种领域发表的16 151篇文献的年度发文量显示(表1):从2013年开始每年发文量均在900篇以上,且呈逐年上升趋势,在2022年达到了1 931篇,10 a间发文量增长超过2倍,2023年发文量略有下降。从每年的发文量增量来看,2014—2018年以每年33~107篇的速度稳步增加,2019年发文量出现跳跃式增长,比2018年增加了223篇。2019年后小麦生物育种发文量的快速增长可能与2018年发布第2版小麦基因组序列有关。虽然2023年后小麦生物育种发文量出现下降趋势,但小麦生物育种仍处于快速发展的重要阶段,是近年来的热门研究领域。

      表 1  小麦生物育种领域2013—2023年度发文量

      Table 1.  Annual publications of wheat bio-breeding during 2013-2023

      出版年份 发文量/篇 出版年份 发文量/篇 出版年份 发文量/篇 出版年份 发文量/篇
      2013 906 2016 1 113 2019 1 520 2022 1 931
      2014 1 013 2017 1 217 2020 1 671 2023 1 681
      2015 1 080 2018 1 297 2021 1 760
    • 小麦是世界三大粮食作物之一。共有123个国家参与了小麦生物育种研究(图1),说明小麦生物育种研究是全球广泛关注的学科领域。在所有国家中,中国发文量最多(5 389篇),随后是美国(2 695篇)、澳大利亚(1 489篇)和印度(1 398篇)。中国发文量明显高于其他国家,在全球小麦生物育种研究领域具有竞争优势。在文献影响力方面,中国的总被引频次最高,美国次之,随后是澳大利亚、英国和德国。在篇均被引频次方面,挪威、瑞士、英国、德国、法国、荷兰等发达国家普遍高于发展中国家。中国发表论文数量远远超过其他国家,但篇均被引仅为20.5次,说明中国小麦生物育种研究在提高科研产出数量的同时,还需要进一步提高科研影响力。

      图  1  小麦生物育种全球发文情况和被引频次

      Figure 1.  Worldwide scientific production and citations in the research field of wheat bio-breeding

      本研究使用VOSviewer软件对小麦生物育种的主要发文国家进行合作网络分析(图2)。由图2可见:发文量较多的58个国家形成了5个不同合作集群,分别以中国和美国(紫色)、英国和德国(绿色)、土耳其和伊朗(红色)、巴基斯坦和埃及(蓝色)、澳大利亚和印度(黄色)为代表。其中,中国是发文最多的国家,但美国是国际合作最多的国家(链接数为58个,总链接强度为2 855)。与中国合作最多的5个国家是美国(链接强度为536)、澳大利亚(链接强度为375)、巴基斯坦(链接强度为271)、加拿大(链接强度为135)和墨西哥(链接强度为129)。国际合作不仅能促进了中国小麦生物育种科研产出的数量,也能提高论文的国际影响力。

      图  2  小麦生物育种国家合作网络

      Figure 2.  Country collaboration network visualization using VOSviewer

    • 从机构发文量来看,在小麦生物育种领域发文较多的机构有美国农业部、中国农业科学院、国际农业研究磋商组织、西北农林科技大学、国际玉米小麦改良中心等(表2)。西北农林科技大学是发文量进入前5位的高等学校,在此领域的科研实力较强。在学术影响力方面,英国生物技术与生物科学研究理事会(BBSRC)、英国研究与创新署(UKRI)、法国国家农业食品与环境研究院(INRAE)、英联邦科学与工业研究组织(CSIRO)、堪萨斯州立大学具有较高的篇均被引频次。中国在小麦生物育种领域的主要研究机构是中国农业科学院、西北农林科技大学、中国科学院等,在世界上处于第一梯队。

      表 2  小麦生物育种领域的主要发文机构

      Table 2.  Most publishing institutions in the research field of wheat bio-breeding

      机构发文量/
      总被引
      频次/次
      篇均被引
      频次/次
      机构发文量/
      总被引
      频次/次
      篇均被引
      频次/次
      美国农业部1 14529 40725.7堪萨斯州立大学49820 78041.7
      中国农业科学院1 11525 66323.0四川农业大学4326 74215.6
      国际农业研究磋商组织97029 08030.0英联邦科学与工业研究组织42817 86141.7
      西北农林科技大学86117 80320.7法国国家农业食品与环境研究院38818 63948.0
      国际玉米小麦改良中心81826 10431.9埃及知识库3837 60819.9
      印度农业研究理事会73212 92617.7华盛顿州立大学3819 63925.3
      中国科学院70221 79431.0中国农业大学3779 91026.3
      中国农业与农村部60511 80619.5河南农业大学3717 50520.2
      英国研究与创新署50424 99549.6加拿大农业与农业食品部34810 43530.0
      生物技术与生物科学研究理事会50324 98049.7南京农业大学3286 90021.0
    • 为了探索小麦生物育种的研究热点和趋势,利用VOSviewer对小麦生物育种领域发表文献的关键词进行共现和演化分析,生成关键词共现标签视图(图3A)。可以看出:在频次大于30的关键词中,产量(yield)这一关键词的节点最大,说明产量是小麦生物育种的重点,其次是数量性状位点 (QTL)、硬粒小麦(durum wheat)、全基因组关联分析(GWAS)、干旱(drought)、 基因表达(gene expression)、育种(breeding)、单核苷酸多态性(SNP)和分子标记(molecular markers)。

      图  3  小麦生物育种研究关键词共现图谱(A)和新兴关键词年度分布(B)

      Figure 3.  Co-occurrence overlay visualization of author keyword (A) and yearly trends of newly emerging keywords (B) in the research field of wheat bio-breeding

      图3A可见小麦生物育种领域研究热点的演变。代表性的蓝色节点有简单序列重复 (SSR)、小麦叶锈菌(Puccinia triticina)、RNA干扰(RNAi)等。这些技术或领域在较早的时期就被大量研究,而近年来的研究进展缓慢或有下降趋势,说明小麦生物育种中的相关研究已经相当成熟或有新的技术方法得到应用。代表性的绿色节点,如yield、breeding、QTL、durum wheat、drought等关键词增长平缓。黄色节点的关键词在近几年的研究中较为活跃,可能代表新兴的研究方向,代表性的关键词包括GWAS、竞争性等位基因特异性PCR (KASP)、候选基因 (candidate genes)、基因组编辑 (genome editing)、转录组 (transcriptome)、 机器学习(machine learning)等,说明这些技术或领域是近年来的研究热点,科研产出上升较快。

      为了清楚地了解这些词的变化趋势,选取了平均出版年数值大于2020(即关键词所在文献的平均出版年在2020年之后),并且出现频次较高的前30个关键词,对其年度分布进行了分析(图3B)。可以看出:GWAS相关的年度产出要明显高于其他关键词。GWAS在2017前发文还较少(出现频次低于10次),2017年后迅速增长,2022年已成为小麦生物育种研究中最大的热点(出现频次高于同年其他关键词)。有些关键词在2017年以前没有或只有少量相关研究,2017年后逐渐兴起,如KASP、CRISPR、 高通量表型分析(high-throughput phenotyping)、基因组编辑、无人机 (UAV)、机器学习等。这与近年来组学、生物技术、高通量表型和人工智能等现代生物育种技术的发展和广泛应用相关。

    • 本研究提取了16 151篇文献的摘要,进行LDA分析,建立语言模型,识别研究主题,最终将所有文献归为50个研究主题。进一步根据Luovian聚类将50个主题分为了5个主题网络集群,以5种不同的颜色显示(图4A)。

      图  4  小麦生物育种研究LDA主题网络聚类分析(A)和年度发文量分析(B)

      Figure 4.  Topic cluster network by LDA (A) and yearly trends of different research topics (B) in the research field of wheat bio-breeding

      在以遗传定位为代表的主题网络集群(绿色区域)中,研究较多的主题是QTL、GWAS、遗传多样性(genetic diversity)、基因标记(gene marker)、表型(phenotyping)、模型预测(model prediction)等。其中GWAS、基因标记、基因组测序和QTL之间联系紧密,而表型、模型预测和遗传选择(genetic selection)之间联系紧密,表明现代小麦遗传育种涉及了表型、基因组、基因定位和育种模型的联合分析以及重要基因的遗传定位。在以基因组和育种研究为代表的主题网络集群(紫色区域)中,包括小麦基因组(wheat genomes)、染色体易位(chromosome translocation)、硬粒小麦、地方品种(landraces)、突变体(mutants)、淀粉(starch)、开花(flowering)、株高(height)等研究主题。在以生物逆境为代表的主题集群(红色区域)中,包括锈病抗性(rust resistance)、赤霉病(fusarium head blight, FHB)、病原菌(pathogens)、叶片光合作用(leaf photosynthesis)等研究主题,其中锈病抗性相关研究发表文章最多。在以非生物逆境为代表的主题集群(蓝色区域)中,研究较多的主题是盐胁迫(salt stress)、高温胁迫(heat stress)、干旱胁迫(drought stress)、氮效率(nitrogen efficiency)、根系生长(root growth)等。在以产量形成为代表的主题网络集群(橙色区域)中,主要包括产量、产量稳定性(yield stability)、灌浆(grain filling)、基因型与环境互作(genotype-environment interaction)等研究主题。对每个主题的年度发文量进行分析,发现锈病抗性相关的研究近年来发表数量持续增多,在2022年达到了207篇,是小麦生物育种的热点研究主题,其次是QTL、面粉品质(flour quality)、干旱胁迫(drought stress)、病原菌、脱落酸、GWAS等相关主题(图4B)。2022年GWAS相关文章发表124篇,与2013年相比增长了接近10倍,是论文数量增长最快的主题,该结果与关键词共现和演化分析结果一致。

    • 本研究利用文献计量学和机器学习的方法对小麦生物育种的现状、前沿热点和发展趋势进行分析总结。过去10 a是小麦生物育种迅速发展时期。然而,对于国内外小麦生育物育种研究论文的文献计量学分析还停留在2018年以前[79],无法反映小麦生物育种研究的现状和趋势。本研究从Web of Science (WoS)核心合集数据库中检索2013—2024年发表的小麦生物育种相关文献,共计16 151篇。结果显示:2013年以来,全球小麦生物育种研究的科研产出大幅增加,全球123个国家参与小麦生物育种研究,全球小麦生物育种研究正处于快速发展阶段,是近年来的热门研究领域。中国是发表小麦生物育种相关论文最多的国家,还拥有最多的一流大学和研究院所,对小麦研究的重视程度高。

      对2018年前发表的小麦研究相关文献分析显示:小麦遗传育种关键词主要集中在产量、品质、品种、遗传多样性、数量性状位点和分子标记等传统育种和分子育种相关词汇[79]。本研究的关键词共现分析表明:产量、数量性状位点、全基因组关联分析、干旱、基因表达、单核苷酸多态性等关键词出现的频率最高。随着测序技术的发展,数量性状位点和全基因组关联分析相关研究迅速增多。目前在小麦中已鉴定超过27 500个数量性状位点,其中大部分的数量性状位点是近10 a间鉴定的[15]。近年来还出现了高通量表型分析、无人机、机器学习、深度学习、基因组编辑、规律间隔成簇短回文重复序列等现代生物技术相关的关键词。多篇文章整合表型组、基因组、代谢组、机器学习和基因编辑等技术对小麦重要性状进行遗传解析[1620]。该结果说明,现代生物育种和信息技术已经开始应用到小麦育种[2122]。也需要注意的是,这些新兴关键词出现的频率还不高,说明小麦生物育种研究未来需要进一步加强现代生物技术的应用。另外,LDA主题词汇分析表明:锈病、数量性状位点、面粉品质、干旱、全基因组关联分析等相关研究的发文量增长较快。这些主题成为近年来的热点研究领域,可能是由于小麦基因组序列的发布和小麦遗传转化技术的突破。比较而言,分子标记、育种选择等主题增长缓慢或停滞。叶锈病是研究最多的主题,有超过80个叶锈病抗性基因应用于小麦抗病育种[23]。随着全球气候变化加剧,干旱和盐胁迫越来越受到重视,多基因聚合和转基因技术被用来改良综合抗性,实现多性状协同的目标[2425]。这些结果说明小麦生物育种研究更加关注抗性与产量的协同提升。

    • 在过去10 a间,小麦基因组测序的完成和现代生物技术的应用极大地推动了小麦生物育种的发展。然而还存在几点不足:高影响力和高水平基础研究占比小;关于基因编辑技术开发、基因组选择算法、转基因技术的基本机制的研究很少;对代谢物营养品质、抗病和抗逆机理研究不足;关键基因在育种中的应用研究很少。未来还需要充分利用包括组学、自动表型、人工智能、基因编辑、基因组育种等现代生物技术,发掘和利用重要基因,开展多基因聚合育种,大幅提高小麦产量的同时,改良综合抗性和适应性,实现多性状协同提升。

参考文献 (25)

目录

    /

    返回文章
    返回