基于词袋模型的林业业务图像分类

张广群; 李英杰; 汪杭军

doi:10.11833/j.issn.2095-0756.2017.05.004

基于词袋模型的林业业务图像分类

DOI: 10.11833/j.issn.2095-0756.2017.05.004

张广群^1,2,,
李英杰³,
汪杭军^3, ,

1.
浙江农林大学信息工程学院, 浙江临安 311300
2.
浙江农林大学浙江省林业智能监测与信息技术研究重点实验室, 浙江临安 311300
3.
浙江农林大学暨阳学院, 浙江诸暨 311800

基金项目:

浙江省自然科学基金资助项目 LY16C160007

浙江农林大学科研发展基金人才启动项目 2013FR059

详细信息

作者简介: 张广群, 副教授, 从事图像处理等研究.E-mail:gloria@zafu.edu.cn

通信作者: 汪杭军, 教授, 博士, 从事林业图像处理和模式识别研究.E-mail:whj@zafu.edu.cn

中图分类号: S758;TP391

Classification of forestry images based on the BoW Model

ZHANG Guangqun^{1,2
,},
LI Yingjie³,
WANG Hangjun^{3
, ,}

1.
School of Information Engineering, Zhejiang A & F University, Lin'an 311300, Zhejiang, China
2.
Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology, Zhejiang A & F University, Lin'an 311300, Zhejiang, China
3.
Jiyang College, Zhejiang A & F University, Zhuji 311800, Zhejiang, China

摘要: 针对林业业务图像的特点，提出了一种基于稠密尺度不变特征转换（Dense SIFT）特征的词袋（BoW）模型，并联合直方图正交核的支持向量机（SVM）对图像自动分类。首先采用Dense SIFT提取林业业务图像特征，然后使用BoW模型描述各业务图像，最后利用SVM进行分类识别。实验结果表明：采用Dense SIFT特征比SIFT特征训练时间和识别时间更短，并有更高的识别率，更适应实时性较高的场合；SVM采用多项式核函数（Poly），径向基核函数（RBF），多层感知器核函数（Sigmoid）以及直方图交叉核对3类林业业务图像分类时，直方图正交核取得的平均识别率最高；综合Dense SIFT在局部特征上的优势，加上BoW模型和直方图交叉核SVM分类器，平均识别率达到了86.7%，有较好的识别效果。
- 森林计测学 /
- 林业业务图像 /
- 图像分类 /
- 特征提取 /
- BoW模型 /
- 支持向量机
Abstract: For characteristics of forestry images, an image classification method was put forward based on Dense SIFT and the BoW Model with support vector machine (SVM) using a histogram intersection kernel in order to improving to meet the need of the forest resources management. First, using the BoW Model, the Dense SIFT features of forestry images were extracted to describe the image. Then SVM was used for classification to identify the category of the images. Different kinds of kernel functions like Poly, RBF, Sigmoid, and the histogram intersection kernel were used to find the best recognition rate. Experimental results showed that using Dense SIFT had a shorter detection time (t=60.143 s) and a higher recognition rate (r=86.7%) than SIFT (t=95.567 s and r=83.3% respectively), and it was suited for high real-time applications. Also the histogram intersection kernel had a higher average recognition (r=86.7%). Combining Dense SIFT and the BoW Model with SVM and using the histogram intersection kernel, algorithms used with three kinds of forestry images had a better average recognition (r=86.7%).
- forest measurement /
- forestry images /
- image classification /
- feature extraction /
- BoW Model /
- support vector machine

图 1 应用于图像分类的BoW模型算法流程

Figure 1 Block graph of BoW model

下载: 全尺寸图片幻灯片

图 2 森林火灾原图(A)、SIFT效果图(B)和Dense SIFT效果图(C)

Figure 2 Original forest fire image(A) and its SIFT effect image(B) and its Dense SIFT effect image (C)

下载: 全尺寸图片幻灯片

图 3 森林火灾类图像的直方图

Figure 3 Histogram of an forest fire image

下载: 全尺寸图片幻灯片

图 4 3类林业业务图像数据集样本演示

Figure 4 Data set sample demo of three kinds of forest image

下载: 全尺寸图片幻灯片

表 1 "类林业图像在不同核函数下的分类结果

Table 1. Recognition comparison results of three kinds of forestry image with different kernel functions

核函数	森林火灾/%	非法采伐/%	森林病虫害/%	平均识别率/%
多项式核函数	80.0	85.0	75.0	80.0
径向基核函数	85.0	85.0	80.0	83.3
多层感知器核函数	80.0	80.0	75.0	78.3
直方图交叉核函数	85.0	90.0	85.0	86.7

下载: 导出CSV

表 2 BoW中不同特征识别性能比较

Table 2. Recognition comparison with different feature in BoW

特征	分类识别时间/s	平均识别率/%
SIFT特征	95.567	83.3
Dense SIFT特征	60.143	86.7

下载: 导出CSV

表 3 基于不同特征的林业业务图像识别结果

Table 3. Forestry image recognition performance based on different feature

特征	分类识别时间/s	平均识别率/%
SIFT特征	33.652	48.5
Dense SIFT特征	21.312	52.3
Dense SIFT特征+BoW模型	60.143	86.7

下载: 导出CSV

[1]	陈锦标, 张春花.基于分类的林业图片管理信息系统的设计与实现[J].中南林业调查规划, 2010, 29(2):30-33. CHEN Jinbiao, ZHANG Chunhua. Design and implementation of forestry picture management information system based on classification [J]. Cent South For Invent Plann, 2010, 29(2): 30-33.
[2]	刘义华, 李媛媛.海量林业图像数据的分布式体系分析[J].林业调查规划, 2010, 35(4):10-14. LIU Yihua, LI Yuanyuan. Distributed systematic analysis for massive data of forestry image [J]. For Invent Plann, 2010, 35(4): 10-14.
[3]	SIVIC J, ZISSERMAN A. Video Google: a text retrieval approach to object matching in videos [J]. IEEE Int Conf Comput Vis, 2003, 2: 1470-1478.
[4]	WU Lei, HOI S C H, YU Nenghai. Semantics-preserving bag-of-words models and applications [J]. IEEE Trans Image Proc, 2010, 19(7): 1908-1920.
[5]	UIJLINGS J R R, SMEULDERS A W M, SCHA R J H. Real-time visual concept classification [J]. IEEE Trans Multimedia, 2010, 12(7): 665-681.
[6]	赵春晖, 王莹, KANEKO M.一种基于词袋模型的图像优化分类方法[J].电子与信息学报, 2012, 34(9):2064-2070. ZHAO Chunhui, WANG Ying, KANEKO M. An optimized method for image classification based on bag of words model [J]. J Electron Inf Technol, 2012, 34(9): 2064-2070.
[7]	艾浩军, 张敏, 方禹, 等.视觉词汇的主成分线性编码方法[J].软件学报, 2013, 24(增刊2):42-49. AI Haojun, ZHANG Min, FANG Yu, et al. Principal component linear coding for visual words [J]. J Software, 2013, 24(supp 2): 42-49.
[8]	朱映映, 朱艳艳, 文振焜.基于类型标志镜头与词袋模型的体育视频分类[J].计算机辅助设计与图形学学报, 2013, 25(9):1375-1383. ZHU Yingying, ZHU Yanyan, WEN Zhenkun. Sports video classification based on marked genre shots and bag of words model [J]. J Comput-Aid Des Comput Graph, 2013, 25(9): 1375-1383.
[9]	LI Zhen, YAP K H. An efficient approach for scene categorization based on discriminative codebook learning in bag-of-words framework [J]. Image Vision Comput, 2013, 31(10): 748-755.
[10]	MUMTAZ A, COVIELLO E, LANCKRIET G R, et al. A scalable and accurate descriptor for dynamic textures using bag of system trees [J]. IEEE Trans Pattern Anal Mach Intell, 2015, 37(4): 697-712.
[11]	生海迪. 视觉词袋模型的改进及其在图像分类中的应用研究[D]. 济南: 山东师范大学, 2015. SHENG Haidi. The Improvement of Bag-of-Visual-Words Model and Its Application Research in Images Classification [D]. Ji'nan: Shandong Normal University, 2015.
[12]	王涛. 基于词袋模型的人脸表情识别研究[D]. 武汉: 华中科技大学, 2013. WANG Tao. Research on Bag of Words Model-Based Facial Expression Recognition [D]. Wuhan: Huazhong University of Science and Technology, 2013.
[13]	LOWE D G. Object recognition from local scale-invariant features [J]. IEEE Int Conf Comput Vision, 1999, 2: 1150-1157.
[14]	LOWE D G. Distinctive image features from scale-invariant keypoints [J]. Int J Computr Vision, 2004, 60(2): 91-110.
[15]	MATHUR A, FOODY G M. Multiclass and binary SVM classification: implications for training and classification users [J]. IEEE Trans Geosci Remote Sens Letter, 2008, 5(2): 241-245.
[16]	KALYANI S, SWARUP K S. Classification and assessment of power system security using multiclass SVM [J]. IEEE Trans Syst Man Cybern Part C Appl Rev, 2011, 41(5): 753-758.
[17]	GRAUMAN K, DARRELL T. The pyramid match kernel: discriminative classification with sets of image features [C]//Proceedings of the IEEE International Conference on Computer Vision. Beijing: IEEE Computer Society, 2005: 1458-1465.
[18]	CHANG C C, LIN C J. LIBSVM: a library for support vector machines [J]. ACM Trans Intell Syst Technol, 2007, 2(3): 389-396.

[1]	梁昊, 蔡晨韬, 赵玮, 李亚杰, 王文坤, 胡宇航, 申玉晓, 李永华, 孙天晓. 基于智能手机RGB图像的玉兰叶片叶绿素和氮素预测 . 浙江农林大学学报, 2025, 42(5): 1090-1101. doi: 10.11833/j.issn.2095-0756.20250460
[2]	杨凡, 杨博凯, 李荣荣. 基于图像分割和深度学习的人造板表面缺陷检测 . 浙江农林大学学报, 2024, 41(1): 176-182. doi: 10.11833/j.issn.2095-0756.20230280
[3]	庾露, 黄艳霞, 刘警鉴, 段炼. 降雨影响下的水稻长势极化特征提取 . 浙江农林大学学报, 2020, 37(5): 992-998. doi: 10.11833/j.issn.2095-0756.20190605
[4]	杜雨菲, 吴保国, 陈玉玲. 基于机器学习算法的广西桉树适宜性研究 . 浙江农林大学学报, 2020, 37(1): 122-128. doi: 10.11833/j.issn.2095-0756.2020.01.016
[5]	郭瑞霞, 李崇贵, 刘思涵, 马婷, 全青青. 利用多时相特征的落叶松人工林分类 . 浙江农林大学学报, 2020, 37(2): 235-242. doi: 10.11833/j.issn.2095-0756.2020.02.006
[6]	王礼, 洪祖兵, 方陆明, 陈珣, 吴超. 基于iOS系统的观赏植物识别 . 浙江农林大学学报, 2018, 35(5): 900-907. doi: 10.11833/j.issn.2095-0756.2018.05.015
[7]	陶江玥, 刘丽娟, 庞勇, 李登秋, 冯云云, 王雪, 丁友丽, 彭琼, 肖文惠. 基于机载激光雷达和高光谱数据的树种识别方法 . 浙江农林大学学报, 2018, 35(2): 314-323. doi: 10.11833/j.issn.2095-0756.2018.02.016
[8]	管昉立, 徐爱俊. 基于智能手机与机器视觉技术的立木胸径测量方法 . 浙江农林大学学报, 2018, 35(5): 892-899. doi: 10.11833/j.issn.2095-0756.2018.05.014
[9]	杨立岩, 冯仲科, 刘迎春, 刘金成. 量子粒子群优化最小二乘支持向量机的立木材积估算 . 浙江农林大学学报, 2018, 35(5): 868-876. doi: 10.11833/j.issn.2095-0756.2018.05.011
[10]	白雪冰, 许景涛, 郭景秋, 陈凯. 基于局部二值拟合模型的板材表面节子与虫眼的图像分割 . 浙江农林大学学报, 2016, 33(2): 306-314. doi: 10.11833/j.issn.2095-0756.2016.02.017
[11]	姚飞, 叶康, 周坚华. 植物叶图像特征分析和分类检索 . 浙江农林大学学报, 2015, 32(3): 426-433. doi: 10.11833/j.issn.2095-0756.2015.03.015
[12]	陈芳, 张广群, 崔坤鹏, 汪杭军. 嵌入式植物自动识别系统的设计与实现 . 浙江农林大学学报, 2013, 30(3): 379-384. doi: 10.11833/j.issn.2095-0756.2013.03.012
[13]	张广群, 吴伟志, 汪杭军. 基于加速鲁棒特征的木材显微图像自动配准方法 . 浙江农林大学学报, 2012, 29(4): 600-605. doi: 10.11833/j.issn.2095-0756.2012.04.018
[14]	郝红, 徐常青, 张新平. 基于非负矩阵分解的航拍图像信息提取 . 浙江农林大学学报, 2012, 29(1): 72-77. doi: 10.11833/j.issn.2095-0756.2012.01.013
[15]	陈建珍, 何超, 岳彩荣. 基于FLAASH模块的高级陆地成像仪图像的大气校正 . 浙江农林大学学报, 2011, 28(4): 590-596. doi: 10.11833/j.issn.2095-0756.2011.04.011
[16]	金明, 丁贵杰. 贵州马尾松单株木二元材种出材率表的编制 . 浙江农林大学学报, 2011, 28(4): 576-582. doi: 10.11833/j.issn.2095-0756.2011.04.009
[17]	方益明, 郑红平, 冯海林. 基于傅里叶变换和独立成分分析的木材显微图像特征提取与识别 . 浙江农林大学学报, 2010, 27(6): 826-830. doi: 10.11833/j.issn.2095-0756.2010.06.004
[18]	刘成林. 毛竹根径标准根查定表编制及应用方法的探讨 . 浙江农林大学学报, 2009, 26(4): 549-553.
[19]	龚直文, 亢新刚, 顾丽, 赵俊卉, 郑焰锋, 杨华. 天然林林分结构研究方法综述 . 浙江农林大学学报, 2009, 26(3): 434-443.
[20]	林新春, 俞志雄. 木兰科植物的叶表皮特征及其分类学意义 . 浙江农林大学学报, 2004, 21(1): 33-39.

链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.2017.05.004

https://zlxb.zafu.edu.cn/article/zjnldxxb/2017/5/791

点击查看大图

图(4) / 表(3)

计量

文章访问数: 3224
HTML全文浏览量: 596
PDF下载量: 369
被引次数: 0

全文HTML

森林具有巨大的生态、经济和社会功能，是应对经济全球化发展过程中造成的生态危机和气候变化问题的有效资源。森林资源清查和森林生态保护一直都是各级政府建设的重要内容。实际工作中，护林员通过手机拍摄到的林业现场数据传输回服务器后，可根据林业业务需求快速分类；其分类结果发送到相关管理部门，就可完成对相关事件及时有效的处理。这种森林资源监管模式避免了传统管理手段无法准确及时了解森林现状及动态的问题。要使林业各个管理部门全面配合、相互协调，增强决策支持和加快应急处理，其核心是实现林业业务图像迅速、准确的分类。陈锦标等^[1]使用.NET提出了基于分类的林业图像管理信息系统，解决林业图像管理分散、分类混乱、查找困难问题。刘义华等^[2]针对林业图像数据的特点，提出了海量数据服务器架设方式和需要解决的关键问题。这些研究的基础是对林业图像进行标注，系统代价高，人工成本也高。本研究中林业业务图像自动分类的理论基础是场景图像分类。场景图像分类是在20世纪90年代末开始兴起的一个研究领域，2006年麻省理工学院首次召开场景理解研讨会后成为了新的研究热点。2005年之前，场景图像分类主要采用基于底层特征（low level features）的方法和基于场景结构的方法；之后则采用基于图像视觉词汇的方法，该类方法由SIVIC等^[3]提出视觉词汇的概念，将文本分类中的词袋方法（bag of words, BoW）应用到图像分类中来。之后，由于视觉词汇在图像分类中具有特征表达能力强和简单有效的优点^[4]，被研究者应用在计算机视觉的图像分类领域^[5-12]。词袋方法的核心是提取图像特征构建视觉词汇本。近年来，多采用局部特征用于图像分类，例如，LOWE^[13]提出的高效区域检测算法SIFT（scale invariant feature transform）具有图像旋转、尺度缩放、平移保持不变性，该方法在2004年得到完善^[14]；Dense SIFT即密集SIFT，是在SIFT基础上发展而来的一种算法，相比传统SIFT特征后者具有实时性好、表达能力强的优点。本研究针对林业业务图像数据的特点，利用Dense SIFT提取图像中的业务信息，构建合理的视觉词汇本，描述林业业务图像；根据林业业务管理需求，联合直方图正交核的支持向量机对图像自动分类，并将各类信息传递至各职能管理，从而实现快速、及时、准确、有效的管理。

3. 结论

本研究提出了一种基于Dense SIFT特征的BoW模型，联合直方图正交核的支持向量机对林业业务图像进行自动分类。以收集到的林业业务图像数据集为对象进行实验，结论如下：① 本研究以3类林业业务图像的识别为例，验证发现BoW模型应用于林业业务图像分类可以取得比较好的识别效果。增加新的业务类别时，只要选择足够数量的新增类别的训练样本，重新建立“视觉词汇本”即可。② SIFT和Dense SIFT都能有效地提取到林业业务图像的识别特征；就对图像局部特征完整提取的效果而言，Dense SIFT特征提取法比SIFT在对林业业务图像分类上更有优势。利用BoW模型对特征进行组合，产生的直方图特征更能反映林业业务本身特点，因而识别的准确率得到了极大提高。③ 采用SVM对林业业务图像进行分类时，应用不同的核函数对最后的识别率会产生较大的影响。由于BoW模型使用直方图描述图像的特征，直方图正交核能更好地处理直方图的比较问题，故能取得最佳的识别效果。

综上所述，基于Dense SIFT的BoW模型方法为林业业务图像自动识别研究提供了一种重要思路。该问题的研究与应用有助于中国对森林资源监管模式的创新与实践，有利于加强林业各个管理部门配合，相互协调，增强决策支持和应急处理能力，进而为实现森林的快速、有效、及时的现代化管理打下基础。

参考文献 (18)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于词袋模型的林业业务图像分类

DOI: 10.11833/j.issn.2095-0756.2017.05.004

作者简介: 张广群, 副教授, 从事图像处理等研究.E-mail:gloria@zafu.edu.cn

通信作者: 汪杭军, 教授, 博士, 从事林业图像处理和模式识别研究.E-mail:whj@zafu.edu.cn

Classification of forestry images based on the BoW Model

计量

基于词袋模型的林业业务图像分类

doi: 10.11833/j.issn.2095-0756.2017.05.004

1. 浙江农林大学信息工程学院, 浙江临安 311300

2. 浙江农林大学浙江省林业智能监测与信息技术研究重点实验室, 浙江临安 311300

3. 浙江农林大学暨阳学院, 浙江诸暨 311800

作者简介:
张广群, 副教授, 从事图像处理等研究.E-mail:gloria@zafu.edu.cn

通信作者: 汪杭军, 教授, 博士, 从事林业图像处理和模式识别研究.E-mail:whj@zafu.edu.cn

English Abstract

Classification of forestry images based on the BoW Model

全文HTML

1.1. 图像特征提取和表示

1.1.1. 建立尺度空间并检测极值点

1.1.2. 确定关键点位置

1.1.3. 确定关键点方向

1.1.4. 确定关键点描述子

1.2. 视觉词汇本创建

1.3. 支持向量机（SVM）分类

2.1. 不同核函数识别比较

2.2. SIFT和Dense SIFT特征比较

2.3. 不同模型识别性能比较

目录

留言板

基于词袋模型的林业业务图像分类

DOI: 10.11833/j.issn.2095-0756.2017.05.004

作者简介: 张广群, 副教授, 从事图像处理等研究.E-mail:gloria@zafu.edu.cn

通信作者: 汪杭军, 教授, 博士, 从事林业图像处理和模式识别研究.E-mail:whj@zafu.edu.cn

Classification of forestry images based on the BoW Model

计量

出版历程

基于词袋模型的林业业务图像分类

doi: 10.11833/j.issn.2095-0756.2017.05.004

1. 浙江农林大学 信息工程学院, 浙江 临安 311300 2. 浙江农林大学 浙江省林业智能监测与信息技术研究重点实验室, 浙江 临安 311300 3. 浙江农林大学 暨阳学院, 浙江 诸暨 311800

作者简介: 张广群, 副教授, 从事图像处理等研究.E-mail:gloria@zafu.edu.cn

通信作者: 汪杭军, 教授, 博士, 从事林业图像处理和模式识别研究.E-mail:whj@zafu.edu.cn

English Abstract

Classification of forestry images based on the BoW Model

全文HTML

1.1. 图像特征提取和表示

1.1.1. 建立尺度空间并检测极值点

1.1.2. 确定关键点位置

1.1.3. 确定关键点方向

1.1.4. 确定关键点描述子

1.2. 视觉词汇本创建

1.3. 支持向量机（SVM）分类

2.1. 不同核函数识别比较

2.2. SIFT和Dense SIFT特征比较

2.3. 不同模型识别性能比较

目录

1. 浙江农林大学信息工程学院, 浙江临安 311300

2. 浙江农林大学浙江省林业智能监测与信息技术研究重点实验室, 浙江临安 311300

3. 浙江农林大学暨阳学院, 浙江诸暨 311800

作者简介:
张广群, 副教授, 从事图像处理等研究.E-mail:gloria@zafu.edu.cn