-
水果产业是中国种植业中仅次于粮食、蔬菜的第三大产业,在国民经济中占有重要地位。中国是世界上最大的水果生产国[1],如苹果Malus pumila,梨Pyrus spp.,甜樱桃Prunus avium等,但国产水果的质量不容乐观,培育和检测高质果树是当前迫切需要解决的现实问题。遥感技术(RS)和地理信息系统(GIS)的集成可以提供强大的空间决策支持系统,为检测果树的生长状况、健康状况和果树分类等[2-4]提供了技术基础;随着遥感技术的发展,植物物种信息提取已有大量研究[5-6],也为果树的遥感信息带来了可能。近红外光谱技术由于其高分辨率特性被广泛应用,如邢东兴等[7]利用冠层和叶片的实测高光谱数据对果树的病虫害、冻害、营养元素与微量元素含量等进行了研究;朱西存等[8-9]基于高光谱数据,建立了苹果花磷素和氮素含量的预测模型,效果较好;雷彤等[10]基于多光谱和数码照相技术发现蓝光、红光和近红外波段为苹果花期的敏感波段,花期光谱特征变化与花叶比和花树比呈现较好的相关性;李子艺等[11]采用BP神经网络对南疆盆地主栽果树进行基于冠层光谱的分类,而且分类精度较高。国内外基于光谱技术对果树的研究基本局限于病虫害预警、施药、叶面积指数估计和冠层生物量检测、产量预测和果品品质评估等方面[12-13],对于果树花期分类的研究涉及极少。本研究采集并分析了常见4种果树花期的光谱数据,并选取了相关特征波长以及归一化植被指数(INDV)和比值植被指数(IRV)分类建模,以期探寻利用地面全波段光谱测试数据对果树树种进行科学识别的有效方法与途径,并为今后高空遥感技术进行果树树种识别提供理论基础。
-
近红外光谱通常包含数以千计的波长变量,且远大于样本量,利用全波段数据进行建模时,并非每个波长都能提供有用信息,大量的冗余数据会增加建模工作量。本研究采用连续投影算法(SPA)[19],寻找含有最少冗余信息的变量组合,使变量间的共线性最小。迭代结果如图 2所示,按筛选出的顺序排序特征波长分别为541,395,370,682,1 839,2 481,1 268 nm。
对4类树种花的光谱数据求平均值(图 3),发现在430 ~ 1 000 nm波段下光谱反射率由高到低的顺序为:苹果>梨>杏>桃;在1 100~1 400 nm波段下,光谱反射率由高到低的顺序为:苹果>梨>桃>杏;在1 500 ~ 1 800 nm光谱反射率由高到低的顺序为:苹果>梨>桃>杏。对光谱数据求导数可以反映光谱反射率的上升速度,从图 4可知:桃在562 ~ 675 nm波段时反射率上升最快,其次是杏,苹果,梨;在695 ~ 750 nm波段时,反射率上升速度有所变化,速度由高到低为苹果>梨>桃>杏。由此可知:在562 ~ 675 nm和695 ~ 750 nm波段下果树花期光谱波形有差异,不能被全部采用,因此连续投影算法(SPA)将此2个波段大部数据排除,只选择了此波段的峰值590 nm,720 nm作为建模数据;植被指数是能反映植物生长状况的指数,常用的植被指数有IRV和INDV,为了提高模型的精度本研究又增加这2个植被指数用于建模。综上分析,最终选取的特征波长为370,395,541,590,682,720,1 839,2 481,1 268 nm以及IRV和INDV。
-
从图 5和表 1可知:残差方差和误差随着模型输入主成分数量的增加先减小而后稳定,决定系数R2值则先增加而后稳定。当主成分数值显示为6时,得到均方误差最小值为0.05,决定系数最大值为0.79(表 1);因此,在随即建立的PLS-DA模型中选择了6个主成分,由此得到的得分图如图 6所示,显示效果较好。
表 1 各主成分误差变化及决定系数变化情况
Table 1. Changes of errors and R2 for every principal parameters
主成分参数 模型决定
系数R2预测集决
定系数Q2误差 测试集误差 PC1 0.22 0.22 0.20 0.20 PC2 0.44 0.44 0.08 0.08 PC3 0.53 0.52 0.08 0.09 PC4 0.59 0.58 0.04 0.05 PC5 0.66 0.65 0.08 0.08 PC6 0.79 0.78 0.05 0.05 PC7 0.78 0.77 0.06 0.06 PC8 0.79 0.78 0.05 0.06 通过使用所选择的最佳波长和植被指数建立的PLS-DA模型如下:y=-3.30R369+6.20R394-7.99R540+5.51R681-1.79R590-4.25R720+3.29R1267-0.98R1838+3.44R2480-12.50INDV+0.45IRV+8.22。表 2显示了不同果树树种在PLS-DA模型下的预测精度。结果表明:对于苹果、桃和杏的预测精度较高,梨的准确度略低。不同果树物种的检测精度差异很大。预测集样本总体识别率为76.36%。
表 2 PLS-DA模型下4类果树花期光谱识别率
Table 2. Classification results of PLS-DA model for four fruit tree species
种类 识别次数/次 识别率/% 梨 苹果 桃 杏 梨 3 12 0 0 20.00 苹果 0 20 0 0 100 桃 0 0 9 1 90.00 杏 0 0 0 10 100 识别率/% 100 62.50 100 90.91 76.36 -
从图 7和表 3可知:残差方差和误差随着模型输入主成分数量的增加先减小而后趋于稳定,相关系数R2则先增加而后趋于稳定增加。当主成分数值显示为7时,得到均方误差最小值为0.04,决定系数R2最大值为0.85(表 3);因此,在建立O-PLS-DA模型中选择了7个主成分作为指标,得到得分图如图 8所示。此模型下分类效果比PLS-DA更明显。
表 3 各主成分误差变化及决定系数变化情况
Table 3. Changes of errors and R2 for every principal parameters
主成分参数 模型决定
系数R2预测集决
定系数Q2误差 测试集误差 PC1 0.05 0.04 0.34 0.34 PC2 0.30 0.29 0.18 0.18 PC3 0.53 0.51 0.07 0.08 PC4 0.67 0.64 0.06 0.06 PC5 0.79 0.76 0.05 0.05 PC6 0.82 0.81 0.04 0.04 PC7 0.84 0.82 0.04 0.05 PC8 0.85 0.84 0.04 0.04 建立的O-PLS-DA模型如下:y=0.01R369-0.06R394-1.08R540-0.52R681-0.89R590-0.99R720-0.96R1267-0.51R1838+0.10R2480-0.28INDV-2.58IRV+2.16。表 4显示了不同果树树种的O-PLS-DA模型的预测精度。结果表明,对于苹果、桃和杏的预测精度较高,梨的准确度略低,但比PLS-DA略有提高。不同果树品种的检测精度差异很大。预测集样本总体识别率为81.82%,比PLS-DA模型精度有所提高。
表 4 Q-PLS-DA模型下4类未知果树花期光谱识别率
Table 4. Classification results of O-PLS-DA model for detecting fruit tree species
种类 识别次数/次 识别率/% 梨 苹果 桃 杏 梨 6 8 1 0 40.00 苹果 0 20 0 0 100 桃 0 1 9 0 90.00 杏 0 0 0 10 100 识别率/% 100 68.97 81.82 100 81.82 -
图 9表明:在训练34次后交叉熵趋向于平稳,即BP神经网络算法在迭代34次时得到最稳定模型,误差最优为0.04~0.05(图 10),在预测集中有部分杏被误认为桃,总体识别率达到93.90%(表 5),与前面2种识别方法相比,BP神经网络算法具有自动划分样本集的功能,方法有效,识别率高。由于BP神经网络是有输入层、隐含层、输出层的非线性模型,因此没有具体的模型表达式。
表 5 BP模型下4类果树花期预测集光谱识别率
Table 5. Classification results of BP model for detecting fruit tree species
种类 识别次数/次 识别率/% 梨 苹果 桃 杏 梨 8 0 0 0 100 苹果 0 20 0 0 100 桃 0 0 23 1 95.80 杏 0 0 3 11 78.60 识别率/% 100 100 88.50 91.70 93.90
Automatic detection of fruit tree species during the flowering period using near infrared spectra technologies
-
摘要: 为建立果树花期树种识别的有效模型,利用ASD FieldSpec 3全波段便携式光谱分析仪采集了4种果树花期花的光谱数据。利用剔除异常光谱、5点移动平滑等技术对4种果树花期花的光谱反射率进行预处理,使用连续投影算法(SPA)进行有效波长选取并获得7个波长下的反射光谱,同时增加了590 nm和720 nm处2个波形差异大的光谱,与归一化植被指数(INDV)和比值植被指数(IRV)共11个特征波段作为分类建模数据,建立了偏最小二乘判别分析(PLS-DA),正交偏最小二乘判别分析(O-PL-DA)和基于误差反向传播算法的多层前向神经网络(BP)算法3种识别模型。结果表明:对测试样本的识别率由高到低依次为BP(93.90%)> O-PLS-DA(81.82%)> PLS-DA(76.36%)。综合研究认为:在优选波段的基础上,对果树花期树种判别应优选BP神经网络模型。Abstract: To establish an effective model for fruit tree species identification at the flowering stage, spectral data of four kinds of fruit trees were collected using an ASD FieldSpec 3 full band portable spectrometer. Nine sensitive and characteristic bands of the spectrum (370 nm, 395 nm, 541 nm, 590 nm, 682 nm, 720 nm, 1 268 nm, 1 839 nm, and 2 481 nm) and two vegetation indices for accurately detecting fruit tree species were first obtained using the Successive-Projections-Algorithm (SPA) method. Subsequently, some classification methods were applied, such as Partial Least Squares Discriminant Analysis (PLS-DA), Orthogonal Projection to Latent Structure Discriminant Analysis (O-PLS-DA), and Back Propagation (BP), to compare their effectiveness for distinguishing fruit tree species. Choice 30 m×30 m standard rural area in the garden, select 10 trees of every 4 fruit tree species and every tree select 3-4 points using optional bolting method. 10 spectra were measured and take the average at every point, repeated three times. Results showed that the average detecting accuracy for PLS-DA was 73.36%, for O-PLS-DA was 81.82%, and for BP was 93.90% with the BP model having the best prediction accuracy for clarifying fruit tree species. This study demonstrated the feasibility of implementing hyperspectral imaging from near infrared spectra technologies (NIST) for identifying fruit tree species during the flowering period.
-
Key words:
- non-timber forest products (NTFP) /
- fruit tree florescence /
- near infrared spectrum /
- classification /
- PLS-DA /
- O-PLS-DA /
- BP
-
表 1 各主成分误差变化及决定系数变化情况
Table 1. Changes of errors and R2 for every principal parameters
主成分参数 模型决定
系数R2预测集决
定系数Q2误差 测试集误差 PC1 0.22 0.22 0.20 0.20 PC2 0.44 0.44 0.08 0.08 PC3 0.53 0.52 0.08 0.09 PC4 0.59 0.58 0.04 0.05 PC5 0.66 0.65 0.08 0.08 PC6 0.79 0.78 0.05 0.05 PC7 0.78 0.77 0.06 0.06 PC8 0.79 0.78 0.05 0.06 表 2 PLS-DA模型下4类果树花期光谱识别率
Table 2. Classification results of PLS-DA model for four fruit tree species
种类 识别次数/次 识别率/% 梨 苹果 桃 杏 梨 3 12 0 0 20.00 苹果 0 20 0 0 100 桃 0 0 9 1 90.00 杏 0 0 0 10 100 识别率/% 100 62.50 100 90.91 76.36 表 3 各主成分误差变化及决定系数变化情况
Table 3. Changes of errors and R2 for every principal parameters
主成分参数 模型决定
系数R2预测集决
定系数Q2误差 测试集误差 PC1 0.05 0.04 0.34 0.34 PC2 0.30 0.29 0.18 0.18 PC3 0.53 0.51 0.07 0.08 PC4 0.67 0.64 0.06 0.06 PC5 0.79 0.76 0.05 0.05 PC6 0.82 0.81 0.04 0.04 PC7 0.84 0.82 0.04 0.05 PC8 0.85 0.84 0.04 0.04 表 4 Q-PLS-DA模型下4类未知果树花期光谱识别率
Table 4. Classification results of O-PLS-DA model for detecting fruit tree species
种类 识别次数/次 识别率/% 梨 苹果 桃 杏 梨 6 8 1 0 40.00 苹果 0 20 0 0 100 桃 0 1 9 0 90.00 杏 0 0 0 10 100 识别率/% 100 68.97 81.82 100 81.82 表 5 BP模型下4类果树花期预测集光谱识别率
Table 5. Classification results of BP model for detecting fruit tree species
种类 识别次数/次 识别率/% 梨 苹果 桃 杏 梨 8 0 0 0 100 苹果 0 20 0 0 100 桃 0 0 23 1 95.80 杏 0 0 3 11 78.60 识别率/% 100 100 88.50 91.70 93.90 -
[1] 邓小蕾. 果园信息获取现代传感方法及装置研究[D]. 北京: 中国农业大学, 2014. DENG Xiaolei. Advanced Sening Method and Apparatus for Orchard Information Collection[D]. Beijing:China Agricultural University, 2014. [2] MASELLI F, CHIESI M, BRILLI L, et al. Simulation of olive fruit yield in tuscany through the integration of remote sensing and ground data[J]. Ecol Model, 2012, 244(1745):1-12. [3] PEÑA M A, BRENNING A. Assessing fruit-tree crop classification from landsat-8 time series for the Maipo valley, Chile[J]. Remote Sens Environ, 2015, 171(10):234-244. [4] STRUTHERS R, IVANOVA A, TITS L, et al. Thermal infrared imaging of the temporal variability in stomatal conductance for fruit trees[J]. Int J Appl Earth Obs Geoinf, 2015, 39(2):9-17. [5] IMMITZER M, VUOLO F, ATZBERGER C. First experience with sentinel-2 data for crop and tree species classifications in Central Europe[J]. Remote Sens, 2016, 8(3):166. doi:10.3390/rs8030166. [6] LIU Xiaolong, BO Yanchen. Object-based crop species classification based on the combination of airborne hyperspectral images and LiDAR data[J]. Remote Sens, 2015, 7(1):922-950. doi:10.3390/rs70100922. [7] 邢东兴, 常庆瑞.基于花期果树冠层光谱反射率的果树树种辨识研究[J].红外与毫米波学报, 2009, 28(3):207-211. XING Dongxing, CHANG Qingrui. Identification of species of fruit trees based on the spectral reflectance of canopies of fruit trees during flowering period[J]. J Infrared Millim Waves, 2009, 28(3):207-211. [8] 朱西存, 赵庚星, 王凌, 等.基于高光谱的苹果花氮素含量预测模型研究[J].光谱学与光谱分析, 2010, 30(2):416-420. ZHU Xicun, ZHAO Gengxing, WANG Ling, et al. Hyperspectrum based prediction model for nitrogen content of apple flowers[J]. Spectrosc Spectral Anal, 2010, 30(2):416-420. [9] 朱西存, 赵庚星, 雷彤, 等.苹果花期的冠层高光谱特征研究[J].光谱学与光谱分析, 2009, 29(10):2708-2712. ZHU Xicun, ZHAO Gengxing, LEI Tong, et al. Study on hyperspectral characteristics of apple florescence canopy[J]. Spectrosc Spectral Anal, 2009, 29(10):2708-2712. [10] 雷彤, 赵庚星, 朱西存, 等.基于高光谱和数码照相技术的苹果花期光谱特征研究[J].中国农业科学, 2009, 42(7):2481-2490. LEI Tong, ZHAO Gengxing, ZHU Xicun, et al. Research of apple florescence spectral features based on hyperspectral data and digital photos[J]. Sci Agric Sin, 2009, 42(7):2481-2490. [11] 李子艺, 王振锡, 岳俊, 等.基于BP神经网络的高光谱果树树种识别研究[J].江苏农业科学, 2016, 44(5):410-414. LI Ziyi, WANG Zhenxi, YUE Jun, et al. Study on recognition of fruit tree with hyperspectral data based on BP neural network[J]. Jiangsu Agric Sci, 2016, 44(5):410-414. [12] DAS P T, TAJO L, GOSWAMI J. Assessment of citrus crop condition in umling block of Ri-Bhoi district using RS and GIS technique[J]. J Indian Soc Remote Sens, 2009, 37(2):317-324. [13] 郑剑, 周竹, 仲山民, 等.基于近红外光谱与随机青蛙算法的褐变板栗识别[J].浙江农林大学学报, 2016, 33(2):322-329. ZHENG Jian, ZHOU Zhu, ZHONG Shanmin, et al. Chestnut browning detected with near-infrared spectroscopy and a random-frog algorithm[J]. J Zhejiang A & F Univ, 2016, 33(2):322-329. [14] 刘伟, 赵众, 袁洪福, 等.光谱多元分析校正集和验证集样本分布优选方法研究[J].光谱学与光谱分析, 2014, 34(4):947-951. LIU Wei, ZHAO Zhong, YUAN Hongfu, et al. An optimal selection method of samples of calibration set and validation set for spectral multivariate analysis[J]. Spectrosc Spectral Anal, 2014, 34(4):947-951. [15] 唐果, 田旷达, 李祖红, 等.近红外光谱结合PLS-DA划分烟叶等级[J].烟草科技, 2013(4):60-62. TANG Guo, TIAN Kuangda, LI Zuhong, et al. Classification of tobacco grades by near-infrared spectroscopy and PLS-DA[J]. Tobacco Sci Technol, 2013(4):60-62. [16] 唐军, 王青, 童红, 等.薰衣草精油的衰减全反射红外光谱辨别分析[J].光谱学与光谱分析, 2016, 36(3):716-719. TANG Jun, WANG Qing, TONG Hong, et al. Discriminant analysis of lavender essential oil by attenuated total reflectance infrared spectroscopy[J]. Spectrosc Spectral Anal, 2016, 36(3):716-719. [17] 王茜蒨, 黄志文, 刘凯, 等.基于主成分分析和人工神经网络的激光诱导击穿光谱塑料分类识别方法研究[J].光谱学与光谱分析, 2012, 32(12):3179-3182. WANG Qianqian, HUANG Zhiwen, LIU Kai, et al. Classification of plastics with laser-induced breakdown spectroscopy based on principal component analysis and artificial neural network model[J]. Spectrosc Spectral Anal, 2012, 32(12):3179-3182. [18] 高浪, 谢康和.人工神经网络在岩土工程中的应用[J].土木工程学报, 2002, 35(4):77-81. GAO Lang, XIE Kanghe. Application of artificial neural networks to geotechnical engineering[J]. China Civil Eng J, 2002, 35(4):77-81. [19] 成忠, 张立庆, 刘赫扬, 等.连续投影算法及其在小麦近红外光谱波长选择中的应用[J].光谱学与光谱分析, 2010, 30(4):949-952. CHENG Zhong, ZHANG Liqing, LIU Heyang, et al. Successive projections algorithm and its application to selecting the wheat near-infrared spectral variables[J]. Spectrosc Spectral Anal, 2010, 30(4):949-952. [20] 吴桂芳, 蒋益虹, 王艳艳, 等.基于独立主成分和BP神经网络的干红葡萄酒品种的鉴别[J].光谱学与光谱分析, 2009, 29(5):1268-1271. WU Guifang, JIANG Yihong, WANG Yanyan, et al. Discrimination of varieties of dry red wines based on independent component analysis and BP neural network[J]. Spectrosc Spectral Anal, 2009, 29(5):1268-1271. [21] 王艳艳, 何勇, 邵咏妮, 等.基于可见-近红外光谱的咖啡品牌鉴别研究[J].光谱学与光谱分析, 2007, 27(4):702-706. WANG Yanyan, HE Yong, SHAO Yongni, et al. Discrimination among different brands of coffee by using vis-near infrared[J]. Spectrosc Spectral Anal, 2007, 27(4):702-706. [22] 邵咏妮, 何勇, 鲍一丹.基于独立组分分析和BP神经网络的可见/近红外光谱蜂蜜品牌的鉴别[J].光谱学与光谱分析, 2008, 28(3):602-605. SHAO Yongni, HE Yong, BAO Yidan. Application of visible/near infrared spectroscopy to discriminating honey brands based on independent component analysis and BP neural network[J]. Spectrosc Spectral Anal, 2008, 28(3):602-605. -
链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.2017.06.006