基于优化<i>k</i>-NN模型的高山松地上生物量遥感估测

谢福明; 字李; 舒清态

doi:10.11833/j.issn.2095-0756.2019.03.012

基于优化k-NN模型的高山松地上生物量遥感估测

DOI: 10.11833/j.issn.2095-0756.2019.03.012

西南林业大学林学院, 云南昆明 650224

基金项目:

国家林业公益性行业科研专项 201404309

国家自然科学基金资助项目 31460194

国家自然科学基金资助项目 31060114

详细信息

作者简介: 谢福明, 从事地理信息系统与遥感应用研究。E-mail:geoxfming@qq.com

通信作者: 舒清态, 副教授, 博士, 从事"3S"技术及森林景观经营研究。E-mail:shuqt@163.com

中图分类号: S758.5

Optimizing the k-nearest neighbors technique for estimating Pinus densata aboveground biomass based on remote sensing

College of Forestry, Southwest Forestry University, Kunming 650224, Yunnan, China

摘要: 针对传统k-最近邻法（k-nearest neighbor，k-NN）在搜索最近邻单元时赋予特征变量相等的权重，缺少对特征变量加权优化等不足问题，在云南省香格里拉市，以高山松Pinus densata为研究对象，基于49块实测标准地，116株高山松样木和Landsat 8/OLI影像，在前期进行基于遗传算法（genetic algorithm，GA）优化的k-NN模型实现的基础上，对k-NN的3个参数（k，t和d）进行反复测试优化组合，在像元尺度上对研究区高山松地上生物量进行遥感估算。结果表明：基于遗传算法优化的k-NN模型精度优于传统的k-NN模型，优化前均方根误差为30.0 t·hm^-2，偏差为-0.418 t·hm^-2，相对标准误差百分比（R_MSE）为54.8%；优化后均方根误差为24.0 t·hm^-2，偏差为-0.123 t·hm^-2，R_MSE为43.7%。基于优化k-NN模型的研究区高山松地上生物量总储量估测结果为0.89×10⁷ t。
- 森林测计学 /
- k-NN模型 /
- 遗传算法 /
- Landsat 8/OLI /
- 地上生物量 /
- 高山松
Abstract: For the traditional k-nearest neighbor (k-NN), there are insufficient problems that give the weight of the feature variables equally when searching the nearest neighbor population units and a lack of weight vectors for the feature variables. In this study, Shangri-la City, Yunnan Province, was selected as the research area, and Pinus densata was taken as the research object. Based on 49 field data plots, 116 P. densata data samples, and Landsat 8/Operational Land Imager (OLI) imaging, a genetic algorithm was used to optimize the k-nearest neighbor model in the early stages, and the aboveground biomass of P. densata in the study area was estimated at the pixel scale after the k-NN three parameters (k, t, and d) were repeatedly tested and optimized. Results showed that accuracy of the k-NN model optimized by a genetic algorithm was better than the traditional k-NN model. Before optimization, the root mean square error was 30.0 t·hm^-2, deviation was -0.418 t·hm^-2, and R_MSE was 54.8%; after optimization, the root mean square error was 24.0 t·hm^-2, deviation was -0.123 t·hm^-2, and R_MSE was 43.7%. Finally, the estimated total aboveground biomass of P. densata in the study area was 0.89×10⁷ t based on the optimized k-NN model.
- forest mensuration /
- k-NN model /
- genetic algorithm /
- Landsat 8/OLI /
- aboveground biomass /
- Pinus densata

图 1 研究区地理位置示意图

Figure 1 Location of the study area

下载: 全尺寸图片幻灯片

图 2 高山松单木地上生物量模型验证

Figure 2 Validation of Pinus densata aboveground biomass model

下载: 全尺寸图片幻灯片

图 3 k-NN模型精度随k和t的变化曲线

Figure 3 Change curve of model accuracy with the value of k and t

下载: 全尺寸图片幻灯片

图 4 遗传算法优化中适应度值随遗传代数的降低曲线

Figure 4 Reduction of fitness value curve with the number of generations in optimization of genetic algorithm

下载: 全尺寸图片幻灯片

图 5 模型优化前后生物量的估测精度对比

Figure 5 Comparison of estimation accuracy of aboveground biomass of Pinus densata between k-NN and ik-NN model

下载: 全尺寸图片幻灯片

图 6 像元尺度下的k-NN/ik-NN模型局部反演对比

Figure 6 Comparison of local inversion of k-NN/ik-NN model on pixel scale

下载: 全尺寸图片幻灯片

图 7 像元尺度下香格里拉市高山松地上生物量反演结果示意图

Figure 7 Spatial distribution of Pinus densata aboveground biomass in Shangri-la at the pixel scale

下载: 全尺寸图片幻灯片

表 1 遥感因子一览表

Table 1. A list of factors derived from remote sensing

变量	数量	公式及说明
$\rho_{{{{\rm{B}}i}}}$	6	Landsat 8/OLI数据第i波段原始发生率拖$\rho_{{\rm{B}} i}(i=2, 3, 4, 5, 6, 7)$
$V_{{\rm{IS}} 234}$	1	${V_{{\rm{IS}}234}} = \sum\limits_{i = 2}^4 {{\rho _{{\rm{B}}i}}} $
$A_{\text { lledo }}$	1	${A_{{\rm{lhedo}}}} = \sum\limits_{i = 2}^7 {{\rho _i}} $
${P_{{\rm{CA}}j}}, {I_{{\rm{CA}}j}}, {M_{{\rm{NF}}j}}$	9	分别为主成分分析、独立主成分分析、MNF变换的第j成分(j=1, 2, 3)
$T_{{\rm{CB}}}, T_{{\rm{CG}}}, T_{{\rm{CW}}}$	3	分别为缨穗变换的亮度、绿度、湿度分量
$D_{{\rm{VI}}}$	1	差值植被指数${D_{{\rm{VI}}}} = {\rho _{{\rm{NIR}}}} - {\rho _{\rm{R}}}, \;{\rho _{{\rm{NIR}}}}, \;{\rho _{\rm{R}}}$分别为近红外波段、红波段的反射率
${N_{{\rm{DVI}}}}$	1	归一化植被指数:${N_{{\rm{DVI}}}} = \left( {{\rho _{{\rm{NIR}}}} - {\rho _{\rm{R}}}} \right)/\left( {{\rho _{{\rm{NIR}}}} + {\rho _{\rm{R}}}} \right)$
${E_{{\rm{VI}}}}$	1	增强植被指数:${E_{{\rm{VI}}}} = 2.5\left[ {\frac{{\left( {{\rho _{{\rm{NIR}}}} - {\rho _{\rm{R}}}} \right)}}{{\left( {{\rho _{{\rm{NIR}}}} + 6.0{\rho _{\rm{R}}} - 7.5{\rho _{{\rm{BLUE}}}} + 1} \right)}}} \right]$，$\rho_{{\rm{BLUE}}}$为蓝波段的反射率
$R_{{\rm{VI}}}$	1	比值植被指数:${R_{{\rm{VI}}}} = \left( {{\rho _{{\rm{NIR}}}}/{\rho _{\rm{R}}}} \right)$
$S_{{\rm{AVI}}}$	1	土壤调节植被指数：${S_{{\rm{AVI}}}} = \frac{{(1 + L)\left( {{\rho _{{\rm{NIR}}}} - {\rho _{\rm{R}}}} \right)}}{{\left( {{\rho _{{\rm{NIR}}}} + {\rho _{\rm{R}}} + L} \right)}}$，L为土壤调节系数，因研究区植被覆盖率大，本研究取0.25
B_{i_N_T}	96	纹理特征，即第i波段N×N窗口下的纹理滤波T。i=2, 3, 4, 5; N=3, 5, 9;T为纹理滤波，依次分为：均值ME，方差VA，协同性HO, 对比度CO, 相异性DI，信息熵EN，二阶矩SM，相关性CR
$E_{\text { levation }}$	1	海拔
$S_{\rm{lope}}$	1	DEM派生的坡度因子

下载: 导出CSV

表 2 生物量实测数据基本信息表

Table 2. Basic information of biomass measured data

变量	样木数据(N=116)			标准数据(N=49)
变量	树高/m	胸径/cm	单株地上生物量/kg	标准树高/m	标准胸径/cm
均值	15.061	24.094	276.381	9.275	15.295
最大值	33.00	76.00	2 058.50	14.77	23.10
最小值	4.20	5.60	4.03	5.61	8.62
标准差	6.480	14.082	370.847	2.092	3.373

下载: 导出CSV

表 3 不同特征变量等级下的模型精度对比

Table 3. Comparison of model accuracy under different level feature variables

特征变量等级	数量	$\widehat \sigma $/(t·hm^-2)	$\hat{\overline{e}}$/(t·hm^-2)	R_MSE/%
原始	123	33.96	0.03	61.6
显著相关	35	33.34	-2.7	63.6
极显著相关	16	29.95	-0.42	54.8
显著或极显著相关	51	34.52	0.01	62.6

下载: 导出CSV

表 4 遗传算法有效参数值与主要算子汇总

Table 4. Parameters and main functions of genetic algorithm

自定义有效参数值	主要算子(算法调用于Sheffield遗传算法工具箱)
初始化染色体群体个数n_pop: 50	crtbp.m，创建任意离散随机种群
遗传迭代次数n_gen:30~80	bs2rv.m，二进制串到实值的转换
染色体选择操作概率p_s: 0.95	ranking.m，基于排序的适应度分配
染色体基因交叉操作概率P_c:0.7	sus.m，随机遍历采样选择方式
染色体变异操作概率P_m: 0.01	xovsp.m，单点交叉；mut.m，离散变异
优化权重上限值: 0.5	reins.m，一致随机和基于适应度的重插入

下载: 导出CSV

表 5 第50代优化的特征变量权重值（遗传代数为50，上限值为0.5）

Table 5. Values of the elements of the weight vector for feature variables for the 50th optimization (with upper bounds 0.5 and 50 generations)

项目	B₂	B_{2_3_ME}	B_{2_3_HO}	B_{2_3_DI}	B_{3_3_HO}	B_{3_3_DI}	B_{3_3_EN}	B_{3_3_SM}	B_{4_3_ME}	B_{2_5_ME}	B_{3_5_ME}	B_{3_5_EN}	B_{3_5_SM}	B_{4_5_ME}	B_{2_9_ME}	B_{3_9_ME}
权重	2.10×l0^-3	2.50×10^-2	7.53×10^-2	1.41×10^-1	1.14×10^-1	1.24×10^-1	1.16×10^-1	6.12×10^-2	2.42×10^-2	2.88×10^-2	2.29×10^-2	2.75×10^-2	9.52×10^-2	2.59×10^-2	4.04×10^-2	7.50×10^-2
说明：B_{i_N_T}为纹理特征，即第i波段N×N窗口下的纹理滤波T。纹理滤波依次分为：均值ME，方差VA，协同性HO，对比度CO，相异性DI，信息熵EN，二阶矩SM，相关性CR。如B_{2_3_ME}，即第2波段3×3窗口下的均值（ME）纹理滤波，依次类推

下载: 导出CSV

表 6 高山松地上生物量实测值与模型预测值统计结果

Table 6. Statistics of observations and model predictions of aboveground biomass of Pinus densata

变量	生物量/(t·hm^-2)
变量	最小值	最大值	均值	标准差
样地实测	10.2	141.2	55.1	34.9
k-NN预测	16.2	92.6	54.7	18.9
ik-NN预测	23.3	95.2	55.0	20.1

下载: 导出CSV

[1]	王效科, 冯宗炜.中国森林生态系统中植物固定大气碳的潜力[J].生态学杂志, 2000, 19(4):72-74. WANG Xiaoke, FENG Zongwei. The potential to sequester atmospheric carbon through forest ecosystems in China[J]. Chin J Ecol, 2000, 19(4):72-74.
[2]	胡会峰, 刘国华.中国天然林保护工程的固碳能力估算[J].生态学报, 2006, 26(1):291-296. HU Huifeng, LIU Guohua. Carbon sequestration of China's National Natural Forest Protection Project[J]. Acta Ecol Sin, 26(1):291-296.
[3]	胡会峰, 刘国华.森林管理在全球CO₂减排中的作用[J].应用生态学报, 2006, 17(4):709-714. HU Huifeng, LIU Guohua. Roles of forest management in global carbon dioxide mitigation[J]. Chin J Appl Ecol, 2006, 17(4):709-714.
[4]	汤旭光, 刘殿伟, 王宗明, 等.森林地上生物量遥感估算研究进展[J].生态学杂志, 2012, 31(5):1311-1318. TANG Xuguang, LIU Dianwei, WANG Zongming, et al. Estimation of forest aboveground biomass based on remote sensing data:a review[J]. Chin J Ecol, 2012, 31(5):1311-1318.
[5]	TOMPPO E. Satellite imagery-based national inventory of Finland[J]. Int Arch Photogramm Remote Sensing, 1991, 28(7/1):419-424.
[6]	MCROBERTS R E. Estimating forest attribute parameters for small areas using nearest neighbors techniques[J]. For Ecol Manage, 2012, 272(3):3-12.
[7]	MCROBERTS R E, NÆSSET E, GOBAKKEN T. Optimizing the k-Nearest Neighbors technique for estimating forest aboveground biomass using airborne laser scanning data[J]. Remote Sensing Environ, 2015, 163:13-22.
[8]	MURA M, MCROBERTS R E, CHIRICI G, et al. Statistical inference for forest structural diversity indices using airborne laser scanning data and the k-Nearest Neighbors technique[J]. Remote Sensing Environ, 2016, 186:678-686.
[9]	MCROBERTS R E, DOMKE G M, CHEN Q, et al. Using genetic algorithms to optimize k-Nearest Neighbors configurations for use with airborne laser scanning data[J]. Remote Sensing Environ, 2016, 184:387-395.
[10]	MCROBERTS R E, CHEN Q, WALTERS B F. Multivariate inference for forest inventories using auxiliary airborne laser scanning data[J]. For Ecol Manage, 2017, 401:295-303.
[11]	KATILA M, TOMPPO E. Stratification by ancillary data in multisource forest inventories employing k-nearest neighbor estimation[J]. Can J For Res, 2002, 32(9):1548-1561.
[12]	TOMPPO E, HALME M. Using coarse scale forest variables as ancillary information and weighting of variables in k-NN estimation:a genetic algorithm approach[J]. Remote Sensing Environ, 2004, 92(1):1-20.
[13]	TOMPPO E, GAGLIANO C, NATALE F D, et al. Predicting categorical forest variables using an improved k-Nearest Neighbour estimator and Landsat imagery[J]. Remote Sensing Environ, 2009, 113(3):500-517.
[14]	陈尔学, 李增元, 武红敢, 等.基于k-NN和Landsat数据的小面积统计单元森林蓄积量估测方法[J].林业科学研究, 2008, 21(6):745-750. CHEN Erxue, LI Zengyuan, WU Honggan, et al. Forest volume estimation method for small areas based on k-NN and Landsat data[J]. For Res, 2008, 21(6):745-750.
[15]	郭颖.森林地上生物量的非参数遥感估测方法优化[D].北京: 中国林业科学研究院, 2011. GUO Ying. Optimum Non-Parametric Method for Forest Aboveground Biomass Estimation based on Remote Sensing Data[D]. Beijing: Chinese Academy of Forestry, 2011.
[16]	胥辉, 张会儒.林木生物量模型研究[M].昆明:云南科技出版社, 2002.
[17]	CHIRICI G, MURA M, MCINEMEY D, et al. A meta-analysis and review of the literature on the k-Nearest Neighbors technique for forestry applications that use remotely sensed data[J]. Remote Sensing Environ, 2016, 176(2):282-294.
[18]	谢福明, 舒清态, 字李, 等.基于k-NN非参数模型的高山松生物量遥感估测研究[J].江西农业大学学报, 2018, 40(4):743-750. XIE Fuming, SHU Qingtai, ZI Li, et al. Remote sensing estimation of Pinus densata aboveground biomass based on k-NN nonparametric model[J]. Acta Agric Univ Jiangxi, 2018, 40(4):743-750.
[19]	BEAUDOIN A, BERNIER P Y, GUINDON L, et al. Mapping attributes of Canada's forests at moderate resolution through k-NN and MODIS imagery[J]. Can J For Res, 2014, 44(5):521-532.
[20]	MCROBERTS R E. Estimating forest attribute parameters for small areas using nearest neighbors techniques[J]. For Ecol Manage, 2012, 272(3):3-12.

[1]	卢佶, 张国威, 吴昊. 基于多时相光学和雷达遥感的太平湖生态保护区森林地上生物量反演 . 浙江农林大学学报, 2023, 40(5): 1082-1092. doi: 10.11833/j.issn.2095-0756.20220682
[2]	杨绍钦, 王翔, 许澄, 商天其. 基于MODIS时间序列数据的竹林地上生物量估算 . 浙江农林大学学报, 2022, 39(4): 734-741. doi: 10.11833/j.issn.2095-0756.20210431
[3]	栾景然, 冯国红, 朱玉杰. 基于连续投影算法-遗传算法-BP神经网络的可见/近红外光谱木材识别 . 浙江农林大学学报, 2022, 39(3): 671-678. doi: 10.11833/j.issn.2095-0756.20210377
[4]	黄屹杰, 张加龙, 胡耀鹏, 程滔. 高山松地上生物量遥感估算的不确定性分析 . 浙江农林大学学报, 2022, 39(3): 531-539. doi: 10.11833/j.issn.2095-0756.20210473
[5]	杜雨菲, 吴保国, 陈玉玲. 基于机器学习算法的广西桉树适宜性研究 . 浙江农林大学学报, 2020, 37(1): 122-128. doi: 10.11833/j.issn.2095-0756.2020.01.016
[6]	兰洁, 肖中琪, 李吉玫, 张毓涛. 天山雪岭云杉生物量分配格局及异速生长模型 . 浙江农林大学学报, 2020, 37(3): 416-423. doi: 10.11833/j.issn.2095-0756.20190384
[7]	黄剑峰, 谭伟, 柴宗政, 蔡照军. 黔中马尾松近熟林空间结构特征及其调控 . 浙江农林大学学报, 2019, 36(4): 749-756. doi: 10.11833/j.issn.2095-0756.2019.04.015
[8]	王科, 谭伟, 戚玉娇. 近自然经营间伐对黔中马尾松天然次生纯林生长的初期效应 . 浙江农林大学学报, 2019, 36(5): 886-893. doi: 10.11833/j.issn.2095-0756.2019.05.006
[9]	申家朋, 陈东升, 孙晓梅, 张守攻. 基于似乎不相关回归和哑变量的日本落叶松单木生物量模型构建 . 浙江农林大学学报, 2019, 36(5): 877-885. doi: 10.11833/j.issn.2095-0756.2019.05.005
[10]	罗恒春, 张超, 魏安超, 张一, 黄田, 余哲修. 云南松林分平均胸径生长模型及模型参数环境解释 . 浙江农林大学学报, 2018, 35(6): 1079-1087. doi: 10.11833/j.issn.2095-0756.2018.06.011
[11]	王海宾, 彭道黎, 高秀会, 李文芳. 基于GF-1 PMS影像和k-NN方法的延庆区森林蓄积量估测 . 浙江农林大学学报, 2018, 35(6): 1070-1078. doi: 10.11833/j.issn.2095-0756.2018.06.010
[12]	冉啟香, 邓华锋, 黄国胜, 王雪军, 陈振雄. 云南松地上生物量模型研究 . 浙江农林大学学报, 2016, 33(4): 605-611. doi: 10.11833/j.issn.2095-0756.2016.04.008
[13]	吕常笑, 邓华锋, 王少杰, 陈振雄, 王雪军. 马尾松不同区域相容性立木材积和地上生物量模型 . 浙江农林大学学报, 2016, 33(5): 790-797. doi: 10.11833/j.issn.2095-0756.2016.05.010
[14]	王月婷, 张晓丽, 杨慧乔, 王书涵, 白金婷. 基于Landsat 8卫星光谱与纹理信息的森林蓄积量估算 . 浙江农林大学学报, 2015, 32(3): 384-391. doi: 10.11833/j.issn.2095-0756.2015.03.008
[15]	邓静, 陈宇拓. 利用增长量分配模型的杉木林分生长预测建模 . 浙江农林大学学报, 2014, 31(6): 898-904. doi: 10.11833/j.issn.2095-0756.2014.06.011
[16]	商珍珍, 周国模, 杜华强. 毛竹林地上生物量与胸径的分形关系 . 浙江农林大学学报, 2013, 30(3): 319-324. doi: 10.11833/j.issn.2095-0756.2013.03.002
[17]	魏晓慧, 孙玉军, 马炜. 基于Richards方程的杉木树高生长模型 . 浙江农林大学学报, 2012, 29(5): 661-666. doi: 10.11833/j.issn.2095-0756.2012.05.004
[18]	季碧勇, 陶吉兴, 张国江, 杜群, 姚鸿文, 徐军. 高精度保证下的浙江省森林植被生物量评估 . 浙江农林大学学报, 2012, 29(3): 328-334. doi: 10.11833/j.issn.2095-0756.2012.03.002
[19]	王晓宁, 徐天蜀, 李毅. 利用ALOS PALSAR双极化数据估测山区森林蓄积量模型 . 浙江农林大学学报, 2012, 29(5): 667-670. doi: 10.11833/j.issn.2095-0756.2012.05.005
[20]	田有圳, 黄金桃, 林照授, 涂育合, 叶功富. 凹叶厚朴一元立木材积方程的研究 . 浙江农林大学学报, 2002, 19(3): 255-258.

链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.2019.03.012

https://zlxb.zafu.edu.cn/article/zjnldxxb/2019/3/515

点击查看大图

图(7) / 表(6)

计量

文章访问数: 3678
HTML全文浏览量: 868
PDF下载量: 65
被引次数: 0

全文HTML

大气中温室气体浓度上升引起的全球气候变化，导致极端气候事件频发，严重威胁着人类生存与社会经济的可持续发展，成为各国政府和科学家关注的重大环境问题。在应对全球气候变化背景下，森林碳汇的相关研究成为科学界关注的热点^[1-3]。生物量是森林生态系统碳汇潜力评估的重要基础，如何快速、准确地获取森林生物量信息，在20世纪90年代就成了森林生态系统与全球气候变化研究的关键^[4]。准确评估森林碳储量的时空变化，不仅可以为森林资源的经营管理和林业可持续发展提供的科学依据，而且对碳循环及碳汇研究具有重要的意义。随着遥感技术的不断发展，利用数学模型结合实测样地数据进行生物量的大尺度快速估测变得有效可行。k-最近邻法（k-nearest neighbor, k-NN）作为一种非参数方法，已被广泛用于多源林业调查和森林参数估计的反演。1990年，TOMPPO^[5]首次将k-NN技术应用于芬兰森林资源监测中并取得了较好的效果。MCROBERTS^[6]记录了该技术在国际范围内被广泛用于林业应用领域，包括森林调查空间插值预测、数据库监测、反演制图、小区域估测和统计推理。从数据层面上来讲，k-NN与Landsat影像，机载激光扫面数据和MODIS数据联合使用估测评价森林属性的研究较多，并且将机载激光扫描指标等主动遥感变量与光学遥感、大尺度森林变量等参数结合使用有助于提高k-NN模型的预测精度^[7]。国外研究者在遗传算法的优化下，利用k-NN和机载激光扫描数据对森林资源调查、森林参数估测与评价等方面取得了较好的研究成果^[8-10]。KATILA等^[11]和TOMPPO等^[12]运用数字地图进行数据分层和使用遗传算法对特征变量进行加权来作为一种提高预测精度的手段后，该方法得到了加强。利用遗传算法对卫星影像数据特征变量加权优化将会提高估测精度，并且将优化好的模型应用于单一森林属性变量（如某个树种）比同时应用于多变量的精度会提高许多^[13]。然而，国内的研究学者缺少对k-NN模型算法进行优化改良的研究，仅局限于将传统的k-NN运用于不同的森林参数估计。如陈尔学等^[14]运用Landsat数据和传统的k-NN法对小面积统计单元森林蓄积量估测，其结果表明采用k-NN法对县市级统计单元森林参数的估测效果明显优于只利用固定样地数据的传统参数估测方法。郭颖^[15]利用k-NN非参数回归模型对甘肃省西水林场的森林地上生物量进行估测，并用随机森林算法（RF）进行特征选择后估测精度得以提升，优化后的算法在处理错误样本时具有良好的容错能力。本研究使用遗传算法对k-NN模型进行优化，使模型预测结果的偏差、均方根误差等最小化，以期提高模型的估测精度，实现对研究区高山松Pinus densata地上生物量储量估计与空间反演制图。

4. 结论与讨论

本研究使用遗传算法实现对k-NN模型中的特征变量赋予相应的权重值后，构建加权欧氏距离，结合卫星数据和地面实测样地数据建立了优化的k-NN估测回归模型，估算出香格里拉高山松地上生物量储量，反演出地上生物量分布等级图。结果显示：k-NN算法参数k和t分别取值为5和2时，模型的预测效果最佳；基于遗传算法优化的ik-NN模型预测精度优于传统的k-NN模型，均方根误差为24.0 t·hm^－2，偏差为－0.123 t·hm^－2，R_MSE为43.7%。研究区像素级水平下高山松地上生物量的预测值为16.8~108.9 t·hm^－2，总估计值为0.89×10⁷ t。

CHIRICI等^[17]研究显示：使用卫星光谱数据作为特征变量时，需要大量的样本来获取较小的相对标准误差百分比，这与本研究结果相符合。本研究k-NN模型的参考样本偏少，且参考样本在空间分布上相对集中（图 1），所以生物量的预测结果残差较大，出现高值低估，低值高估的现象；造成这一现象的另一个原因是k-NN法本身存在的缺陷，即只能局限于实测值范围内对未知单元进行估测，预测值不会超出实测值的范围，模型算法中k个参考样本间的加权求和降低了估计值的方差，从而产生了更大的估测误差。但k-NN在大尺度区域上的森林资源监测中有很大的潜力，不仅适用于森林参数的估测反演，还适用于森林调查空间插值预测、数据库监测、小区域估测和统计推理等研究^[19-20]，并且从以下方面做出突破可以有效提升其预测能力，为生活生产实践提供更好的技术借鉴：①k-NN在搜索最近邻个体时应限制搜寻的范围，如限制一个搜寻半径或在指定的图斑区域，而不是全局搜索，充分利用区域化变量的特性来提高模型的估测精度。②利用地物光谱的差异性，结合星载、机载高光谱数据和地面实测高光谱数据或者其他能够区分地物的单波段，利用最近邻法或其他机器学习算法实现对地物的精细识别，提高区域尺度上的地物分类精度，进而提高对其生理生化参数定量估测的准确性。

参考文献 (20)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于优化k-NN模型的高山松地上生物量遥感估测

DOI: 10.11833/j.issn.2095-0756.2019.03.012

作者简介: 谢福明, 从事地理信息系统与遥感应用研究。E-mail:geoxfming@qq.com

通信作者: 舒清态, 副教授, 博士, 从事"3S"技术及森林景观经营研究。E-mail:shuqt@163.com

Optimizing the k-nearest neighbors technique for estimating Pinus densata aboveground biomass based on remote sensing

计量

基于优化k-NN模型的高山松地上生物量遥感估测

doi: 10.11833/j.issn.2095-0756.2019.03.012

西南林业大学林学院, 云南昆明 650224

作者简介:
谢福明, 从事地理信息系统与遥感应用研究。E-mail:geoxfming@qq.com

通信作者: 舒清态, 副教授, 博士, 从事"3S"技术及森林景观经营研究。E-mail:shuqt@163.com

English Abstract

Optimizing the k-nearest neighbors technique for estimating Pinus densata aboveground biomass based on remote sensing

College of Forestry, Southwest Forestry University, Kunming 650224, Yunnan, China

全文HTML

2.1. 遥感数据及信息提取

2.2. 地面实测数据及处理

2.3. 基于传统和优化k-NN模型的生物量估测

2.3.1. 传统k-最近邻法（k-NN）

2.3.2. 优化k-最近邻法（ik-NN）

2.4. 模型的精度评价方法

3.1. 建模特征变量的筛选

3.2. 模型参数优化配置

3.2.1. k-NN模型参数优化配置

3.2.2. 遗传算法参数说明

3.3. 模型效果分析

3.4. 生物量估计与反演

目录

留言板

基于优化k-NN模型的高山松地上生物量遥感估测

DOI: 10.11833/j.issn.2095-0756.2019.03.012

作者简介: 谢福明, 从事地理信息系统与遥感应用研究。E-mail:geoxfming@qq.com

通信作者: 舒清态, 副教授, 博士, 从事"3S"技术及森林景观经营研究。E-mail:shuqt@163.com

Optimizing the k-nearest neighbors technique for estimating Pinus densata aboveground biomass based on remote sensing

计量

出版历程

基于优化k-NN模型的高山松地上生物量遥感估测

doi: 10.11833/j.issn.2095-0756.2019.03.012

西南林业大学 林学院, 云南 昆明 650224

作者简介: 谢福明, 从事地理信息系统与遥感应用研究。E-mail:geoxfming@qq.com

通信作者: 舒清态, 副教授, 博士, 从事"3S"技术及森林景观经营研究。E-mail:shuqt@163.com

English Abstract

Optimizing the k-nearest neighbors technique for estimating Pinus densata aboveground biomass based on remote sensing

College of Forestry, Southwest Forestry University, Kunming 650224, Yunnan, China

全文HTML

2.1. 遥感数据及信息提取

2.2. 地面实测数据及处理

2.3. 基于传统和优化k-NN模型的生物量估测

2.3.1. 传统k-最近邻法（k-NN）

2.3.2. 优化k-最近邻法（ik-NN）

2.4. 模型的精度评价方法

3.1. 建模特征变量的筛选

3.2. 模型参数优化配置

3.2.1. k-NN模型参数优化配置

3.2.2. 遗传算法参数说明

3.3. 模型效果分析

3.4. 生物量估计与反演

目录

西南林业大学林学院, 云南昆明 650224

作者简介:
谢福明, 从事地理信息系统与遥感应用研究。E-mail:geoxfming@qq.com