留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

高山松地上生物量遥感估算的不确定性分析

黄屹杰 张加龙 胡耀鹏 程滔

姬永杰, 杨丛瑞, 张王菲, 等. 基于机载P波段全极化SAR数据的森林地上生物量估测[J]. 浙江农林大学学报, 2022, 39(5): 971-980. DOI: 10.11833/j.issn.2095-0756.20220111
引用本文: 黄屹杰, 张加龙, 胡耀鹏, 等. 高山松地上生物量遥感估算的不确定性分析[J]. 浙江农林大学学报, 2022, 39(3): 531-539. DOI: 10.11833/j.issn.2095-0756.20210473
JI Yongjie, YANG Congrui, ZHANG Wangfei, et al. Forest above ground biomass estimation using airborne P band polarimetric SAR data[J]. Journal of Zhejiang A&F University, 2022, 39(5): 971-980. DOI: 10.11833/j.issn.2095-0756.20220111
Citation: HUANG Yijie, ZHANG Jialong, HU Yaopeng, et al. Uncertainty analysis of estimating aboveground biomass of Pinus densata by remote sensing[J]. Journal of Zhejiang A&F University, 2022, 39(3): 531-539. DOI: 10.11833/j.issn.2095-0756.20210473

高山松地上生物量遥感估算的不确定性分析

DOI: 10.11833/j.issn.2095-0756.20210473
基金项目: 国家自然科学基金资助项目(31860207);2020年云南省高层次人才培养支持计划“青年拔尖人才”专项(81210468);西南林业大学科研启动基金(111932)
详细信息
    作者简介: 黄屹杰(ORCID: 0000-0001-6922-1029),从事森林生物量遥感估测研究。E-mail: huangyijie@swfu.edu.cn
    通信作者: 张加龙(ORCID: 0000-0002-6969-3656),教授,博士,从事资源环境遥感研究。E-mail: jialongzhang@swfu.edu.cn
  • 中图分类号: S758.5

Uncertainty analysis of estimating aboveground biomass of Pinus densata by remote sensing

  • 摘要:   目的  采用遥感数据估算森林地上生物量仍存在一些不确定性问题,研究估算过程中的误差来源及其占比,对提高森林地上生物量的估测精度具有重要意义。  方法  从遥感影像提取因子,结合高山松Pinus densata外业调查数据,建立多元线性回归、梯度提升回归树、随机森林等3种地上生物量估测模型,对样地尺度与3种模型的不确定性进行分析和度量。  结果  ①高山松单株生物量模型不确定性为16.43%,样地尺度的不确定性为7.07%;②多元线性回归模型残差不确定性为34.86%,参数不确定性为21.30%,与样地不确定性合成后总不确定性为41.45%;③非参数模型中,梯度提升回归树估测高山松地上生物量的总不确定性为23.12%,随机森林为19.42%。  结论  3种遥感估算模型中,非参数模型的不确定性明显低于参数模型。相较于样地尺度,遥感估算模型的不确定性对地上生物量估算精度的影响较大。图3表3参26
  • 森林在陆地生态系统中发挥着重要的碳汇作用。森林生物量的空间精准量化对了解陆地碳储量、碳收支、碳平衡,以及它们与全球气候变化之间的关系具有重要意义[1-3]。森林地上生物量(AGB)为林木干、枝、叶的有机体干质量,不含林木根部、灌木、草本及林下枯枝落叶,是森林生物量的主体部分。近年来,采用遥感技术反演森林AGB展露出巨大的潜力,光学、激光雷达(LiDAR)、被动微波雷达和合成孔径雷达(SAR)等多种遥感数据用于森林AGB的估测,使得森林AGB估测的区域尺度性、经济性及精度等不断提升[3-7]。其中,SAR不受天时、天气的影响,且微波波长较长,在森林中具有较强的穿透能力,因此在获取森林密度、树高、AGB等森林垂直结构因子方面极具潜力[2, 8-10]。SAR估测森林AGB的能力有赖于其工作频率的高低,大量研究证实了低频波段后向散射对森林AGB变化的敏感性更强。在常用于森林监测的微波波段中,频率较低的P波段SAR后向散射系数对森林AGB变化最为敏感[11-13]。目前P波段的研究多基于机载数据展开,且研究区多位于国外,而国内相关研究则开展较少。CARTUS等[1]基于AfriSAR、BioSAR和TropiSAR机载飞行试验,使用P、C、L波段联合进行了森林AGB反演,结果表明P波段与森林结构因子的树干、树枝的相关性较高,P波段的加入有力地提高了反演的准确度和精度。LIAO等[14]使用TropiSAR机载P波段数据,采用层析方法(TomoSAR)将相干幅度、干涉相位和后向散射特征建模对法属圭亚那热带雨林AGB进行了反演,结果表明树高特征的引入可有效提高森林AGB反演精度,决定系数(R2)最高可达0.7。冯琦等[10]使用国产机载P波段数据结合坡度因子,在考虑当地入射角和坡度的情况下建立对数统计模型,对内蒙古根河市生态站的寒温带针叶林进行森林AGB的反演,最高反演精度R2为0.634、均方根误差(RMSE)为12.07 t·hm−2

    现有采用P波段SAR数据进行的森林AGB估测,多集中在采用P波段的后向散射信息、相位和相干性信息,而对于极化信息的利用则较少。由于SAR信息的差异,使得其用于森林AGB估测的方法也差异明显,如采用后向散射信息估测森林地上生物量,多采用线性回归参数模型;而采用相位和相干性信息利用层析技术进行森林AGB估测则多基于植被微波散射模型或电磁波信号模型进行反演。线性回归模型简单灵活,但通常无法表征P波段特征与森林AGB变化之间的复杂关系;植被散射模型或者电磁波信号模型能够体现森林与P波段电磁波之间的部分物理作用机制,但模型较复杂,应用推广困难。

    近年来,随着极化SAR数据的丰富,可提取的极化SAR特征涌现,非参数模型被广泛应用于SAR极化特征农作物生长参数的定量反演,并表现出较强的反演能力和较好的应用推广性。鉴于P在森林监测中的潜力,其极化特征在森林AGB估测中并未深入探索,参数模型过于简单、植被微波散射模型理解过于困难,本研究以中国北方典型寒温带森林作为研究对象,使用机载P波段SAR数据,提取多种极化特征,在分析其P波段极化散射特征的基础上,探索采用参数和非参数模型进行森林AGB估测的可行性,旨在明确P波段森林的极化散射特征,探索采用P波段极化SAR数据进行森林AGB估测具体应用的有效方法。

    研究区为位于内蒙古呼伦贝尔盟的根河市大兴安岭森林生态系统国家野外科学观测研究站(大兴安岭生态站),50°49′~50°51′N,121°30′~121°31′E。该研究站是中国纬度最高的森林生态研究站,面积为102 km2。研究区气候类型为典型的寒温带大陆性季风气候。研究区地势相对平缓,区域内80%的坡度小于15°,海拔高度分布在800~1 200 m,森林覆盖率大于75%,主要树种为兴安落叶松Larix gmelinii、白桦Betula platyphylla、樟子松Pinus sylvestris var. mongolica等。

    采用的P波段SAR数据由机载CAMSAR系统获得[15]。通过协议方式获取根河实验区机载P波段全极化(HH/HV/VV/VH) SLC数据。该数据是2013年9月以“奖状Ⅱ”飞机平台,以CASMSAR系统右视观测获取的全极化SAR数据。获取过程中飞行方向为自西向东,飞行高度为5 807 m,获取时间为2013年9月13—16日,极化方式为HH/HV/VH/VV,产品模式为SLC,幅宽为6 km × 7 km,中心入射角为55.058°,距离向分辨率为0.666 m,方位向分辨率为0.625 m。机载P波段SAR数据的预处理关键步骤包括多视处理、正射校正、入射角校正和极化方位角校正。多视视数在距离向和方位向均为3,数据的正射校正、入射校正参考文献[10];极化方位角校正过程和算法见文献[16]。P波段SAR数据预处理结果、森林AGB抽样点及林分概况见图1

    图 1  P波段SAR数据(A)及其覆盖区样点分布(B)、林分概况(C)
    Figure 1  P band SAR data (A), the distribution of samples (B) and stand examples (C)

    LiDAR获取的数字表面模型(DSM)、数字高程模型(DEM)用于P波段SAR数据的地理编码,由冠层高度模型(CHM)获取的LiDAR森林AGB数据用于反演模型的训练及验证。本研究获取的机载LiDAR数据是将Leica机载雷达系统荷载于“运-5”飞机平台上,于2012年8—9月在根河实验区开展飞行任务。该原始数据密度为5.6个·m−2的点云数据,激光中心波谱值为1550 nm,在初始点云数据的基础上,提取了研究区域高精度的DEM (图2A)、CHM (图2B)和森林AGB(图2C)等衍生产品。DSM、DEM、CHM数据的详细生成方法参考文献[17],高精度LiDAR森林AGB的详细提取过程与方法参考文献[10,18]。

    图 2  LiDAR衍生数据
    Figure 2  Lidar derived data

    为保证建模样本和验证样本能够代表整个研究区的森林AGB水平,以高精度LiDAR森林AGB图为基础,按照750 m的空间采样间隔,在ArcGIS中采用交互人工干预(去除道路及裸露地物)的方法选取113个样点(图1B)作为森林AGB反演模型的训练与验证。机载P波段SAR数据覆盖区森林林相不均匀,平均AGB较低,约46.7 t·hm−2,且大于100 t·hm−2的采样点仅有5个。113个样点AGB以10 t·hm−2间隔得分布情况(图1B):0~10 t·hm−2,3个;>10~20 t·hm−2,14个;>20~30 t·hm−2,17个;>30~40 t·hm−2,17个;>40~50 t·hm−2,18个;>50~60 t·hm−2,14个;>60~70 t·hm−2,10个;>70~80 t·hm−2,8个;>80~90 t·hm−2,7个;>90 t·hm−2,5个。

    极化目标分解方法是从全极化数据中提取地物极化信息的有效方法,目前多种极化分解参数在森林类型识别中表现出巨大的潜力。本研究采用目前常用的极化后向散射系数、常用的3种极化分解方法提取极化SAR特征,并基于此分析森林的极化散射特征。提取P波段HH、HV和VV等3个极化的后向散射系数,基于3个后向散射系数的雷达植被指数(RVI)、极化辨别率参数(PDR);基于Freeman-Durden三分量分解的体散射分量(FVOL)、单次散射分量(FODD)、二次散射分量(FDBL)、体地散射比分量(FD1/FD2,1表示地散射分量是ODD和DBL的和,2表示地散射分量仅为ODD);基于Yamaguchi的体散射分量(YVOL)、单次散射分量(YODD)、二次散射分量(YDBL)、螺旋体散射分量(YHLX);基于H-A-ALPHA极化分解的极化散射熵(entropy)、反熵(anisotropy)、散射角(alpha)、目标方位向角(beta)、相位差角1(gamma)、相位差角2(delta)。3种极化分解方法参考文献[19-20]。由于本次飞行试验时并未布设角反射器用于定标,因此本研究使用的后向散射系数值仅有相对含义。

    森林在P波段极化特征响应分析的目的是为了确定P波段对森林AGB动态变化敏感的极化特征参数,从而确定有效的极化特征参数进行森林AGB的估测。将研究区的森林AGB划分为A (表示生物量在0~30 t·hm−2变化时对应后向散射系数的箱线变化,均值约20 t·hm−2),B (31~50 t·hm−2,40 t·hm−2),C (51~70 t·hm−2,60 t·hm−2),D (71~90 t·hm−2,80 t·hm−2),E (>91 t·hm−2,100 t·hm−2)等5个变化等级,分别制作各等级相应P波段SAR提取参数值的箱线图,分析研究区各极化特征参数对森林AGB动态变化的响应,进而分析其极化散射特征。为了定量的分析各极化特征与森林AGB变化的关系,计算了它们之间的皮尔逊相关系数及显著性水平。

    3.2.1   多元线性逐步回归模型

    多元线性逐步回归模型(MLR)是森林AGB估测中最常用、最经典的方法之一。与常规的线性回归模型相比,MLR可同时完成模型输入参数的优选,进而提高森林AGB估测的效率和精度。MLR是将自变量逐个引入,每次判断自变量对因变量影响的显著性,并对模型中的自变量进行检验,逐个从模型中剔除不显著的变量,从而得到最优模型。即在保证显著性值在0.05以下的情况下,筛选相关性高的特征变量,进而得到因变量的最优估计。MLR的实现算法详见文献[21]。

    3.2.2   KNN、SVR、RF非参数模型

    KNN[22-25]、SVR[22, 24]和RF[24, 26]是森林AGB估测中常用的非参数模型,与参数模型相比,无固定的模型结构,通常通过数据驱动的方法来确定模型结构并用于森林AGB的估测,因此也称为机器学习方法。在森林AGB估测中,这3种方法各有优势,因此选取这3种方法来探究非参数方法在P波段森林AGB估测中的潜力。

    反演结果精度的定量评价通过反演结果与真值之间的决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)、估测精度(Acc)来表征。这4个参数的计算公式参考文献[27]。

    本研究获取的P波段中心波长为64 cm,该波段在森林中的穿透性较强。由图3可知:P波段20个SAR特征均表现出对研究区森林AGB变化的敏感性。P波段3种极化方式后向散射系数对森林AGB在0~110 t·hm−2内动态变化的响应与已有研究[28]相似,即后向散射系数的值均随着森林AGB的升高而缓慢增长。在各森林AGB水平中,HH、HV和VV散射能量强度相差并不明显,并且从箱线图(图3)的中值可以看出:HH的单调增长趋势较其他2个极化明显,且异常值较少。这可能是由于P波段波长较长,比较粗树干等圆柱体形状的散射体为森林中的散射体,使得去极化特征明显降低,因此同极化的HH和VV后向散射能量对AGB变化的敏感性明显高于HV[29]。此外,由后向散射系数计算的RVI也随着森林AGB增加而单调增加且未出现饱和现象,并且通过箱线图的宽度变化可以看出:各水平RVI箱宽变化不明显,说明该值对森林结构的变化不敏感,而对森林AGB的变化比较敏感。相比RVI,PDR非单调增长,在不同森林AGB水平,占主导散射的散射体会发生明显变化[30-31],该现象也可由Freeman-Durden中各个参数随森林AGB变化的响应加以说明。P波段Freeman-Durden分解相关特征中,除FODD和FDBL外,均随着森林AGB的增加而增加,并且2种体地散射比的值均远远大于1。Yamaguchi分解特征对森林AGB的响应趋势与Freeman-Durden分解相关特征的趋势基本一致。P波段H-A-ALPHA分解提取的参数中,散射熵(entropy)随着森林AGB增加而单调增加,而alpha则敏感性不明显。但beta、gamma和delta对森林AGB变化的敏感性则高于散射角alpha。P波段森林的极化散射特征随森林AGB的变化与已有研究中短波长的研究差异明显,说明现有的极化分解建模方法与该森林AGB水平P波段的散射特征有明显差异。

    图 3  P波段森林散射机制分析
    Figure 3  Forest scattering mechanism analysis at P band

    表1可知:极化分解中表征体散射分量的极化特征与森林AGB变化的显著性较低或不存在显著性,而二次散射特征分量则与森林AGB变化具有强相关性且显著性水平最高。这说明在本研究区,树干与地表形成的二次散射对森林AGB的变化最为敏感,且目前极化分解中的体散模型并不适合P波段研究区森林AGB水平下森林的散射机制。表1的定量分析结果与图4的定性分析结果对比可知:由于各极化参数的值域范围差异明显,图3对森林AGB敏感性较明显的参数在定量分析时相关性并不一定最高,因此图4的分析仅可作为初步参考,对于森林AGB敏感的极化特征参数的分析,仍需要采用皮尔逊系数进行相关性定量分析。

    表 1  P波段SAR极化特征与森林AGB相关性分析
    Table 1  Correlation coefficients of polarization feature and forest AGB
    特征RP特征RP特征RP
    HH 0.401** 0 F_VOL −0.129 0.173 alpha −0.734** 0
    HV −0.249** 0.008 Y_DBL 0.719** 0 beta 0.037 0.696
    VV −0.322** 0 Y_ODD 0.323** 0 delta 0.221* 0.018
    FD1 −0.453** 0 Y_VOL −0.213* 0.024 gamma 0.314** 0.001
    FD2 −0.448** 0 Y_HLX 0.187* 0.047 PDR 0.629** 0
    F_DBL 0.650** 0 entropy −0.136 0.151 RVI −0.374** 0
    F_ODD 0.303** 0.001 anisotropy 0.436** 0
      说明:R代表Pearson相关系数;P代表显著性水平,**代表0.01水平上显著;*代表0.05水平上显著
    下载: 导出CSV 
    | 显示表格
    图 4  4种模型森林AGB估测与LiDAR抽样点散点图
    Figure 4  Scatter plots of estimated and LiDAR forest AGB of four models

    表2可知:4种模型中,MLR模型估测结果精度最低,RF精度最高;而KNN和SVR模型的估测精度则相近,R2相同,RMSE、MAE和Acc也基本相同,比RF估测结果的最高值仅低约2%。

    表 2  基于4种模型的P波段SAR 森林AGB估测结果
    Table 2  P band SAR forest AGB inversion using four models
    波段反演模型模型参数R2RMSEAcc/%MAE
    P MLR 显著性为0.0008 0.43 19.16 63.55 16.99
    KNN K值为11,欧氏距离 0.54 17.04 71.18 13.44
    SVR 惩罚系数7.0 0.54 17.09 71.15 13.45
    RF 决策树数为100,树深度为11 0.60 15.98 72.97 12.60
    下载: 导出CSV 
    | 显示表格

    图4可看出:在整个森林AGB分布中,MLR估测结果分布较其他3种非参数方法分散,在森林AGB大于80 t·hm−2时出现了明显的饱和低估现象。其他3种方法尽管也有低估的现象,但是饱和现象并不明显。此外,本研究中4种方法估测结果的相对误差约30%,而以往区域性森林AGB的估测误差为37%~67%[32],采用P波段HV后向散射系数的估测结果中,同质性森林地区的相对误差约13%,而异质性地区相对误差则约60%[28]。在采用L-波段极化分解参数进行森林AGB反演研究中,在森林AGB水平低于120 t·hm−2时,后向散射的特征优于3种极化分解的特征,这与本研究中P波段的研究结果基本一致[33]。4种方法的估测结果中均出现了低值高估和高值低估的现象,这与以往采用不同遥感数据源进行森林AGB估测的结果一致[32]图5中,RF的残差分布最接近高斯分布,尽管峰值出现在10 t·hm−2左右,由于其值分布较窄,因此具有较高的估测精度。KNN和SVR的残差分布图均较为连续,并且分布区间明显高于MLR,但由于正值占比较大,因此总体上呈现高估现象。MLR估测结果的残差分布图在10和20 t·hm−2出现了2个明显的峰值,且所有残差值的分布范围较宽,解释了其估测精度低于其他3种方法的原因。在ENGHART等[34]基于C和L-波段参数和非参数方法森林AGB估测的研究中,也发现MLR的估测结果要略低于非参数模型。然而参数和非参数模型的适用性还受到训练样本大小的影响,因此在训练样本较大时可选择非参数模型进行估测,当样本较小时则可优先选择MLR方法进行森林AGB估测[32]

    图 5  森林AGB估测结果与LiDAR抽样点差值直
    Figure 5  Histograms of difference between forest AGB estimation results and LiDAR sampling points

    为了进一步分析P波段极化特征对森林AGB估测的潜力,本研究将研究区森林AGB划分为不同的等级,然后采用4种估测模型中估测结果最优的RF模型进行估测,估测结果见表3。在本研究中将森林AGB划分为3组,其中第1组分别以30、60 t·hm−2为边界划分为3个子组;而第2组和第3组分别以40和50 t·hm−2为界划分为2个子组。由表3可知:分组界限不同,估测精度有明显的差异,分组划分越详细,估测精度(Acc)越高;此外,3种分组情况的估测结果均表明:在森林AGB平均值约45 t·hm−2,最高值不超过120 t·hm−2时,P波段在森林AGB水平较高的分组估测精度较高,如在第1组中,森林AGB大于30 t·hm−2分组的估测精度比小于30 t·hm−2分组的估测精约高5%;而在以50 t·hm−2为分组界限的2组中,森林高AGB组的估测精度比低AGB组的估测精度约高出6%。表3的结果分析表明:待估森林的AGB水平对P波段极化特征进行森林AGB估测的估测精度有明显影响,且P波段极化信息更适合森林AGB较高区域森林AGB的估测。

    表 3  基于4种模型的P波段SAR 森林AGB反演情况     
    Table 3  P band SAR forest AGB inversion based on four models
    序号AGB分段/
    (t·hm−2)
    R2RMSE/
    (t·hm−2)
    Acc/%
    10~300.554.9276.12
    30~600.137.9581.85
    >600.2514.8981.57
    20~500.478.4672.15
    >500.3015.8078.19
    30~400.486.5274.36
    >400.3616.2174.82
    下载: 导出CSV 
    | 显示表格

    针对P波段极化SAR数据在森林AGB估测中的潜力,提取了20个P波段极化SAR参数,探索了森林AGB估测中常用的MLR、KNN、SVR和RF方法在使用P波段极化SAR数据进行森林AGB估测的潜力。结果表明:P波段极化SAR信息在森林AGB估测中具潜力,但估测精度受到待估区域森林AGB水平高低的影响;4种估测方法中,非参数方法的估测结果明显优于MLR估测。P波段森林AGB估测结果中,同样存在AGB低值高估和高值低估的现象,其原因仍需要进一步探索。此外由于本研究区的森林AGB均值为45 t·hm−2,最高值低于120 t·hm−2,所以P波段极化信息在AGB高于120 t·hm−2的森林覆盖区中对森林AGB的估测能力仍有待进一步研究。

  • 图  1  基于多元线性回归的地上生物量预测效果和残差不确定性

    Figure  1  Prediction effect and the residual uncertainty of aboveground biomass based on multiple linear regression

    图  2  基于梯度提升回归树的地上生物量预测效果和残差不确定性

    Figure  2  Prediction effect and the residual uncertainty of aboveground biomass based on gradient boost regression tree

    图  3  基于随机森林的地上生物量预测效果和残差不确定性

    Figure  3  Prediction effect and the residual uncertainty of aboveground biomass based on random forest

    表  1  外业调查样地统计

    Table  1.   Basic statistics of the sample plots of field surveys

    指标平均胸径/cm平均树高/m林分密度/(株·hm−2)
    最大值22.7614.183 100.00
    最小值6.854.48222.22
    平均值14.808.701 181.30
    标准差3.682.11714.14
    下载: 导出CSV

    表  2  建模和检验样本的地上生物量实测值

    Table  2.   Measured values of aboveground biomass of modeling and testing samples

    样本集样地数/个地上生物量/(t·hm−2)
    最大值最小值平均值标准差
    建模样本48169.7512.9556.5033.85
    检验样本1294.9715.4462.5626.48
    下载: 导出CSV

    表  3  3种地上生物量估测模型的不确定性

    Table  3.   Uncertainty results of the three aboveground biomass estimation models

    模型遥感估算地上生物量的不确定性样地尺度地上生物量的不确定性总不确定性/%
    模型残差
    变异/%
    模型参数
    变异/%
    遥感估测模型
    不确定性/%
    模型残差
    变异/%
    模型参数
    变异/%
    单株生物量模型
    不确定性/%
    样地尺度不
    确定性/%
    多元线性回归 34.8621.3040.8410.7612.4216.437.0741.45
    梯度提升回归树22.0122.0123.12
    随机森林   18.0918.0919.42
      说明:梯度提升回归树与随机森林为非参数模型,不考虑模型参数变异的不确定性
    下载: 导出CSV
  • [1] 唐守正, 张会儒, 胥辉. 相容性生物量模型的建立及其估计方法研究[J]. 林业科学, 2000, 36(专刊1): 19 − 27.

    TANG Shouzheng, ZHANG Huiru, XU Hui. Study on establish and estimate method of compatible biomass model[J]. Sci Silv Sin, 2000, 36(spec 1): 19 − 27.
    [2] 王维枫, 雷渊才, 王雪峰, 等. 森林生物量模型综述[J]. 西北林学院学报, 2008, 23(2): 58 − 63.

    WANG Weifeng, LEI Yuancai, WANG Xuefeng, et al. A review of forest biomass models [J]. J Northwest For Univ, 2008, 23(2): 58 − 63.
    [3] 徐婷, 曹林, 佘光辉. 基于Landsat 8 OLI的特征变量优化提取及森林生物量反演[J]. 遥感技术与应用, 2015, 30(2): 226 − 234.

    XU Ting, CAO Lin, SHE Guanghui. Feature extraction and forest biomass estimation based on Landsat 8 OLI [J]. Remote Sensing Technol Appl, 2015, 30(2): 226 − 234.
    [4] MCROBERTS R E, WESTFALL J A. Effects of uncertainty in model predictions of individual tree volume on large area volume estimates [J]. For Sci, 2014, 60(1): 34 − 42.
    [5] LU Dengsheng, CHEN Qi, WANG Guangxing, et al. A survey of remote sensing-based aboveground biomass estimation methods in forest ecosystems [J]. Int J Digital Earth, 2016, 9(1): 63 − 105.
    [6] BAO Rui, ZHANG Jialong, LU Chi, et al. Estimating above-ground biomass of Pinus densata Mast. using best slope temporal segmentation and Landsat time series[J/OL]. J Appl Remote Sensing, 2021, 15(2)[2021-03-25]. doi: 10.1117/1.JRS.15.024507.
    [7] ZHAO Panpan, LU Dengsheng, WANG Guangxing, et al. Examining spectral reflectance saturation in landsat imagery and corresponding solutions to improve forest aboveground biomass estimation [J]. Remote Sensing, 2016, 8(6): 469 − 495.
    [8] 张加龙, 胥辉, 陆驰. 应用Landsat 8 OLI和GBRT对高山松地上生物量的估测[J]. 东北林业大学学报, 2018, 46(8): 25 − 30.

    ZHANG Jialong, XU Hui, LU Chi. Estimating above ground biomass of Pinus densata based on Landsat 8 OLI and gradient boost regression [J]. J Northeast For Univ, 2018, 46(8): 25 − 30.
    [9] COHEN R, KAINO J, OKELLO J A, et al. Propagating uncertainty to estimates of above-ground biomass for Kenyan mangroves: a scaling procedure from tree to landscape level [J]. For Ecol Manage, 2013, 310: 968 − 982.
    [10] 秦立厚, 张茂震, 钟世红, 等. 森林生物量估算中模型不确定性分析[J]. 生态学报, 2017, 37(23): 7912 − 7919.

    QIN Lihou, ZHANG Maozhen, ZHONG Shihong, et al. Model uncertainty in forest biomass estimation [J]. Acta Ecol Sin, 2017, 37(23): 7912 − 7919.
    [11] SHETTLES M, TEMESGEN H, GRAY A N, et al. Comparison of uncertainty in per unit area estimates of aboveground biomass for two selected model sets [J]. For Ecol Manage, 2015, 354: 18 − 25.
    [12] CLARK D B, KELLNER J R. Tropical forest biomass estimation and the fallacy of misplaced concreteness [J]. J Veg Sci, 2012, 23(6): 1191 − 1196.
    [13] CHEN Qi, LAURIN G V, VALENTINI R. Uncertainty of remotely sensed aboveground biomass over an African tropical forest: propagating errors from trees to plots to pixels [J]. Remote Sensing Environ, 2015, 160: 134 − 143.
    [14] 秦立厚. 浙江省森林碳储量估算不确定性研究[D]. 杭州: 浙江农林大学, 2017.

    QIN Lihou. Uncertainty of Forest Carbon Storage Estimation in Zhejiang Province[D]. Hangzhou: Zhejiang A&F University, 2017.
    [15] 孙雪莲. 基于Landsat 8-OLI的香格里拉高山松林生物量遥感估测模型研究[D]. 昆明: 西南林业大学, 2016.

    SUN Xuelian. Biomass Estimation Model of Pinus densata Forests in Shangri-La City Based on Landsat 8-OLI by Remote Sensing[D]. Kunming: Southwest Forestry University, 2016.
    [16] NICHOL J, HANG L K, SING W M. Empirical correction of low sun angle images in steeply sloping terrain: a slope-matching technique [J]. Int J Remote Sensing, 2006, 27(3): 629 − 635.
    [17] 陆驰. 基于Landsat的香格里拉市高山松地上生物量及其动态变化建模研究[D]. 昆明: 西南林业大学, 2017.

    LU Chi. The Estimation and Dynamic Modeling on the Aboveground Biomass of Pinus densata in Shangri-La Based on Landsat[D]. Kunming: Southwest Forestry University, 2017.
    [18] HARALICK R M, SHANMUGAM K, DINSTEIN I. Textural features for image classification [J]. Stud Media Commun, 1973, 3(6): 610 − 621.
    [19] 岳彩荣. 香格里拉县森林生物量遥感估测研究[D]. 北京: 北京林业大学, 2011.

    YUE Cairong. Forest Biomass Estimation in Shangri-La County Based on Remote Sensing[D]. Beijing: Beijing Forestry University, 2011.
    [20] 张加龙, 胥辉. 基于遥感的高山松连清固定样地地上生物量估测模型构建[J]. 北京林业大学学报, 2020, 42(7): 1 − 11.

    ZHANG Jialong, XU Hui. Establishment of remote sensing based model to estimate the aboveground biomass of Pinus densata for permanent sample plots from national forestry inventory [J]. J Beijing For Univ, 2020, 42(7): 1 − 11.
    [21] FRIEDMAN J H. Greedy function approximation: a gradient boosting machine [J]. Ann Stat, 2001, 29(5): 1189 − 1232.
    [22] OU Guanglong, LÜ Yanyu, XU Hui, et al. Improving forest aboveground biomass estimation of Pinus densata forest in Yunnan of southwest China by spatial regression using Landsat 8 images [J]. Remote Sensing, 2019, 11(23): 738 − 762.
    [23] HOSMER D W, LEMESHOW S. Applied Logistic Regression [M]. New York: John Wiley & Sons, 2000.
    [24] 李金海. 误差理论与测量不确定度评定[M]. 北京: 中国计量出版社, 2003.

    LI Jinhai. Error Theory and Measurement Uncertainty Assessment[M]. Beijing: China Metrology Publishing House, 2003.
    [25] 陈蜀蓉, 张超, 郑超超, 等. 公益林生物量估算方法研究——以浙江省缙云县公益林为例[J]. 浙江林业科技, 2015, 35(5): 20 − 28.

    CHEN Shurong, ZHANG Chao, ZHENG Chaochao, et al. Estimation methods for biomass of ecological forest in Jinyun [J]. J Zhejiang For Sci Technol, 2015, 35(5): 20 − 28.
    [26] CHAVE J, CONDIT R, AGUILAR S, et al. Error propagation and scaling for tropical forest biomass estimates [J]. Philos Trans R Soc Lond Series B Biol Sci, 2004, 359(1443): 409 − 420.
  • [1] 南国卫, 王静慧, 秦淑莹, 韩磊, 何馨雨.  不同恢复年限刺槐林林下草本层的物种多样性 . 浙江农林大学学报, 2024, 41(5): 978-985. doi: 10.11833/j.issn.2095-0756.20240128
    [2] 卢佶, 张国威, 吴昊.  基于多时相光学和雷达遥感的太平湖生态保护区森林地上生物量反演 . 浙江农林大学学报, 2023, 40(5): 1082-1092. doi: 10.11833/j.issn.2095-0756.20220682
    [3] 周东洋, 王晓雨, 朱向涛, 詹咪莎, 白尚斌.  亚热带常绿阔叶林5个优势树种的树干碳氮磷质量分数估算及其不确定性分析 . 浙江农林大学学报, 2022, 39(4): 727-733. doi: 10.11833/j.issn.2095-0756.20220171
    [4] 姬永杰, 杨丛瑞, 张王菲, 曾鹏, 张甫香, 屈亚妮.  基于机载P波段全极化SAR数据的森林地上生物量估测 . 浙江农林大学学报, 2022, 39(5): 971-980. doi: 10.11833/j.issn.2095-0756.20220111
    [5] 杨绍钦, 王翔, 许澄, 商天其.  基于MODIS时间序列数据的竹林地上生物量估算 . 浙江农林大学学报, 2022, 39(4): 734-741. doi: 10.11833/j.issn.2095-0756.20210431
    [6] 卢腾飞, 周律, 胡中岳, 欧光龙, 胥辉.  基于混合效应模型的迪庆云冷杉林地上生物量遥感估测 . 浙江农林大学学报, 2021, 38(3): 510-522. doi: 10.11833/j.issn.2095-0756.20200327
    [7] 兰洁, 肖中琪, 李吉玫, 张毓涛.  天山雪岭云杉生物量分配格局及异速生长模型 . 浙江农林大学学报, 2020, 37(3): 416-423. doi: 10.11833/j.issn.2095-0756.20190384
    [8] 申家朋, 陈东升, 孙晓梅, 张守攻.  基于似乎不相关回归和哑变量的日本落叶松单木生物量模型构建 . 浙江农林大学学报, 2019, 36(5): 877-885. doi: 10.11833/j.issn.2095-0756.2019.05.005
    [9] 谢福明, 字李, 舒清态.  基于优化k-NN模型的高山松地上生物量遥感估测 . 浙江农林大学学报, 2019, 36(3): 515-523. doi: 10.11833/j.issn.2095-0756.2019.03.012
    [10] 向安民, 刘凤伶, 于宝义, 李崇贵.  基于k-NN方法和GF遥感影像的森林蓄积量估测 . 浙江农林大学学报, 2017, 34(3): 406-412. doi: 10.11833/j.issn.2095-0756.2017.03.004
    [11] 吕常笑, 邓华锋, 王少杰, 陈振雄, 王雪军.  马尾松不同区域相容性立木材积和地上生物量模型 . 浙江农林大学学报, 2016, 33(5): 790-797. doi: 10.11833/j.issn.2095-0756.2016.05.010
    [12] 冉啟香, 邓华锋, 黄国胜, 王雪军, 陈振雄.  云南松地上生物量模型研究 . 浙江农林大学学报, 2016, 33(4): 605-611. doi: 10.11833/j.issn.2095-0756.2016.04.008
    [13] 俞淑红, 周国模, 施拥军, 吕玉龙, 沈振明.  毛竹碳汇造林初期净碳汇量监测与不确定性分析 . 浙江农林大学学报, 2016, 33(5): 807-815. doi: 10.11833/j.issn.2095-0756.2016.05.012
    [14] 王金亮, 程鹏飞, 徐申, 王小花, 程峰.  基于遥感信息模型的香格里拉森林生物量估算 . 浙江农林大学学报, 2013, 30(3): 325-329. doi: 10.11833/j.issn.2095-0756.2013.03.003
    [15] 商珍珍, 周国模, 杜华强.  毛竹林地上生物量与胸径的分形关系 . 浙江农林大学学报, 2013, 30(3): 319-324. doi: 10.11833/j.issn.2095-0756.2013.03.002
    [16] 玉宝, 张秋良, 王立明, 乌吉斯古楞.  不同结构落叶松天然林生物量及生产力特征 . 浙江农林大学学报, 2011, 28(1): 52-58. doi: 10.11833/j.issn.2095-0756.2011.01.009
    [17] 杨前宇, 谢锦忠, 张玮, 林振清.  椽竹各器官生物量模型 . 浙江农林大学学报, 2011, 28(3): 519-526. doi: 10.11833/j.issn.2095-0756.2011.03.027
    [18] 涂洁, 刘琪璟, 简敏菲.  千烟洲湿地松中幼林树冠生物量及生长量分析 . 浙江农林大学学报, 2008, 25(2): 206-210.
    [19] 林新春, 方伟, 俞建新, 余学军, 胡超宗, 周林.  苦竹各器官生物量模型 . 浙江农林大学学报, 2004, 21(2): 168-171.
    [20] 贺东北, 骆期邦, 曾伟生.  立木生物量线性联立模型研究 . 浙江农林大学学报, 1998, 15(3): 298-303.
  • 期刊类型引用(0)

    其他类型引用(8)

  • 加载中
  • 链接本文:

    https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20210473

    https://zlxb.zafu.edu.cn/article/zjnldxxb/2022/3/531

图(3) / 表(3)
计量
  • 文章访问数:  728
  • HTML全文浏览量:  166
  • PDF下载量:  55
  • 被引次数: 8
出版历程
  • 收稿日期:  2021-07-08
  • 修回日期:  2021-12-24
  • 录用日期:  2022-03-04
  • 网络出版日期:  2022-05-23
  • 刊出日期:  2022-05-23

高山松地上生物量遥感估算的不确定性分析

doi: 10.11833/j.issn.2095-0756.20210473
    基金项目:  国家自然科学基金资助项目(31860207);2020年云南省高层次人才培养支持计划“青年拔尖人才”专项(81210468);西南林业大学科研启动基金(111932)
    作者简介:

    黄屹杰(ORCID: 0000-0001-6922-1029),从事森林生物量遥感估测研究。E-mail: huangyijie@swfu.edu.cn

    通信作者: 张加龙(ORCID: 0000-0002-6969-3656),教授,博士,从事资源环境遥感研究。E-mail: jialongzhang@swfu.edu.cn
  • 中图分类号: S758.5

摘要:   目的  采用遥感数据估算森林地上生物量仍存在一些不确定性问题,研究估算过程中的误差来源及其占比,对提高森林地上生物量的估测精度具有重要意义。  方法  从遥感影像提取因子,结合高山松Pinus densata外业调查数据,建立多元线性回归、梯度提升回归树、随机森林等3种地上生物量估测模型,对样地尺度与3种模型的不确定性进行分析和度量。  结果  ①高山松单株生物量模型不确定性为16.43%,样地尺度的不确定性为7.07%;②多元线性回归模型残差不确定性为34.86%,参数不确定性为21.30%,与样地不确定性合成后总不确定性为41.45%;③非参数模型中,梯度提升回归树估测高山松地上生物量的总不确定性为23.12%,随机森林为19.42%。  结论  3种遥感估算模型中,非参数模型的不确定性明显低于参数模型。相较于样地尺度,遥感估算模型的不确定性对地上生物量估算精度的影响较大。图3表3参26

English Abstract

姬永杰, 杨丛瑞, 张王菲, 等. 基于机载P波段全极化SAR数据的森林地上生物量估测[J]. 浙江农林大学学报, 2022, 39(5): 971-980. DOI: 10.11833/j.issn.2095-0756.20220111
引用本文: 黄屹杰, 张加龙, 胡耀鹏, 等. 高山松地上生物量遥感估算的不确定性分析[J]. 浙江农林大学学报, 2022, 39(3): 531-539. DOI: 10.11833/j.issn.2095-0756.20210473
JI Yongjie, YANG Congrui, ZHANG Wangfei, et al. Forest above ground biomass estimation using airborne P band polarimetric SAR data[J]. Journal of Zhejiang A&F University, 2022, 39(5): 971-980. DOI: 10.11833/j.issn.2095-0756.20220111
Citation: HUANG Yijie, ZHANG Jialong, HU Yaopeng, et al. Uncertainty analysis of estimating aboveground biomass of Pinus densata by remote sensing[J]. Journal of Zhejiang A&F University, 2022, 39(3): 531-539. DOI: 10.11833/j.issn.2095-0756.20210473
  • 森林生物量是森林生态系统的最基本数量特征,是研究林业和生态问题的基础[1]。地上生物量(aboveground biomass, AGB)是森林生态系统生产力的重要指标和质量的综合体现,对研究全球气候变化具有重要意义。目前,森林地上生物量的调查方法有地面调查和遥感监测2种。传统的地面调查法耗时长、成本高,而遥感监测方法快速、无损,具有在更大尺度上应用的优势,已成为地上生物量估测的主流[2-3]。在森林调查中,常使用统计模型来预测样地内个体树木的生物量,然后对同一树种的单株地上生物量进行汇总,来作为遥感估算生物量的训练数据和精度评估数据[4]。用于地上生物量估测的遥感数据源包括光学遥感、机载雷达、激光测量数据等[5]。与成本较高的机载雷达数据相比,光学影像穿透森林冠层获取树干信息的能力较差,但随着新算法的不断改进,使用光学遥感影像进行地上生物量估算的精度也在不断提高[6]

    目前,遥感估算地上生物量在因子选取、建模方法、数据饱和等方面存在较多不确定性问题[7-8]。区域尺度森林地上生物量遥感估算包含测量和抽样、单株生物量模型、遥感因子和地形因子等不确定性来源[9-10]。其中,与测量和抽样误差相比,模型的不确定性对地上生物量估算的影响较大,如SHETTLES等[11]利用激光雷达和地面数据估测地上生物量发现:模型不确定性占总不确定性的55%。同时,用于建模的生物量数据是使用该区域树种的异速生长方程计算得出的。因此,单株生物量模型的误差会传播到样地级的生物量估测,从而影响遥感估算生物量的不确定性[12-13]。现阶段不确定性的量化方法主要分为3种[14]:过程模型分析法、随机误差传递法和Monte Carlo模拟法。

    本研究基于云南省香格里拉市Landsat 8影像和外业调查数据,建立了生物量遥感估测模型,分析了遥感估算样地高山松Pinus densata地上生物量的总不确定性,以期为提高森林地上生物量估算精度提供参考。

    • 研究区位于云南省西北部的迪庆藏族自治州香格里拉市(26°52′~28°52′N,99°20′~100°19′E),该区总面积为11 613 km2,平均海拔为3 459 m。香格里拉市的森林覆盖率较高,达75%,主要植被类型为寒温性针叶林,优势树种有云杉Picea asperata、冷杉Abies fabri、高山松、云南松Pinus yunnanensis、高山栎Quercus semicarpifolia等。

    • 于2015年11月和2016年3月,在每个乡镇高山松纯林区域随机布设60块样地,大小为30 m×30 m,且每块样地间隔3 km以上。样地高山松林分的龄级主要为近熟林和成熟林。外业调查记录胸径大于5 cm样木的树高、胸径,同时对每块样地的林分密度进行了计算(表1)。

      表 1  外业调查样地统计

      Table 1.  Basic statistics of the sample plots of field surveys

      指标平均胸径/cm平均树高/m林分密度/(株·hm−2)
      最大值22.7614.183 100.00
      最小值6.854.48222.22
      平均值14.808.701 181.30
      标准差3.682.11714.14

      Landsat 8影像数据来源于美国地质调查局(http://glovis.usgs.gov/),3景数据为2015年11—12月的成像,云量均小于2%。

    • 采用每木检尺,通过胸径、树高和单株生物量模型[15]计算每株地上生物量,进而得出每块样地的地上生物量。单株生物量模型($ W $)如下:

      $$ W=0.073\times {D}^{1.739}\times {H}^{0.880} 。 $$ (1)

      式(1)中:$ D $为胸径,$ H $为树高,模型R2为0.992,均方根误差为30.778 kg。

    • 对影像数据进行辐射定标,采用FLAASH方法进行大气校正。以研究区SPOT-5影像为参考数据,选取100个地面控制点,采用二项式方法对影像进行几何校正,使用双线性内插法将影像重新采样为30 m×30 m,误差控制在1个像元内[8];接着,采用坡度匹配模型[16]进行地形校正。具体操作方法参考文献[17]。

      对预处理后的影像数据提取4类遥感因子:①原始波段因子,分别为C、B1、B2、B3、B4、B5、B7;②植被指数因子,分别为B43、B42、B53、B54、B57、B73、B74、B3Albedo、 B473、NDVI、ND32、ND53、ND54、ND57、ND452、DVI;③信息增强因子,分别为VIS123、Albedo、MID57;④纹理信息因子[18],分别为均值(ME)、方差(VA)、同质性(HO)、反差(CO)、相异(DI)、熵(EN)、角二阶矩(SM)、相关性(CR)、偏度(SK)。用R5和R9分别代表5×5和9×9窗口,如R9B5CR代表9窗口第5波段的相关性纹理。

      岳彩荣[19]提取了5×5、7×7、9×9、15×15的4种窗口纹理信息因子对香格里拉森林生物量进行了遥感估测;张加龙等[20]基于遥感影像和连续清查固定样地对高山松地上生物量进行估算时,使用了5×5、9×9的2种窗口纹理信息因子。以上研究表明:高山松地上生物量与5×5和9×9窗口的纹理信息因子相关性更强。因此,本研究的纹理信息因子选用5×5和9×9窗口。4类遥感因子的提取和计算参考文献[8, 17, 20]。

    • 基于SPSS软件对样地地上生物量与备选遥感因子进行相关性分析,结果按照Pearson系数进行排序。本研究因子入选的显著性水平为P≤0.05,因子剔除的水平为P≥0.10,得到相关性排前14个的遥感因子。为避免解释变量之间的多重共线性问题,将各个遥感因子之间相关性较高的因子剔除,最终筛选9个因子参与模型建立,分别为B74、9窗口第5波段相关性(R9B5CR)、9窗口第6波段方差(R9B6VA)、9窗口第3波段熵(R9B3EN)、5窗口第5波段角二阶矩(R5B5SM)、9窗口第6波段相关性(R9B6CR)、5窗口第3波段熵(R5B3EN)、5窗口第4波段熵(R5B4EN)、5窗口第4波段偏度(R5B4SK)。

    • 遥感估算高山松地上生物量的3种方法分别为多元线性回归(MLR)、梯度提升回归树(GBRT)以及随机森林(RF)。从60个样地调查数据中随机选取48个(80%)进行建模,剩余12个(20%)用来独立性检验。建模和检验样本的地上生物量统计结果见表2

      表 2  建模和检验样本的地上生物量实测值

      Table 2.  Measured values of aboveground biomass of modeling and testing samples

      样本集样地数/个地上生物量/(t·hm−2)
      最大值最小值平均值标准差
      建模样本48169.7512.9556.5033.85
      检验样本1294.9715.4462.5626.48
    • 多元线性回归模型可以同时对多个解释变量与1个因变量进行拟合,用回归方程来表示拟合关系。本研究多元线性回归建模在SPSS软件中实现。

    • 该方法通过构建多个弱分类器,经过多次迭代最终组合成1个强分类器[21]。本研究基于Python语言的Sklearn工具包提供的梯度提升回归树算法,对高山松地上生物量与遥感因子进行建模分析。在建模分析前需要对弱分类器的最大迭代次数(n_estimators)、学习速率(learning_rate)、最大深度(max_depth)等参数进行确定。参数确定往往需要遵循一定的经验,比如最大迭代次数通常在预测值收敛的情况下越小越好,学习速率通常小于0.10,最大深度通常不应大于15。依据这些经验设置上述参数的范围,比较参数值组合下模型学习的效果,以得到模型输出预测结果[8]。本研究根据拟合优度的最佳参数组合,选取最大迭代次数为60,子采样为0.5,学习速率为0.05,决策树最大深度为7,叶子节点最少样本数为3。

    • 随机森林适用于多数分类与回归的问题,由一系列决策树组成。基于Python语言的Sklearn工具包进行高山松地上生物量建模分析。程序使用bootstrap重采样方法从样本集中提取多个重采样样本进行建模,之后对多个模型值进行预测并组合,再通过投票得出最终值,一般会在随机产生的分类树中选出重叠次数最多的决策树作为最终模型[6]。本研究初步设置决策树数量为50,逐步增加决策树数量模拟建模过程,回归误差趋于稳定,最终确定决策树数量为300。

    • 采用的评价指标包括决定系数(R2)、均方根误差(RMSE)、预测精度(F)。各指标计算如下:

      $$ {R}^{2}=\frac{\displaystyle \sum \limits_{i=1}^{s}{\left(\hat{{y}_{i}}-\bar{y}\right)}^{2}}{\displaystyle \sum \limits_{i=1}^{s}{\left({y}_{i}-\bar{y}\right)}^{2}} \text{;} $$ (2)
      $$ {R}_{\mathrm{M}\mathrm{S}\mathrm{E}}=\sqrt{\frac{\displaystyle \sum _{i=1}^{s}{\left({y}_{i}-\hat{{y}_{i}}\right)}^{2}}{s}} \text{;} $$ (3)
      $$ F=\frac{1}{s}\sum _{i=1}^{s}\left(1-\left|\frac{{y}_{i}-\hat{{y}_{i}}}{\hat{{y}_{i}}}\right|\right)\times 100\% 。 $$ (4)

      式(2)~(4)中:$ {y}_{i} $表示第i个样本地上生物量的实测值;$\hat{{y}_{i}}$表示第i个样本地上生物量的预测值;$\bar{y} $表示所有样本地上生物量实测值的均值;$ s $表示样本总数量。

    • 样地尺度上单株生物量模型的残差不确定性($ {\sigma }_{\mathrm{w}} $)计算如下:

      $$ {\sigma }_{\mathrm{w}}=\frac{{R}_{{\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{W}}}}{\overline{M}}\times 100\% 。 $$ (5)

      式(5)中:$ {R}_{{\mathrm{M}\mathrm{S}\mathrm{E}}_{\mathrm{W}}} $为单株生物量模型的均方根误差;$ \overline{M} $为高山松地上生物量实测值的平均值[22]

      采用六步法[23]计算地上生物量遥感估算模型残差变异产生的误差:第1步升序排列样地地上生物量实测值(y);第2步利用生物量模型的预测值($ \hat y $)计算残差($ {M}_{\text{ε} } $),残差为样地地上生物量实测值与预测值的差值;第3步将60块样地进行分组,每6块地为1组,共10组;第4步计算每组样地地上生物量预测值的平均值($ \bar{\hat{y}}$)及残差标准差$ \left({\sigma }_{\text{ε} }\right) $。每组样地地上生物量预测值的平均值、残差、残差标准差计算如下:

      $$ {\bar{\hat{y}}}=\frac{1}{n}\sum _{j=1}^{n}{\hat y}_{{{j}}} \text{;} $$ (6)
      $$ {M}_{\text{ε}}=y-{\hat y} \text{;} $$ (7)
      $$ {\sigma _{\text{ε} }}=\sqrt{\frac{\displaystyle \sum _{j=1}^{n}{\left({M}_{\text{ε}j }-\overline{{M}}_{\text{ε} }\right)}^{2}}{n-1}} 。 $$ (8)

      式(6)~(8)中:$ \hat y_j $表示第$ j $块样地地上生物量预测值;${M}_{\text{ε}j }、\overline{{M}}_{\text{ε}} $分别表示第j块样地的残差和残差平均值;$ n $表示6块样本集样地数量。

      第5步对${\bar{\hat{y}}}$$ {\sigma }_{\text{ε} } $进行相关性拟合,自变量为地上生物量模型预测值,因变量为残差标准差。模型残差变异与样地分组地上生物量预测值的平均值关系可表达为:

      $$ {\sigma }_{\text{ε} }=f\left( {\bar{\hat{y}}} \right) 。 $$ (9)

      第6步将各块样地地上生物量预测值代入拟合后得出的公式,对所有样地的残差标准差求和,除以地上生物量实测值的和,从而得到模型残差的不确定性。

    • 对于单株生物量模型和多元线性回归模型的参数不确定性,可通过泰勒级数一阶展开式进行量化计算。生物量模型$ B=f\left(x,\;\hat{\alpha }\right) $经泰勒级数一阶展开如下:

      $$ B=f\left(x,\;\hat{\alpha }\right)\approx f\left(x,\;\alpha \right)+\frac{\partial f\left(x,\;\alpha \right)}{\partial {\alpha _{j}}}\left(\hat{\alpha }-\alpha \right) 。 $$ (10)

      式(10)中:$ f\left(x,\;\alpha \right) $为地上生物量预测值;$ x $为解释变量;$\hat{\alpha }$为参数模拟值;$ \alpha $表示参数真实值,$\dfrac{\partial f\left(x,\;\alpha \right)}{\partial {\alpha }_{j}}$为模型参数$ {\alpha }_{j} $的偏导数。$\dfrac{\partial f\left(x,\;\alpha \right)}{\partial {\alpha }_{j}}\left(\hat{\alpha }-\alpha \right)$为模型参数引起的误差(${\sigma }_{{\rm{p}}})$${\sigma }_{{\rm{p}}}$可近似表示为:

      $$ {{\boldsymbol{\sigma}} }_{{\rm{p}}}^{2}\approx {{\boldsymbol{Z}}}_{{\boldsymbol{jk}}}{\boldsymbol{var}}\left({\boldsymbol{\alpha}} \right){{\boldsymbol{Z}}}_{{\boldsymbol{jk}}}^{{\boldsymbol{T}}} 。 $$ (11)

      式(11)中:Zjk表示Z矩阵为j×k矩阵;$ {{\boldsymbol{Z}}}_{{\boldsymbol{jk}}}^{{\boldsymbol{T}}} $${{\boldsymbol{Z}}}_{{\boldsymbol{jk}}} $的转置矩阵;$ {\boldsymbol{var}}\left({\boldsymbol{\alpha}} \right) $为生物量方程中估计参数$ \alpha $的协方差矩阵。

    • 假设间接测量值与直接测量值之间存在某种函数关系,那么间接测量的不确定性可通过特定函数关系,用直接测量的不确定性表示为合成不确定性[24]。误差可以表示为:

      $$ {N}_{\mathrm{R}}=\sqrt{{N}_{{{\rm{U}}}_{1}}^{2}+{N}_{{{\rm{U}}}_{2}}^{2}+{N}_{{{\rm{U}}}_{3}}^{2}+\cdots +{N}_{{{\rm{U}}}_{i}}^{2}} 。 $$ (12)

      式(12)中:$ {N}_{\mathrm{R}} $表示总误差;$ {N}_{{\mathrm{U}}_{i}} $表示第$ i $个变量的误差。根据此式,计算单株生物量模型的不确定性($ {\sigma }_{\mathrm{t}\mathrm{r}\mathrm{e}\mathrm{e}} $):

      $$ {\sigma }_{\mathrm{t}\mathrm{r}\mathrm{e}\mathrm{e}}=\sqrt{{{\sigma }_{\mathrm{w}}^{2}}+{{\sigma }_{\mathrm{p}}^{2}}} 。 $$ (13)

      式(13)中:$ {\sigma }_{\mathrm{w}} $为单株生物量模型残差不确定性;$ {\sigma }_{\mathrm{p}} $为参数不确定性。

    • 单株生物量的误差传播到样地尺度的不确定性($ {\sigma }_{\mathrm{p}\mathrm{l}\mathrm{o}\mathrm{t}} $)由下式计算:

      $$ {\sigma }_{\mathrm{p}\mathrm{l}\mathrm{o}\mathrm{t}}=\sqrt{\sum_{i=1}^{N}{{\sigma }_{\mathrm{t}\mathrm{r}\mathrm{e}\mathrm{e}i}^{2}}/S}。 $$ (14)

      式(14)中:N为单位样地内样木株数;$ {\sigma }_{\mathrm{t}\mathrm{r}\mathrm{e}\mathrm{e}i} $为样地内第$ i $株样木的单株生物量不确定性;$ S $为样地面积。

      得到样地尺度不确定性和地上生物量遥感估测模型地上生物量的不确定性后,根据式(12),结合遥感信息数据,估测高山松地上生物量的总不确定性($ \sigma $):

      $$ \sigma =\sqrt{{{\sigma }_{\mathrm{p}\mathrm{l}\mathrm{o}\mathrm{t}}^{2}}+{{\sigma }_{\mathrm{R}}^{2}}}。 $$ (15)

      式(15)中:$ {\sigma }_{\mathrm{p}\mathrm{l}\mathrm{o}\mathrm{t}} $为样地尺度不确定性;$ {\sigma }_{\mathrm{R}} $为遥感估测模型不确定性。

    • 单株生物量模型参数的协方差矩阵为:

      $$ \left(\begin{array}{rrr}0.002\;700& -0.000\;760& 0.000\;089\\ -0.000\;450& 0.006\;100& -0.040\;000\\ 0.000\;089& -0.040\;000& 0.006\;200\end{array}\right) 。 $$

      将协方差矩阵带入式(11),得出单株生物量模型的参数不确定性为12.42%。

      由式(5)计算模型的残差不确定性为10.76%。对残差不确定性与参数不确定性合成,可得出单株生物量模型的不确定性为16.43%。当模型误差叠加到样地尺度时,通过式(14)得出样地尺度不确定性为7.07%。

    • 本研究建立了地上生物量与遥感因子的多元线性回归模型,根据拟合优度选出最佳模型为:

      $$ y=2\;820.989-520.296 {x}_{\mathrm{R}5\mathrm{B}4\mathrm{E}\mathrm{N}}+73.833 {x}_{\mathrm{R}9\mathrm{B}5\mathrm{C}\mathrm{R}}-259.225 {x}_{\mathrm{R}9\mathrm{B}3\mathrm{E}\mathrm{N}}\mathrm{。} $$

      其中:y表示地上生物量预测值,xR5B4EN为5窗口第4波段熵,xR9B5CR为9窗口第5波段相关性,xR9B3EN为9窗口第3波段熵。模型R2为0.326,RMSE为26.12,预测精度为64.91%(图1A)。

      图  1  基于多元线性回归的地上生物量预测效果和残差不确定性

      Figure 1.  Prediction effect and the residual uncertainty of aboveground biomass based on multiple linear regression

      对残差标准差(y)和样地地上生物量预测分组平均值(x)进行相关性拟合发现:拟合效果最佳的模型为$ y=91.345+0.029{x}^{2}-3.074x $R2= 0.836,计算后得出多元线性回归模型的残差不确定性为34.86%(图1B)。

      多元线性回归模型参数的协方差矩阵为:

      $$ \left(\begin{array}{rrr}0.038\;00& -0.004\;50& 0.000\;94\\ -0.007\;80& 0.068\;00& -0.800\;00\\ 0.000\;94& -0.800\;00& 0.044\;00\end{array}\right) 。 $$

      将协方差矩阵代入式(11)可得出参数变异不确定性为21.30%。对残差不确定性和参数不确定性合成,通过多元线性回归模型,估算出高山松地上生物量的不确定性为40.84%。

    • 图2A所示:梯度提升回归树模型的R2为0.815,RMSE为14.24,预测精度为74.72%。图2B所示:残差标准差(y)与样地地上生物量预测分组平均值(x)拟合的最佳模型为$ y=0.260\;1x-2.127\;3 $R2=0.670,得出残差不确定性为22.01%。非参数建模方法不考虑参数不确定性,基于梯度提升回归树模型估算得出高山松地上生物量的不确定性为22.01%。

      图  2  基于梯度提升回归树的地上生物量预测效果和残差不确定性

      Figure 2.  Prediction effect and the residual uncertainty of aboveground biomass based on gradient boost regression tree

    • 图3A所示:随机森林模型的R2为0.889,RMSE为11.02,预测精度为76.47%。图3B所示:残差标准差(y)与样地生物量预测分组平均值(x)拟合后的最佳模型为线性关系,模型为$ y=0.214\;3x-1.475\;7 $R2=0.863。与多元线性回归和梯度提升回归树模型的残差不确定性计算方法相同,在不考虑参数不确定性的情况下,得出随机森林估算高山松地上生物量的不确定性为18.09%。

      图  3  基于随机森林的地上生物量预测效果和残差不确定性

      Figure 3.  Prediction effect and the residual uncertainty of aboveground biomass based on random forest

    • 表3可见:在样地尺度上,单株生物量模型的不确定性为16.43%,总不确定性为7.07%;在3种遥感估算模型中,多元线性回归模型的不确定性为40.84%,梯度提升回归树模型的不确定性为22.01%,随机森林模型的不确定性为18.09%。基于多元线性回归、梯度提升回归树、随机森林模型,估算出高山松地上生物量的总不确定性分别为41.45%、23.12%和19.42%。

      表 3  3种地上生物量估测模型的不确定性

      Table 3.  Uncertainty results of the three aboveground biomass estimation models

      模型遥感估算地上生物量的不确定性样地尺度地上生物量的不确定性总不确定性/%
      模型残差
      变异/%
      模型参数
      变异/%
      遥感估测模型
      不确定性/%
      模型残差
      变异/%
      模型参数
      变异/%
      单株生物量模型
      不确定性/%
      样地尺度不
      确定性/%
      多元线性回归 34.8621.3040.8410.7612.4216.437.0741.45
      梯度提升回归树22.0122.0123.12
      随机森林   18.0918.0919.42
        说明:梯度提升回归树与随机森林为非参数模型,不考虑模型参数变异的不确定性
    • 本研究结合误差传递的方法,量化了3种生物量遥感估测模型与样地尺度单株生物量模型产生的误差,并将各个来源的不确定性合成,得出遥感估算高山松地上生物量的总不确定性。遥感估算地上生物量的不确定性主要来源于遥感估测模型的不确定性,其中多元线性回归为40.84%,梯度提升回归树为22.01%,随机森林为18.09%。样地尺度不确定性相对较小,为7.07%。从预测效果来看,非参数的随机森林和梯度提升回归树模型的不确定性要优于参数的多元线性回归模型,随机森林模型的不确定性低于梯度提升回归树模型。单株生物量模型参数变异为12.42%,残差不确定性为10.76%,模型的不确定性主要来源于参数变异,残差不确定性相对较低。

      3种遥感估算模型的不确定性研究表明:多元线性回归通过回归方程直观反映遥感因子和地上生物量的关系,但不能有效描述它们之间复杂的非线性关系,要提高参数模型的预测精度则需要大量样地观测数据。张加龙等[8]基于外业调查和Landsat 8 OLI影像,建立了多元线性回归、偏最小二乘、随机森林和梯度提升回归树4种模型,估测了香格里拉市高山松地上生物量,结果表明:随机森林和梯度提升回归树2种非参数模型的预估精度优于其他2种参数模型;陈蜀蓉等[25]运用4种模型对浙江缙云县公益林生物量进行建模估算的结果同样表明:随机森林和Erf-BP神经网络2种非参数模型优于参数模型。本研究建立的梯度提升回归树和随机森林2种非参数模型有较好的拟合优度和预测精度,不确定性优于参数的多元线性回归模型。遥感估测模型的不确定性对森林地上生物量的估算精度占主要的影响,因此,提升模型精度仍是今后生物量估算研究的重要方向。

      已有不少学者进行了单株生物量模型不确定性的研究。秦立厚等[10]分别用30、42、48株杉木Cunninghamia lanceolata进行单株生物量建模时发现:一元生物量模型的残差变异引起的不确定性分别为15.2%、12.3%、11.7%,二元生物量模型的不确定性为13.3%、9.4%、8.7%,表明二元单株生物量模型的不确定性要低于一元模型,且建模样本的增加可以显著降低模型残差变异不确定性。与其相比,本研究在对样地尺度生物量不确定性进行度量时,引用了基于幂函数形式的二元单株生物量估算模型[15]。由于缺少实际伐倒的样木生物量数据,运用模型预测精度和均方根误差间接计算模型不确定性,结果可能存在偏差。CHAVE等[26]计算的热带雨林地区生物量模型残差变异误差为31.3%,而本研究模型残差变异误差为10.76%。这可能是热带树种之间的特征差异大,导致产生的残差变异较大,而本研究建模对象仅为亚热带高山松单一树种,未对抽样、测量误差以及遥感影像坐标校正误差进行分析。这在后续研究中还需进一步完善。

参考文献 (26)

目录

/

返回文章
返回