-
树高和胸径是森林连续清查和管理中的2个重要因子,相较于胸径的测量,树高的测量具有耗时、成本高且误差大等缺点[1]。因此,研究者将树高-胸径模型作为一种常见、快速、便捷的方法预测林木高度[2],估算森林的生长与产量[3]、生物量和碳储量[4−5]、林木材积[6]和立地指数[7]等。普通最小二乘法(ordinary least squares,OLS)常被学者作为基础模型预测树高,但该模型在拟合具有空间分布特征的变量时,消除空间自相关的能力较弱[8−10]。广义可加模型(generalized additive model,GAM)属于数据驱动模型,采用链接函数建立响应变量和解释变量的平滑函数之间的关系,优势在于能够处理响应变量和解释变量之间高度非线性和非单调的关系[11]。线性混合模型(linear mixed model,LMM)由固定效应和随机效应两部分组成,可以同时反映整体变化规律和不同个体在整体中的变化,方差协方差结构还能反映数据之间的自相关和异质性[12]。因此,与传统模型OLS相比,GAM和LMM模型能提高模型拟合精度[9, 13]。地理加权回归模型(geographically weighted regression,GWR)作为能够显著消除模型空间自相关性的局域模型,研究对象位置不同导致权函数不同,进而使每个位置上参数随着空间的变化而变化,产生的结果更加精确,该模型已被运用于很多研究领域。近年来,学者们从各方面对GWR模型进行拓展,如李泽坤等[14]将时间维度引入GWR模型回归参数部分拓展出时空地理加权回归模型(geographically and temporally weighted regression,GTWR)分析了浙江省各影响因素对碳排放总量影响的时空异质性,陈科屹等[15]对模型残差进行普通克里格插值,拓展出地理加权回归克里格模型(geographically weighted regression kriging,GWRK)对吉林省汪清林业局浪溪林场天然次生林碳储量空间分布进行了研究,吴子豪等[16]从解决自变量差异化方面拓展出多尺度地理加权回归模型(multi-scale geographic weighted regression model,MGWR),探明了湖北省武汉市黄陂区土壤镉在不同空间位置的影响因子和污染来源等。
马尾松Pinus massoniana作为中国南方主要先锋造林树种,具有速生、丰产、适应性强等特点,但马尾松纯林存在结构简单、生态系统不稳定,容易造成土壤退化,引发水土流失等问题[17]。因此,常把马尾松与其他树种进行混交造林,提高林分稳定性。木荷Schima superba因为其材质优良,适应能力强,能在酸性土壤和贫瘠山地等不利的条件下生长,被列入国家珍贵用材发展名录[18]。有研究发现:马尾松-木荷混交林在提高林地生产力,改善林地生态环境,促进林木生长[19]等方面优于马尾松纯林,但与纯林相比,混交林的复杂性和多样性使得建立树高-胸径模型更为复杂。目前,许多学者做了关于混交林树高-胸径模型的研究[20−21]。但对于马尾松-木荷混交林研究主要在不同混交比例对林分生长的影响[22]、林下植被物种组成及多样性[23]、凋落物和水土保持性能[24]等方面,对树高-胸径模型鲜有研究。因此,本研究以贵州省开阳县马尾松-木荷混交林为研究对象,对比分析OLS、GAM、LMM、GWR和GWRK树高-胸径回归哑变量模型拟合效果及降低模型残差空间自相关和异质性的程度,为开阳县马尾松-木荷混交林科学经营管理提供理论依据。
-
研究区位于贵州省贵阳市开阳县,该县西连安顺市与毕节市,东与南连接黔南布依族苗族自治州,北接遵义。位置为26°11′~27°22′N,106°07′~107°16′E,地势南北高、中间低、平均海拔为1 200 m,地形以山地、丘陵为主、喀斯特地貌分布广泛,占全区面积的71.8%。气候类型为亚热带高原季风湿润性气候,年均气温为15.3 ℃,年均降水量为1 196.9 mm。所选研究区森林类型为天然马尾松-木荷混交林,林内树种有马尾松、木荷、水青冈Fagus longipetiolata、光叶海桐Pittosporum glabratum、云贵鹅耳枥Carpinus pubescens和杉木Cunninghamia lanceolata等。
2017年8月,在研究区马尾松-木荷混交林内,根据CTFS(Centre for Tropical Forest Science)样地建设标准方法设置40 m×50 m的固定样地,并将样地划分为20个10 m×10 m的小样方,对每个样方内所有胸径≥1 cm的树木进行每木检尺,即记录树种名称,测量胸径、树高、冠幅、坐标等因子。样地内林木调查因子描述性统计见表1。
树种 胸径/cm 树高/m 密度/(株·hm−2) 胸高断面积/(m2·hm−2) 全林木 7.3±7.9 7.2±5.8 3 635 6.580 0 马尾松Pinus massoniana 27.9±12.8 22.2±6.9 225 3.320 0 木荷Schima superba 6.6±4.2 6.3±2.8 1 545 1.510 0 水青冈Fagus longipetiolata 8.3±7.6 9.5±6.2 290 0.580 0 杉木Cunninghamia lanceolata 8.1±6.4 8.0±5.6 235 0.390 0 枫香Liquidambar formosana 12.0±10.7 12.3±8.5 45 0.180 0 云贵鹅耳枥Carpinus pubescens 4.8±3.3 5.8±2.8 290 0.150 0 山樱花Cerasus serrulata 18.2±10.5 19.5±6.1 15 0.100 0 光叶海桐Pittosporum glabratum 2.8±1.5 2.4±0.3 330 0.050 0 光皮桦Betula luminifera 10.7±4.3 14.6±1.5 25 0.050 0 白栎Quercus fabri 3.6±4.5 4.9±3.9 95 0.050 0 老鼠矢Symplocos stellaris 3.6±2.7 4.2±2.5 145 0.040 0 响叶杨Populus adenopoda 14.4±8.1 15.4±4.1 10 0.040 0 虎皮楠Daphniphyllum oldhamii 7.7±1.7 6.9±2.1 55 0.020 0 栲Castanopsis fargesii 3.1±1.6 4.9±2.7 110 0.020 0 山胡椒Lindera glauca 2.4±0.9 5.2±2.6 65 0.006 0 穗序鹅掌柴Heptapleurum delavayi 3.3±1.1 3.1±1.7 30 0.005 0 栓皮栎Quercus variabilis 5.2±0.3 8.7±0.0 10 0.004 0 川榛Corylus heterophylla var. sutchuenensis 2.4±0.9 5.8±2.6 35 0.003 0 山矾Symplocos sumuntia 2.3±1.2 2.7±0.8 25 0.002 0 象鼻藤Dalbergia mimosoides 2.7±0.6 8.4±1.1 10 0.001 0 灰毛大青Clerodendrum canescens 1.6±0.3 4.6±0.6 15 0.000 6 说明:胸径和树高数值为平均值±标准差。 Table 1. Descriptive statistics of forest survey factors in sample plots
-
根据调查数据(表1)可知林内主要树种为马尾松和木荷。因此,将树种作为哑变量引入OLS、GAM、LMM、GWR和GWRK模型中,分别构建马尾松,木荷和其他树种树高-胸径模型。树种分类用定性代码0和1表示,第i个树种表示为Si,定性数据Si转换为(0, 1)形式;Si为0或1,当x是第i个树种时为1,否者为0。其中i=1、2、3;S1、S2、S3分别是马尾松、木荷和其他树种的定性代码。将没有引入哑变量的模型作为全林木基础模型。
-
采用幂函数(Y=aXb)的对数变换形式(lnY=a+blnX)作为本研究的基础模型。其模型表达式如下:
式(1)中,Ht为树高(m),DBH为胸径(cm),a与b为模型参数,$ \varepsilon $为模型误差。
-
增加样方水平的单水平随机效应,在模型参数a和b的位置上分别增加随机参数$ {\mu }_{1}{\mathrm{和}\mu }_{2} $,如式(2)所示:
式(2)中,a和b为模型参数,$ {\mu }_{1} $和$ {\mu }_{2} $为随机参数,$ \varepsilon $为模型随机误差。
-
GAM是广义线性模型的半参数拓展,唯一的基本假设是平滑函数是可加的[25]。将lnDBH作为解释变量,lnHt作为响应变量,平滑回归项采用平滑样条函数构建GAM,其表达式:
式(3)中,s为平滑样条函数,$ \varepsilon $为模型误差,$ \alpha $为截距。
-
GWR模型作为传统回归方法的拓展,将样本点的地理位置信息加入建模,使得模型既能描述响应变量与解释变量间的关系,又能消除模型残差的空间自相关[26]。使用Gauss函数作为权函数,构建开阳县马尾松-木荷混交林树高-胸径模型。
式(4)中,$ \mathrm{l}\mathrm{n}{H}_{t} $为响应变量,$ \left({u}_{i},{v}_{i}\right) $为第i个样本点的坐标,β0为第i个样本点的常数估计值,Xki为第k个自变量在第i样本点的值,$ {\beta }_{k}\left({u}_{i},{v}_{i}\right) $为第i个样本点上的第k个回归参数,是关于地理位置的函数,p为用于建模的林木总数,$ \varepsilon $为模型误差。
-
GWRK模型是GWR模型的延伸与拓展,将GWR与克里格插值相结合的模型,通过GWR回归残差进行空间插值,然后将插值结果和GWR回归估计值相加,从而获得GWRK估计值[27]。
-
分别采用全局与局域莫兰指数(Moran’s I)评价模型残差的空间分布[9]。全局Moran’s I是用来描述所有的空间单元在整个区域上与周边地区的平均关联程度,取值为−1~1,多数统计检验在开始时都先确定零假设,在计算全局Moran’s I时通常会给出Z值,如果Z>1.96或者<−1.96,拒绝零假设,表示空间分布可能是聚集模式或分散模式;若−1.96≤Z≤1.96,接受零假设,表示空间分布可能是随机过程产生的结果,Z能够判断n个样点内的观测值之间是否存在空间相关性[28]。而局域Moran’s I可以进一步研究局域空间聚集现象,评价模型残差是否存在局域聚集情况,分析模型残差局域空间自相关性。
-
空间异质性作为生态系统的主要属性之一,是产生空间格局的主要原因[29]。使用模型残差组内方差评价模型残差空间异质性[28, 30]。
-
模型评价指标选用决定系数(R2)、均方误差(MSE)和赤池信息准则(AIC)进行模型比较,除了决定系数值越大越好外,其他指标均是越小越好。综合以上评价指标选择最优模型。
-
使用R语言的minpack.lm包、mgcv包、lme4包和GWmodel包分别对OLS、GAM、LMM和GWR模型进行建模分析,随机选择581株(80%)林木作为建模数据,剩余的146株(20%)林木作为检验数据。用ArcMap 10.6对模型残差进行普通克里格插值,ROOKCASE (用VBA编写的Excel宏文件)计算全局和局域Moran’s I,作图在Excel中完成。
-
全林木基础模型拟合结果见表2,5种模型的R2为0.63~0.80,MSE为0.08~0.16,AIC为462.77~759.23,都能很好地反映树高与胸径之间的关系。将树种作为哑变量引入后,模型拟合精度整体高于全林木基础模型,5种回归模型的R2提高了0.01~0.06,MSE和AIC也有不同程度的降低,全林木基础模型和哑变量模型的3种拟合指标从劣到优均依次为OLS、GAM、LMM、GWR、GWRK。OLS和LMM哑变量模型参数估计值均在0.001水平上显著,GWR模型的参数估计值为一个范围,能很好地表现林木间的差异(表3)。
模型类型 模型 R2 MSE AIC 全局Moran’I (Z) 哑变量模型 普通最小二乘法(OLS) 0.65 0.16 723.97 0.2494(26.521 0) 线性混合模型(LMM) 0.78 0.09 506.29 −0.0065(−0.5448) 广义可加模型(GAM) 0.66 0.15 714.54 0.2047(22.0847) 地理加权回归模型(GWR) 0.85 0.07 271.83 −0.0125(−1.1784) 地理加权克里格回归模型(GWRK) 0.86 0.06 260.66 −0.0095(−1.0208) 全林木基础模型 普通最小二乘法(OLS) 0.63 0.16 759.23 0.2878(30.1583) 线性混合模型(LMM) 0.77 0.10 522.88 −0.0071(−0.6050) 广义可加模型(GAM) 0.65 0.15 723.95 0.2797(29.6680) 地理加权回归模型(GWR) 0.79 0.09 488.08 −0.0144(−1.3773) 地理加权克里格回归模型(GWRK) 0.80 0.08 462.77 −0.0122(−0.4704) 说明:R2为决定系数,MSE为均方误差,AIC为赤池信息准则,全局Moran’I (Z)为空间自相关性评价指标。 Table 2. Model fitting statistics and Global Moran’s I (Z-value) for five regression models
模型类型 拟合参数 估计值 标准误 P 普通最小二乘法
(OLS)a 1.200 7 0.087 6 <0.001 b 0.581 5 0.020 5 <0.001 木荷 −0.440 0 0.069 7 <0.001 其他 −0.398 2 0.073 0 <0.001 线性混合模型
(LMM)a 0.969 6 0.093 1 <0.001 b 0.637 6 0.017 8 <0.001 木荷 −0.282 8 0.060 2 <0.001 其他 −0.249 7 0.062 2 <0.001 地理加权回归模型
(GWR)a −1.003 4~2.401 6 b 0.285 9~1.314 6 木荷 −1.241 3~0.842 6 其他 −1.245 5~1.368 1 说明:a和b为模型拟合参数;P表示拟合参数的显著性,其中P<0.001表示在0.001水平上显著。GAM模型为非参数模型;GWRK模型是将基础模型残差进行普通克里格插值,也没有参数估计值。 Table 3. OLS, LMM and GWR dummy variable model parameter estimation
-
由表2可知:OLS和GAM模型残差全局Moran’s I在α=0.05的显著水平下,Z>1.96,存在显著的空间自相关性。而LMM、GWR和GWRK模型残差具有更低的全局Moran’s I,且在α=0.05条件下,模型残差全局Moran’s I的Z在−1.96~1.96范围,模型残差空间自相关性不显著。以5 m为间隔,计算5~20 m滞后距离内模型残差全局Moran’s I (图1)。OLS和GAM模型残差全局Moran’s I随着滞后距离增加不断降低,而LMM、GWR和GWRK模型残差全局Moran’s I在各滞后距离处在0上下小幅度波动,且值相接近。
Figure 1. Spatial correlation and local distribution of Moran’s I values of the five models’ residuals
OLS和GAM模型残差的局域Moran’s I整体分布不均匀且存在大而多的黑色气泡(正局域Moran’s I)(图1B~F),说明这2种模型对热点的预测不足或过度。相比之下,LMM、GWR和GWRK模型残差产生更少的热点,局域Moran’s I多为负值,相邻点之间表现为相反特征。
-
图2为5~20 m滞后距离内各模型残差的组内方差。在该范围内,5种模型残差组内方差在5 m处最小,并随着滞后距离的增加而增加。GWR和GWRK模型残差组内方差在各滞后距离处均显著小于OLS、GAM和LMM模型残差组内方差。5种模型残差在各滞后距离处的组内方差从小到大排序为GWRK、GWR、LMM、GAM、OLS。
Height-diameter model of Pinus massoniana and Schima superba mixed forest in central Guizhou Province
doi: 10.11833/j.issn.2095-0756.20230363
- Received Date: 2023-06-12
- Accepted Date: 2023-10-24
- Rev Recd Date: 2023-10-18
- Available Online: 2024-03-21
- Publish Date: 2024-04-01
-
Key words:
- Pinus massoniana /
- Schima superba /
- mixed forest /
- tree height-diameter model /
- model residuals /
- spatial autocorrelation /
- spatial heterogeneity
Abstract:
Citation: | RAN Jiaxuan, QI Yujiao. Height-diameter model of Pinus massoniana and Schima superba mixed forest in central Guizhou Province[J]. Journal of Zhejiang A&F University, 2024, 41(2): 343-352. doi: 10.11833/j.issn.2095-0756.20230363 |