基于混合效应模型及EBLUP预测杉木树高生长过程

王明初; 孙玉军

doi:10.11833/j.issn.2095-0756.2017.05.003

基于混合效应模型及EBLUP预测杉木树高生长过程

DOI: 10.11833/j.issn.2095-0756.2017.05.003

王明初,
孙玉军^,

北京林业大学林学院, 北京 100083

基金项目:

基于FORPLAN的森林多功能经营技术引进项目 2015-04-31

国家林业局重点资助项目 2012-07

林业科技成果国家级推广项目 [2014]26

详细信息

作者简介: 王明初, 从事林业资源调查与监测研究.E-mail:wangmc@bjfu.edu.cn

通信作者: 孙玉军, 教授, 博士, 博士生导师, 从事森林资源监测与模型等研究.E-mail:sunyj@bjfu.edu.cn

中图分类号: S797.27

Based on mixed-effects model and empirical best linear unbiased predictor predicting growth profile of height for Chinese fir

WANG Mingchu,
SUN Yujun^,

College of Forestry, Beijing Forestry University, Beijing 100083, China

摘要: 基于福建省将乐县国有林场15块标准地的30株杉木Cunninghamia lanceolata标准木的解析数据，首先对5个生长方程运用非线性最小二乘法进行拟合，选出拟合效果最好的模型作为基础模型，利用解析木数据构建非线性混合效应树高生长模型。以单株树木作为随机效应，通过变换混合效应参数个数，利用R软件选择赤池信息准则（AIC），贝叶斯信息准则（BIC）最小，对数似然函数（Loglik）值最大的混合效应模型作为最优模型，基于混合效应模型研究经验线性无偏最优预测法（EBLUP）预测树高生长过程的特点。结果表明：Weibull方程中，β₁，β₂和β₃等3个参数都作为混合效应参数的模型模拟精度最高。观测次数相同时，延长观测间隔能够降低预测误差，提高预测精度；观测间隔相同时，增加观测次数，预测精度会提高。
- 森林测计学 /
- 树高生长模型 /
- 混合效应模型 /
- 经验线性无偏最优预测法 /
- 杉木
Abstract: Based on the data of 30 sample trees from 15 permanent plots of Chinese fir in the national forest farm of Jiangle, at first we study the best function as the base model with the least square method among five growth profile equations. The nonlinear mixed model was constructed based on the base model and modeling data. We use the R for model fitting. Select the mixed model with the minimum value of AIC, BIC and the maximum value of Loglik as the best model by changing the number of mixed parameters in fitting progress. Using mixed model to predict growth profile of height and studying the characteristics of Empirical Best Linear Unbiased Predictor (EBLUP). Fitting results showed the simulation's precision of Weibull's including three random effect parameters(β₁, β₂ and β₃) was maximal. In the analysis of prediction, prediction accuracy decreased as age interval of observations extended with the same number of previous observations. MSE decreased as the number of previous observations increased. EBLUP prediction could fully predict individual growth process, given that there were multiple previous observations with long-enough age intervals.
- forest measuration /
- height growth model /
- mixed-effects model /
- EBLUP /
- Chinese fir

图 1 树高生长过程比较

Figure 1 Comparison of the height growth

下载: 全尺寸图片幻灯片

图 2 解析木F18逐年预测的均方误差

Figure 2 The value of F18 yearly forecast E_MS

下载: 全尺寸图片幻灯片

表 1 建模数据和检验数据概况

Table 1. Summary statistics of the fitting and calibration data

项目	拟合数据(20)		验证数据（10)
项目	树高/m	年龄/a	树高/m	年龄/a
平均值	14.3	23	15.1	24
最大值	25.0	33	22.3	38
最小值	6.6	6	4.1	7
标准差	5.4	7.7	7.5	12.5
说明：表头括号中为随机选择的株数。

下载: 导出CSV

表 2 树高生长方程

Table 2. The equations of height growth

编号	模型	方程
1	Richards	$H = {\beta _1}{\left[ {1 - {\text{exp}}\left( {{\beta _2}t} \right)} \right]^{{\beta _3}}}$
2	Weibull	$H = {\beta _1}\left[ {1 - {\text{exp}}\left( {{\beta _2}{t^{{\beta _3}}}} \right)} \right]$
3	Korf	$H = {\beta _1}{\text{exp}}\left( {\frac{{ - {\beta ^2}}}{{{t^{{\beta _3}}}}}} \right)$
4	Logistic	$H = \frac{{{\beta _1}}}{{1 + {\text{exp}}\left( {{\beta ^2} - {\beta _3}t} \right)}}$
5	Logistic2	$H = \frac{{{\beta _1}}}{{{\text{exp}}\left( {{\beta ^2} + {\beta _3}{\text{lg}}\left( t \right)} \right)}}$

下载: 导出CSV

表 3 各树高生长方程拟合结果

Table 3. Simulant result of height growth

方程	参数			确定系数R²	均方根差（R_mse	平均绝对残差\|E\|
方程	β₁	β₂	β₃	确定系数R²	均方根差（R_mse	平均绝对残差\|E\|
1	45.517 7	0.024 1	1.192 1	0.819 9	2.698 8	0.042 7
2	41.994 9	0.013 2	1.157 9	0.819 9	2.699 1	0.076 2
3	2 647.267 0	8.858 0	0.177 1	0.820 1	2.697 2	0.002 7
4	20.734 9	2.434 6	0.169 2	0.808 3	2.784 4	2.976 8
5	65.986 0	4.821 0	-2.730 0	0.819 9	2.986 0	0.042 1

下载: 导出CSV

表 4 基于不同随机效应参数组合的树高生长模型拟合精度比较

Table 4. Comparison of models' fitting precisions with different combinations of random effects parameters

模型编号	随机效应参数	AIC	BIC	Loglik
1.1	β₁	1 516.717 0	1 537.274	-753.358 4
1.2	β₂	1 461.503 0	1 482.060	-725.751 3
1.3	β₃	1 600.736 0	1 621.293	-795.368 1
1.4	β₁, β₃	1 207.652 0	1 236.432	-596.826 0
1.5	β₂, β₃	1 147.023 0	1 175.803	-566.511 4
2.1	β₁	1 516.378 5	1 536.936	-753.189 3
2.2	β₂	1 455.967 7	1 476.525	-722.983 8
2.3	β₃	1 382.081 0	1 402.638	-686.040 5
2.4	β₂, β₃	1 158.258 6	1 187.039	-572.129 3
2.5	β₁, β₂, β₃	973.412 2	1 014.527	-476.706 1
3.1	β₂	1 513.753 0	1 534.311	-751.876 7
3.2	β₃	1 484.579 0	1 505.136	-737.289 6
3.3	β₁, β₂	1 253.315 0	1 282.096	-619.657 7
3.4	β₂, β₃	1 241.380 0	1 270.160	-613.690 0
其他情况	不收敛

下载: 导出CSV

表 5 各残差方差模型的模拟结果

Table 5. Simulation results for each residual variance model

残差方差模型	AIC	BIC	Loglik
指数函数	975.447 1	1 020.673	-476.723 5
幂函数	975.070 0	1 020.296	-476.535 0
常数加幂函数	977.447 0	1 026.785	-476.723 5

下载: 导出CSV

表 6 模型拟合结果

Table 6. Statistical results of the model fitting

固定效应参数		随机效应参数协方差矩阵
参数	估计值	参数	b_{i, 1}	b_{i, 2}	b_{i, 3}
β₁	1.954 00	b_{i, 1}	5.936 4	0.016 6	0.473 7
β₂	0.018 96	b_{i, 2}	0.016 6	-0.302 0	-0.251 0
β₃	1.631 90	b_{i, 3}	0.473 7	-0.251 0	-0.655 0

下载: 导出CSV

表 7 预测的向量和矩阵

Table 7. The matrices and vectors used for prediction

${{\tilde y}_i}/{\text{m}}$	${X_i}/{\text{a}}$	$f\left( {{A_i}\hat \beta ,{X_i}} \right)/{\text{m}}$	${{\hat Z}_{i,1}}$	${{\hat Z}_{i,2}}$	${{\hat Z}_{i,3}}$	${{\hat b}_i}$
16.60	23	18.713 9	0.957 7	137.837 1	8.196 0	-2.412 3
15.00	18	17.195 6	0.880 0	262.154 1	14.369 5	-0.016 4
12.00	13	13.923 5	0.712 6	369.254 3	17.961 2	0.312 6

下载: 导出CSV

表 8 F18样木树高观测值、总体估计值、EBLUP预测值比较

Table 8. Comparison of observations of height, population mean, and EBLUP predicted for F18

年龄/a	树高观测值/m	总体估计值/m	EBLUP预测值	校正值
22	16.28	18.509 2	16.533 9	-1.975 3
21	15.96	18.261 8	16.312 6	-1.949 2
20	15.64	17.965 1	16.0342	-1.930 9
19	15.32	17.612 1	15.689 3	-1.922 8

下载: 导出CSV

表 9 验证数据统计分析

Table 9. The statistical analysis of data verification

观测间隔/a	观测次数/次	均方误差
观测间隔/a	观测次数/次	F04(23年生）	F18(28年生)	F15(35年生）	F11(38年生)
1	3	5.546 0	4.178 7	12.396 0	22.533 3
3	3	2.866 1	1.092 4	3.388 9	2.310 8
5	3	2.746 0	0.391 7	2.704 3	0.941 7
1	6	5.218 6	3.982 9	5.238 3	3.607 2
3	6	0.332 1	0.2145	2.212 0	0E925 9
5	6	0.271 6	0.195 6	0.284 0	0E707 1
1	9	4.256 1	2.401 7	2.631 7	1E020 8
3	9	0.1670	0.189 4	0.200 3	0.379 7
5	9			0.094 6	0E247 0

下载: 导出CSV

[1]	孟宪宇.测树学[M].北京:中国林业出版社, 2006.
[2]	LITTLE R C, MILLIKEN G A, STROUP W W, et al. SAS System for Mixed Models [M]. Cary North Carolina: SAS Institute Inc., 1996.
[3]	NANOS N, CALAMA R, MONTERO G, et al. Geostatistical prediction of height/diameter models [J]. For Ecol Manage, 2004, 195(1/2): 221-235.
[4]	CALAMA R, MONTERO G. Interregional nonlinear height-diameter model with random coefficients for stone pine in Spain [J]. Can J For Res, 2004, 34(1): 150-163.
[5]	MEHTÄTALO L. A longitudinal height-diameter model for Norway spruce in Finland [J]. Can J For Res, 2004, 34(1): 131-140.
[6]	BUDHATHOKI C B, LYNCH T B, GULDIN J M. Individual tree growth models for natural even-aged shortleaf pine[C]//CONNER K F. Proceedings of the 13th Biennial Southern Silvicultural Conference. Asheville, NC: U.S. Department of Agriculture, Forest Service, Southern Research Station, 2006: 359-361.
[7]	CASTEDO D F, DIEGUEZARANDA U, BARRIO A M, et al. A generalized height-diameter model including random components for radiata pine plantations in northwestern Spain [J]. For Ecol Manage, 2006, 229(1/3): 202-213.
[8]	LYNCH T B, HOLLEY A G, STEVENSON D J. A random-parameter height-dbh model for cherrybark oak [J]. South J Appl For, 2005, 29(1): 22-26.
[9]	LAPPI J, BAILEY R L. A height prediction model with random stand and tree parameters: an alternative to traditional site index methods [J]. For Sci, 1988, 34(4): 907-927.
[10]	HALL D B, BAILEY R L. Modeling and prediction of forest growth variables based on multilevel nonlinear mixed models [J]. For Sci, 2001, 47(3): 311-321.
[11]	FANG Z, BAILEY R L. Nonlinear mixed effects modeling for slash pine dominant height growth following intensive silvicultural treatments [J]. For Sci, 2001, 47(3): 287-300.
[12]	CALEGARIO N, DANIELS R F, MAESTRI R, et al. Modeling dominant height growth based on nonlinear mixed-effects model: a clonal Eucalyptus plantation case study [J]. For Ecol Manage, 2005, 204(1): 11-21.
[13]	TANG Shenglan, MENG Fanrui, BOURQUE C P A. Analyzing parameters of growth and yield models for Chinese fir provenances with a linear mixed model approach [J]. Silv Genet, 2001, 50(3/4): 140-145.
[14]	李永慈, 唐守正.用Mixed和Nlmixed过程建立混合生长模型[J].林业科学研究, 2014, 17(3):279-283. LI Yongci, TANG Shouzheng. Establishment of tree height growth model based on Mixed and Nlmixed of SAS [J]. For Res, 2004, 17(3): 279-283.
[15]	李春明, 张会儒.利用非线性混合模型模拟杉木林优势木平均高[J].林业科学, 2010, 46(3):89-95. LI Chunming, ZHANG Huiru. Modeling dominant height for Chinese fir plantation using a nonlinear mixed-effects modeling approach [J]. Sci Silv Sin, 2010, 46(3): 89-95.
[16]	祖笑锋, 倪成才, NIGH G, 等.基于混合效应模型及EBLUP预测美国黄松林分优势木树高生长过程[J].林业科学, 2015, 51(3):25-33. ZU Xiaofeng, NI Chengcai, NIGH G, et al. Based on mixed-effects model and empirical best linear unbiased predictor to predict growth profile of dominant height [J]. Sci Silv Sin, 2015, 51(3): 25-33.
[17]	董云飞, 孙玉军, 许昊, 等.基于非线性混合模型的杉木标准树高曲线[J].东北林业大学学报, 2014, 42(11):72-76, 81. DONG Yunfei, SUN Yujun, XU Hao, et al. Generalized height-diameter model for Chinese fir based on nonlinear mixed effects model [J]. J North For Univ, 2014, 42(11): 72-76, 81.
[18]	PINHEIRO J C, BALES D M. Mixed-Effects Models in S and S-PLUS [M]. New York: Springer Verlag, 2000.
[19]	董灵波, 刘兆刚, 李凤日, 等.基于线性混合模型的红松人工林一级枝条大小预测模拟[J].应用生态学报, 2013, 24(9):2447-2456. DONG Lingbo, LIU Zhaogang, LI Fengri, et al. Primary branch size of Pinus koraiensis plantation: a prediction based on linear mixed effect model [J]. Chin J Appl Ecol, 2013, 24(9): 2447-2456.
[20]	姜立春, 李凤日, 张锐.基于线性混合模型的落叶松枝条基径模型[J].林业科学研究, 2012, 25(4):464-469. JIANG Lichun, LI Fengri, ZHANG Rui. Modeling branch diameter with linear mixed effects for Dahurian larch [J]. For Res, 2012, 25(4): 464-469.
[21]	姜立春, 蒋雨航.利用混合模型模拟树冠特征对兴安落叶松树干干形的影响[J].北京林业大学学报, 2014, 36(2):10-14. JIANG Lichun, JIANG Yuhang. Modeling effects of crown characteristics on stem taper of Dahurian larch using mixed model [J]. J Beijing For Univ, 2014, 36(2): 10-14.
[22]	曾伟生, 唐守正.非线性模型对数回归的偏差校正及与加权回归的对比分析[J].林业科学研究, 2011, 24(2):137-143. ZENG Weisheng, TANG Shouzheng. Bias correction in logarithmic regression and comparison with weighted regression for non-linear models [J]. For Res, 2011, 24(2): 137-143.
[23]	NI Chengcai, NIGH G D. An analysis and comparison of predictors of random parameters demonstrated on planted loblolly pine diameter growth prediction [J]. Forestry, 2011, 85(2): 271-280.

[1]	卢腾飞, 周律, 胡中岳, 欧光龙, 胥辉. 基于混合效应模型的迪庆云冷杉林地上生物量遥感估测 . 浙江农林大学学报, 2021, 38(3): 510-522. doi: 10.11833/j.issn.2095-0756.20200327
[2]	兰洁, 肖中琪, 李吉玫, 张毓涛. 天山雪岭云杉生物量分配格局及异速生长模型 . 浙江农林大学学报, 2020, 37(3): 416-423. doi: 10.11833/j.issn.2095-0756.20190384
[3]	吴丹子, 王成德, 李倞, 刘敏. 福建杉木树冠外轮廓和树冠体积相容性模型 . 浙江农林大学学报, 2020, 37(1): 114-121. doi: 10.11833/j.issn.2095-0756.2020.01.015
[4]	谢福明, 字李, 舒清态. 基于优化k-NN模型的高山松地上生物量遥感估测 . 浙江农林大学学报, 2019, 36(3): 515-523. doi: 10.11833/j.issn.2095-0756.2019.03.012
[5]	王科, 谭伟, 戚玉娇. 近自然经营间伐对黔中马尾松天然次生纯林生长的初期效应 . 浙江农林大学学报, 2019, 36(5): 886-893. doi: 10.11833/j.issn.2095-0756.2019.05.006
[6]	谢巧雅, 余坤勇, 邓洋波, 刘健, 范华栋, 林同舟. 杉木人工林冠层高度无人机遥感估测 . 浙江农林大学学报, 2019, 36(2): 335-342. doi: 10.11833/j.issn.2095-0756.2019.02.015
[7]	王金池, 冉啟香, 邓华锋, 黄国胜, 王雪军. 基于度量误差方法的油松林分生长模型 . 浙江农林大学学报, 2018, 35(1): 68-74. doi: 10.11833/j.issn.2095-0756.2018.01.009
[8]	罗恒春, 张超, 魏安超, 张一, 黄田, 余哲修. 云南松林分平均胸径生长模型及模型参数环境解释 . 浙江农林大学学报, 2018, 35(6): 1079-1087. doi: 10.11833/j.issn.2095-0756.2018.06.011
[9]	胡梦霄, 杭芸, 黄华宏, 张胜龙, 童再康, 楼雄珍. 杉木木材结晶度的近红外预测模型建立及变异分析 . 浙江农林大学学报, 2017, 34(2): 361-368. doi: 10.11833/j.issn.2095-0756.2017.02.022
[10]	刘薇祎, 邓华锋, 冉啟香, 黄国胜, 王雪军. 湖南省杉木林分相容性树高曲线方程组研究 . 浙江农林大学学报, 2017, 34(6): 1051-1058. doi: 10.11833/j.issn.2095-0756.2017.06.012
[11]	陈金星, 岳德鹏, 冯仲科, 丁家巍, 姚炳全, 叶添雄. 手持式树径自动识别测树仪的研制与应用 . 浙江农林大学学报, 2016, 33(4): 589-598. doi: 10.11833/j.issn.2095-0756.2016.04.006
[12]	邓静, 陈宇拓. 利用增长量分配模型的杉木林分生长预测建模 . 浙江农林大学学报, 2014, 31(6): 898-904. doi: 10.11833/j.issn.2095-0756.2014.06.011
[13]	余乐, 吕建雄, 李贤军, 徐康, 吴义强, 蒋佳荔. X射线扫描法和切片法测量干燥过程中杉木含水率分布的比较研究 . 浙江农林大学学报, 2013, 30(4): 543-547. doi: 10.11833/j.issn.2095-0756.2013.04.013
[14]	邹奕巧, 杜群, 葛宏立. 有年龄生长模型应用于无年龄情况研究 . 浙江农林大学学报, 2012, 29(6): 889-896. doi: 10.11833/j.issn.2095-0756.2012.06.013
[15]	王晓宁, 徐天蜀, 李毅. 利用ALOS PALSAR双极化数据估测山区森林蓄积量模型 . 浙江农林大学学报, 2012, 29(5): 667-670. doi: 10.11833/j.issn.2095-0756.2012.05.005
[16]	魏晓慧, 孙玉军, 马炜. 基于Richards方程的杉木树高生长模型 . 浙江农林大学学报, 2012, 29(5): 661-666. doi: 10.11833/j.issn.2095-0756.2012.05.004
[17]	周国模, 郭仁鉴, 韦新良, 王雪军. 浙江省杉木人工林生长模型及主伐年龄的确定 . 浙江农林大学学报, 2001, 18(3): 219-222.
[18]	林思祖, 黄青峥, 吴旺民. 杉木马尾松几个模型的预报有效性的计算机模拟试验 . 浙江农林大学学报, 1993, 10(2): 184-188.
[19]	郑勇平, 曾建福, 汪和木, 石柏林, 於琼花. 浙江省杉木实生林多形地位指数曲线模型 . 浙江农林大学学报, 1993, 10(1): 55-62.
[20]	罗福裕, 方延福, 励龙昌. 遂昌县杉木人工林生长模型的研究 . 浙江农林大学学报, 1993, 10(1): 49-54.

链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.2017.05.003

https://zlxb.zafu.edu.cn/article/zjnldxxb/2017/5/782

点击查看大图

图(2) / 表(9)

计量

文章访问数: 4256
HTML全文浏览量: 874
PDF下载量: 398
被引次数: 0

全文HTML

林木树高是基本测树因子之一，能够反映林木生长状况，是森林资源经营管理和林木生长收获研究所必需。树高生长模型是描述树高生长过程的统计模型，也是林木生长收获模型系统中一个重要的组成部分，同时林分优势木树高的预测为适地适树、森林经营活动和林分生长收获预测提供重要的基础数据^[1]。因此，树高生长模型的研究对于建立林分生长模型系统及评价立地质量具有重要意义。模型的建立方法很多，混合效应模型是近代发展起来的新统计方法，混合效应模型由固定效应和随机效应两部分组成，既可以反映总体变化趋势，又可以提供方差、协方差等多种信息来反映个体之间的差异^[2]。国外开展了大量树高生长的混合效应模型研究^[3-12]，国内对混合效应模型的拟合方法也进行了系统的研究^[13-15]，但是目前国内林业上对混合效应模型的应用基本限于与传统模型拟合效果上的比较，对预测的研究还很少。祖笑锋等^[16]基于混合效应模型及经验线性无偏最优预测法（EBLUP）预测美国黄松Pinus ponderosa林分优势木树高生长过程，很好地解释了EBLUP，并且深入地分析了EBLUP的特点。EBLUP最早用于动物育种学中，与地统计学的Kriging，时间序列的卡尔曼滤波及小域估计法的数学原理一致^[16]。本研究以福建将乐林场杉木Cunninghamia lanceolata人工林为研究对象，基于30株解析木数据，建立拟合最优的非线性混合效应树高生长模型，研究如何利用EBLUP预测树高生长过程，并通过设置不同的观测次数、观测间隔研究与预测精度之间的关系，并探究提高预测精度的方法。

1. 研究区概况

研究区位于福建省将乐县国有林场，26°26′~27°04′N，117°05′~117°40′E。将乐县位于福建省西北部，地处武夷山脉东南部，以中、低山为主，最高峰海拔为1 640.2 m。属亚热带季风气候，具有海洋性和大陆性气候特点，年平均气温为19.8 ℃，年平均降水量为2 027.0 mm。境内气温较高，夏季时间长，冬季较温暖，霜冻较少，生长期长。土壤以红壤为主，并分布有黄红壤，土层深厚，土质较好的一般为沙壤土或轻壤土，水分充足，土壤肥沃。植被以亚热带植物区系为主，植被种类非常丰富。其中人工次生林的乔木主要有杉木、马尾松Pinus massoniana等；灌木主要有粗叶榕Ficus hirta，黄毛楤木Aralia decaisneana，檵木Loropetalum chinensis等；草本主要有乌毛蕨Blechnum orientale，乌蕨Stenoloma chusanum，铁线蕨Adiantum capillus-veneris等。

2. 材料与方法

2.1. 数据的采集与整理

2010-2012年，根据林分不同年龄和密度，以典型抽样原则设置了15块20 m × 30 m标准地。对标准地内的林木进行每木检尺，选取标准木2株·标准地^-1，共30株，伐倒并进行树干解析，解析木编号为F01~F30。根据解析木内业表内插法获得各年龄对应的树高值。随机选择20株进行拟合，10株进行预测（表 1）。

表 1 建模数据和检验数据概况

Table 1. Summary statistics of the fitting and calibration data

项目	拟合数据(20)		验证数据（10)
项目	树高/m	年龄/a	树高/m	年龄/a
平均值	14.3	23	15.1	24
最大值	25.0	33	22.3	38
最小值	6.6	6	4.1	7
标准差	5.4	7.7	7.5	12.5
说明：表头括号中为随机选择的株数。

2.2. 基础模型

选择Richards方程、Weibull方程、Korf方程以及Logistic方程的2种变化形式等5个方程作为基础模型，对树高生长进行模拟（表 2）。运用非线性最小二乘法对5个树高生长方程进行拟合，选出拟合效果最好的模型作为基础模型，构建非线性混合效应模型^[17]。

表 2 树高生长方程

Table 2. The equations of height growth

编号	模型	方程
1	Richards	$H = {\beta _1}{\left[ {1 - {\text{exp}}\left( {{\beta _2}t} \right)} \right]^{{\beta _3}}}$
2	Weibull	$H = {\beta _1}\left[ {1 - {\text{exp}}\left( {{\beta _2}{t^{{\beta _3}}}} \right)} \right]$
3	Korf	$H = {\beta _1}{\text{exp}}\left( {\frac{{ - {\beta ^2}}}{{{t^{{\beta _3}}}}}} \right)$
4	Logistic	$H = \frac{{{\beta _1}}}{{1 + {\text{exp}}\left( {{\beta ^2} - {\beta _3}t} \right)}}$
5	Logistic2	$H = \frac{{{\beta _1}}}{{{\text{exp}}\left( {{\beta ^2} + {\beta _3}{\text{lg}}\left( t \right)} \right)}}$

2.3. 非线性混合效应模型

非线性混合效应模型主要特点是参数分为固定效应和随机效应，固定效应可以反映研究对象的总体变化规律，随机效应随个体的不同而变化，反映总体中不同个体的变化规律，从而获得较好的拟合效果。笔者主要研究利用EBLUP预测树高生长过程，并探究提高预测精度的方法。因此将样木作为随机效应，建立混合效应模型后，通过选取生长过程与总体平均生长过程差异较大的样木进行预测分析。非线性混合模型的一般表达式为：

$${y_i} = f\left( {{A_i}\beta + {B_i}{b_i},{X_i}} \right) + {e_i}。$$

(1)

式（1）中：β为p×1维的固定效应向量；p为固定参数个数，b_i为q×1维的随机效应向量；q为随机参数个数；A_i和B_i为具有相应维度的设计矩阵，其元素通常为0，1或与固定效应和随机效应相关的协方差值；e_i为随机误差项向量；f为非线性函数；X_i为年龄；y_i为树高。其中随机向量b_i：N（0, D），e_i：N（1, R_i），并且相互独立；e_i和b_i协方差矩阵分别为R_i和D，且为n_i维和q维的对称矩阵。

构建非线性混合效应模型还要确定以下3种结构：① 混合效应参数。依据PINHEIRO等^[18]的研究，将基础模型中参数进行组合作为混合参数进行模拟，选择收敛的模型，通过比较其赤池信息量准则（AIC），贝叶斯信息准则（BIC）以及对数似然函数（Loglik）模型评价指标。AIC，BIC值越小，Loglik值越大，模型拟合效果越好。② 随机效应内的方差协方差矩阵。为了确定随机效应内的方差协方差矩阵，需要解决异方差和自相关性结构。以指数函数（Exp），幂函数（Power）和常数加幂函数（ConstPower）3种结构形式，消除数据间的异方差。表达式为：

$${R_i}\left( {\beta ,{b_i},p} \right) = {\sigma ^2}G_i^{0.5}{I_{ni}}G_i^{0.5};$$

(2)

$${\text{VarExp}}\left( {{e_i}} \right) = {\sigma ^2}{\text{exp}}\left( {\beta t} \right);$$

(3)

$${\text{VarPower}}\left( {{e_i}} \right) = {\sigma ^2}{t^\beta };$$

(4)

$${\text{VarConstPower}}\left( {{e_i}} \right) = {\sigma ^2}\left( {{\beta _1} + {t^{{\beta _2}}}} \right)。$$

(5)

式（2）~式（5）中：σ²为误差方差值，由模型残差方差值给出；G_i为n_i×n_i维对角矩阵来解释方差异质性，对角元素为相应误差项的标准差；由于本研究数据间不存在自相关性，因此，I_ni为n_i×n_i维的单位矩阵。β，β₁，β₂为参数，t为年龄^[19-22]。从自变量为年龄的3种函数中，根据AIC，BIC，Loglik值以及似然比检验，确定残差方差模型。③ 随机效应间的协方差矩阵。随机效应间的协方差矩阵反映了随机效应之间的变化性。本研究包含3个随机参数，因此，矩阵为3 × 3维的方差协方差矩阵，结构例如下：

$$D = \left[ {\begin{array}{*{20}{l}} u \\ v \\ w \end{array}} \right] = \left[ {\begin{array}{*{20}{l}} {\sigma _u^2}&{{\sigma _{uv}}}&{{\sigma _{uw}}} \\ {{\sigma _{vu}}}&{\sigma _v^2}&{{\sigma _{vw}}} \\ {{\sigma _{wu}}}&{{\sigma _{wv}}}&{\sigma _w^2} \end{array}} \right]。$$

(6)

式（6）中：σ_u²，σ_v²，σ_w²分别为随机参数u，v，w的方差，σ_uv=σ_vu为随机参数u和v的协方差，σ_uw=σ_wu为随机参数u和w的协方差，σ_vw=σ_wv为随机参数w和v的协方差。

2.4. EBLUP预测原理与方法

推导方法基于多元正态分布理论，以b_i=0为基点，用一阶泰勒公式将非线性混合效应模型式（1）近似地表达为：

$${y_i} \approx f\left( {{A_i}\beta ,{X_i}} \right) + {Z_i}{b_i} + {e_i}。$$

(7)

式（7）中：矩阵Z_i为q × n_i维矩阵，其元素可以通过对混合效应模型式（1）分别求关于随机效应b_i的偏导数，随后令所有b_i取0即可求出。前文提到b_i：N（0, D），e_i：N（1, R_i），且相互独立，因此对式（7）求y_i的方差矩阵为：

$${\text{Var}}\left( {{y_i}} \right) = {Z_i}DZ_i^T + {R_i}。$$

b_i和y_i间协方差矩阵为：

$$\begin{gathered} {\text{Cov}}\left( {{b_i},{y_i}} \right) = {\text{Cov}}\left[ {{b_i},f\left( {{A_i}\beta ,{X_i}} \right) + {Z_i}{b_i} + {e_i}} \right] \hfill \\ = {\text{Cov}}\left( {{b_i},{Z_i}{b_i}} \right) = DZ_i^T。 \hfill \\ \end{gathered} $$

b_i和y_i的联合分布为：

$$\left( {\begin{array}{*{20}{l}} {{b_i}} \\ {{y_i}} \end{array}} \right) \sim {\text{N}}\left[ {\left( {\begin{array}{*{20}{c}} 0 \\ {f\left( {{A_i}\beta ,{X_i}} \right)} \end{array}} \right),\left( {\begin{array}{*{20}{c}} D&{DZ_i^T} \\ {{Z_i}{D^T}}&{{Z_i}DZ_i^T + {R_i}} \end{array}} \right)} \right]。$$

根据多元正态分布理论，当 ${y_i} = {{\tilde y}_i}$ （ ${{\tilde y}_i}$ 为观测值）时，b_i的条件分布数学期望为：

$$E\left( {{b_i}|{y_i} = {{\tilde y}_i}} \right) = E\left( {{b_i}} \right) + DZ_i^T{\left( {{Z_i}DZ_i^T + {R_i}} \right)^{ - 1}}\left[ {{{\tilde y}_i} - f\left( {{A_i}\beta ,{X_i}} \right)} \right]。$$

对于随机变量取值最优预测值是其数学期望值，所以随机变量b_i在y_i取观测值时可以用b_i的条件分布数学期望表示：

$${{\hat b}_i} = DZ_i^T{\left( {{Z_i}DZ_i^T + {R_i}} \right)^{ - 1}}\left[ {{{\tilde y}_i} - f\left( {{A_i}\beta ,{X_i}} \right)} \right]。$$

将式中β，D，R，Z_i及f（A_i β, X_i）用相应的估计值取代后则：

$${{\hat b}_i} = \hat D\hat Z_i^T{\left( {{{\hat Z}_i}\hat D\hat Z_i^T + {{\hat R}_i}} \right)^{ - 1}}\left[ {{{\tilde y}_i} - f\left( {{A_i}\hat \beta ,{X_i}} \right)} \right]。$$

(8)

式（8）称为经验线性无偏最优预测法（EBLUP）^[16]。

设定 ${y_i} = \left( {\begin{array}{*{20}{l}} {{y_{i,1}}} \\ {{y_{i,2}}} \end{array}} \right)$ ，y_{i, 1}为观测值，y_{i, 2}为预测值。则y_{i, 1}和y_{i, 2}的联合分布为：

$${y_i} = \left( {\begin{array}{*{20}{l}} {{y_{i,1}}} \\ {{y_{i,2}}} \end{array}} \right) \sim N\left[ {\left( {\begin{array}{*{20}{c}} {f\left( {{A_i}\beta ,{X_{i,2}}} \right)} \\ {f\left( {{A_i}\beta ,{X_{i,1}}} \right)} \end{array}} \right),\left( {\begin{array}{*{20}{c}} {{W_{22}}}&{{W_{21}}} \\ {{W_{12}}}&{{W_{11}}} \end{array}} \right)} \right]。$$

其中：W₂₁=Cov（y_{i, 2}, y_{i, 1}）=Z_{i, 2}DZ_{i, 1}^T+Cov（e_{i, 1}^T, e_{i, 2}），W₁₁=Var（y_i）=Z_{i, 1}DZ^T_{i, 1}+R_{i, 1}，则y_{i, 2}的条件分布数学期望：

$${{\tilde y}_{i,2}} = f\left( {{A_i}\tilde \beta ,{X_{i,2}}} \right) + {{\tilde W}_{21}}\tilde W_{11}^{ - 1}\left[ {{y_{i,1}} - f\left( {{A_i}\tilde \beta ,{X_{i,1}}} \right)} \right]。$$

将各项参数用相应估计值带入的：

$${{\tilde y}_{i,2}} = f\left( {{A_i}\tilde \beta ,{X_{i,2}}} \right) + {{\hat Z}_{i,2}}\underbrace {\hat D\hat Z_{i,1}^T{{\left( {{{\hat Z}_{i,1}}\hat D\hat Z_{i,1}^T} \right)}^{ - 1}}\left[ {{y_{i,1}} - f\left( {{A_i}\hat \beta ,{X_{i,1}}} \right)} \right]}_{{{\hat b}_i}}。$$

简化为：

$${{\tilde y}_{i,2}} = f\left( {{A_i}\hat \beta ,{X_{i,2}}} \right) + {{\hat Z}_{i,2}}{{\hat b}_i}。$$

(9)

结合公式（8）和公式（9）即可利用混合效应模型进行EBLUP预测。详细推导过程参考文献[23]。

根据EBLUP预测原理，式（9）中Z_{i, k}可通过求关于随机效应b_i的偏导数，求出偏导数后令所有b_i取0即可。本模型有3个随机效应，故k取1，2，3。Z_{i, k}的估计值为：

$${{\hat Z}_{i,1}} = 1 - {{\text{e}}^{ - {{\tilde \beta }_2}{t_i}^{{{\tilde \beta }_3}}}};$$

(10)

$${{\hat Z}_{i,2}} = {{\hat \beta }_1}{{\text{e}}^{ - {{\tilde \beta }_2}{t_i}^{{{\tilde \beta }_3}}}}{t_i}^{{{\tilde \beta }_3}};$$

(11)

$${{\hat Z}_{i,3}} = {{\hat \beta }_1}{{\text{e}}^{ - {{\tilde \beta }_2}{t_i}^{{{\tilde \beta }_3}}}}{{\tilde \beta }_2}{t_i}^{{{\tilde \beta }_3}}{\text{lg}}{t_i}。$$

(12)

列向量 $f\left( {{A_i}\hat \beta ,{X_i}} \right)$ 表达式为：

$$f\left( {{A_i}\hat \beta ,{X_i}} \right) = {{\hat \beta }_1}\left( {1 - {{\text{e}}^{ - {{\tilde \beta }_2}{t_i}^{{{\tilde \beta }_3}}}}} \right)。$$

(13)

式（11）~式（14）中： ${{\hat \beta }_{i,1}},{{\hat \beta }_{i,2}},{{\hat \beta }_{i,3}}$ 为β_{i, 1}，β_{i, 2}，β_{i, 3}的估计值，通过R语言软件得出。随机效应参数的预测值 ${{\hat b}_{i,1}},{{\hat b}_{i,2}},{{\hat b}_{i,3}}$ 根据式（8），利用SAS 9.3的IML过程计算获得。将各参数估计值代入式（9）进行预测。

4. 结论

本研究选用5个生长方程，选取3个拟合效果较好的方程作为基础模型，进一步改变不同的随机效应组合，最终以式（2）为基础的Weibull方程中，3个参数都作为混合模型的模型精度最高，拟合效果最好。通过EBLUP预测表明：本研究建立的非线性混合效应模型在考虑样木随机效应时，预测效果明显优于固定模型，能更好地反映树高生长过程。将随机效应考虑到样木水平，就相当于为每株样木建立树高生长模型，可以充分预测样木的生长过程，能够为将乐林场的杉木林经营决策提供一定的依据。进行预测时，观测次数相同，增加观测间隔能够降低预测误差，提高预测精度。由于增加观测值间年龄间隔，可以更充分提供树高生长过程信息，因此可以显著降低预测误差。观测次数不同，预测精度变化较大。观测间隔相同时，增加观测次数，预测精度会提高。因此在预测杉木树高生长过程时，要根据其年龄选择适当的观测间隔和观测次数。EBLUP可以充分利用观测值所涵盖的生长过程信息降低预测误差，随着预测远离用来预测b_i的观测值，均方误差逐渐变大。

通过本次研究得到的数据不能明确观测间隔和观测次数对预测准确度影响，有关研究还需要进一步进行。

参考文献 (23)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于混合效应模型及EBLUP预测杉木树高生长过程

DOI: 10.11833/j.issn.2095-0756.2017.05.003

作者简介: 王明初, 从事林业资源调查与监测研究.E-mail:wangmc@bjfu.edu.cn

通信作者: 孙玉军, 教授, 博士, 博士生导师, 从事森林资源监测与模型等研究.E-mail:sunyj@bjfu.edu.cn

Based on mixed-effects model and empirical best linear unbiased predictor predicting growth profile of height for Chinese fir

计量

基于混合效应模型及EBLUP预测杉木树高生长过程

doi: 10.11833/j.issn.2095-0756.2017.05.003

北京林业大学林学院, 北京 100083

作者简介:
王明初, 从事林业资源调查与监测研究.E-mail:wangmc@bjfu.edu.cn

通信作者: 孙玉军, 教授, 博士, 博士生导师, 从事森林资源监测与模型等研究.E-mail:sunyj@bjfu.edu.cn

English Abstract

Based on mixed-effects model and empirical best linear unbiased predictor predicting growth profile of height for Chinese fir

College of Forestry, Beijing Forestry University, Beijing 100083, China

全文HTML

2.1. 数据的采集与整理

2.2. 基础模型

2.3. 非线性混合效应模型

2.4. EBLUP预测原理与方法

3.1. 基础模型的选择

3.2. 非线性混合效应模型构建

3.2.1. 混合效应参数的确定

3.2.2. 误差项方差协方差结构

3.2.3. 模型拟合结果

3.3. EBLUP预测分析

3.3.1. 单木树高生长的预测

3.3.2. EBLUP预测的精度分析

目录

留言板

基于混合效应模型及EBLUP预测杉木树高生长过程

DOI: 10.11833/j.issn.2095-0756.2017.05.003

作者简介: 王明初, 从事林业资源调查与监测研究.E-mail:wangmc@bjfu.edu.cn

通信作者: 孙玉军, 教授, 博士, 博士生导师, 从事森林资源监测与模型等研究.E-mail:sunyj@bjfu.edu.cn

Based on mixed-effects model and empirical best linear unbiased predictor predicting growth profile of height for Chinese fir

计量

出版历程

基于混合效应模型及EBLUP预测杉木树高生长过程

doi: 10.11833/j.issn.2095-0756.2017.05.003

北京林业大学 林学院, 北京 100083

作者简介: 王明初, 从事林业资源调查与监测研究.E-mail:wangmc@bjfu.edu.cn

通信作者: 孙玉军, 教授, 博士, 博士生导师, 从事森林资源监测与模型等研究.E-mail:sunyj@bjfu.edu.cn

English Abstract

Based on mixed-effects model and empirical best linear unbiased predictor predicting growth profile of height for Chinese fir

College of Forestry, Beijing Forestry University, Beijing 100083, China

全文HTML

2.1. 数据的采集与整理

2.2. 基础模型

2.3. 非线性混合效应模型

2.4. EBLUP预测原理与方法

3.1. 基础模型的选择

3.2. 非线性混合效应模型构建

3.2.1. 混合效应参数的确定

3.2.2. 误差项方差协方差结构

3.2.3. 模型拟合结果

3.3. EBLUP预测分析

3.3.1. 单木树高生长的预测

3.3.2. EBLUP预测的精度分析

目录

北京林业大学林学院, 北京 100083

作者简介:
王明初, 从事林业资源调查与监测研究.E-mail:wangmc@bjfu.edu.cn