-
森林火灾是一种失去人为控制肆意燃烧毁坏林地的森林燃烧现象,严重威胁着生物多样性、森林生态系统和人类生命财产安全[1-2]。森林火险区划是有效防止和减小森林火灾危害的手段,结合火环境将森林区域划分为不同的火险等级便于分级管理[3]。国内外许多学者研究表明,林火受多种驱动因子共同影响,因子可以分为气象、地形、植被和人为因素[4-5]。森林火险区划与林火驱动因子之间存在复杂联系,根据前人研究,其划分方法主要包括模糊聚类法、主成分分析法、模糊综合评判法等[6-8]。Logistic模型是林火研究常用的一种回归模型,因其模型的解释性好和预测准确率较高被广泛应用在林火研究之中。本研究应用Logistic回归模型结合气象、地形、植被、人为等因素建立林火预测模型,对昆明市林火驱动因子进行分析并划分等级,以期为昆明市林火预防和管理工作提供参考。
-
二项Logistic回归模型可以有效进行二分类数据的判别,被国内外学者广泛运用于林火区划[8,13]。以林火发生概率作为二项Logistic回归模型的因变量,以y=1或0代表林火是否发生。设P为林火发生概率,则林火未发生概率为1−P,由此得公式:
$$ P = \frac{e{\beta }_{0}+{\beta }_{1}{x}_{1}+{\beta }_{2}{x}_{2}+\dots +{\beta _jx_j}}{1+e{\beta }_{0}+{\beta }_{1}{x}_{1}+{\beta }_{2}{x}_{2}+\dots +{\beta _jx_j}}。 $$ 将上面公式做logit变换,得到公式为:
$$ \mathrm{ln}\left(\frac{P}{1-P}\right)={\beta }_{0} + {\beta }_{1}{x}_{1}+{\beta }_{2}{x}_{2}+\dots +{\beta }_j{x}_{j} 。 $$ 其中:
$ {\;\beta }_{0} $ 、$ {\;\beta }_{1} $ 、$ {\;\beta }_{2} 、\cdots 、 {\beta }_{j} $ 为各自变量因子的回归系数,$ {x}_{1}、{x}_{2} 、\cdots 、 {x}_{j} $ 为各自变量因子,$ e $ 为常量,j为自变量个数,P为林火发生概率,$ \mathrm{l}\mathrm{n}\left(\dfrac{P}{1-P}\right) $ 为P的比数的对数。建立二项Logistic林火预测回归模型时,需要一些随机非火点与火点共同构成样本数据。基于前人的研究经验[14],将火点与非火点比例调整为1∶2,对非火点日期进行随机赋值,保证时间和空间上的双随机。将样本数据随机分成60%作为模型样本,40%进行独立检验,重复5次随机划分,避免样本分布对最终模型结果的影响。
-
多重共线指变量因子之间存在相关关系使模型精度下降,利用多重共线性诊断可以有效剔除相关变量。使用方差膨胀因子(VIF)进行多重共线性检验,通常认为0<VIF<10时不存在多重共线性,当VIF≥10时,变量之间存在显著共线性,据此逐步剔除直至变量间不存在显著共线性。
-
为减小随机选择自变量对建模结果的影响,提高模型的精确度,采用SPSS中系统默认的“强迫回归方法”进行自变量的筛选,逐步剔除变量使剩余变量VIF值均小于10。在上述5次划分的随机模型中选取至少出现3次的显著变量参与全样本数据的拟合。
-
受试者工作特征曲线(receiver operator characteristic curve,ROC)常用于评价分类模型精度和计算最佳阈值。该曲线以特异性(正类误判为负类)为横坐标,以敏感性(正类判断为正类)为纵坐标,ROC曲线下面积(area under curve AUC)的值用来评价模型的精度,AUC的值越接近于1则表示该模型的精度越高,通常认为AUC>0.8时该模型拥有较好预测能力[15]。约登指数(Youden index,敏感性+1-特异性)是ROC曲线上最靠近左上角的一点,代表两分类模型预测准确度最佳阈值[16],用该阈值计算可以得到模型的预测准确率。
-
依据全样本运算得到的Logistic回归方程式计算结果,使用ArcGIS的克里金插值法进行图层运算,获得昆明市的林火发生概率分布图。《全国森林火险区划等级》[17]将全国森林火险等级划分为3级,但该标准只适用于县级或林场的等级区划,对于大区域的宏观预测精度和指导意义远远不够。本研究按照前人的经验和国际惯例[18],依据概率等间距将昆明市划分为五级森林火险:0~0.2为一级火险区,0.2~0.4为二级火险区,0.4~0.6为三级火险区,0.6~0.8为四级火险区,0.8~1.0为五级火险区。
-
共线性诊断适用于连续变量不适用于分类变量,因此,先对15个连续变量进行多重共线性诊断,再综合5个中间模型加上非连续性变量“植被类型”和“坡向”进行模型显著性检验,确定最终林火驱动因子。多重共线性诊断的结果如表1所示:在剔除月均气温之后,不存在多重共线性。将筛选的连续变量和分类变量采用“沃尔德(Wald)向前”原则对5个样本进行拟合,选择结果中出现3次及以上的显著变量作为全样本模型的自变量因子,全样本的拟合结果如表2所示。
表 1 多重共线性诊断结果
Table 1. Results of multicollinearity diagnosis
序号 变量名 剔除变量
前VIF值剔除变量
后VIF值1 海拔 1.179 1.177 2 坡度 1.113 1.109 3 月均地表温度 23.899 1.933 4 月均气压 1.930 1.823 5 月均相对湿度 4.562 4.351 6 月均风速 1.950 1.946 7 月均气温 25.876 − 8 月均日照时长 3.573 3.514 9 归一化植被指数 2.213 2.173 10 距河流距离 1.090 1.089 11 距居民区距离 1.171 1.170 12 距公路距离 1.216 1.210 13 距铁路距离 1.243 1.236 14 人均GDP 1.810 1.799 15 人口密度 1.168 1.168 说明:−表示月均气温被剔除 表 2 全样本数据逻辑斯特回归模型拟合结果
Table 2. Results of logistic regression model for all data
变量 系数 标准误 沃尔德 显著性 海拔(x1) −2.138 1.096 3.805 0.000 距居民点距离(x2) 1.768 0.658 7.224 0.007 距铁路距离(x3) −1.373 0.614 4.997 0.025 归一化植被指数(x4) −3.159 0.769 16.875 0.000 月均地表温度(x5) 2.110 0.641 3.298 0.000 月均气压(x6) −1.654 0.552 6.665 0.010 月均相对湿度(x7) −2.273 0.612 18.478 0.000 月均风速(x8) 1.169 1.153 3.649 0.000 人均GDP(x9) 6.638 1.162 33.169 0.000 常量 2.061 0.796 6.699 0.010 -
如图2所示:用ROC曲线分别计算模型的AUC和约登指数并以此计算测试样本预测准确率。如表3所示:5个中间模型的样本的AUC值均大于0.890,对样本的预测准确率均高于80%,全样本AUC值为0.905,预测准确率为81.7%,说明Logistic回归模型对昆明市林火发生预测有较好的预测效果,适用于昆明市林火发生预测。根据全样本拟合结果建立昆明市Logistic回归概率模型为:
表 3 模型评价
Table 3. Model evaluation
样本 AUC 阈值 训练样本预测
准确率/%测试样本预测
准确率/%样本组1 0.906 0.334 83.3 82.1 样本组2 0.898 0.385 82.0 84.5 样本组3 0.906 0.366 81.1 82.3 样本组4 0.898 0.329 82.5 85.7 样本组5 0.913 0.379 82.0 84.3 全样本 0.905 0.342 81.7 $$ \begin{split} &\mathrm{ln}\left(\frac{P}{1-P}\right)=-2.138{x}_{1}+1.768{x}_{2} -1.373 {x}_{3} -3.159 {x}_{4}+\\ &2.110 {x}_{5} -1.654 {x}_{6} -2.373 {x}_{7}+ 1.169 {x}_{8} +6.638 {x}_{9}+ 2.061。 \end{split} $$ 其中:P是林火发生概率,
$ {x}_{1} $ 为海拔,$ {x}_{2} $ 为居民点,$ {x}_{3} $ 为离铁路距离,$ {x}_{4} $ 为NDVI,$ {x}_{5} $ 为月均地表温度,$ {x}_{6} $ 为月均气压,$ {x}_{7} $ 为月均相对湿度,$ {x}_{8} $ 为月均风速,$ {x}_{9} $ 为人均GDP。 -
由图3可见:5类森林火险等级分别占昆明市区面积的48.82%、35.17%、11.26%、2.55%、2.2%,高火险地区集中分布在五华区、盘龙区、官渡区、呈贡区、西山区、安宁市等,四级和五级火险区集中在一起。与实际火点进行比对,这片区域发生历史火灾集中且次数最多。总体来看,昆明市的重点火险区主要分布在昆明市西南部、嵩明县的中部地区、东川区的边界和石林彝族自治县的中部地区。
-
从表3可以看出:对昆明市林火发生概率具有显著影响的林火驱动因子分别为海拔、距居民点距离、距铁路距离、NDVI值、月均地表温度、月均气压、月均相对湿度、月均风速、人均GDP。由图4可得:火点集中在距居民区1 500~2 500 m,这个区间属于人口密集区,人为活动频繁导致林火发生概率增大。火点集中分布在月均地表温度15~25 ℃区间,该温度对应昆明市春夏季,此时正是昆明市的防火期,降水稀少,日照时间长,可燃物含水率低,容易引发火灾发生。昆明市火点频次在月均风速2.0~4.0 m·s−1时呈下降趋势,到达4.5 m·s−1先上升后下降,该区间对应昆明市春夏季过渡到秋季,降水增多,植物含水率和温度较低,不易发生火灾。11月进入冬季,为昆明市防火期时段,从月均相对湿度来看,昆明市火点主要集中在40%~60%,在相对湿度高于60%之后的区间,月均相对湿度与火点频次呈负相关关系。
火点频次与距铁路距离呈明显的负相关关系,火点主要分布在0~20 km的区域内,随距离增加,火点越来越少,距居民区的火点集中在0~2 000 m的区域内,2 000 m以后呈明显的负相关。人均GDP与火点频次呈明显的负相关,随人均GDP的增长火点减少,人均GDP较少的区域多处于农村、乡镇区域,森林面积大,火点占有可能性较高。NDVI代表植被覆盖率,其值与植被覆盖率呈正比关系,火点落入0.2~0.5最多,这一现象可能是因为植被茂密地区地表温度较低,地表蒸发量小,从而使可燃物含水率保持在较高的程度,不易发生火灾。
Driving factors of forest fire and fire risk zoning in Kunming City
-
摘要:
目的 对昆明市2000—2015年的火点数据进行分析,确定主要林火驱动因子,建立昆明市林火预报模型并进行火险区划,为昆明市林火预防提供参考。 方法 基于林火数据,选取气象、地形、植被、人为等17个林火驱动因子构建Logistic回归林火概率模型,并划分5个中间模型选取全样本的显著变量因子,用受试者工作特征曲线(ROC)进行模型检验与评价,基于全样本的模型结果分析昆明市主要林火驱动因子,并计算得到林火发生概率的最佳阈值,根据Logistic模型结果划分五级火险区。 结果 海拔、距居民点距离、距铁路距离、归一化植被指数(NDVI)值、月均地表温度、月均气压、月均相对湿度、月均风速、人均国内生产总值(GDP)等9个因子与昆明市林火发生概率存在显著关系;Logistic模型的预测准确率高达81.7%;ROC曲线下面积(AUC)的值为0.905;划分的最佳阈值为0.342;火险区划的五级火险区面积比率分别为48.82%、35.17%、11.26%、2.55%、2.20%。 结论 昆明市林火主要驱动因子是气象因子;昆明市高火险区集中分布在五华区、盘龙区、官渡区、呈贡区、西山区、安宁市等西南部地区。图4表3参22 -
关键词:
- 林火驱动因子 /
- Logistic回归模型 /
- 火险区划 /
- 卫星林火数据 /
- 昆明市
Abstract:Objective With an analysis of the data of fire spots in Kunming City from 2000 to 2015, this study is aimed to determine the main driving factors of forest fires, establish the forest fire prediction model in Kunming City, map the forest fire-risk zones so as to provide reference for the prevention and management of forest fires in Kunming City. Method First, with 17 forest fire driving factors selected, a Logistic regression forest fire probability model was constructed on the basis of the satellite forest fire data, including meteorology, terrain, vegetation, artificial, and so on. Then five intermediate models were employed to select the significant variable factors for whole samples before the model was tested using ROC curve. Based on the modeling results of the whole samples, an analysis was conducted of the main forest fire driving factors in Kunming City with the best threshold for probability of forest fire calculated. At last, five fire-risk zones were determined based on the results obtained via the Logistic model. Result Among the nine driving factors were altitude, distance from residential areas, distance from railways, NDVI value, monthly average surface temperature, monthly average air pressure, monthly average relative humidity, monthly average wind speed and per capita GDP. The prediction accuracy of Logistic model was as high as 81.7%. The area AUC under ROC curve is 0.905. The best threshold of division was 0.342, the area percent of the five-level fire danger zones were 48.82%, 35.17%, 11.26%, 2.55% and 2.2% respectively. Conclusion The main driving factor for forest fire in Kunming City is the meteorological factor with the high fire risk areas in Kunming City concentrated in the southwest region including Wuhua District, Panlong District, Guandu District, Chenggong District, Xishan District and Anning City. [Ch, 4 fig. 3 tab. 22 ref.] -
表 1 多重共线性诊断结果
Table 1. Results of multicollinearity diagnosis
序号 变量名 剔除变量
前VIF值剔除变量
后VIF值1 海拔 1.179 1.177 2 坡度 1.113 1.109 3 月均地表温度 23.899 1.933 4 月均气压 1.930 1.823 5 月均相对湿度 4.562 4.351 6 月均风速 1.950 1.946 7 月均气温 25.876 − 8 月均日照时长 3.573 3.514 9 归一化植被指数 2.213 2.173 10 距河流距离 1.090 1.089 11 距居民区距离 1.171 1.170 12 距公路距离 1.216 1.210 13 距铁路距离 1.243 1.236 14 人均GDP 1.810 1.799 15 人口密度 1.168 1.168 说明:−表示月均气温被剔除 表 2 全样本数据逻辑斯特回归模型拟合结果
Table 2. Results of logistic regression model for all data
变量 系数 标准误 沃尔德 显著性 海拔(x1) −2.138 1.096 3.805 0.000 距居民点距离(x2) 1.768 0.658 7.224 0.007 距铁路距离(x3) −1.373 0.614 4.997 0.025 归一化植被指数(x4) −3.159 0.769 16.875 0.000 月均地表温度(x5) 2.110 0.641 3.298 0.000 月均气压(x6) −1.654 0.552 6.665 0.010 月均相对湿度(x7) −2.273 0.612 18.478 0.000 月均风速(x8) 1.169 1.153 3.649 0.000 人均GDP(x9) 6.638 1.162 33.169 0.000 常量 2.061 0.796 6.699 0.010 表 3 模型评价
Table 3. Model evaluation
样本 AUC 阈值 训练样本预测
准确率/%测试样本预测
准确率/%样本组1 0.906 0.334 83.3 82.1 样本组2 0.898 0.385 82.0 84.5 样本组3 0.906 0.366 81.1 82.3 样本组4 0.898 0.329 82.5 85.7 样本组5 0.913 0.379 82.0 84.3 全样本 0.905 0.342 81.7 -
[1] YING Lingxiao, HAN Jie, DU Yongsheng, et al. Forest fire characteristics in China: spatial patterns and determinants with thresholds [J]. For Ecol Manage, 2018, 424: 345 − 354. [2] SU Zhangwen, TIGABU M, CAO Qiangqian, et al. Comparative analysis of spatial variation in forest fire drivers between boreal and subtropical ecosystems in China[J/OL]. For Ecol Manage, 2019, 454: 117669[2021-03-14]. doi: 10.1016/j.foreco.2019.117669. [3] 舒立福, 张小罗, 戴兴安, 等. 林火研究综述(Ⅱ)林火预测预报[J]. 世界林业研究, 2003(4): 34 − 37. SHU Lifu, ZHANG Xiaoluo, DAI Xing’an, et al. Forest fire research (Ⅱ) fire forecast [J]. World For Res, 2003(4): 34 − 37. [4] 杨夏捷, 苏漳文, 田超, 等. 基于ArcGIS的福建南部地区林火管理资源分布优化[J]. 生态学杂志, 2017, 36(4): 1142 − 1149. YANG Xiajie, SU Zhangwen, TIAN Chao, et al. Optimization of resource distribution of forest fire management in southern Fujian based on ArcGIS [J]. Chin J Ecol, 2017, 36(4): 1142 − 1149. [5] CHAS-AMIL M L, PRESTEMON J P, MCCLEAN C J, et al. Human-ignited wildfire patterns and responses to policy shifts [J]. Appl Geogr, 2015, 56: 164 − 176. [6] 谭三清, 林强, 张盛, 等. 基于可变模糊集方法的森林火险区划研究[J]. 中南林业科技大学学报, 2015, 35(9): 35 − 38. TAN Sanqing, LIN Qiang, ZHANG Sheng, et al. Study on forest fire danger division based on variable fuzzy sets method [J]. J Cent South Univ For Technol, 2015, 35(9): 35 − 38. [7] 苏立娟, 何友均, 陈绍志. 1950—2010年中国森林火灾时空特征及风险分析[J]. 林业科学, 2015, 51(1): 88 − 96. SU Lijuan, HE Youjun, CHEN Shaozhi. Temporal and spatial characteristics and risk analysis of forest fires in China from 1950 to 2010 [J]. Sci Silv Sin, 2015, 51(1): 88 − 96. [8] MODUGNO S, BALZTER H, COLE B, et al. Mapping regional patterns of large forest fires in wildland-urban interface areas in Europe [J]. J Environ Manage, 2016, 172: 112 − 126. [9] STRYDOM S, SAVAGE M J. A spatio-temporal analysis of fires in the Southern African Development Community region[J]. Nat Hazards, 2018, 92(3): 1617−1632. [10] 高超, 林红蕾, 胡海清, 等. 我国林火发生预测模型研究进展[J]. 应用生态学报, 2020, 31(9): 3227 − 3240. GAO Chao, LIN Honglei, HU Haiqing, et al. A review of models of forest fire occurrence prediction in China [J]. Chin J Appl Ecol, 2020, 31(9): 3227 − 3240. [11] 曾爱聪, 蔡奇均, 苏漳文, 等. 基于MODIS卫星火点的浙江省林火季节变化及驱动因子[J]. 应用生态学报, 2020, 31(2): 399 − 406. ZENG Aicong, CAI Qijun, SU Zhangwen, et al. Seasonal variation and driving factors of forest fire in Zhejiang Province, based on MODIS satellite hot spots [J]. Chin J Appl Ecol, 2020, 31(2): 399 − 406. [12] ALOSON-CANAS I, CHUVIECO E. Global burned area mapping from ENVISAT-MERIS and MODIS active fire data [J]. Remote Sensing Environ, 2015, 163: 140 − 152. [13] 蔡奇均, 曾爱聪, 苏漳文, 等. 基于Logistic回归模型的浙江省林火发生驱动因子分析[J]. 西北农林科技大学学报(自然科学版), 2020, 48(2): 102 − 109. CAI Qijun, ZENG Aicong, SU Zhangwen, et al. Driving factors of forest fire in Zhejiang Province based on Logistic regression model [J]. J Northwest A&F Univ Nat Sci Ed, 2020, 48(2): 102 − 109. [14] GUO Futao, WANG Guangyu, SU Zhangwen, et al. What drives forest fire in Fujian, China? Evidence from logistic regression and Random Forests [J]. Int J Wildl Fire, 2016, 25(5): 505 − 519. [15] PENCINA M J, D’AGOSTINO Sr R B, D’AGOSTINO Jr R B, et al. Evaluating the added predictive ability of a new marker: from area under the ROC curve to reclassification and beyond [J]. Stat Med, 2008, 27(2): 157 − 172. [16] FLUSS R, FARAGGI D, REISER B. Estimation of the Youden Index and its associated cutoff point [J]. Biom J Biom Zeitschrift, 2005, 47(4): 458 − 472. [17] 国家林业局调查规划设计院. 全国森林火险区划等级: LY/T 1063—2008[S]. 北京: 中国标准出版社, 2008. Survey and Design Institute of State Forestry Administration. Rank of the Regionalization on Nationwide Forest Fire Risk: LY/T 1063−2008[S]. Beijing: China Standards Press, 2008. [18] 马文苑, 冯仲科, 成竺欣, 等. 山西省林火驱动因子及分布格局研究[J]. 中南林业科技大学学报, 2020, 40(9): 57 − 69. MA Wenyuan, FENG Zhongke, CHENG Zhuxin, et al. Study on driving factors and distribution pattern of forest fires in Shanxi province [J]. J Cent South Univ For Technol, 2020, 40(9): 57 − 69. [19] GUO Futao, SU Zhangwen, WANG Guangyu, et al. Understanding fire drivers and relative impacts in different Chinese forest ecosystems [J]. Sci Total Environ, 2017, 605: 411 − 425. [20] 梁慧玲, 林玉蕊, 杨光, 等. 基于气象因子的随机森林算法在塔河地区林火预测中的应用[J]. 林业科学, 2016, 52(1): 89 − 98. LIANG Huiling, LIN Yurui, YANG Guang, et al. Application of random forest algorithm on the forest fire prediction in Tahe area based on meteorological factors [J]. Sci Silv Sin, 2016, 52(1): 89 − 98. [21] 王卫国, 潘竟虎, 冯娅娅, 等. 基于MODIS数据和GWLR的甘肃省火灾风险模型与区划[J]. 遥感技术与应用, 2017, 32(3): 514 − 523. WANG Weiguo, PAN Jinghu, FENG Yaya, et al. Model and zoning of fire risk in Gansu Province based on GWLR and MODIS imagery [J]. Remote Sensing Technol Appl, 2017, 32(3): 514 − 523. [22] 潘登, 郁培义, 吴强. 基于气象因子的随机森林算法在湘中丘陵区林火预测中的应用[J]. 西北林学院学报, 2018, 33(3): 169 − 177. PAN Deng, YU Peiyi, WU Qiang. Application of random forest algorithm on the forest fire prediction based on meteorological factors in the hilly area, central Hunan Province [J]. J Northwest For Univ, 2018, 33(3): 169 − 177. -
链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20210339