-
宁夏回族自治区固原市位于黄土高塬沟壑区[1]。长期的过度放牧、不合理耕作,导致该地区植被稀疏、水土流失加剧[2],严重影响了当地社会经济发展和生态安全。梯田有效缓解了农业生产带来的水土流失问题[3],从20世纪80年代开始,固原市实施了大面积的坡改梯工程[4]。加之2000年开始实施的国家退耕还林还草工程[5],该地区的水土流失问题有所缓解,生态环境持续向好[6]。随着遥感技术的快速发展,如何从遥感影像中高效、准确、大尺度地获取梯田时空分布信息,对于指导农业生产、水土保持监测和防治水土流失具有重要的意义。传统的梯田遥感识别主要采用目视解译[7],该方法精度较高,但存在耗时耗力、成本高、方法复用性差等问题,目前更多用来采集机器学习(machine learning)的样本[8]。近年来,大部分学者采用面向对象或基于像元的监督识别技术,利用决策树(CART)、随机森林(RF)、支持向量机(SVM)、深度学习(DL)等[9-11]机器学习算法,先学习采集的样本,然后利用学习好的模型识别新的样本。面向对象技术较基于像元识别技术,不仅依靠地物的光谱特征,还利用像元和像元之间的关系提高识别精度,识别过程更加复杂,影像分辨率要求更高[7]。但是,无论采用哪种方法进行梯田遥感识别,基本上都是基于单机处理,普遍存在遥感数据获取困难、预处理复杂、性能限制等问题[9],难以开展大尺度的遥感识别研究。为了解决这些问题,Google公司借助其强大的计算资源与海量数据存储,推出了遥感云平台Google Earth Engine(GEE)[12]。借助该平台,研究人员可以极大扩展自身原有研究的覆盖范围,提供国家乃至全球尺度的研究成果[13]。目前,GEE在大尺度森林变化监测、土地利用类型分类、人类居住地动态监测等[14-16]方面应用广泛,但大尺度梯田遥感识别未见相关报道。为此,本研究在GEE平台支持下,利用Landsat时间序列数据和SRTM数字高程模型(digital elevation model,DEM),建立每年时间序列影像的百分位数特征。对比3种机器学习算法的分类精度大小,选择分类精度最高的识别结果,应用LandTrendr时序算法逐像元拟合修正时间序列,实现固原市1988−2019年度梯田动态监测的目的。研究结果可为黄土丘陵地区梯田的高效、准确识别和水土保持监测、评价提供参考。
-
黄土梯田动态监测的流程可分为4个主要功能模块:遥感数据加载、数据预处理、分类算法优选、序列优化。各模块从上到下,层层递进,最终实现黄土梯田动态监测(图1)。
-
使用T1级别(质量最高)的Landsat地表反射率数据(surface reflectance, SR)。该数据产品已经过几何校正、辐射校正和大气校正,空间分辨率30 m,时间分辨率16 d。由于Landsat 5/7/8卫星的服务年限不同,1988−2011年使用Landsat 5影像,2012年使用Landsat 7影像,2013−2019年使用Landsat 8影像,共使用1 690景影像。
-
采用30 m空间分辨率的数字高程模型,具体编号为SRTMGL1_003。
-
地类仅分为梯田和其他2类。通过Google Earth Pro提供的高清历史影像,利用目视解译法采集样本数据。样本数据包括样点数据和斑块数据。样点数据按时间分为2010−2014年地类属性相同和2000年的样点,以满足Landsat 5/7/8不同卫星分别进行机器学习样本训练的需求。样点采集遵循以下原则:①在研究区生成5 km方形格网,以使样点分布均匀;②保持样点100 m以内属性相同。样点数据共2 673个,梯田样点1 040个,其他样点1 633个。斑块数据为6个随机分布的5 km×5 km正方形区域,参考Google Earth Pro中2019年厘米级高清遥感影像人工勾绘以及实地验证。
-
选择Landsat对应卫星影像的红波段(Br)、绿波段(Bg)、蓝波段(Bb)、近红外(Bnir)、短波红外1(Bswir1)、短波红外2(Bswir2)6个光谱波段;再经裁边(坏像元)、光谱指数计算(计算方法如表1)、去云后,针对黄土梯田全年季相变化特点[17],统计每年度内时间序列影像百分位数特征融合影像[18],即逐像元对某一波段1 a内所有观测值取其10%、25%、50%、75%、90%百分位数,获得该像元位置该波段对应的5个指标波段;再与6个地形特征波段组合,即由数字高程计算得到的海拔、坡度、坡向,以及3个3×3、7×7、11×11像元窗口内地形起伏度波段。共计61个特征波段。
表 1 光谱指数计算方法
Table 1. Calculation methods of spectral index
光谱指数名称 计算方法 归一化植被指数 BNDVI = (Bnir−Br)/(Bnir + Br) 增强型植被指数 BEVI = (Bnir−Br)/(Bnir + 6Br−7.5Bb + 1) 归一化建筑指数 BNDBI = (Bswir2−Bnir)/(Bswir2 + Bnir) 归一化湿度指数 BNDMI = (Bnir−Bswir1)/(Bnir + Bswir1) 归一化水体指数 BNDWI = (Bg−Bnir)/(Bg + Bnir) 说明:Br为红波段;Bg为绿波段;Bb为蓝波段;Bnir为近红 外;Bswir1为短波红外1;Bswir2为短波红外2 -
3种机器学习算法为随机森林、决策树、支持向量机,GEE均有内建,可直接调用。另外,针对不同卫星分别进行机器学习,把样点数据分年度映射到对应合成影像并汇总(如Landsat 5包括2000、2010和2011年的样本),再按9∶1划分样本,90%的样本用于分类器训练,10%的样本用于精度验证。
-
LandTrendr算法将以年时间序列的值进行分割、逐段拟合、平滑[19],获取单个像元在整个研究时间段内的整体变化特征。具体介绍参考文献[19]。
-
应用前文分类精度最高的机器学习算法,对研究区1988−2019年逐年进行梯田遥感识别。为减少极端天气和人类活动导致识别错误,利用地类在时间序列上连续、稳定的特征,使用LandTrendr算法[19]对识别结果的时间序列(概率为0~1的浮点)拟合平滑处理。参考中国水土保持措施分类[20],提取坡度>2°和坡度<25°区域的梯田,以减少沟壑地及塬地的误分。
-
采用混淆矩阵的方法,以总体精度、Kappa系数、生产者精度和用户精度等指标作为识别精度评价依据。具体计算方法参考文献[18]。
-
植被覆盖度(fractional vegetation cover, FVC)采用归一化植被指数和像元二分模型计算。具体计算方法参考文献[21]。
-
表2为随机抽取的1 051个样点的验证结果。4种精度指标均为随机森林算法最高,决策树算法次之,支持向量机算法最小。随机森林算法基于样点检验的精度分别为:梯田的生产者精度94.46%、梯田的用户精度89.03%、总体精度94.10%、Kappa系数为0.87,都远大于另外2种算法。因此,后文采用随机森林机器学习算法进行梯田遥感识别。
表 2 不同机器学习算法识别结果的样点验证精度
Table 2. Sample points verification accuracy of the results of different machine learning algorithms
机器学习
算法梯田的生产
者精度/%梯田的用户
精度/%总体精
度/%Kappa
系数随机森林 94.46 89.03 94.10 0.87 决策树 78.89 78.07 84.40 0.66 支持向量机 70.88 67.36 78.02 0.52 -
表3显示:去除交界100 m缓冲区后的验证精度高于未去除时(0 m)的验证精度。另外,经LandTrendr处理后梯田的生产者精度、梯田的用户精度、总体精度和Kappa系数分别为:81.75%、85.97%、93.33%、0.80,均大于LandTrendr处理前的验证精度。
表 3 原始识别结果及使用LandTrendr算法处理后的斑块验证精度(随机森林)
Table 3. Speckles verification accuracy of the original results and the results of using LandTrendr algorithm(RF)
去除交界
缓冲区/m验证像元数/
(×104个)LandTrendr
处理梯田的生产者
精度/%梯田的用户
精度/%总体精
度/%Kappa
系数0 20.66 处理前 78.24 73.47 84.73 0.65 处理后 80.82 76.18 86.38 0.68 100 14.43 处理前 77.55 84.93 92.04 0.76 处理后 81.75 85.97 93.33 0.80 说明:去除交界缓冲区是指去除梯田与其他类型交界线缓冲区范围内的像元,减少有地理配准误差较大的像元输入。0 m代表不 去除 -
选择3个不同位置来展示LandTrendr算法拟合效果(图2),位置A原始识别结果在1994、2002、2004年被错误识别为其他类型,位置B原始识别结果在1997年被错误识别为其他类型,在2015年被错误识别为梯田类型。经LandTrendr算法处理后,这些错误类型均被校正。位置C原始识别结果与经LandTrendr算法处理后的结果均为其他类型,识别类型没有变化。
-
经LandTrendr算法处理后的研究区梯田面积(图3)变化趋势更稳定,从1988年5 816.59 km2减少到2019年3 146.72 km2,年均减少90.85 km2·a−1。1988−2019年,研究区植被覆盖度则呈现不断增加的趋势,与梯田面积变化趋势相反。另外,处理前、处理后的梯田面积与植被覆盖度极显著(P<0.001)相关,其相关系数分别为−0.50和−0.75。
-
图4显示了研究区1988−2019年梯田使用时间长短的分布。从整体上来看,梯田主要分布在六盘山山脉两侧,且西部的梯田使用时间较东部更长。从局部来看,南部的泾源县区域,梯田零星分布,使用时间相对较短;西部西吉县的沟谷条带、中部的六盘山山脉、北部原州区清水河的河谷冲积平原(红色部分)能明显区分出来。
Dynamic monitoring of loess terraces based on Google Earth Engine and machine learning
-
摘要:
目的 梯田是黄土高原最重要的水土保持措施和农业生产措施,高效、准确地获取长时间序列黄土梯田分布信息,对黄土高原的水土保持监测和评价十分重要。 方法 在Google Earth Engine(GEE)的支持下,以宁夏回族自治区固原市为研究区,使用遥感影像监督识别技术,对比随机森林(RF)、决策树(CART)、支持向量机(SVM)等3种机器学习算法的识别精度,探讨LandTrendr算法在长时间序列动态监测中的优化应用,最终获取固原市近30 a梯田分布信息。 结果 ①3种算法识别精度从大至小依次为随机森林、决策树、支持向量机。②使用随机森林算法识别梯田,基于样点检验总体精度达94.10%,Kappa系数达0.87,基于实地斑块检验总体精度达93.33%,Kappa系数达0.80。③ LandTrendr算法能有效校正时间序列中的错误值。④ 1988-2019年,固原市梯田面积减少了45.90%。⑤固原市西部的梯田使用时间较东部更长。 结论 采用本研究方法在GEE云平台可以高效、准确地遥感监测长时序、大尺度的黄土梯田。固原市近30 a梯田农业比例逐渐下降,促进了生态环境持续向好发展。图4表3参22 -
关键词:
- 黄土梯田 /
- Google Earth Engine /
- 遥感 /
- 机器学习 /
- LandTrendr
Abstract:Objective Terraces are the most important soil and water conservation measures and agricultural production measures in the Loess Plateau, the main region of soil and water loss and the key region of ecological environmental construction in China. The purpose of this study is to obtain the distribution information of loess terraces in a long time series efficiently and accurately, so as to monitor and evaluate soil and water loss in the Loess Plateau. Method Google Earth Engine (GEE), a cloud-based platform of remote sensing with high-performance computing resources, was used in this study. Guyuan City of Ningxia, a gully region of the Loess Plateau, was taken as the research area. The recognition accuracy of three machine learning algorithms, including random forest (RF), decision tree (CART) and support vector machine (SVM), was compared by using remote sensing image supervised recognition technology, and the optimized application of LandTrendr algorithm in long-time series dynamic monitoring was discussed. Finally, the distribution of terraces in Guyuan City in recent 30 years was obtained. Result (1) The order of identification accuracy of the three algorithms from large to small was RF, CART, and SVM. (2) Using random forest algorithm to identify terraces, the overall accuracy based on sample test was 94.10%, Kappa coefficient 0.87, and the overall accuracy based on field patch test was 93.33%, Kappa coefficient 0.80. (3) LandTrendr algorithm can effectively correct the errors in the time series and improve the accuracy of time series identification. (4) From 1988 to 2019, the area of terraces in Guyuan decreased by 45.90%. (5) The time to use terraces in the west of Guyuan was longer than that in the east. Conclusion The RF machine learning algorithm combined with LandTrendr algorithm on GEE can efficiently and accurately monitor long-term and large-scale loess terraces. In the past 30 years, the proportion of terrace agriculture in Guyuan City has gradually declined, which promotes the sustainable development of ecological environment. [Ch, 4 fig. 3 tab. 22 ref.] -
Key words:
- loess terraces /
- Google Earth Engine (GEE) /
- remote sensing /
- machine learning /
- LandTrendr
-
表 1 光谱指数计算方法
Table 1. Calculation methods of spectral index
光谱指数名称 计算方法 归一化植被指数 BNDVI = (Bnir−Br)/(Bnir + Br) 增强型植被指数 BEVI = (Bnir−Br)/(Bnir + 6Br−7.5Bb + 1) 归一化建筑指数 BNDBI = (Bswir2−Bnir)/(Bswir2 + Bnir) 归一化湿度指数 BNDMI = (Bnir−Bswir1)/(Bnir + Bswir1) 归一化水体指数 BNDWI = (Bg−Bnir)/(Bg + Bnir) 说明:Br为红波段;Bg为绿波段;Bb为蓝波段;Bnir为近红 外;Bswir1为短波红外1;Bswir2为短波红外2 表 2 不同机器学习算法识别结果的样点验证精度
Table 2. Sample points verification accuracy of the results of different machine learning algorithms
机器学习
算法梯田的生产
者精度/%梯田的用户
精度/%总体精
度/%Kappa
系数随机森林 94.46 89.03 94.10 0.87 决策树 78.89 78.07 84.40 0.66 支持向量机 70.88 67.36 78.02 0.52 表 3 原始识别结果及使用LandTrendr算法处理后的斑块验证精度(随机森林)
Table 3. Speckles verification accuracy of the original results and the results of using LandTrendr algorithm(RF)
去除交界
缓冲区/m验证像元数/
(×104个)LandTrendr
处理梯田的生产者
精度/%梯田的用户
精度/%总体精
度/%Kappa
系数0 20.66 处理前 78.24 73.47 84.73 0.65 处理后 80.82 76.18 86.38 0.68 100 14.43 处理前 77.55 84.93 92.04 0.76 处理后 81.75 85.97 93.33 0.80 说明:去除交界缓冲区是指去除梯田与其他类型交界线缓冲区范围内的像元,减少有地理配准误差较大的像元输入。0 m代表不 去除 -
[1] 杨艳芬, 王兵, 王国梁, 等. 黄土高原生态分区及概况[J]. 生态学报, 2019, 39(20): 7389 − 7397. YANG Yanfen, WANG Bing, WANG Guoliang, et al. Ecological regionalization and overview of the Loess Plateau [J]. Acta Ecol Sin, 2019, 39(20): 7389 − 7397. [2] 中华人民共和国水利部. 第1次全国水利普查水土保持情况公报[R/OL]. (2013-11-21)[2021-04-06]. http://www.mwr.gov.cn/zw/slbgb/201612/t20161222_775434.html. [3] 马荣亮, 朱立军, 杨晓珍, 等. 茹河流域水土保持工程隔坡梯田应用研究[J]. 水土保持通报, 2008, 28(6): 135 − 137. MA Rongliang, ZHU Lijun, YANG Xiaozhen, et al. Study of the bench terrace as soil and water conservation engineering in Ruhe watershed [J]. Bull Soil Water Conserv, 2008, 28(6): 135 − 137. [4] 胡望舒, 洪辉, 周侃, 等. 黄土丘陵区水平梯田与农民收入的关系及原因: 以宁夏回族自治区固原市为例[J]. 干旱区地理, 2013, 36(3): 536 − 544. HU Wangshu, HONG Hui, ZHOU Kan, et al. Relationship of level terrace and farmers’ income and its causes in loess hilly region: a case study in Guyuan [J]. Arid Land Geogr, 2013, 36(3): 536 − 544. [5] FENG Xiaoming, FU Bojie, LU Nan, et al. How ecological restoration alters ecosystem services: an analysis of carbon sequestration in China’s Loess Plateau [J]. Sci Rep, 2013, 3(1): 2846 − 2850. [6] 余峰, 李月祥. 宁夏退耕还林工程研究[M]. 银川: 阳光出版社, 2012: 6 − 13. [7] 党恬敏, 穆兴民, 孙文义, 等. 高分辨率遥感影像梯田快速提取方法研究进展[J]. 人民黄河, 2017, 39(3): 85 − 89, 94. DANG Tianmin, MU Xingmin, SUN Wenyi, et al. Review of quickly discriminating approaches of terrace information based on high resolution remote sensing images [J]. Yellow River, 2017, 39(3): 85 − 89, 94. [8] XIONG Jun, THENKABAIL P S, TILTON J C, et al. Nominal 30-m cropland extent map of continental Africa by integrating pixel-based and object-based algorithms using Sentinel-2 and Landsat-8 data on Google Earth Engine [J]. Remote Sensing, 2017, 9(10): 1065 − 1091. [9] 刘凯, 彭力恒, 李想, 等. 基于Google Earth Engine的红树林年际变化监测研究[J]. 地球信息科学学报, 2019, 21(5): 731 − 739. LIU Kai, PENG Liheng, LI Xiang, et al. Monitoring the inter-annual change of mangroves based on the Google Earth Engine [J]. J Geo-inf Sci, 2019, 21(5): 731 − 739. [10] TELUGUNTLA P, THENKABAIL P S, OLIPHANT A, et al. A 30-m Landsat-derived cropland extent product of Australia and China using random forest machine learning algorithm on Google Earth Engine cloud computing platform [J]. ISPRS J Photogramm Remote Sensing, 2018, 144(1): 325 − 340. [11] 严欣荣, 张美曼, 郑亚雄, 等. 基于Sentinel-2的丛生竹林信息提取方法比较及分布特征[J]. 生态学杂志, 2020, 39(3): 1056 − 1066. YAN Xinrong, ZHANG Meiman, ZHENG Yaxiong, et al. Comparison of extraction methods and the distribution characteristics of cluster bamboo forest information based on Sentinel-2 [J]. Chin J Ecol, 2020, 39(3): 1056 − 1066. [12] GORELICK N, HANCHER M, DIXON M, et al. Google Earth Engine: planetary-scale geospatial analysis for everyone [J]. Remote Sensing Environ, 2017, 202(1): 18 − 27. [13] 谭深, 吴炳方, 张鑫. 基于Google Earth Engine与多源遥感数据的海南水稻分类研究[J]. 地球信息科学学报, 2019, 21(6): 937 − 947. TAN Shen, WU Bingfang, ZHANG Xin. Mapping paddy rice in the Hainan Province using both Google Earth Engine and remote sensing images [J]. J Geo-inf Sci, 2019, 21(6): 937 − 947. [14] CHEN Bangqian, XIAO Xiangming, LI Xiangping, et al. A mangrove forest map of China in 2015: analysis of time series Landsat 7/8 and Sentinel-1A imagery in Google Earth Engine cloud computing platform [J]. ISPRS J Photogramm Remote Sensing, 2017, 131(1): 104 − 120. [15] GONG Peng, LIU Han, ZHANG Meinan, et al. Stable classification with limited sample: transferring a 30-m resolution sample set collected in 2015 to mapping 10-m resolution global land cover in 2017 [J]. Sci Bull, 2019, 64(6): 370 − 373. [16] GONG Peng, LI Xuecao, ZHANG Wei. 40-Year (1978−2017) human settlement changes in China reflected by impervious surfaces from satellite remote sensing [J]. Sci Bull, 2019, 64(1): 756 − 763. [17] 王彦武, 牛莉婷, 张峰, 等. 黄土区高标准梯田生态服务功能及其价值[J]. 水土保持学报, 2019, 33(6): 190 − 196. WANG Yanwu, NIU Liting, ZHANG Feng, et al. Ecological service function and its value of high-standard terrace in loess region [J]. J Soil Water Conserv, 2019, 33(6): 190 − 196. [18] 柴旭荣, 李明, 周义, 等. 影像的土地覆被快速分类[J]. 遥感技术与应用, 2020, 35(2): 315 − 325. CHAI Xurong, LI Ming, ZHOU Yi, et al. Rapid land cover classification using Landsat time series based on the Google Earth Engine [J]. Remote Sensing Technol Appl, 2020, 35(2): 315 − 325. [19] 王塞, 王思诗, 樊风雷. 基于时间序列分割算法的雅鲁藏布江流域NDVI(1985−2018)变化模式研究[J]. 生态学报, 2020, 40(19): 6863 − 6871. WANG Sai, WANG Sishi, FAN Fenglei. Change patterns of NDVI (1985−2018) in the Yarlung Zangbo River Basin of China based on time series segmentation algorithm [J]. Acta Ecol Sin, 2020, 40(19): 6863 − 6871. [20] 刘宝元, 刘瑛娜, 张科利, 等. 中国水土保持措施分类[J]. 水土保持学报, 2013, 27(2): 80 − 84. LIU Baoyuan, LIU Yingna, ZHANG Keli, et al. Classification for soil conservation practices in China [J]. J Soil Water Conserv, 2013, 27(2): 80 − 84. [21] 裴杰, 牛铮, 王力, 等. 基于Google Earth Engine云平台的植被覆盖度变化长时间序列遥感监测[J]. 中国岩溶, 2018, 37(4): 608 − 616. PEI Jie, NIU Zheng, WANG Li, et al. Monitoring to variations of vegetation cover using long-term time series remote sensing data on the Google Earth Engine cloud platform [J]. Carsol Sin, 2018, 37(4): 608 − 616. [22] 王立祥, 李永平, 许强. 中国粮食问题: 宁夏粮食生产能力提升及战略储备[M]. 银川: 阳光出版社, 2015: 92 − 93. -
链接本文:
https://zlxb.zafu.edu.cn/article/doi/10.11833/j.issn.2095-0756.20200673