-
宁夏回族自治区固原市位于黄土高塬沟壑区[1]。长期的过度放牧、不合理耕作,导致该地区植被稀疏、水土流失加剧[2],严重影响了当地社会经济发展和生态安全。梯田有效缓解了农业生产带来的水土流失问题[3],从20世纪80年代开始,固原市实施了大面积的坡改梯工程[4]。加之2000年开始实施的国家退耕还林还草工程[5],该地区的水土流失问题有所缓解,生态环境持续向好[6]。随着遥感技术的快速发展,如何从遥感影像中高效、准确、大尺度地获取梯田时空分布信息,对于指导农业生产、水土保持监测和防治水土流失具有重要的意义。传统的梯田遥感识别主要采用目视解译[7],该方法精度较高,但存在耗时耗力、成本高、方法复用性差等问题,目前更多用来采集机器学习(machine learning)的样本[8]。近年来,大部分学者采用面向对象或基于像元的监督识别技术,利用决策树(CART)、随机森林(RF)、支持向量机(SVM)、深度学习(DL)等[9-11]机器学习算法,先学习采集的样本,然后利用学习好的模型识别新的样本。面向对象技术较基于像元识别技术,不仅依靠地物的光谱特征,还利用像元和像元之间的关系提高识别精度,识别过程更加复杂,影像分辨率要求更高[7]。但是,无论采用哪种方法进行梯田遥感识别,基本上都是基于单机处理,普遍存在遥感数据获取困难、预处理复杂、性能限制等问题[9],难以开展大尺度的遥感识别研究。为了解决这些问题,Google公司借助其强大的计算资源与海量数据存储,推出了遥感云平台Google Earth Engine(GEE)[12]。借助该平台,研究人员可以极大扩展自身原有研究的覆盖范围,提供国家乃至全球尺度的研究成果[13]。目前,GEE在大尺度森林变化监测、土地利用类型分类、人类居住地动态监测等[14-16]方面应用广泛,但大尺度梯田遥感识别未见相关报道。为此,本研究在GEE平台支持下,利用Landsat时间序列数据和SRTM数字高程模型(digital elevation model,DEM),建立每年时间序列影像的百分位数特征。对比3种机器学习算法的分类精度大小,选择分类精度最高的识别结果,应用LandTrendr时序算法逐像元拟合修正时间序列,实现固原市1988−2019年度梯田动态监测的目的。研究结果可为黄土丘陵地区梯田的高效、准确识别和水土保持监测、评价提供参考。
HTML
-
黄土梯田动态监测的流程可分为4个主要功能模块:遥感数据加载、数据预处理、分类算法优选、序列优化。各模块从上到下,层层递进,最终实现黄土梯田动态监测(图1)。
-
使用T1级别(质量最高)的Landsat地表反射率数据(surface reflectance, SR)。该数据产品已经过几何校正、辐射校正和大气校正,空间分辨率30 m,时间分辨率16 d。由于Landsat 5/7/8卫星的服务年限不同,1988−2011年使用Landsat 5影像,2012年使用Landsat 7影像,2013−2019年使用Landsat 8影像,共使用1 690景影像。
-
采用30 m空间分辨率的数字高程模型,具体编号为SRTMGL1_003。
-
地类仅分为梯田和其他2类。通过Google Earth Pro提供的高清历史影像,利用目视解译法采集样本数据。样本数据包括样点数据和斑块数据。样点数据按时间分为2010−2014年地类属性相同和2000年的样点,以满足Landsat 5/7/8不同卫星分别进行机器学习样本训练的需求。样点采集遵循以下原则:①在研究区生成5 km方形格网,以使样点分布均匀;②保持样点100 m以内属性相同。样点数据共2 673个,梯田样点1 040个,其他样点1 633个。斑块数据为6个随机分布的5 km×5 km正方形区域,参考Google Earth Pro中2019年厘米级高清遥感影像人工勾绘以及实地验证。
-
选择Landsat对应卫星影像的红波段(Br)、绿波段(Bg)、蓝波段(Bb)、近红外(Bnir)、短波红外1(Bswir1)、短波红外2(Bswir2)6个光谱波段;再经裁边(坏像元)、光谱指数计算(计算方法如表1)、去云后,针对黄土梯田全年季相变化特点[17],统计每年度内时间序列影像百分位数特征融合影像[18],即逐像元对某一波段1 a内所有观测值取其10%、25%、50%、75%、90%百分位数,获得该像元位置该波段对应的5个指标波段;再与6个地形特征波段组合,即由数字高程计算得到的海拔、坡度、坡向,以及3个3×3、7×7、11×11像元窗口内地形起伏度波段。共计61个特征波段。
光谱指数名称 计算方法 归一化植被指数 BNDVI = (Bnir−Br)/(Bnir + Br) 增强型植被指数 BEVI = (Bnir−Br)/(Bnir + 6Br−7.5Bb + 1) 归一化建筑指数 BNDBI = (Bswir2−Bnir)/(Bswir2 + Bnir) 归一化湿度指数 BNDMI = (Bnir−Bswir1)/(Bnir + Bswir1) 归一化水体指数 BNDWI = (Bg−Bnir)/(Bg + Bnir) 说明:Br为红波段;Bg为绿波段;Bb为蓝波段;Bnir为近红 外;Bswir1为短波红外1;Bswir2为短波红外2 Table 1. Calculation methods of spectral index
-
3种机器学习算法为随机森林、决策树、支持向量机,GEE均有内建,可直接调用。另外,针对不同卫星分别进行机器学习,把样点数据分年度映射到对应合成影像并汇总(如Landsat 5包括2000、2010和2011年的样本),再按9∶1划分样本,90%的样本用于分类器训练,10%的样本用于精度验证。
-
LandTrendr算法将以年时间序列的值进行分割、逐段拟合、平滑[19],获取单个像元在整个研究时间段内的整体变化特征。具体介绍参考文献[19]。
-
应用前文分类精度最高的机器学习算法,对研究区1988−2019年逐年进行梯田遥感识别。为减少极端天气和人类活动导致识别错误,利用地类在时间序列上连续、稳定的特征,使用LandTrendr算法[19]对识别结果的时间序列(概率为0~1的浮点)拟合平滑处理。参考中国水土保持措施分类[20],提取坡度>2°和坡度<25°区域的梯田,以减少沟壑地及塬地的误分。
-
采用混淆矩阵的方法,以总体精度、Kappa系数、生产者精度和用户精度等指标作为识别精度评价依据。具体计算方法参考文献[18]。
-
植被覆盖度(fractional vegetation cover, FVC)采用归一化植被指数和像元二分模型计算。具体计算方法参考文献[21]。
2.1. 数据源
2.1.1. Landsat影像
2.1.2. 高程数据
2.1.3. 样本数据
2.2. 研究方法
2.2.1. 合成影像
2.2.2. 机器学习
2.2.3. LandTrendr算法
2.2.4. 识别结果优化
2.2.5. 精度验证方法
2.3. 植被覆盖度计算
-
表2为随机抽取的1 051个样点的验证结果。4种精度指标均为随机森林算法最高,决策树算法次之,支持向量机算法最小。随机森林算法基于样点检验的精度分别为:梯田的生产者精度94.46%、梯田的用户精度89.03%、总体精度94.10%、Kappa系数为0.87,都远大于另外2种算法。因此,后文采用随机森林机器学习算法进行梯田遥感识别。
机器学习
算法梯田的生产
者精度/%梯田的用户
精度/%总体精
度/%Kappa
系数随机森林 94.46 89.03 94.10 0.87 决策树 78.89 78.07 84.40 0.66 支持向量机 70.88 67.36 78.02 0.52 Table 2. Sample points verification accuracy of the results of different machine learning algorithms
-
表3显示:去除交界100 m缓冲区后的验证精度高于未去除时(0 m)的验证精度。另外,经LandTrendr处理后梯田的生产者精度、梯田的用户精度、总体精度和Kappa系数分别为:81.75%、85.97%、93.33%、0.80,均大于LandTrendr处理前的验证精度。
去除交界
缓冲区/m验证像元数/
(×104个)LandTrendr
处理梯田的生产者
精度/%梯田的用户
精度/%总体精
度/%Kappa
系数0 20.66 处理前 78.24 73.47 84.73 0.65 处理后 80.82 76.18 86.38 0.68 100 14.43 处理前 77.55 84.93 92.04 0.76 处理后 81.75 85.97 93.33 0.80 说明:去除交界缓冲区是指去除梯田与其他类型交界线缓冲区范围内的像元,减少有地理配准误差较大的像元输入。0 m代表不 去除 Table 3. Speckles verification accuracy of the original results and the results of using LandTrendr algorithm(RF)
-
选择3个不同位置来展示LandTrendr算法拟合效果(图2),位置A原始识别结果在1994、2002、2004年被错误识别为其他类型,位置B原始识别结果在1997年被错误识别为其他类型,在2015年被错误识别为梯田类型。经LandTrendr算法处理后,这些错误类型均被校正。位置C原始识别结果与经LandTrendr算法处理后的结果均为其他类型,识别类型没有变化。
-
经LandTrendr算法处理后的研究区梯田面积(图3)变化趋势更稳定,从1988年5 816.59 km2减少到2019年3 146.72 km2,年均减少90.85 km2·a−1。1988−2019年,研究区植被覆盖度则呈现不断增加的趋势,与梯田面积变化趋势相反。另外,处理前、处理后的梯田面积与植被覆盖度极显著(P<0.001)相关,其相关系数分别为−0.50和−0.75。
-
图4显示了研究区1988−2019年梯田使用时间长短的分布。从整体上来看,梯田主要分布在六盘山山脉两侧,且西部的梯田使用时间较东部更长。从局部来看,南部的泾源县区域,梯田零星分布,使用时间相对较短;西部西吉县的沟谷条带、中部的六盘山山脉、北部原州区清水河的河谷冲积平原(红色部分)能明显区分出来。