Volume 33 Issue 5
Oct.  2016
Turn off MathJax
Article Contents

DONG Xinyu, FAN Wenyi, TIAN Tian. Object-based forest type classification with ZY-3 remote sensing data[J]. Journal of Zhejiang A&F University, 2016, 33(5): 816-825. doi: 10.11833/j.issn.2095-0756.2016.05.013
Citation: DONG Xinyu, FAN Wenyi, TIAN Tian. Object-based forest type classification with ZY-3 remote sensing data[J]. Journal of Zhejiang A&F University, 2016, 33(5): 816-825. doi: 10.11833/j.issn.2095-0756.2016.05.013

Object-based forest type classification with ZY-3 remote sensing data

doi: 10.11833/j.issn.2095-0756.2016.05.013
  • Received Date: 2015-11-30
  • Rev Recd Date: 2016-01-03
  • Publish Date: 2016-10-01
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

Figures(13)  / Tables(5)

Article views(2971) PDF downloads(870) Cited by()

Related
Proportional views

Object-based forest type classification with ZY-3 remote sensing data

doi: 10.11833/j.issn.2095-0756.2016.05.013

Abstract: A new method of identification technology for forest types, an important and difficult part of remote sensing classification, uses object-oriented remote sensing image classification.It provides a new direction for forest type to extract which is based on ZY-3 remote sensing data. This study applied ZY-3 remote sensing data to the object-oriented classification method, chose hierarchical segmentation of a fractal network as an evolution method, and combined typical ground objects including spectrum features, texture features, geometrical characteristics, and vegetation indexes, to build a decision tree model which is applicable to forest types. Then, the different segmentation scale compared from the support vector machine (SVM) classification method. Results showed that classification accuracy of the decision tree classification method with multi-level segmentation (which increased 6.1% and 12.5% ) was higher than the support vector machine (SVM) classification method with the different single segmentations. Thus, it would be suitable to build a decision tree classification with multi-level segmentation to the classification of forest type.

DONG Xinyu, FAN Wenyi, TIAN Tian. Object-based forest type classification with ZY-3 remote sensing data[J]. Journal of Zhejiang A&F University, 2016, 33(5): 816-825. doi: 10.11833/j.issn.2095-0756.2016.05.013
Citation: DONG Xinyu, FAN Wenyi, TIAN Tian. Object-based forest type classification with ZY-3 remote sensing data[J]. Journal of Zhejiang A&F University, 2016, 33(5): 816-825. doi: 10.11833/j.issn.2095-0756.2016.05.013
  • 森林资源是世界上最重要的资源之一,对生态功能具有不可替代的作用,且在经济、社会和环境的可持续发展中起着重要的调节作用[1]。随着遥感影像空间分辨率的不断提高以及分类方法的不断完善,使高精度的森林类型识别逐渐成为可能。面向对象的分类方法能够充分利用高分辨率遥感影像丰富的形状和纹理信息等多种特征,提高分类精度,从而为遥感图像分类提供了一个新的方向。随着面向对象分类方法的广泛应用,已有学者针对面向对象的方法进行了研究,由于面向对象的方法改变了传统的分类方式,使面向对象的分类方法成为遥感技术创新的热门话题[2]。FROHN等[3]采用面向对象的模糊分类的方法,对美国陆地卫星4~5号专题制图仪(thematic mapper,TM)影像进行分类处理,区分出较大范围的落叶森林覆盖范围。孙晓艳等[4-5]以法国SPOT卫星第5颗卫星获取的遥感影像(SPOT5)数据为基础,结合图像的光谱纹理信息,采用面向对象的方法构建多尺度多层次结构,对毛竹Phyllostachys edulis林信息进行提取,结果证明其方法优于基于像元的分类方法。随后,对SPOT5遥感影像和TM遥感影像进行多源遥感数据整合,采用面向对象的分割方法,找出并确定最佳分割尺度,结果表明分类精度高于其他森林类型分类精度。都金康等[6]采用面向对象的信息提取方法,把SPOT影像中的水体进行剔除,有效地解决了水体和阴影容易混淆的问题,使整体分类精度达到96.4%。温兴平等[7]利用美国陆地探测卫星系统装备的Enhanced Thematic Mapper Plus设备获取遥感影像(ETM+遥感影像)的波段组合数据进行信息提取,并结合决策树分类算法,结果证明分类精度得到了提高。近年来,面向对象的分类方法,主要是采用分形网络演化算法(fractal net evolution approach-FNEA)进行分割,该算法分割稳定,在德国专业软件eCognition上得到了广泛的应用。分形网络演化算法结合地物的光谱特征、形状特征、紧致度、光滑度,将地物分割成不同对象进行分类研究,避免了分类过程中的“椒盐现象”。对于大数据量的影像进行分割时,分割速度较慢,影像整体分割效率低。目前,采用资源3号遥感影像进行面向对象的多尺度分层分割研究较少,且分类方法多采用传统基于像元的分类方法,对于利用信息提取技术构建决策树模型研究森林类型较少[8]。本研究以2012年10月的资源3号卫星遥感数据作为基础,在专业软件eCognition平台上利用分形网络演化算法对图像进行多层分割,结合遥感影像的纹理信息、光谱信息、几何信息等特征,建立多层次结构,并结合决策树的分类方法进行逐级分层分类,希望提高森林类型信息提取的精度。

  • 本研究以黑龙江省大兴安岭地区塔河县为研究区域。塔河县境内地形复杂,植被类型多,分布着不同植被。塔河县属寒温带大陆性气候。该区域的地理条件和气候条件,使境内林木茂密、树种丰富,森林覆盖率为81%,主要树种有落叶松Larix gmelinii,白桦Betula platyphylla,杨树Populus spp.等10余种。

  • 本研究采用的遥感影像数据为资源3号卫星多光谱影像,分辨率为5.8 m,成像时间为2012年10月7日。首先,对原始影像数据进行FLAASH大气校正。大气校正的目的是消除大气折射、散射等现象对地物反射的影像,提高地物提取精度。其次,以塔河地区1∶1万地形图为参考,均匀选取20个控制点,采用二次多项式纠正方法,并根据资源3号卫星的特点,结合RPC(rational polynomial coefficients,变换系数矩阵)参数,进行正射校正,总RMSE为0.43,投影为WGS84/UTM。最后,将正射校正后的数据与二类数据进行叠加处理,并截取该影像的一部分进行分类处理。

  • 本研究区为黑龙江省塔河地区的一部分,研究重点是森林类型的分类。根据黑龙江省森林资源规划设计调查分类系统的技术标准,将塔河地区地物类型分为建设用地、水体、裸地、耕地、灌草地、有林地等六大类别。由于本研究重点为森林类型的识别,根据该区域的树种组成中分析得到,该区域的有林地为落叶松林(落叶松占蓄积65%以上的林分),白桦林(白桦占蓄积65%以上的林分),杨桦林(杨树和桦树Betula sp.共同占蓄积65%以上的林分),阔叶混交林(主要有柳树Salix babylonica,杨树,柞树Xylosma racemosum等),针阔混交林(主要有落叶松、白桦等),针叶混交林(主要有落叶松、樟子松Pinus sylvestris var. mongolica,云杉Picea asperata等)。

  • 本研究是基于影像的多尺度分层分割,以得到不同层次上的影像对象。在面向对象的专业软件eCognition平台上进行分形网络演化法分割。该算法是根据影像对象的感兴趣区域,在分割的尺度内,影像分割后的大尺度和小尺度对象可同时存在并形成一个有层次的多尺度影像对象等级网络。在分割中,同时要考虑影像的光谱特征、形状特征和空间特征,并遵循异质性最小的原则[9]。其中,异质性度量准则的计算公式为:

    式(1)和式(2)中:F代表异质性准则,ω1表示颜色和形状的权重,h1h2分别代表颜色差异性度量和形状差异性度量,其中h2形状差异性度量又分为平滑度h3和紧致度h4ω2表示平滑度和紧致度的权重值,平滑度表示的是合并后区域边界的光滑程度,而紧致度是为了保证合并后区域更加紧凑,它们各占有一个权值构成了形状差异性度量。由此可见,多层多尺度的分割不但可以针对不同地物进行不同尺度的分割,而且还可以结合地物的空间特征和形状特征进行更加准确地分割。同时,结合分类时上下层的关系,上一层为下一层的“父层”,利用“父”与“子”的对象关系特征,在“父层”的条件下,对“子层”进行更深层次地分割。

  • 在分割的过程中,分割参数选择一般包括尺度、层数的选择、颜色因子、形状因子、光滑度、紧致度等[4]。在本研究中,分割规则的确定主要考虑了以下几个方面:①多层次分割,根据地物的光谱特点、几何形状、拓扑特征来确定设置的每层的规则。②根据“父层”与“子层”的关系,由“子层”继承“父层”,并且增加“子层”自己的特征。根据以上分割规则,经过多次试验,对影像进行实用性的分割。层1进行水体分割,分割尺度不宜过大,以免造成地物破碎,故分割尺度为90;层2主要区分建设用地、裸地、耕地、灌草地、林地,因建设用地、耕地有一定的形状特征,故结合地物的形状特征,有效地将地物分开;层3主要区分林地,根据各个树种所呈现的光谱特征、形状特征、紧致度、平滑度,并与现有地面数据进行比较,有效提取地物。表 1为各个层次分割的具体参数。

    对象层次 分割尺度 颜色权重 形状权重 平滑度 紧致度 分类层次
    层1 90 0.9 0.1 0.5 0.5 水体,非水体
    层2 40 0.5 0.5 0.6 0.4 耕地,建设用地,裸地,灌草地,林地
    层3 20 0.9 0.1 0.9 0.1 落叶松林,白桦林,杨桦林,针阔混交林,阔叶混交林,针叶混交林

    Table 1.  Multilayer segmentation scale parameter

  • 分层分割后,利用分割后的对象选取训练样地进行统计分析,根据每个类型的各个特征的差异确定分类特征,为分类做准备。

  • 根据对象的光谱信息,选取波段的均值(Mk)和亮度(M)2种光谱特征进行提取,其中均值和亮度的公式如下:

    式(3)中:MkS)表示第k波段的光谱均值,S表示所包含的像素个数,Mkxy)表示第k个影像(xy)位置的灰度值。

    式(4)中:MS)表示像素的亮度值,ωkB表示第k个波段所占的权重,即在假彩色合成影像上各个波段所占的比率,ωB表示总权重之和。在加入光谱信息的同时,在第2层分类时,由于考虑到耕地与林地、建设用地与裸地的光谱相似性,故加入形状信息进行区分,分别选取基于形状特征中的面积(area)和不对称性(asymmetry)[10]等信息。

  • 在植被遥感中,归一化植被指数(INDVI)应用最为广泛,是植被生长状态以及植被覆盖的最佳指示因子[11]。其计算公式如下:

    式(5)中:ρnir表示近红外光波段反射率;ρred表示红光波段反射率。

  • 在分类时,由于灌草地、耕地与林地光谱信息比较相似,存在一定程度上的误分现象,故在光谱信息的基础上加入纹理信息。灰度共生矩阵(grey level co-occurrence matrix,GLCM)反映出图像灰度变化的综合信息,以及分析图像的排列规律和局部模式。其中,Homogeneity 是 GLCM 的主要特征之一,表示该区域的同质性,同质性越高,其值越大[12]。根据以上统计分析方法得出所用的分类指标如表 2

    层次 类别 选择的特征
    层1 水体,非水体 归一化植被指数
    层2 建设用地,耕地,灌草地,林地,裸地 均值,面积,归一化植被指数(同质性、亮度),不对称性
    层3 落叶松林,白桦林,杨桦林,针叶混父林,针阔混交林,阔叶混交林 均值,归一化植被指数,同质性,亮度

    Table 2.  Classification index

  • 决策树分类算法作为一种新型的分类算法,具有灵活、清晰、高效的运算效率等优点,从而获得广泛的应用[13]

    决策树的分类方法主要可以分为决策树学习和决策树分类这2个方面。决策树的学习过程是利用训练样本进行归纳学习(inductive learning),生成以决策树形式表示的分类规则[14]。决策树分类就是在训练样本进行决策树学习并生成决策树基础上,根据属性的取值对一个未知的样本进行分类[15]

    图 1归纳了本研究采用面向对象的方法,包括图像多尺度分层分割、信息提取、决策树分类。

    Figure 1.  Flow chart of research

  • 首先对水体分割,在满足精细的条件下,分割尺度为90,分割出的水体整体性好,且边缘轮廓明显,经过多次试验证明,分割尺度为200的大尺度分割,会造成水体与非水体的混淆;分割尺度为40的小尺度分割,造成地物对象破碎,后续分类结果差,如图 2分割尺度分别为200,90,40。其次,对建设用地、裸地、耕地、灌草地、林地进行分割,充分考虑形状特征,在相同分割尺度下,形状特征分别为0.1,0.5(图 3);最后,对林地进行单独分割,考虑到树种之间不同的光谱亮度,经过多次分割、分类试验,分割尺度为20时,林地分类效果最好,如图 4所示。

    Figure 2.  Segmentation scale on 200, 90, 40

    Figure 3.  Segmentation scale on 40, shape characteristic on 0.1 and 0.5

    Figure 4.  Segmentation scale on 20

  • 图 5为图像分割对象的波段均值,图 6为不同对象的亮度值。从图 5图 6中可以看出:①虽然不同对象的波段均值不同,但是植被之间的波段均值却较为接近,要进一步对植被进行分类,就要加入更多的特征信息。②不同对象的亮度均值呈现出不同的变化规律,能够区分不同地物。

    Figure 5.  Band average

    Figure 6.  Object brightness statistics

    图 7为不同地物对象的INDVI提取值。由图 7可知:水体的INDVI值不同于其他地物对象,在进行分类时,引用INDVI值进行区分第1层水体与非水体。在对第2层、第3层地物对象进行分类时,结合其他特征,亦可更好地区分不同地物。

    Figure 7.  NDVI extracting values

  • 本研究利用专业软件eCognition,根据不同层次的光谱信息、纹理信息、形状信息以及植被指数,采用决策树自动分类方法,得到分类规则,如图 8

    Figure 8.  Decision tree model

  • 本研究采用面向对象的多尺度多层次分割方法,充分利用地物对象的光谱信息、纹理信息、植被指数等特征,结合地物多层分割(表 1)以及决策树分类规则(图 8),得到研究区域的分类结果。为了更好地验证本研究方法以及分类精度,把多尺度分层分割的决策树分类方法定为方案1(图 9);采用单层分割,分割尺度为40的支持向量机分类方法定义为方案2(图 10),分割尺度为20的支持向量机分类方法定义为方案3(图 11)。对3种方法进行对比分析。

    Figure 9.  Classification results of solution 1

    Figure 10.  Classification results of solution 2

    Figure 11.  Classification results of solution 3

  • 本研究采用混淆矩阵的方法对最终分类结果进行精度评价,以二类数据调查(图 12)以及外业调查所获得的60个固定样地点建立混淆矩阵,固定样地面积为0.06 hm2·块-1,调查内容主要包括树种组成、林分类型、优势树种组等(图 13),通过目视判读,以对象为统计对象,均匀选取459个试验对象样本,用混淆矩阵以及总体精度表示精度评定结果。对方案1和方案2的分类结果进行分析。如表 3~4

    Figure 12.  Vector map of Tahe and the corresponding attribute table of sub-compartment

    Figure 13.  Sampling point for accuracy assessment

    类别 水体 建设用地 耕地 裸地 灌草地 落叶松林 白桦林 杨桦林 针叶混交 阔叶混交 针阔混交 样本总数 用户精度%
    水体 27 0 0 0 0 0 0 0 0 0 0 27 100
    建设用地 0 18 1 2 0 0 0 0 0 0 0 21 85.7
    耕地 0 1 30 0 3 0 1 1 0 0 0 36 83.3
    裸地 0 3 0 23 0 0 0 0 0 0 0 26 88.5
    灌草地 0 0 4 0 20 0 0 0 0 0 1 25 80.0
    落叶松林 0 0 0 0 1 28 1 0 2 1 1 34 82.4
    白桦林 0 0 0 0 0 0 44 4 1 2 1 52 84.6
    杨桦林 0 0 0 0 0 1 3 41 1 2 2 50 82.0
    针叶混交 0 0 0 0 0 3 0 1 50 2 3 59 84.7
    阔叶混交 0 0 0 0 0 0 2 3 1 58 3 67 86.6
    针阔混交 0 0 0 0 0 1 1 2 4 1 53 62 85.5
    样本总数 27 22 35 25 24 33 52 52 59 66 64 459
    用户精度/% 100 81.8 85.7 92.0 83.3 84.8 84.6 78.8 84.7 87.9 82.8
    说明:总体精度为85.3%,Kappa系数为0.812。

    Table 3.  Classification accuracy and confusion matrix of solution 1

    类别 水体 建设用地 耕地 裸地 灌草地 落叶松林 白桦林 杨桦林 针叶混交 阔叶混交 针阔混交 样本总数 用户精度%
    水体 23 1 1 0 0 0 0 0 0 0 0 25 92.0
    建设用地 0 15 2 2 0 0 0 0 0 0 0 19 78.9
    耕地 0 1 38 0 5 1 1 1 0 0 0 47 80.9
    裸地 1 1 3 27 0 0 0 0 0 0 0 32 84.4
    灌草地 0 0 4 1 17 0 0 0 0 0 1 23 73.9
    落叶松林 0 0 0 0 1 39 1 1 4 1 1 48 81.3
    白桦林 0 0 0 0 0 3 48 5 1 2 4 63 76.2
    杨桦林 0 0 0 0 0 2 3 35 1 2 2 45 77.8
    针叶混交 0 0 0 0 0 1 0 1 44 2 6 54 81.5
    阔叶混交 0 0 0 0 0 2 2 3 1 33 1 42 78.6
    针阔混交 0 0 0 0 0 1 6 2 2 1 49 61 80.3
    样本总数 24 18 48 30 23 49 61 48 53 41 64 459
    用户精度% 95.8 83.3 79.2 90.0 73.9 79.6 78.7 72.9 83.0 80.5 76.6
    说明:总精度为79.2%,Kappa系数为0.766。

    Table 4.  Classification accuracy and confusion matrix of solution 2

    方案1的分类精度达到85.3%,Kappa系数为0.812(表 3),方案2的分类精度达到79.2%,Kappa系数为0.766(表 4),方案3的分类精度达到72.8%,Kappa系数为0.705(表 5),说明采用多层分形网络演化算法进行分割,对光谱特征、纹理特征、几何特征进行计算、统计分析并最终确定分类特征,建立决策树模型进行分类,分类结果高于单层分割的支持向量机分类方法。方案1分类精度高于方案2和方案3的分类精度,说明多层次分割以及对象的植被指数、纹理信息、光谱信息在分类中起着重要的作用。方案1中,第1层分类水体,分类精度比方案2和方案3高,原因是由于方案2和方案3进行单层次分割,分割较为破碎,造成部分水体误分的现象,且在方案1中,根据提取INDVI信息,单独提取水体,能够有效将水体与非水体分开。在第2层处理时,由于充分考虑到分割时的形状特征,并且加入几何信息,所以方案1比方案2分类精度更高,且方案3中,耕地误分现象明显,是由于单层分割尺度不适合耕地分割,而耕地的光谱信息与林地较为接近,所以误分现象高于方案1和方案2。在3层处理中,在方案1中,白桦林和杨桦林存在误分现象,是由于杨桦林所含树种与白桦林相似,且边缘交界不明显,故存在一定的误分现象,但方案1中采用分层分割,剔除了其他地物对林地的影响,且加入光谱、纹理、植被指数等信息,故分类精度高于方案2和方案3。在方案2中,有部分杨桦林、针阔混交林被误分为白桦林,原因可能是3种森林类型光谱信息比较相近,没有纹理信息、植被指数等进行区分,分类效果较差。在方案3中,白桦林精度明显低于其他森林类型,是由于单层分割,分割尺度不适合所有地物,且分割尺度小,亦容易造成林地与非林地之间的混分现象,故分类精度较差。总体来说,方案1的分类精度优于方案2和方案3的分类精度。

    类别 水体 建设用地 耕地 裸地 灌草地 落叶松林 白桦林 杨桦林 针叶混交 阔叶混交 针阔混交 样本总数 用户精度%
    水体 29 0 1 1 0 0 1 0 0 0 0 32 90.6
    建设用地 0 18 2 5 0 0 0 0 0 0 0 25 72.0
    耕地 0 1 23 0 2 2 4 2 1 1 0 36 63.9
    裸地 1 3 1 22 0 1 0 0 0 0 0 28 78.6
    灌草地 0 1 3 1 15 0 0 0 0 0 1 21 71.4
    落叶松林 0 0 1 0 1 33 4 3 4 1 0 47 70.2
    白桦林 0 1 4 0 2 3 37 5 3 2 4 61 60.7
    杨桦林 0 0 2 0 1 1 2 46 1 2 2 57 80.7
    针叶混交 0 0 0 0 0 4 1 2 36 2 3 48 75.0
    阔叶混交 0 0 1 0 1 2 2 4 4 46 1 61 75.4
    针阔混交 0 0 1 0 0 1 2 3 1 3 32 43 74.1
    样本总数 30 24 39 29 22 47 53 65 50 57 43 459
    用户精度% 96.7 75.0 66.7 75.9 68.2 70.2 69.8 70.8 72.0 80.7 74.1
    说明:总精度为72.8%,Kappa系数为0.705。

    Table 5.  Classification accuracy and confusion matrix of solution 3

  • 本研究通过对资源3号遥感影像多次分割、分类对比分析,找出最优的分割尺度,并且提取地物对象的光谱信息、植被指数等,结合纹理信息、几何信息,最终构建适合于信息提取的决策树模型。分类结果表明:采用多层次分割的决策树分类方法比单层次分割的支持向量机分类方法精度要高,能够有效区分森林类型,适用于森林类型的提取。

    虽然采用面向对象的分类方法,可以大大提高分类精度,但是由于阔叶林间有很大的相似性,分类结果还存在一定的误分现象。若能进一步结合资源3号的立体像对信息,提取数字高程模型(DEM),有可能在一定程度上进一步提高分类精度。

Reference (15)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint
    Return
    Return