ENVI中几种监督分类方法精度比较
遥感图像的监督分类常用方法目前可以分为:平行六面体法,马氏距离法,最大似然法,神经网络法以及支持向量机法等。文章将就以上所述的五种常用的监督分类方法在ENVI中分别对汶川县威州镇同一Landsat8 OLI数据进行土地覆盖与利用状况分类.比较各种方法的分类精度,并对之所产生的差异的原因进行浅析,进而对实际的生产以及应用做出借鉴。
标签:监督分类;平行六面体;神经网络;支持向量机;分类精度
Abstract: The common methods of supervised classification of remote sensing images can be divided into: parallelepiped classifier method, Mahalanobis distance method, maximum likelihood method, neural network method and support vector machine method. In this paper, the land cover and utilization of the same Landsat8 OLI data in Weizhou Town, Wenchuan County are classified by the five common supervised classification methods mentioned above in ENVI. Comparing the classification accuracy of various methods, we made an analysis of the causes of the differences, and then identify their actual production and application.
Keywords: supervised classification; parallelepiped; neural network; support vector machine; classification accuracy
1 概述
遥感图像的分类主要是利用计算机将遥感图像中的光谱和空间信息进行分析,提出不同地物之间的特征及边界,并利用一定的算法的各个像元划归到互不重叠的各个子空间之中。遥感图像的分类的主要依据是不同地物在图像上会反映出不同的亮度值(DN值),从而可以区分不同地物的差异。例如,河流、民宅、林地、草地、耕地等。
2 ENVI中基于遥感光谱图像分类方法
遥感影像通过亮度值或者像元值的高低差异(反映地物的光谱信息)以及空间变化(反映地物的空间信息)来表示不同地物的差异与区别,这是区分不同影像地物的物理基础。遥感影像分类就是利用计算机通过对遥感影像中各地类的光谱信息和空间信息进行分析,选择其中所包含的特征,将图像中的每个象元按照某种规则或者算法划分成为不同的类别,之后获得遥感影像中与实际地物所对应的信息,从而实现遥感影像的分类。
遥感图像的分类分为监督分类与非监督分类。
非监督分类与监督分类最本质的区别是是否存在训练样本。若不存在训练样本则称为非监督分类,非监督分类使用的算法是对影像上的光谱信息进行自动的
聚合,聚合之后的所生成的不同地类需要后期人工进行判读;若存在训练样本则称为监督分类,监督分类是在计算机分类之前人工对影像选择若干样本区域的位置与样本类型,之后选择不同的分类器或不同的算法将影像中其他区域归入不同的样本中。无论是非监督分类还是监督分类都是基于光谱的分类方法,及基于遥感影像灰度值的分类方法。
3 实验区选择及实验方法
本文所选择的实验区为四川省阿坝州汶川县的Landsat-8 OLI为数据源,对原始数据进行6,5,4波段RGB真彩色合成(增强植被水域的对比)。选择汶川县威州镇为实验区,进行土地利用分类,以确定各种分类方法的精度比较。
3.1 训练样本可分离性判断
在进行分类之前,先进行人工样本选取,创建5个ROI感兴趣区训练样本,为耕地,住宅用地,林地/草地,水域和其他,并且分别用黄色,红色,绿色,蓝色以及紫色表示。然后先计算样本的可分离性。用Jeffries-Matusita和Transformed Divergence参数表示。这两个参数的值在0~2.0之间,大于1.9说明样本之间的可分离性良好,小于1.8需重新選取样本,小于1即考虑将两样本合成一类样本。本次工区样本的可分离性为图1所示。
本实验工区样本之间本分离性均大于1.85,属于合格样本。
3.2 分类器选择与使用
用ENVI监督分类模块进行监督分类时,采用不同的分类器时选择相同的人工训练样本区域以比较不同分类方法的分类精度。选择toolbox→Classification→Supervised Classification中找到不同类型的分类器。本文以支持向量机(Support vector machines,SVM)为例进行分类使用。
在Supervised Classification中选择Support vector machines,点击所需要分类的图像进入SVM参数设置面板。SVM参数设置面板为图2。
参数意义如下:
(1)Kernel Type下拉列表里选项有 Linear,Polynomial,Radial Basis Function和 Sigmoid。a.如果选择Polynomial,设置一个核心多项式(Degree of Kernel Polynomial)的次数用于SVM,最小值是1,最大值是6。
b.如果选择Polynomial或者Sigmoid,使用向量机规则需要为Kernel指定the Bias,默认值是1。
c.如果选择是 Polynomial,Radial Basis Function,Sigmoid,需要设置Gamma in Kernel Function参数。这个值是一个大于零的浮点型数据。默认值是输入图像
波段数的倒数。
(2)Penalty Parameter:这个值是一个大于0的浮点型数据。这個参数控制了样本错误与分类刚性延伸之间的平衡, 默认值是100。
(3)Pyramid Levels:设置分级处理等级,用于SVM训练和分类处理过程。如果这个值为0,将以原始分辨率处理;最大值随着图像的大小而改变。
(4)Pyramid Reclassification Threshold(0~1):当Pyramid Levels值大于0时候需要设置这个重分类阈值。
(5)Classification Probability Threshold: 为分类设置概率域值,如果一个像素计算得到所有的规则概率小于该值,该像素将不被分类,范围是0~1,默认是0。
(6)选择分类结果的输出路径及文件名。
(7)设置Out Rule Images为Yes,选择规则图像输出路径及文件名。
(8)单击OK按钮执行分类。
4 分类结果与精度验证
在对实验工区进行土地分类之后,再进行分类后处理。采用混淆矩阵进行精度验证,将不同方法的分类以及Kappa系数进行对照比较。
4.1 分类结果与后处理结果
使用平行六面体,马氏距离,最大似然,神经网络和支持向量机对工区进行分类及后处理后所得结果分别为图3-图7所示。
4.2 混淆矩阵精度验证
在分类结束后对不同方法的分类后处理结果通过混淆矩阵进行对照。本文以水域为例,分别对相关的精度因子进行比较,如表1所示。
5 结束语
本文通过对五种监督分类方法的比较分析发现神经网络,支持向量机在总体分类精度,错分误差和漏分误差方面均明显优于最大似然,平行六面体、马氏距离,分类精度最高。而最大似然法次之,前三者分类精度均高于平行六面体和马氏距离。
神经网络和支持向量机的明显优点: