监督分类
概述
监督分类,又称训练分类法,用被确认类别的样本像元去识别其他未知类别像元的过程。它就是在分类之前通过目视判读和野外调查,对遥感图像上某些样区中影像地物的类别属性有了先验知识,对每一种类别选取一定数量的训练样本,计算机计算每种训练样区的统计或其他信息,同时用这些种子类别对判决函数进行训练,使其符合于对各种子类别分类的要求,随后用训练好的判决函数去对其他待分数据进行分类。使每个像元和训练样本作比较,按不同的规则将其划分到和其最相似的样本类,以此完成对整个图像的分类。
遥感影像的监督分类一般包括以下6个步骤,如下图所示:
详细操作步骤
第一步:类别定义/特征判别
根据分类目的、影像数据自身的特征和分类区收集的信息确定分类系统;对影像进行特征判断,评价图像质量,决定是否需要进行影像增强等预处理。这个过程主要是一个目视查看的过程,为后面样本的选择打下基础。
启动ENVI5.1,打开待分类数据
通过目视可分辨六类地物:建筑、草地、耕地、裸地、水体、其他六类。
第二步:样本选择
(1)在图层管理器Layer Manager中,can_tmr.img图层上右键,选择"New Region Of Interest",打开Region of Interest (ROI) Tool面板,下面学习利用选择样本。
1)在Region of Interest (ROI) Tool面板上,设置以下参数:
目视判断一下这个影像中地物大概分几类,可定义
为建筑用地,
为裸地,
鲜绿色的为建筑,,
为耕地,
绿色的为草地,
黑色的为阴影与水体定义为其他。
2)默认ROIs绘制类型为多边形,在影像上辨别林地区域并单击鼠标左键开始绘制多边形样本,一个多边形绘制结束后,双击鼠标左键或者点击鼠标右键,选择Complete and Accept Polygon,完成一个多边形样本的选择;
3)同样方法,在图像别的区域绘制其他样本,样本尽量均匀分布在整个图像上;
4)这样就为林地选好了训练样本。
注:1、如果要对某个样本进行编辑,可将鼠标移到样本上点击右键,选择Edit record是修改样本,点击Delete record是删除样本。
2、一个样本ROI里面可以包含n个多边形或者其他形状的记录(record)。
3、如果不小心关闭了Region of Interest (ROI) Tool面板,可在图层管理器Layer Manager上的某一类样本(感兴趣区)双击鼠标。
(2)在图像上右键选择New ROI,分别为建筑、耕地、裸地、水体、其他5类选择样本;
(3)如下图为选好好的样本。
(4)计算样本的可分离性。在Region of Interest (ROI) Tool面板上,选择Option>Compute ROI Separability,在Choose ROIs面板,将几类样本都打勾,点击OK;
(5)表示各个样本类型之间的可分离性,用Jeffries-Matusita, Transformed Divergence参数表示,这两个参数的值在0~2.0之间,大于1.9说明样本之间可分离性好,属于合格样本;小于1.8,需要编辑样本或者重新选择样本;小于1,考虑将两类样本合成一类样本。
(理论上需要分离度1.8以上,但由于图像限制,故放低标准)
第三步:分类器选择
根据分类的复杂度、精度需求等确定哪一种分类器。目前ENVI的监督分类可分为基于传统统计分析学的,包括平行六面体、最小距离、马氏距离、最大似然,基于神经网络的,基于模式识别,包括支持向量机、模糊分类等,针对高光谱有波谱角(SAM),光谱信息散度,二进制编码。下面是几种分类器的简单描述。
平行六面体(Parallelepiped)
根据训练样本的亮度值形成一个n维的平行六面体数据空间,其他像元的光谱值如果落在平行六面体任何一个训练样本所对应的区域,就被划分其对应的类别中。
最小距离(Minimum Distance)
利用训练样本数据计算出每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中的中心位置,计算输入图像中每个像元到各类中心的距离,到哪一类中心的距离最小,该像元就归入到哪一类。
马氏距离(Mahalanobis Distance)
计算输入图像到各训练样本的协方差距离(一种有效的计算两个未知样本集的相似度的方法),最终技术协方差距离最小的,即为此类别。
最大似然(Maximum Likelihood)
假设每一个波段的每一类统计都呈正态分布,计算给定像元属于某一训练样本的似然度,像元最终被归并到似然度最大的一类当中。
神经网络(Neural Net)
指用计算机模拟人脑的结构,用许多小的处理单元模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程。
支持向量机(Support Vector Machine)
支持向量机分类(Support Vector Machine或SVM)是一种建立在统计学习理论(Statistical Learning Theory或SLT)基础上的机器学习方法。SVM可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类与类之间的间隔最大化,因而有较好的推广性和较高的分类准确率。
波谱角(Spectral Angle Mapper)
它是在N维空间将像元与参照波谱进行匹配,通过计算波谱间的相似度,之后对波谱之间相似度进行角度的对比,较小的角度表示更大的相似度。
第四步:影像分类
基于传统统计分析的分类方法参数设置比较简单,在Toolbox/Classification/Supervised Classification能找到相应的分类方法。这里选择支持向量机分类方法。在toolbox中选择/Classification/Supervised Classification/Support Vector Machine Classification,选择待分类影像,点击OK,按照默认设置参数输出分类结果。
分类后处理
通过对比发现,其他(白色)与草地有较高重合度,故将其合并
统计分类后结果数据
结果输出矢量
因为evf格式无法在arcgis中打开,故转为shp
在arcgis中打开如下