|
前面说到解译遥感影像就是寻找足够的地表参量可以解释大部分的影像信息。显然对于一幅影像最大的信息变化来自于地物类别的不同。因此,对图像分类制作主题地图一直是遥感最重要的任务。
一、分类器
很多遥感书上都会讲非监督分类(聚类)和监督分类。从遥感分类实践来看,这两种分类方法常常结合使用。不过从学术的角度讲,监督分类被研究得更广泛和深入。监督分类的过程:选择训练样本(指定样本光谱和样本类别)->获得分类规则->对未知类别的样本分类。监督分类源于模式识别,其本质是学习。通过对训练样本的学习来获得分类规则。学习过程也就是分类器是模式识别的核心内容。最简单的分类器是最小距离法:利用训练样本中各类别在各波段的均值,根据各像元离训练样本平均值距离的大小来判定其类别。如图所示,根据类别A和B训练样本分别计算出它们的均值a和b,比较待分像元c到类别A和B的均值的距离|ac|和|bc|,由于|ac|<|bc|,所以判定像元c属到A类。
最小距离法很简单,但是告诉我们一个事实,分类器的本质是通过学习获得瓜分特征空间归属的规则。关于分类器的研究很多,理论很多。在此只作列举:
基于统计和概率理论的:
Fisher判别
极大似然法
贝叶斯分类法
k-最近邻法
基于机器学习理论的:
神经网络
支撑向量机(SVM)
各种分类器背后都是一套理论,可以说相关研究相当繁多。似乎没有哪种分类器被公认地最可靠。个人经验支撑向量机的效果最好,稳定性最高,但相比基于统计和概率理论的计算速度很慢,因此建议使用SVM时不要选择太多的训练样本(每类在1000以下)。
二、特征量
前面提到分类器,但是分类器的输入是样本光谱和样本类别。实际上,除了样本光谱可以作为输入外,我们常常需要一些体现纹理信息的量。表达纹理信息的指标很多,但似乎并没有得到太多的认可。总结一下可以作为分类器输入的量:
光谱向量
光谱角
纹理信息
显然地增多特征量可以增强类别的可分性,但是不是特征量越多越好呢?另一个很重要的现象是:Hugh效应。当特征量比较少的时候,确实特征量越多越好,但随着特征量的进一步增多,分类精度却下降。形成这个现象的原因,我认为是过学习(有待考证)。理论上讲支撑向量机在解决过学习问题方面,走在了前面,它的Hugh效应是最小的(再次推荐支撑向量机)
三、椒盐效应
经过上述过程,选择特征量,选择训练样本,分类器分类。我们得到的分类影像往往有所谓椒盐效应——就是错分的像元以散点的形式散落在图像里。这显然是由于光谱的偶然误差导致的。解决该问题有两种方式
1. 分类后处理:将面积过小的斑块的类别用周围的类别代替(ENVI,ERDAS都提供了这样的功能。还有一些算法上的研究如概率松弛等。
2. 面向对象的分类:这本应该是一个极大的重点,因为它应该代表了一个趋势。其思想为先把图像分割成斑块,再对斑块进行分类,特征量可以选择斑块的很多指标,包括光谱,纹理,形状等。这里面引入了另一个极具研究价值的领域,图像分割。
四、精度评价
在任何一本关于遥感的教材里都会提到精度评价有总体精度,用户精度,生产者精度以及kappa。其计算公式在书都能找得到,这里强调一下被人常常误解的一个现象,kappa的取值范围是-1~1之间,这点与总体精度不一样(0~1)。Kappa的含义是(总体精度—偶然正确率),因为一个瞎子来分类(随机分)的话也有一定的正确率,kappa将它定为零,而负值则表示了分类结果与正确结果相反(负相关)。Kappa的另一个重要特征是它是一个不随类别抽样样本量大小改变而改变的统计量。对于总体精度而言,需要在抽样上很小心,各个类别最好取得相等的样本量,否则,小样本量的类别会被忽略,这个问题在kappa上就不存在。Kappa的这两个优越性建立了其在分类精度评价上的统治地位。
五、混合像元分解
对于中低分辨率影像,大多数的像元是混合像元,不可能被归属于哪一类。因此混合像元分解技术就提出来用于求解混合像元中各个类别的盖度。我们可以从主成分空间中的散点图来体会混合像元。
前面提到的分类,意味着不同类别有不同的光谱。散点图应该如下(红色表示像元越多,蓝色越少):可以看到两个类别是分开的,散点图应该有多个密度高的地方(本图有两个)。
但在以混合像元为主的图像中,密度高的地方往往只有一个,而且是在中心处。
对于混合像元为主的图像,分类去解释图像方差就不是特别地好。用像元各类别盖度的不同去解释图像方差则更回合适
线性混合模型(Linear Mixing Model, LMM是最简单,也是应用最广泛的光谱混合模型。在线性模型中,混合光谱等于端元光谱与端元(纯像元)面积百分比的线性组合。该模型基于以下假设:到达遥感传感器的光子与唯一地物发生作用(即不同地物间没有多次散射)。为使LMM具有物理意义,需要受到两个约束条件限制:一是端元百分比之和为1 ;二是所有的端元百分比都大于0。在特征空间中,所有的混合像元都存在于由端元连接而成的多边形(或多面体)内(如图所示),这样的混合像元才能满足端元面积百分比为正值,并且总和为1。因此,最简单的交互式提取方法就是在特征空间中(通常是前两个主成分构成的特征空间)目视寻找多边形的顶点作为端元。
当然除此之外,有很多其他的混合像元分解技术。
http://hi.baidu.com/hilbertspace/blog/item/f1a03f01b78543087aec2c6f.html |
|