遥感图像|影像分类综述（经典好资料推荐！新手必看！）

地质少侠 · 发表于 2017-3-3 17:01

本帖最后由地质少侠于 2017-3-3 17:04 编辑

1 引言
随着卫星遥感图像和航空遥感图片分辨率的不断提高,人们可以从遥感图像中获得更多的有用的数据和信息。伴随着“数字地球”概念的提出,越来越多的民用场合需要用到遥感图像,包括资源调查,自然灾害观测、大气气象预报等。由于不同场合遥感图像的应用对遥感图像处理提出了不同的要求,所以图像处理中重要的环节——图像分类也就显得尤为重要,经过多年的努力,形成了许多经典的分类方法和算法。本文主要研究和讨论了遥感图像分类技术的分类方法和算法,并且作了简要的评价。

2 图像分类技术
遥感图像是按一定比例尺, 客观真实地记录和反映地表物体的电磁辐射的强弱信息, 是遥感探测所获得的遥感信息资料的一种表现形式。所以, 遥感技术应用的核心问题是根据地物辐射电磁辐射强弱在遥感图像上表现的特征, 判读识别地面物体的类属及其分布特征。遥感图像特征取决于遥感探测通道、地物光谱特征、大气传播特征及传感器的响应特征等因素。只要了解这些因素对遥感图像特征的影响, 则可按图像特征判读地面物体的属性及其分布范围, 实现遥感图像的分类识别。
遥感图像分类主要依据是地物的光谱特征,既地物电磁波辐射的多波段测量值,这些测量值可以用作遥感图像分类的原始特征变量。分类是对图像上每个像素按照亮度并接近程度给出对应类别,以达到大致区分遥感图像中多种地物的目的。
图像分类是模式分类(Pattern Classification)在图像处理中的应用，它完成将图像数据从二维灰度空间转换到目标模式空间的工作。分类的结果是将图像根据不同属性划分为多个不同类别的子区域。
图像分类器(Image Classifier)的定义如下：
给定一个二值均匀测度函数P，如果图像中某个区域满足一定意义下的均匀特性，则该区域P值为真，否则为假。对图像的一个分类就是获得图像的一个划分其中代表第i类属性的区域，该区域应满足：
[1]，其中是像素点的总集；
[2] 是连通；
[3]如果，  相邻,且P() = True , P() = True ,但P(∪) = False。
理想的分类器应具有两种性质：
[1]分类过程的可重复性，由其他测试者采用相同数据能够获得相同的结论；
[2]鲁棒性(Robustness)，对输入数据的微小改变不敏感，即输入的微小变化或随机噪声不会影响输出结果的有效性；
一般地，分类后不同的图像区域之间性质差异应尽可能地大，而区域内部性质应保证平稳特性。
图像分类过程主要有4个步骤
图像分类流程
[1]图像数据的预处理：对观测数据作成像处理，以及图像的几何矫正、量化、采样、预滤波、去噪声等处理；
[2]训练集选择：从待处理数据中抽取出具普遍性、代表性的数据作为训练样本；
[3]特征提取：从样本数据中提取特征矢量，完成样本空间到特征空间的转换，特征应反映观测目标的特性；
[4]图像分类运算：基于特征矢量集采用特定的分类器对特征空间进行划分，完成分类工作；
模式分类一般分为统计模式分类和结构模式分类：统计分类着重于定量的统计方法；结构模式分类则基于描述模式的结构信息、结构特征，利用形式语言中的规则进行分类。
从分类前能否获得训练样本类别这一先验信息角度划分，还可以将模式分类分成两大类：有监督分类（Supervised C1assification）和无监督学习分类(Unsupervised Learning)。

2.1 监督分类
监督分类是一种常用的精度较高的统计判决分类,在已知类别的训练场地上提取各类训练样本,通过选择特征变量、确定判别函数或判别规则,从而把图像中的各个像元点划归到各个给定类的分类方法，这种分类方法就是监督分类。主要步骤包括:
1) 选择特征波段；
2) 选择训练区；
3) 选择或构造训练分类器；
4) 对分类精度进行评价；
有间督的分类方法可以分为分布无关方法和与分布有关的统计分类。分布无关方法无需任何有关于观测目标先验概率分布的知识，是一种启发式的学习分类过程，又称无参数的分类。统计分类方法则基于一定的先验概率分布模型，这种分类方法假定数据的概率分布参数待确定，一般概率分布模型多采用多变量Gaussian分布，因此最终的参数估计就简化到仅需要获得均值矢量，协方差矩阵。
常用的与分布无关的分类方法有：
[a]及近邻法：对于一个样本x，如果它的K个最近邻样本中属于类W的最多，则x就
应被归为W。K近邻法要求有较大的训练集以保证算法的收敛性
决策树法：有点是分类数较大时，决策树方法性能比较优越，且不论特征空间是否
线性可分，决策树算法均能保证收敛。
分布有关的统计分类方法主要有贝叶斯分类器(Bayesian Classifier)、最大似然度分类。
有监督分类主要有最小距离分类、马氏距离分类、Parallel pipe、最大似然分类等方法。下面来加以讨论。

2.1.1 最小距离
最小距离(又称光谱距离) 判别规则。计算象素矢量与每一个模板的平均矢量的光谱距离. 用光谱距离分类的等式是建立在欧氏距离的基础上的,公式如下:
其中:
n :波段数(维数)；
k :某一特征波段；
i :某一聚类中心；
:第i 类样本均值；
:第i 类中心第k 波段的象素值；
d (x，) :象素点x到第i 类中心Mi 的距离；
分类步骤:
最小距离判别方法的主要步骤如下:
①确定地区和波段,配准备分量；
②选择训练区；
③根据各训练区图像数据,计算；
④将训练区外图像像元逐类代入上式,按判别规则比较大小,得到类别；
⑤产生分类图像；
⑥检验结果,如果错误较多需要重新训练区；
⑦输出专题图像。
这种方法的优点是,由于每一个象素总归有一个样本平均值与之最为靠近,因此不存在不分类的象素；计算量小,只计算均值参量,而且矩阵计算也比较简单,因此这种方法节省计算机机时；另外,这种方法只用均值一个参数,避免用协方差矩阵,就避免了在样本数较少的情况下,协方差矩阵计算不准确而引起的误差。缺点是,有些不应分类(按用户指明的某一限度) 的象素被分类,但这一问题可以通过设定阈值除去那些离分类最远的象素得以缓解；没有考虑到类型的变化性,如城市类型的象素,其差异很大,可能与模板的平均值之间的距离就要大些,如果用这种判别规则,有些本属于城市类型的象素,则可能误分；相反,对于内部变化较小的类型如水体,就可能分类象素过多,即把本不属于这类的象素归入这类,因为属于该类的象素与其平均值的距离肯定比不属子该类的象素与其平均值的距离近。

2.1.2　Mahalanobis 距离(马氏距)
除用于等式中的协方差矩阵不一样,Mahalanobis 距离与最小距离相似。这种距离定义考虑了变量间(样本) 相关性的影响,是一种更广义的距离定义。等式中已计算了方差与协方差,因此内部变化较大的聚类组将产生内部变化同样较大的类,反之亦然。例如:正确分类的象素可能与其平均值的距离大于属于水体类型的象素值与其平均值的距离,因为对水体类型来说,一般内部变化不大。马氏距公式如下:
其中:
D :Mahalanobis 距离；
C :某一特定类；
X :象素的测量矢量；
:类型C 的模板的平均矢量；
:类型C 的模板中象素的协方差矩阵；
T :转置函数；
象素将被归入到D 值最小的类型C 中。
马氏距离分类方法的主要步骤:
①确定需要分类的地区和使用的波段和特征分类数,检查所用各波段或特征分量是否相互已经位置配准；
②根据已掌握的典型地区的地面情况,在图像上选择训练区；
③计算图像的协方差矩阵;根据选出的各类训练区的图像数据,计算各类均值,确定分类半径；
④分类,将训练区以外的图像像元逐个逐类地代入公式,对于每个像元,分几类就计算几次,最后比较所得马氏距离的大小,选择最大值得出类别；
⑤产生分类图,给每一类别规定一个值,如分10 类,就定每一类分别为1,2 ……10 ,分类后的像元值便用类别值代替,最后得到的分类图像就是专题图像。由于最大灰阶值等于类别数,在监视器上显示时需要给各类加上不同的彩色；
检验结果,如果分类中错误较多,需要重新选择训练区再作以上各步,直到结果满意为止。这种方法的优点是,考虑到类型的内部变化；在必须考虑统计指标的场合,比最小距离法更有用。缺点是,在协方差矩阵中使用较大的值易于导致对模板(Signature) 过渡分类,如果在聚类组成训练样本中象素的分布离散程度较高,则协方差矩阵中就会出现大值；计算起来比最小距离法慢；Mahalanobis 距离是参数形式的,意味着每一输入波段的数据必须是正态分布的。

2.1.3平行体分类
通过设定在各轴上的一系列分割点,将多维特征划分成分别对应不同分类类别的互不重叠的特征子空间的分类方法。这种方法要求通过选取训练区,详细了解分类类别(总体) 的特征,并以较高的精度设定每个分类类别的光谱特征上限值和下限值,以便构成特征子空间。对于一个未知类别的像素来说,它的分类取决于它落入哪个类别特征子空间中。如落入某个特征子空间中,则属于该类,如落入所有特征子空间中,则属于未知类型,因此平行体分类方法要求训练区样本的选择必须覆盖所有的类型,在分类过程中,需要利用待分类像素光谱特征值与各个类别特征子空间在每一维上的值域进行内外判断,检查其落入哪个类别特征值方体中,直到完成各像素的分类.这种方法的优点是, 快捷简单,因为对每一个模板的每一波段与数据文件值进行对比的上下限都是常量；对于一个首次进行的跨度较大的分类,通常比较有用,这一判别规则可以很快缩小分类数,从而避免了更多的耗时计算,节省了处理时间(如最小距离、Mahalanobis 距离或最大似然)。缺点是由于平行六面体有“角”,因此象素在光谱意义上与模板的平均值相差很远时也被分类。

2.1.4　最大似然/ 贝叶斯分类
与分布有关的统计分类方法主要有最大似然/ 贝叶斯分类。最大似然分类是图像处理中最常用的一种监督分类方法,它利用了遥感数据的统计特征,假定各类的分布函数为正态分布,在多变量空间中形成椭圆或椭球分布,也就是和中个方向上散布情况不同,按正态分布规律用最大似然判别规则进行判决,得到较高准确率的分类结果。否则,用平行六面体或最小距离分类效果会更好。
最大似然/ 贝叶斯分类公式如下:
其中:
D :加权距离(可能性)；
c :某一特征类型；
X :象素的测量矢量；
:类型C 的样本平均矢量；
:任一象素属于类型C 的百分概率(缺省为110 ,或根据先验知识输入)；
:类型C 的样本中的象素的协方差矩阵；
| | :  的行列式；
| |：  的逆矩阵；
ln:自然对数函数；
T :转置函数；
分类步骤:
①确定需要分类的地区和使用的波段和特征分类数,检查所用各波段或特征分量是否相互已经位置配准；
②根据已掌握的典型地区的地面情况,在图像上选择训练区；
③计算参数,根据选出的各类训练区的图像数据,计算和  ,确定先验概率；
④分类,将训练区以外的图像像元逐个逐类代入公式,对于每个像元,分几类就计算几次,最后比较大小,选择最大值得出类别；
⑤产生分类图,给每一类别规定一个值,如果分10 类,就定每一类分别为1 ,2 ……10 ,分类后的像元值便用类别值代替,最后得到的分类图像就是专题图像. 由于最大灰阶值等于类别数,在监视器上显示时需要给各类加上不同的彩色；
⑥检验结果,如果分类中错误较多,需要重新选择训练区再作以上各步,直到结果满意为止。
这种方法的优点是,对符合正态分布的样本P聚类组而言,是监督分类中较准确的分类器,因为考虑的因素较多；与Mahalanobis 距离一样. 通过协方差矩阵考虑了类型内部的变化。缺点是,扩展后的等式计算量较大,当输入波段增加时,计算时间相应增加；最大似然是参数形式的,意味着每一输入波段必须符合正态分布；在协方差矩阵中有较大值时,易于对模板分类过头,如果在聚类组或训练样本中的象素分布较分散,则模板的协方差矩阵中会出现大值。

2.2非监督分类
非监督分类是在没有先验类别知识的情况下,根据图像本身的统计特征及自然点群的分布情况来划分地物类别的分类处理。监督分类可以有效地开发数据内容,但需要充足的信息可以决定地表信息的先验概率,不但监督分类训练样区的选择需要各种丰富的知识与经验,且需要当地土地覆盖的一些具体资料信息。主要步骤包括:
1) 定义一系列参数如最大类别数、迭代终止条件；
2) 执行分类；
3) 为各个类分配颜色和具有实际意义的名称；
4) 对分类精度进行评价。
非监督分类是在没有先验类别作为样本的条件下,主要根据像元间相似性的大小进行
归类合并的方法。它主要有: K平均分类( K means)、ISODATA 方法。

2.2.1 K平均分类
K平均分类方法假定被用来表示样本空间的聚类中心的个数是预先知道的。这种假定本身在某种程度上限制了这一方法的利用。它使聚类域中所有样本到聚类中心的距离平方和最小,这是在误差平方和准则的基础上得来的。
K 平均算法由下述步骤组成:
(1) 任意选择k个初始聚类中心,一般选择给定样本集的前k 个样本作为初始聚类中心；
(2) 第k 次迭代,若,式中i = 1 ,2…… k ,i ≠j ,则x ∈,  为聚类中心是的样本集. 于是分配各样本x 到k 个聚类域；
(3) 由(2) 的结果,计算新的聚类中心
这样使中的所有点到新的聚类中心的距离平方和最小。
(4) 若,算法收敛,程序结束。否则转入第二步。
聚类中心数K、初始聚类中心的选择、样本输入的次序,以及样本的几何特性等均影响k 平均算法的进行过程. 对这种算法虽然无法证明其收敛性,但当模式类之间彼此远离时这个算法所得的结果是令人满意的。

2.2.2　ISODATA分类方法
ISODATA 是Iterative Self-Organizing Data Analysis Techniques A 的缩写,A 是为发音的方便而加入的,ISODATA 意为迭代自组织数据分析技术。ISODATA 算法是利用合并和分开的一种著名的聚类方法。它从样本平均迭代来确定聚类的中心,在每一次迭代时,首先在不改变类别数目的前提下改变分类。然后将样本平均矢量之差小于某一指定阈值的每一类别对合并起来,或根据样本协方差矩阵来决定其分裂与否. 主要环节是聚类、集群分裂和集群合并等处理。
算法原理:
1 指定和输入有关的迭代限值参数：
K —要求的聚类中心数；
—个聚类中心域中至少具有样本个数的阈值；
—标准差的阈值；
—归并系数,聚类中心间距离的阈值；
L —能归并的聚类中心对的最大数；
I — 允许迭代次数。
另在执行算法前,应先指定C 个初始聚类中心,表示为；C 不一定等于所要求的聚类中心数K；可为给定模式中的任意样本。
2 具体步骤
(1) 定算法的参数；
(2) 配N 个样本到C 个聚类中心. 若, i = 1,2……C,i ≠j ,则
x∈其中f j表示分到聚类中心的样本子集, 为中的样本数；
(3) 对任意的j，则去除,并使C = C- 1 ,即将样本数比θN 少的样本子集去除；，
(4) 新聚类中心
(5) 计算聚类域中的样本与它们相应的聚类中心的平均距离
(6) 计算总的平均距离
　　其中N 为样本集中的样本总数；
(7) 判别
a) 若这是最后一次迭代,置,且转到第十一步；
b) 若C ≤KP2 ,则转入下一步；
c) 若C ≥2K 或这是偶次迭代,则转第十一步，否则继续；
(8) 标准差
其中n 是样本模式的维数, 是中第K 个样本的第i 分量, 是的第i 分量。的每个分量表示中样本沿主要坐标轴的标准差；
(9) 找中的最大分量, j = 1 ,2 , ⋯, C ,用表示；
(10) 如果对任意的>，j = 1 ,2 , ⋯, C ,存在有
a) 和
或
b)
则分裂成两个新的聚类中心和,删去,并使C =C+1。对应于的分量上加上一给定量,而的其它分量保持不变来构成。对应于  的的分量上减去,而的其它分量保持不变来构成。规定是的一部分,=K,0 < K ≤1。选择的基本要求是,使任意样本到这两个新的聚类中心和之间有一个足够可检测的距离差别,但又不能太大,以致使原来的聚类域的排列全部改变。如果发生分裂则转第二步,否则继续；
(11) 计算所有聚类中心的两两距离
(12) 比较距离与参数,取出L个，的聚类中心，其中
(13) 从着手,开始一对对归并,算出新的聚类中心
　　删去和,并使C = C -1。注意:仅允许一对对归并,并且一个聚类中心只能归并一次。经实验得出,更复杂的归并有时反而产生不良的后果。
(14) 如果是最后一次迭代则算法结束,否则
a) 如果用户根据判断要求更改算法中的参数,则转第一步；
b) 如果对下次迭代参数不需要修改,则转第二步；
每次回到算法的第一步或第二步就计为一次迭代, I = I + 1。
ISODATA 法的实质是以初始类别为“种子”施行自动迭代聚类的过程. 迭代结束标志着分类所依据的基准类别已经确定,它们的分布参数也在不断的“聚类训练”中逐渐确定,并最终用于构建所需要的判决函数。从这个意义上讲,基准类别参数的确定过程,也是对判决函数的不断调整和“训练”过程。这种方法的优点是、聚类过程不会在空间上偏向数据文件的最顶或最底下的象素,因为它是一个多次重复过程:该算法对蕴含于数据中的光谱聚类组的识别非常有效,只要让其重复足够的次数,其任意给定的初始聚类组平均值对分类结果无关紧要；缺点是,比较费时,因为可能要重复许多次；没有解释象素的空间同质性。

2.2.3贝叶斯学习、最大似然度分类
无监督分类方法还有贝叶斯学习、最大似然度分类。无监督的贝叶斯方法和最大似然度方法与有监督的贝叶斯学习以及最大似然度方法基本相同，唯一的区别在于无已确知类别的样本可供参。

3 遥感图像分类技术
遥感图像分类的研究目标主要有地面房屋、车辆、地面植被、海洋冰、大气云层等目
标。数据来自于机载雷达、星载雷达，如SPOT，LANDSAT等SAR或光学雷达。
针对具体遥感特定图像的分类，我们往往需要获得较大量的图像数据，尤为关键的是
还要得到作为最后校验数据标准的地面信息，否则无法衡量分类的精确度和提取较为准确
的特征矢量。
目前,遥感应用中使用较多的仍是传统的分类方法,即监督分类和非监督分类两类分类方法。随着计算机计算能力的迅速提高,专家系统和神经网络等一些原先工程实现困难的新方法也在遥感图像处理中开始发挥作用。因此,多学科的交叉是遥感图像分类发展的重要方向,以期对遥感图像分类方法的研究有新的突破。

bobo198 · 发表于 2017-3-7 09:39

大赞！好文！

[资料] 遥感图像|影像分类综述（经典好资料推荐！新手必看！）

浏览过的版块