基于集成学习之高光谱遥感影像类别概述
1 绪论
1.1 研究背景与选题依据:
1)基于不同训练样本的构造方式。主要是基于相同的训练集采用不同的抽样技术得到分类器的不同输入训练样本,继而得到对相同分类器不同角度的表示,组合这些分类器,得到一个集成学习系统。最著名的基于不同训练样本构造算法的是Bagging和Boosting,前者对训练样本进行随机有放回重采样,各轮训练样本集相互独立;后者通过重赋权重来代替重采样[基于 Bagging的高光谱分类流程见图2-2。
3 基于旋转森林的高光谱影像分类 .................. 22
3.1 引言............ 22
3.2 RoF 用于高光谱影像分类的基本原理和方法............... 23
3.3 RoF 中的特征提取算法............... 24
4 基于监督/半监督特征提取与集成学习的分类................. 40
4.1 引言................ 40
4.2 高光谱遥感影像特征提取算法概述................... 40
5 光谱-空间特征集成的高光谱影像分类 .......................... 69
5.1 图像分割 .............. 69
5.2 马尔科夫随机场模型 .................. 75
6 高光谱影像集成学习分类系统
6.1 研制背景与目的(Developing Bacground and Purpose)
随着高光谱遥感影像在城市土地覆盖/利用分类、森林植被监测、城市不透水面层检测以及城市污染检测等方面的广泛应用,影像分类作为其中最有效的检测手段之一,通过对高光谱遥感影像分类,可以直接获取用户所需的土地覆盖/利用类型等专题信息,利用这些专题信息进行人类社会及相关自然演变规律有着重要的指导作用。集成学习作为最为最近高光谱遥感影像分类的研究重点,通过集成学习综合各种方法的优点,能够有效地快速的获取用户所需信息,从而能够广泛而快速应用城市不透水面层分析、变化检测等领域。
目前专业处理遥感影像的分析软件有 ENVI、ERDAS,PCI 等,都没有相关的集成学习系统或者具有集成学习模块,在实际运用或操作中,往往需要结合多个软件进行综合运用,其中涉及到大量的重复性工作,大大增加了工作时间。
因此,根据高光谱遥感影像的特点,本文利用开发了系统的、自动化、流程化的高光谱遥感影像集成系统,以期能够通过此系统提高实际工作效率和推广集成学习在高光谱影像中的作用,通过实践证明,此系统也可运用于其他遥感影像,如多光谱影像,Radar 影像等。
7 结论与展望
7.1 结论(Conclusions)
高光谱遥感影像由于能够提供地物完整的光谱信息,而利用这些完整的光谱信息能够提高探测目标的能力,因此在农业规划、矿物识别以及地质灾害等领域越来越受到重视。传统的遥感影像分析算法往往不能够满足高光谱影像处理的需求,因此需要研究新的理论和方法来提高高光谱遥感信息处理水平。随着机器学习技术的发展,单一的学习算法已经不能够满足实际的需要。集成学习是利用多个学习机来解决同一问题的学习范式,由于能够显著提高学习系统的泛化能力,从上个世纪 90 年代,集成学习的理论和算法研究已经称为机器学习界广泛研究的热点问题之一,已经被成功应用在语音识别、图像处理等领域。
经过研究人员的不懈努力,集成学习在近年来取得丰富的成果,但是其在高光谱遥感影像分类领域的研究和应用还比较少,还远未达到人们所期待的水平。集成学习中两个最关键的问题是构建基分类算法和合并策略。如何构建多个基分类器,使基分类器的准确性和差异性达到一个很好的折中;在训练出基分类结果时,如何有效的通过合并策略集成这些分类结果,以便能够更好的提高分类性能,有待进一步研究。
本文在对集成学习中的相关算法进行了较为深入的研究的基础上,简要介绍了集成学习的理论基础和最新研究成果,分析了集成学习应用于高光谱遥感影像分类中的框架,本文主要研究工作包括以下几个方面:
1)将旋转森林应用于高光谱遥感影像分类,并在此基础上,运用了不同特征提取算法提出了基于独立主成分分析、最大噪声分离和局部线性判别分析的Rotation Forest,以 Indian Pine AVIRIS、University of Pavia ROSIS 和 Pavia Center DAIS 数据为例,性能优于其他集成学习算法 Bagging、AdaBoost 和 Random Forest。提出的基于独立主成分分析、最大噪声分离和局部线性判别分析的Rotation Forest 与原始 Rotation Forest 精度相当,并且在类别精度上能够与原始Rotation Forest 产生互补。
2)将半监督/监督概率主成分分析用于高光谱遥感影像分类特征提取,运用Indian Pines AVIRIS、University of Pavia ROSIS 和 Pavia Center ROSIS 高光谱数据,从不同数据、不同数量的标记样本和未标记样本、计算复杂度等方面分析半监督/监督概率主成分分析与其他特征提取算法进行比较,试验结果证明半监督/监督概率主成分析提取出来的分类特征能够得到高精度分类结果。
3)提出了基于监督/半监督特征提取的集成分类策略,通过半监督概率主成分分析、监督概率主成分分析、无参数加权特征提取)三种监督/半监督特征提取算法,构建并行集成和串行集成算法,能够有效提高高光谱遥感影像分类精度。
4)提出集成半监督特征提取的分类和基于图像分割、马尔科夫模型的分类模型,基于图像分割的分类模型分别选择基于聚类的分割、分水岭分割和Mean-shift 分割。其中聚类算法选择 -means、ISODATA、Fuzzy -means、ernel -means;分水岭分割通过四种不同方式构造梯度图像。马尔科夫模型集成分类模型,通过最小化局部能量函数,采用模拟退火算法,能够有效的使邻近像元聚集。通过集成光谱和空间的分类图像,高光谱遥感影像分类精度得到显著改善,并且能够降低遥感影像分类噪声。
5)研发了高光谱遥感影像集成学习分类系统,该系统包含遥感影像基本处理、分类、聚类、分割、集成空间光谱分类和集成学习等功能,以城市不透水面层提取分析为例,说明该系统在实际高光谱遥感信息处理的优势。
参考文献(略)