基于优化决策树的高分辫率遥感影像分类技术研究
第一章绪论
1.1研究背景和研究意义
在传统的土地利用调查中,通常采用资料和数据采集的方法,耗费大量的人力、物力及财力,而且调查的时间跨度大、周期长,严重影响了数据获取以及分析的效率。随着我国城市化进程的不断加快,城市以及农村所在区域的土地利用覆盖也在快读的变化,显然传统的土地利用调查方式己经不能适应这种快速变化的需求。
遥感技术以其全天候、多时相、多波段的特点成为全球环境变化研究的主要技术。而土地利用覆盖作为全球环境变化的研究热点,也更多的使用遥感技术进行研究。遥感影像分类是获取土地利用覆盖数据的一项重要手段。遥感影像分类一直是遥感研究领域里的一项重要内容,是遥感应用的基石,因为它是遥感影像转换为可用的地理数据的核心。通过不同时相的遥感图像,可以快捷地获得土地利用变化的类型、数量和位置。这些变化信息既可以对前期开发治理效果进行正确评价,又可以指导今后的开发治理规划,促进可持续发展。
从遥感影像分辨率的角度分析,较之低或中等分辨率卫星影像,高分辨率卫星影像可以大量减少影像中的混合象元,同时可以提供更加丰富的空间信息,地物几何结构和纹理信息'。这是影像的优势所在,但同时,也对影像分类算法提出了更高的要求。从土地资源的利用的角度进行分析,土地覆盖信息的提取的精度直接影响到土地调查、土地资源评价等各项土地工作的细致程度和工作效率。因此在计算机自动分类的遥感分类中,急需一个具有较高分类精度的高分辨率遥感影像的分类方法。
1.2,遥感影像分类研究的现状
遥感影像的分类方法的研究是遥感领域中的一项重要内容,它直接彩响到遥感数据的应用范围和应用效果。从上世纪90年代以后越来越多的学者对遥感影像的分类方法进行了全面细致的研究,分析应用了各种算法进行遥感形像的分类,期望能得到更好的分类精度,随着遥感技术的发展,遥感影像在遥感平台和影像分辨率上都有了长足的发展,遥感分类的方法研究也向着多方法,多分类器相结合,取长补短进行了更多的新方法的应用研究。
遥感影像的分类方法可以按如下图1.1表示进行分类
如图1.1所示,遥感影像的分类方法按照分类的主要执行者来划分,可以分为人工目视解译与计算机自动解译。为了追求高精度的分类结果,人们长期使用人工目视解译的方法从遥感影像上提取各种专题信息。人工目视解译被广泛地应用于对精度要求较高的专题应用中,特别是在使用高分辨率的遥感图像时这种方法较为常用。
遥感影像计算机自动解译是采用统计模式识别、机器学习、人工神经网络、可视化等各种方法确定各地物类别间的判别界面和规则,形成一个分类标准或者决策规则,进行遥感影像的分类。相较于人工目视解译的方法,遥感影像的计算机自动解译具有可重复利用性好、客观性强、效率处理、海量处理等优点。但是由于遥感影像数据自身的特点,包括数据来源类别多、部分数据含混度大、特征维数高,使多类别分类识别有一定难度,而且得到的影像分类结果精度明显不如人工目视解译的效果。但是遥感影像计算机自动解译仍然是遥感影像分类研究的主流方向。
第二章理论基础
2.1决策树
树是一种非线性纤、构,它是离散数学中重要的一类。树是计算机用来表述非线性信息的重要结构,它便于在计算机中存储和应用。
2.1.1决策树定义
决策树是树在决策系统中的一种应用,它的生成算法是机器学习中归纳学习的一大类,它在决策系统中相当于决策规则集。
决策树是一种直观的知识表示方法,它是一种重要的结构简易、搜索效率高的多级分类器。决策树普遍具有两种节点决策结点和现实节点。决策结点表示对象、模式的属性或属性组合,它对应树的内部节点现实节点表示对象或模式的类别,它对应树的叶节点。除了以上两种节点,决策树还具有一个分支,它表示其上一层决策节点所代表的属性的一个取值或取值范围的组合,用来考察待分对象或模式的某个或某些特征的取值,根据样本的测试结果,选择某一个分支。由于决策树具有易于算法构造,规则易于理解,效率较高等特点,其己在模式识别、数据挖掘、机器学习等领域得到了广泛的应用。决策树从根节点开始,采用自顶向下的方式,在决策树的决策节点将待分类对象或模式进行属性值的比较,并且根据属性值的不同来判断从该节点向下的分支,最后在树的现实结点得到结论。
决策树可以解释成一种特殊形式的规则集,从决策树的根节点到其叶节点的一条路径就对应着一条决策规则,整个决策树就对应着一组规则的表述。这些规则的表述特征就是一种规则的层次组织关系。值得注意的是,这些决策树涉及优劣的问题,有的决策树存计算效率高且储量少,有的决策树计算效率低存储量大,因此需要从中找到较优的决策树,这就涉及到决策树的构造算法。图2.1表述了决策树与决策规则集相互等价的关系。
2.2模拟退火
2.2.1模拟退火算法的原理
模拟退火算法就是模拟这样的热学过程,该算法模拟高温物体降温的热力学过程,在进行优化时首先确定退火的初始温度,选择一个初始现实并确定该现实的目标函数值然后对当前的现实进行一次小的扰动,并计算新现实的目标函数值以概率接受较好点,以某种概率界接受较差点作为当前现实点,直到整个系统冷却。当模拟退火算法在初始温度足够高、温度下降足够慢时,该过程能以概率收敛到全局最优值。由于模拟退火算法也以某种概率界接受较差点为当前现实点,即具有了概率突跳特性,因此该算法能在解空间中随机寻找目标函数的全局最优解,即可以在局部最优解中概率性的跳出,从而具有跳出局部最优解,并最终趋于全局最优解的能力。
模拟退火算法的基本流程如下图2.2所示
第三章面向影像分类的优化决策树模型架构37
3.1面向影像分类的优化决策树模型思想37
3.1.1基本的决策树优化框架..........37
第四章优化决策树的逻辑流构建...........61
4.1基于模拟退火算法的样本纵向压缩...........61
第五章实验分析83
5.1实验数据.........83
第五章实验分析
5.1实验数据
5.1.1实验区域选择
本实验采用高分辨率的遥感影像中具有代表意义的QuicBird和SPOT遥感影像作为实验数据。具体为湖北省武汉市南胡地区获得的QuicBird影像数据及海南省昌江县的SPOT影像数据,区域位置示意图如图5.1所示。
第六章总结与展望
6.1总结
6.1.1全文总结
遥感影像的分类方法的研究是遥感领域中的一项重要内容,它直接影响到遥感数据的应用范围和应用效果。随着遥感技术的发展,遥感影像在遥感平台和影像分辨率上都有了长足的发展,遥感分类的方法研究也向着多方法,多分类器相结合,取长补短进行了更多的新方法的应用研究。本文通过综述现阶段遥感影像分类方法的研究现状和研究趋势,提出继承决策树方法的灵活性和鲁棒性,以及其不存在黑箱;操作的特点,针对决策树分类性能依赖理想样本以及容易陷入局部最优的不足进行改进,结合遥感影像分类特点,得到一个面向影像分类的优化的决策树模型。本文的研究内容可归纳为以下几个方面:
(1)决策树算法假设训练样本数据是完全的理想数据,导致决策树系统在实际应用中容错性较差,样本中数据的不完全,不完整等噪声对决策树的分类性能影响较大。本文首先针对该缺点,结合遥感影像分类本身的特点,提出建立特征优先级机制对节点的选择进行控制。该机制是基于影像知识的,通过影像分类的先验知识,建立起各类地物以及整体影像的特征优先级,并构建特征优先级与决策树节点选择之间的控制模式,完成基于影像知识的决策树准则对决策树方法的优化。
(2)针对ID3算法采用的信息增益嫡为局部非回溯的启发式的缺点,本文引入了模拟退火算法的思想,来重建决策树算法的启发式,利用信息增益嫡和整体影像的破碎度因子相结合,得到模拟退火的目标函数,利用模拟退火有一定几率跳出局部最优的特点,完成决策树算法从局部最优中的跳出,避免过拟合现象的产生,完成基于全局影像的决策树准则对决策树方法的优化。
(3)通过准则的建立,得到面向影像分类的决策树优化模型的构架,并对优化决策树模型的逻辑流进行了详细的设计。在进行优化的决策树节点选择之前,首先对样本数据进行一个模拟退火的纵向聚类。这个聚类比常见的模拟退火聚类增加了一个决策属性在进行聚类时的判断。也就是模拟退火的过程除了考虑样本的相关性系数,收敛程度还需要考虑聚类的样本其决策属性是否相同。纵向聚类过程,设计了一个小样本系数用于保证样本特征的完整性。通过选择合适的算法在纵向聚类完成后的样本上进行样本属性的聚类和离散化过程,得到决策树可处理的数据。在此基础上设计了决策树的剪枝过程,和算法性能的评价指标。
参考文献(略)