WEB环境下基于相关反馈的遥感图像检索研究
第1章绪论
1.1研究背景及选题意义
近年来,遥感技术持续着快速发展的趋势,人们获得的遥感影像数据变得越来越庞大。如何快速准确的检索海量遥感数据库,使用户获得自己感兴趣的信息,如今已成为在遥感信息获取中亟需解决的问题,需要发展更为高效精准的遥感图像检索技术。
遥感图像检索的基础是图像检索技术。图像检索是根据某些相似性指标,从图像库中查询相关图像的过程,主要步骤如下:首先是获取足够的图像资源,从中提取特征并加以分析,以建立图像数据库;接下来是分析用户的需求,转化为可以检索图像数据库的查询条件;最后是根据相似度算法,计算用户查询条件与数据库中图像的相似度大小,将满足阈值的图像作为结果,以相似度降序输出。
最早的图像检索技术是产生于20世纪70年代末的基于文本的图像检索,这一技术是对传统的文本检索技术的沿袭,需要将图像检索转换为文字检索,主要方法是人工为图像添加关键字等描述。由于图像的内容丰富,关键字无法完全表述图像所表述的信息,同时不同的人对图像的观感不同,描述使用的文字也不同,这导致基于文本的图像检索往往不能满足人们的检索需求。
在20世纪90年代之后,出现了一些对图像的内容语义进行分析和检索的技术,即基于内容的图像检索技术。这一技术利用图像本质上包含的特征信息进行检索,因而其检索结果更为客观。然而在实际状况下,人们并不会仅仅通过图像自身的颜色、纹理以及形状等低层视觉特征来判断图像的相似性,而是会根据自身的知识判断来理解这些图像,如图像所表现的对象、事件,甚至是表述的情感含义等,这些特征我们称之为高层语义特征。由于计算机进行图像处理时往往只能依赖于图像的低层视觉特征,但低层视觉特征很难准确表述用户对于图像的语义理解,这一问题被称作语义鸿沟;问题。
为了克服语义鸿沟;问题,研究者们设计了很多方法来从图像中提取高层语义信息,并以这些语义信息作为检索图像时的索引,这就是基于语义的图像检索技术。图像的语义信息能够抽象图像表述内容的本质,而根据抽象程度的不同,这些语义信息可以被分为六个层次,从高级到低级分别是情感语义、行为语义、场景语义、空间关系语义、对象语义和特征语义,这一模型称为图像层次化语义模型,如图1.1所示。
1.2国内外研究现状
1.2.1軒内容的遥挪像检索技术
在基于内容的图像检索技术基础上,国内外的一些研究者们将其扩展到遥感图像的检索研宄上。由于遥感图像自身存在一定的复杂性,CBIR在遥感图像检索上的研究进展和普通图像相比较为缓慢,但也取得了很多成果,其中比较有代表性的有:
1)纽约州立大学提出了一种多分辨率遥感图像的检索方法。该方法使用九叉树法对分解遥感图像,对分解后的每一个子图像都分别进行小波变换,以提取其纹理特征,最后再计算模板图像与数据库中图像的纹理特征之间的距离。
2)Bollacer等提出了一种在网络环境下卫星遥感图像的检索方法。该方法将图像的语义特征信息以及文字描述等存入图像数据库中,可以实现按例查询、交互式查询和语义查询等多种查询方式。
3)缅因大学的Stefanidias等提出了一种草图形状的基础上,逐步渐进的遥感图像检索方法。该方法使用四叉树法分解用户提供的草图,对分解后的每一个子图像进行平移、旋转等拓扑变换,最后再将子图像与数据库中图像进行相似性匹配。
4)日本国家学术情报中心的北本朝展等提出了一种基于层次关系属性的台风云图检索方法该方法首先利用椭圆分解方法,根据台风云图的形状分解成一系列不同层次的椭圆空间分布图,然后使用HARG图表示这些椭圆及其相互之间的关系信息,并提出一种ARG方法以计算两幅图像之间的相似性。
5)亚利桑那大学的Zhu等提出了一种基于自组织图像的航空图像检索方法。该方法首先对航空图像进行分解,对分解后的图像使用滤波提取其特征信息,最后再用欧式距离来计算子图像与数据库中图像的相似性。
6)程起敏提出了一种基于多尺度遥感图像纹理特征的检索方法力。该方法首先采用小波变换来提取遥感图像的纹理特征,并划分多尺度对这些纹理特征进行描述。在过程中同时人工的实现对图像目标的分割,并提取分割后目标的形状特征向量,最后计算这些特征向量与特征库中的向量之间的相似性。
7)陆丽珍等提出了一种基于颜色和纹理特征的遥感图像检索方法。该方法使用五叉树法分解遥感图像,对分解后的图像使用Gabor滤波提取其纹理特征,最后再用这些子图像的颜色和纹理特征来将子图像与数据库中图像进行相似性匹配。
第2章基于相关反馈的遥感图像检索
相关反馈检索算法最早起源于文本检索系统领域。在检索时,用户可能无法清楚的表述想要检索的内容,但当系统向用户展示一些结果时,即使这些结果并不十分准确,用户仍可以从中挑选出感兴趣的部分并将其反馈给系统,而不必详细描述自己的检索需求,这些反馈信息也能够帮助检索系统提高检索效率,由这一需求而导致了相关反馈技术的产生。由此可知,相关反馈检索通过用户对检索结果的反馈,在用户不需要详细了解系统查询细节和内容构成的情况下,使检索结果更加符合用户需求。由于相关反馈算法可以对系统的检索模型做出实时的修改,这使得检索系统获得了自适应的能力,从而能够更好更全面的对遥感图像进行检索。本章主要介绍常见的相关反馈检索算法及其原理,其中包括本文所使用的相关反馈检索方法及其详细流程。
2.1基本流程
相关反馈图像检索的基本流程是
1)开始查询:用户首先提交一个检索条件,系统进行相关性检索并倒序排列,将前个结果返回给用户;
2)反馈循环:系统将结果返回给用户后,用户对检索结果进行评估。这些反馈信息被送入系统修正检索策略,指导系统进行更进一步的检索,并再次将检索结果返回给用户,如此循环。
3)终止查询:当某次循环后,用户对得到的信息感到满意时,终止查询。
图2.1展示了相关反馈图像检索的基本流程。
2.2常见算法
相关反馈流程实质上是一个机器学习机制,系统以用户的反馈作为学习样本,试图发现用户的真实检索需求,因而相关反馈方法的不同也就是学习机制的不同。
2.2.1学习样本的形式
相关反馈图像检索中的学习样本主要是用户的反馈信息以及统计这些用户反馈所得到的其他附加信息。这些样本的形式主要有以下几种:
1)仅反馈作为正例的相关图像;
2)同时反馈作为正例的相关图像和作为反例的不相关图像。一些研究者认为反例有助于在密度部分重叠的图像类中挑选中用户所感兴趣的,同时可以避免陷入检索空间的局部最小。但反对者认为,反例通常难以控制,代表性不大,对检索性能提高不大,反而增加用户的评价负担和计算的复杂性。
3)反馈图像相关的程度等级,例如可将某图像评价为十分相关、相关、模棱两可、不相关、十分不相关等不同等级。
4)反馈图像的相关性比较,即某张图比另一张图更相关或更不相关。
5)反馈图像的集合,用户将其认为相似的图像分为一组,系统通过图像和同组图像的相关性,来学习用户对于图像相关性的认识。
6)反馈用户选择图像的顺序、个数等附加信息,对用户的检索习惯进行学习。
2.2.2学习方法
1)聚类方法
聚类方法以查询向量作为聚类中心计算其最近邻,一般假定查询向量为用户的查询意图,而用户选择的相关图像代表用户对图像的评价。因此需要使查询向量尽量靠近相关图像,同时远离不相关图像。
2)分类方法
分类方法将相关反馈视作一个二分问题,通过用户对图像是否相关的评价,对一种分类器进行学习,从而将相关和不相关的图像分成两类。因此使用不同的分类器,就形成了不同的分类方法,其中主要有概率分类器和几何分类器两类。
第3章基于WEB环境的遥感图像检索........15
3.1检索流程........15
3.1.1语义粗检索........15
3.1.2相关反馈检索........17
第4章实验分析........28
4.1实验流程..........28
4.1.1实验环境.........28
4.1.2实验数据...........28
第5章总结与展望..........45
5.1总结..........45
5.2未来的研究方向..........45
第4章实验分析
为验证本文所提出方案的可行性及检索效果,本文在服务器下搭建了基于的遥感图像检索原型系统,收集了多景来自不同卫星及分辨率的遥感图像进行了检索实验,通过对多次实验结果的分析和评价,来验证本文所提出方法的有效性及技术路线的可行性。
4.1实验流程
4.1.1实验数据
我们收集了包括SPOT5、ALOS、GeoEye和TM图像在内的多景不同分辨率的多光谱图像作为实验的数据源,主要参数如表4.1所示。
为了方便系统查询,本文将以上大范围图像裁切成1024*1024大小的442张子图像和512*512大小的21张子图像:之后对所有子图像进行分割,并基于面向对象的方法进行分类,获取图像的语义信息;接下来利用五叉树分块法对图像进行分块处理,最后符合检索需求的图像共有1024*1024大小的子图像442幅,以及512*512大小的子图像2231幅,共计2673幅图,组成待检索旳图像库。图像库中的每一幅图像都在MYSQL数据库中建立两个表,一个记录图像每个分块的视觉特征、方位特征等信息,另一个记录整幅图像的对象语义、空间关系语义等信息。
第5章总结与展望
5.1总结
为了克服当前基于语义的遥感图像检索中存在的语义鸿沟;问题,并适应当前软件开发WEB化的潮流,本文引入基于权重调整的查询点移动相关反馈遥感图像检索方法,在WEB环境下建立了基于语义的遥感图像检索原型系统,实现了遥感图像的智能化检索。本文使用多景不同来源及不同分辨率的遥感影响进行了检索实验,通过对多次实验结果的分析和评价,验证了本文所提出方法的有效性及技术路线的可行性。
本文的研究工作主要包括:
1)相关反馈遥感图像检索的实现机制与方法。本文研宄了相关反馈检索的原理机制,并比较了相关反馈的常用算法,从中挑选并优化了适宜本文应用目的的相关反馈检索技术。采用基于权重调整的查询点移动方法进行相关反馈遥感图像检索,利用交互式反馈将用户的需求和知识通过反馈的方式传递给系统在一定程度上能够克服传统的CBIR存在的语义鸿沟;问题。
2)WEB环境下遥感图像检索的实现机制与策略。本文研宄了在多用户环境下实现遥感图像检索的优点和存在的问题,并通过相关反馈的应用、图像数据库的优化、检索流程的优化、以及采用先进的HTML5和AVASCRIPT富应用开发技术进行遥感图像的检索和展示等方法,探索出了WEB环境下进行遥感图像检索的实现机制和策略。
3)web环境下的遥感图像检索原型系统。本文设计开发了适用于WEB环境的遥感图像检索原型系统,并在此原型系统之上进行了相关反馈检索技术的检索实验。检索采用两步查询机制,并且采用由粗到精、不断优化的实现过程。经过对不同类型图像检索算法的评价方法的分析,选择了NDCG方法对实验进行评判,验证了本文方法的有效性。
实验表明,本文方法可以在环境WEB下的原型系统上顺利完成,并达到较好的检索效果和效率,符合不同用户对于遥感图像检索的需求,有力的说明了相关反馈方法能够提升遥感图像检索的性能,并证实了在WEB环境下实现遥感图像检索的可行性。
参考文献(略)