网格环境下医学图像应用中的副本放置及文件可用性研究
第1章 绪 论
医学图像数据量的爆炸式增长,还给这些数据的处理带来另外一个问题。对医学图像数据的处理,大都是为了准确显示人体器官及其病理特征,为后续研究和临床诊断服务,这对医学图像数据的处理结果有高品质的要求。但是,为了更好满足这一要求,医学图像处理算法的复杂度也会迅速增加。一般来讲,对算法效果要求较低时,算法复杂度较低;但是当算法效果要求较高时,算法效果的微小改善往往会导致算法复杂度的大幅增长。这意味着为获得更好的图像处理效果,处理算法和构建的数学模型将更为复杂,这对计算机运算能力提出了更高的要求。 医学图像研究的前沿领域对计算能力也提出了更高的要求。例如,在以心肌纤维扩散张量成像技术为研究对象的研究中,需要对磁共振扩散张量成像进行建模与仿真。为了准确地描述组织的微观结构,需要仿真大量水分子的扩散运动。仿真过程中,一个心肌细胞的仿真时间大约为 140 秒 CPU 时间。在利用极化光采集的心脏数据中心肌细胞约为 706472 个,要完成全部心肌细胞的仿真,普通个人计算机需要约 3 年的 CPU 时间,远远满足不了研究者的需求。
..........
第2章网格副本方法分类研究
2.1副本放置的形式化描述
通常,用来评价副本问题的度量方法,都与存储矩阵关于。有些度量,例如总的存储空间,可以直接由存储矩阵获得。另外,有些度量,例如应用在传输数据时消耗的总的传输时间,需要同时考虑该应用所使用的存储矩阵以及在实现这一存储矩阵时所需要的系统资源信息。副本放置问题,可以被描述为找到一个存储函数s,该函数能够给出应用运行时所需要的存储矩阵。存储函数s依赖于能够描述文件副本放置问题的各种参数。例如,在动态算法中,存储函数将依赖于时间参数、存储矩阵的当前值、文件属性(例如文件的访问模式、属主以及文件类型等)、系统环境参数和存储消耗等。文件副本的放置算法就是要实现在性能指标约束下的存储函数s的优化问题。
2.2副本方法分类研究现状
Buyya 等人以及 Amjad 等人对副本问题的分类很好地解决了副本方法的分类学问题。但是,Buyya 等人研究的是 2005 年之前的副本方法,未能考虑文件模型这一重要角度,需要对他们的分类体系进行扩充才能用来分析近年来的副本问题研究成果。Amjad 等人的副本问题分类学研究涉及到了最新的副本问题研究成果,但是,Amjad 等人将研究对象限定为动态副本算法。正如前面所说,动态特性只是副本算法特征的一个方面,因此,Amjad 等人的研究结果是不全面的。而且,Amjad 等人的研究较少涉及生产网格上所使用的副本方法,而这一部分,是研究 VIP 上的数据管理问题所亟需的。因此,Amjad 等人的分类体系也需要补充完善。 综上所述,应在已有副本方法分类体系基础上研究副本方法分类,完善副本方法的分类体系,提供可供观察和测量的分类系统,以达到揭示已有副本方法研究的分布特点及应用规律的目的。
第 3 章 网格环境下的文件可用性模型 ......................................... 49
3.1 网格环境下的文件可用性模型的研究现状 ............................................. 49
3.2 无现实模型 ................................. 51
第 4 章 基于脆性风险熵的不确定性环境下副本放置的度量.............................. 64
4.1 系统脆性理论概述 .............................. 64
4.2 作业的系统脆性风险熵模型 ............................... 66
4.3 SP 与 BE 在副本问题上的综合应用 ........................................ 69
结 论 ................................... 85
第4章 基于脆性风险熵的不确定性环境下副本放置的度量
4.1 系统脆性理论概述
复杂系统的脆性研究是复杂系统研究的一个新的研究方向。人们对复杂系统开展了大量的研究工作[88–92],但是,对复杂系统脆性的研究还不够充分。事实上,在国外的相关研究工作中,使用复杂系统脆性这个概念的情况并不多见。尽管如此,在欧美国家的一些研究工作中讨论的在各种复杂系统中类似的脆弱性的问题[93–102],还是与复杂系统脆性关于的,并广泛涉及到工业、国防、通信、社会等领域。 在我国,是以金鸿章为带头人的课题组,对复杂系统脆弱的研究较为系统深入,逐步建立了复杂系统脆性的相关概念和理论。其中,韦琦等人给出了脆性的定义,讨论了系统脆性的模型,并总结了系统脆性的特点,指出脆性是复杂系统的一个基本特性;金鸿章等人指出了研究复杂系统脆性的必要性,并尝试了将脆性理论应用于 2003 年非典型肺炎危机中的脆性研究[103,104]。金鸿章等人对脆性理论的应用研究涉及到了关系到国计民生的煤矿[105,106]、电力、交通等领域。
4.2作业的系统脆性风险熵模型
在 VIP 上,文件不可用而引起的作业失败是一个亟需解决的问题,希望采取适当的副本策略,通过控制文件副本在存储单元上的分布,提高数据的可用性。在前面的讨论中,建立了存储单元的无现实模型和有现实模型,以 Schinte等人[83]和 Lei 等人[46,47,78]的研究为基础提出了与存储单元的可用性相关的文件可用性模型,并建立了相应的作业成功概率模型。从第三章的实验结果来看,有现实模型更接近 VIP 上的实验数据。在上一节,应用系统脆性理论分析了在VIP 上观察到的文件可用性问题,引入系统脆性理论中的系统脆性熵来度量存储矩阵。 本节将结合作业成功概率模型和系统脆性熵来综合考虑VIP上的副本问题及其放置策略。
.........
结 论
本文针对网格环境下医学图像应用中的副本放置及文件可用性中的科学问题开展理论研究,主要完成以下工作。
(1)深入分析生产网格上的作业管理以及数据管理问题,以此为基础,研究了虚拟成像平台上文件传输中存在的问题。对虚拟成像平台上工作流的运行情况进行观察,从中提取并分析了副本放置、文件传输、存储单元可用性和作业运行情况等数据。数据分析说明,数据传输对网格环境下医学图像应用中的工作流影响显著,通过应用合理的副本策略可以提高虚拟成像平台上的数据管理效率,降低作业失败率。
(2)研究副本方法分类学。在已有副本方法分类体系基础之上,应用资源描述框架描述网格副本问题,从文件模型、资源模型、副本优化准则、副本过程以及副本方法验证等 5 个角度出发,以主语-谓语-宾语;的形式描述副本方法的特点,共获得 45 个副本方法的分类,完善了副本方法分类体系。应用这一分类体系,对近年的副本方法研究成果以表格的形式进行量化分析,分类表清晰显示了副本问题理论研究成果与生产网格上的实际副本问题之间存在的巨大差别,副本方法的理论研究成果还远远不能满足生产网格的现实需求。基于RDF 的副本方法分类体系是一个可供观察和测量的分类系统,可以用来量化副本方法的分布特点以及应用规律。
............
参考文献(略)