网络医学中若干关联问题的计算分析
1网络医学概况及本文工作介绍
随着人类基因组计划和其它许多物种全基因组测序的完成,人类迎来了后基因组时代亦称功能基因组学时代。在这一时代中,生命科学的中心任务是揭示基因组及其所包含的全部基因的功能,研究和预测基因产物蛋白质的结构和功能,并在此基础上阐明生物体遗传、发育、新陈代谢、进化、功能调控等基本生物学问题,以及进一步解决与人类健康、农业生产、环境保护等密切相关的问题。它的研究将为人们深入理解人类基因的结构与功能,个体生长、发育、衰老和死亡机理,疾病发生、发展机理以及其它各种生命科学问题提供共同的科学基础。随着对人类自身不断深入的认识,越来越多的研究表明人类的很多疾病与遗传物质密切相关。按照目前人们对遗传物质的认识水平,我们可将遗传病分为单基因遗传病、多基因遗传病和染色体病三大类。单基因遗传病:同源染色体中来自父亲或母亲的一对染色体上基因的异常所引起的遗传病。这种疾病的遗传符合孟德尔遗传定律,因此也叫孟德尔疾病。如血友病、白化病、镰刀型细胞贫血症等属于单基因遗传病。多基因遗传病:与两对以上基因关于的遗传病。每对基因之间没有显性或隐性的关系,每对基因单独的作用微小,但各对基因的作用有积累效应。一般来说,多基因遗传病远比单基因遗传病多见。多基因遗传病还受环境因素的影响。不同的多基因遗传病,受遗传因素和环境因素影响的程度也不同。遗传因素对疾病发生的影响程度,可用遗传度来说明,一般用百分数来表示,遗传度越高,说明这种多基因遗传病受遗传因素的影响越大。多基因遗传疾病也叫复杂疾病。如癌症、心脏病、糖尿病等属于多基因遗传病。
.........
2基于网络一致性的药物标问题研究
2.1引言
本章中,我们提出了一种新的半监督学习算法来预测药物标靴关系。我们的算法充分利用了样本中的已标记和未标记信息。我们将药物标範预测问题看作是药物查询问题。通过查询异构网络蛋白质蛋白质相似性网络,药物药物相似性网络和药物标交互网络,用户希望能够获得某药物最有可能的潜在标祀。我们认为如果药物按照其以某查询药物的相关性排序,同时标紀也按照其以某潜在标靴的相关性排序,则两种排序结果也会表现出相关性。实验结果表明我们提出的算法在预测精度和时间复杂度等方面优于先前的算法。同时还发现用我们所提出的算法预测的一些排序在前的药物标靴关系得到了现有数据库的证实,这表明我们的算法预测效果可行有效。
2.2数据采集
基于药物所作用的标蛋白种类的不同,文献将收集的药物标数据集分为四类,即酶数据集,离子通道数据集,GPCR数据集和核受体数据集。其中酶数据集中药物有445种,标範蛋白有664个,实验证实的药物标祀关系有2926对;离子通道数据集中药物有210种,标蛋白有204个,实验证实的药物标靴关系有1476对;表2-1列举了本章中所用到的药物,标靴以及它们之间相互作用数据。经实验证实的这些药物标关联关系数据被认为是评价算法性能的黄金准则;。这四类数据集既用于交叉验证中的性能评价又是本章中药物标範相互作用预测的训练集。
3随机游走算法在微RNA-疾病关联关系中的应用研究.......41
3.1引言............41
3.2数据釆集.......43
4基于相似性的微RNA-疾病关联关系预测算法.......50
4.1引言...........50
4.2数据采集...51
5单种群标签SNP s选择算法研究..........61
5.1引言..........61
5.2标签SNPs择问题研究.......64
5单种群标签SNP s选择算法研究
5.1引言
人类是一个具有多样性的群体。不同的个体有不同的体格和外貌,不同的个体对疾病有不同的抵抗能力,同样病症的患者对同一种药物常常出现不同的治疗效果。从遗传的角度上来说,这是因为不同个体的DNA序列是不完全相同的。人类基因组图谱将人类基因组共性的一面揭示出来,但人类个体差异性的一面没有得到体现。卡沃里斯福札等一些人类遗传学家和分子生物学家于1991年提议对全球人类基因组的多样性进行研究,人类基因组多样性计划由此产生。基因组多样性的研究有着重要意义它可阐明不同人群和个体在疾病的易感性和抵抗性方面存在差异的原因。
5.2标签SNPs择问题研究
基于连锁不平衡的多种群标签SNP s选择问题可定义为:给定一组来自多个种群的SNP位点及这些位点在各自相应种群中的连锁不平衡关系度量。试图在这些SNP位点中选出一个最小的位点子集,使得没被选中的SNP位点至少与该子集中的一个SNP位点在其所出现的种群中存在连锁不平衡关系。为了有效地比较各种不同的单种群标签SNPs选择算法,本章所有算法所用的实验数据都是来自于国际人类基因组单体型图计划简称计划。该计划是由加拿大、中国、日本、尼日利亚、英国和美国共同资助和合作进行的项目,旨在建立一个将帮助研究者发现人类疾病及其对药物反应的相关基因的公众资源。详见国际人类基因组单体型图计划相关资料。
.............
6总结与展望
本课题期望通过对网络医学中3个亟待解决的关联问题进行研究,拓展对疾病的发病机理、病理过程和治疗等认识。通过关联分析,对最终阐明人类复杂性疾病的遗传学机制具有重要的参考价值。论文的研究成果主要体现在以下几个方面:药物大多数是通过与人体内的标祀蛋白质相互作用从而产生疗效。蹄选和确定药物作用的点已经成为当前药物开发的关键所在。考虑到实验证实的药物标关系较少,存在大量未知的药物标关系,我们提出釆用半监督学习算法来预测药物标关系。我们从网络一致性的角度出发,融合多种生物特征,利用特征选择来预测药物标範相互作用关系。理论分析表明算法的时间复杂度得到了降低,交叉验证实验表明预测精度得到提高。案例分析也得到了理想的预测结果。
.......
参考文献(略)