基于EMD与GEP组合预测方案用在急性低血压的预测
第一章 绪论
1.1 研究背景及意义
本论文课题来源于同学所在单位的基金项目。本人所做的工作是研究一种基于EMD 与 GEP 组合预测的方法应用于急性低血压预测问题的效果。
随着经济和科学技术的发展,人民生活水平的不断提高和对身体健康的重视,现代医疗卫生事业得到了迅猛的发展,在现代社会发展中占据重要位置并成为衡量社会发展的重要因素之一。而在医疗卫生系统中,重症监护室(Intensive Care Unit,简称ICU)作为守护生命的最后防线无疑为保障患者的生命安全起到了十分重要的作用。虽然在 ICU 拥有大量的先进检测仪器和医疗抢救设备,但这些设备大多数只能体现出患者当前的表征生理特征,例如血压值、心率、体温等,并不能准确的预测患者在未来的一段时间内可能会出现的某种突发急症,在临床上这些突发症判断往往只能依靠医生丰富的临床经验,通过对大量检测设备的检查结果来判断患者在未来的一段时间内是否会出现某种突发症,例如 AHE(Acute Hypotension Episode,简称 AHE),急性肝功能衰竭,重症急性胰腺炎等。其中 AHE 的发生对患者生命安全的影响是最为严重的一种,AHE 的发生将会在短时间内导致患者的昏厥或者休克,器官的不可逆受损甚至是死亡。据美国复杂生理信号研究资源PhysioNET对来自2008年12月份的美国ICU的数据统计,有 41.3%的患者在术后出现 AHE,其中死亡率为 37.8%,远高于 17.8%总体死亡率。
临床上,成人如果收缩压低于 90mmHg、舒张压低于 60mmHg 时称为低血压。低血压分为急性和慢性两种。当血压由正常或较高的水平突然下降至或明显低于正常范围时,称为 AHE。在 ICU 监护中,AHE 的发生不仅会破坏治疗效果,并且严重威胁着患者的生命安全。临床监护治疗表明,AHE 发生后需要及时、有效的干预。如果不做任何处理,AHE 可引起昏厥或休克,导致患者的不可逆性器官损伤,甚至死亡。而有效的处理方法的选择取决于对各种 AHE 发生的病因做出迅速而又正确的诊断,如果医生有足够的时间正确诊断出病因并进行恰当的处置,则可避免患者病情的进一步恶化或者死亡。因此,在处理 AHE 的情况时,时间显得十分宝贵和紧迫。现阶段对发生AHE 的处理方式主要依靠临床医生的专家经验进行处置,如通过采用针对性心理护理、合理的预防性措施、捕捉先兆症状及生命体征监测等预见性护理措施。这种方法在实际临床工作中主要缺点是费时、复杂且不经济。
..................................
1.2 国内外研究现状
在实践中,相关研究人员已经开发出了通过临床收集的患者数据如血压、心率、氧气饱和度等预测 AHE 发生的自动算法,比较經典的方法有 Henriques 和 Rocha T提出利用多个神经网络预测 1 小时预测窗口中的 MAP 波形值等[1];ules Bassale 和Cristina Crespo 等提出利用患者动脉血压波形(ABP)的各种统计量,如均值、方差、中位数等来进行分析[2~3];PAFournier 和 F Roy 提取 MAP 用最近邻算法来匹配训练集进而进行预测[6]。Frolich A 和 Hanss 提出利用患者的心率来分析预测 AHE 的发生;EMancini 等利用血氧饱和度作为有效指标[7]。
Bassale 提出的使用参数和非参数方法来分析和描述低血压发作之前的动脉血压波形 ABP,他得出结论,ABP 变化和形状特性有可能预测此类事件[2]。Crespo et al 则提议使用低血压发生前一段时期实时的 ABP 信号形态学变化,他们提议将 ABP 信号的方差和波斜率的变化作为预测 AHE 的最相关特性[3]。Lehman et al 提出了一种相似性搜索和模式匹配算法,用于分类和预测,通过真实的生理测量,他们提取用于预测重症监护室 AHE 的方法[4]。Saeed et al 同样引进一种新的时间相似性度量,基于时间序列的数据转换为直观的符号表示,他们使用小波分解从多尺度描述时间序列,他们的算法是用来从 ICU 患者确认类似的生理模式血压时间序列,用于检测潜在即将发生的血压恶化[5]。Frolich et al 提出使用心率基线作为产科脊髓低血压的主要预测因子,基本上,他们表明,更高的 HR 基线可能是预测脊髓麻醉后的低血压一个有用的参数[7]。
利用光谱分析心率和 ABP 变化,Pelosi et al 确定在肾透析低血压患者发作的前兆[1]。同样使用频率分析技术,Reich et al 研究心率变化分析和低血压发生的相关性[1]。Chamchad et al 发现非线性心率变化维度分析与在剖腹产的脊椎麻醉后低血压发生的显著相关性[1]。Hanss et al 同样得出结论心率变化分析可以被用来预测脊椎麻醉后的低血压发生,特别地,他们研究特定孕妇和老年人的情况下心率变化功率谱(LF/HF)频率峰值低到高的比例在脊髓麻醉后的低血压发生的预测[1]。Mancini et al 显示心输出量的短期变化与低血压发生的潜在关系[1]。最近,Lee and Mar 研究 ICU 数据存在差别的模式能够指示低血压的发生,基于神经网络,他们提出一种二进制分类方案(正常血压 vs 低血压)和评估策略用于预测未来评价血压数值[1]。
国内目前也有很多大学在研究此相关课题。华南理工大学赖丽娟等人将基于统计学习理论的支持向量机应用于特征参数的训练和分类预测模型的建立中,并比较了不同核函数对 AHE 发生预测模型的影响,另外还提出对发生与未发生 AHE 两者间平均动脉压信号进行小波多尺度分解,并选取各层小波系数的统计特征值中位数和最大值作为信号特征参数,再运用神经网络方法对提取的信号特征参数进行分类预测[21];汕头大学有学者采用粒子群优化算法(PSO)优化初始聚类中心后的 均值(-means)聚类算法对患者的血压数据进行特征提取,并利用支持向量机(SVM)对有无发生 AHE 进行分类预测。总体而言,这些研究都是在国外研究的基础上提出改进方法,对解决 AHE预测问题起到了一定的作用。
....................................
第二章 研究基础
2.1 实验数据获取
2.1.1 生物医学信号研究资源网站
本文数据来源于该网站 MIMIC II 数据库,这些数据都是 ICU 患者的真实数据,选用其中的 ABP 数据作为研究对象。
2.1.2 实验数据获取方法
也可以直接进入 http://www.physio.org/challenge/2009/页面,该页提供了 MIMICII 数据库专为 Challenge 2009 挑战赛提供的用于生理实验的训练数据和测试数据。
................................
2.2 EMD 的基本理论和算法
2.2.1 EMD 基本概念
1) 瞬时频率
在希尔伯特变换方法产生之前,有两个主要原因使得接受瞬时频率的概念较为困难:一是受到傅里叶变换分析的影响;二是瞬时频率没有唯一的定义。当可以使离散数据解析化的希尔伯特变换方法产生以后,瞬时频率的概念得到了统一。对任意时间序列 x(t),可得到它的希尔伯特变换 y(t)如式(2.1):
.......................................
第三章 基于 EMD 与 GEP 组合预测方法.............................................29
3.1 基于 EMD 与 GEP 组合预测方法.................................... 29
3.2 方法的实现 ......................................... 30
3.3 太阳黑子预测实验 ............................................ 33
3.4 本章小结 ................................ 36
第四章 急性低血压预测
4.1 引言
通过前面的讲述,我们了解了 ICU 中 AHE 的发生对患者的严重危害,如果能够通过 ICU 中的监测数据及时预报 AHE 的发生将具有重要的意义。本文引入了一种基于 EMD 分解算法和 GEP 基因表述式算法组合建模方法,通过上一章,介绍了相关算法理论,并进一步通过太阳黑子预测实例演示了该建模方法的具体过程,验证了该建模方法具有良好的性能。本章我们将该方法应用于 AHE 预测问题当中,通过实验演示分析,总结该方法对 AHE 预测的性能。
使用 PhysioNet 网站的 MIMIC-II 数据库中专为 Challenge 2009 挑战赛提供的训练数据集和版本号为 V3.1 的 MIMIC 波形数据库子集的测试数据集实验。Challenge 挑战赛是 Physio 网站与心脏病学用计算机会议(Computers in Cardiology Conference)共同举办的年度系列挑战赛,目的就是预测那些 MIMIC-II 中病人在预测期内是否会发生AHE,提高医护条件以挽救病人[11]。训练数据集共有 48 个患者数据,其中包括有发生 AHE 和未发生 AHE 的数据,在发生 AHE 的数据中,有部分受到了专业医疗干预,有部分则没有;在没有发生 AHE 的数据中,有部分在治疗过程中至始至终都没有发生AHE,有部分则在记录过程前或者记录过程后发生了 AHE。Challenge2009 数据集中的每个数据都为每秒 125HZ 采样,共有 135 万点(3 小时)的动脉血压(ABP)数据。测试数据集共有 45 个患者数据,包含了和训练数据集同样的 4 种类型数据,其中有23 个数据发生的 AHE,有 22 个数据没有发生 AHE。V3.1 数据集中的每个数据都为每秒 1HZ 采样 7200 点(2 小时)的平均动脉压(MAP)数据[11]。通过对两个不同来源的数据集进行实验,可以更加充分验证本方法的性能。
4.2 AHE 的预测过程
由于 AHE 预测问题具有特殊性,要求本方法的预测结果不仅需要较高的准确率,而且要求能够以最快的速度及时地得到预测结果,因为这样的结果才能为医师对患者进行提前干预争取足够的时间。所以针对本问题将预测过程分为三个阶段,第一阶段,数据预处理:经过对数据转换、重采样、消噪、平滑等一系列信号处理,将训练集中的数据转化成可进行分析的数据;第二阶段,建模:使用基于 EMD 与 GEP 的组合预测方法对训练集中的每个数据分别建立模型并保存为模版;第三阶段,预测:对测试集中的数据,通过相关度公式计算,找出与训练数据集已经建模的数据中最匹配的一些数据,通过这些数据的模型预测,并经过加权得出测试数据未来 1 小时内的 MAP信号,最后根据 AHE 的定义判断该数据在未来 1 小时内是否会发生 AHE[1]。
4.2.1 数据预处理
原始的训练数据是通过仪器按 125HZ 采样频率采集的患者动脉血压一维离散数据,数值单位为毫米汞柱 mmHg。在分析之前,我们首先要将这些数据进行预处理,转化为可以用来分析的数据。如图 4.1 所示为数据预处理过程:
1)信号重采样
原始数据采用频率为 125HZ,数据量太大不适宜分析。根据时间序列分析的要求,将原始数据按 1 点/分钟频率重采样序列。简易的方法就是对原始数据,每隔 125 点取一个数据,生成一个新的采用频率为 1HZ 的数据。再通过每 60 点取一个数据,就生成 1 点/分钟的采样数据。通过 Matlab 软件编程实现上述过程,部分代码如图 4.2 所示:
....................................
第五章 总结与展望
5.1 研究总结
随着计算机科学技术的发展,其在各个行业得到了越来越深入广泛的应用。将计算机技术应用于医疗事业,补充由人力无法完成的工作,利用现代信息化手段提升诊疗水平,使普通患者早日疗愈康复,给重病患者带来新的希望。
本研究结合现有的研究实践,在美国PhysioNET网站提供的MIMIC II数据库的ICU患者血压数据基础上,利用信号处理和计算机智能算法,经过理论假设和计算机仿真实验,提出并验证了一种基于 EMD 与 GEP 的组合建模应用于 ICUAHE 发生预测的方法。
AHE 是重症监护室中一种常见的突发疾病,它的发生给患者带来极大的危害,严重时甚至会造成患者死亡。通常在其发生以后,医生根据自己的经验采取一些必要的干预措施。如果能根据 ICU 监测的患者各种数据提前预判 AHE 的发生,给医生予足够的时间提前采取有效的干预措施,将极大的降低患者可能受到的危害。重症监护室ICU 中存在着大量患者的各种监测数据,这些数据作为给医生诊疗的参考依据发挥了重要的作用。但是,由于理论技术的限制,我们知道这些大量数据背后还隐藏的诸多潜在的规律尚未被人们发现利用。在医疗实践中,人们已经发现患者的一些临床信息的变化与 AHE 的发生存在着联系,比较典型的如患者的诊疗历史、医技测试数据和用药记录,以及患者重要的生理信息,如心电、血压、呼吸等。
患者的动脉血压数据 ABP 变化规律能够预示 AHE 的发生。从医疗设备中获取的ABP 由于数据量大,并且带有一定的噪声,直接分析会造成计算量大,精确度难以保证等问题。根据时间序列分析方法,首先将原始的 ABP 数据转换为利于分析的平均动脉压 MAP,再将数据经过重采样、去噪等信号处理手段,变成可分析的时间序列数据。采用 EMD 分解算法,将序列分解为多个本征模态函数。根据 EMD 理论,EMD 不同于小波变换需要设置小波基的限制,它能自适应地将随机信号分解为一组性能较好的具有瞬时频率的固有模态函数(Intrinsic Mode Function, IMF)和具有单调性或一个极值点的余项。本征模态函数表示序列不同特征尺度的分量。相对于原始序列的随机性来说,本征模态函数更加的平稳,有助于其建模和预测。研究使用 GEP 基因表述式算法建立各本征模态函数的数学模型。GEP 基因表述式作为遗传算法和遗传程序设计进化的算法,克服了神经网络需要预先设定结构以及过拟合等一些缺陷,被证明在函数挖掘、符号回归等问题中具有优越的性能。通过上述方法,对历史患者动脉血压数据建立模型。对新的患者数据,通过关联度计算,找出与已知模型中最匹配的一些记录,再用这些记录模型预测后加权计算得出新患者未来 1 个小时内的血压值。最后根据预测值和 AHE 的定义判断患者是否发生 AHE。
通过实验测试,预测准确率达 75%以上。这表明本方法可以作为预测患者 AHE的发生的一种有效方法。论文取得了下列研究成果:
1.提出了一种根据 EMD 分解信号不同特点采用不同时间序列模型的新办法;
2.将 EMD 与 GEP 组合建模方法应用于急性低血压预测问题。
...................................
参考文献(略)