《大数据背景下医疗智能诊断数据分析与入院风险预测》探讨了统计学、机器学习、数据挖掘方法在疾病辅助诊断中的应用,通过实地调研获得了某医院心脏病超声心动图报告和500多份样本数据。首先,运用数据分析和挖掘的有关方法对数据进行预处理、数据筛选等操作;其次,选取了机器学习中的朴素贝叶斯、决策树、BP神经网络、随机森林等方法进行模型学习并对模型参数进行调优;最后,分析了实验的结果,对各个模型的性能进行比较,《大数据背景下医疗智能诊断数据分析与入院风险预测》在特征选取时进行统计学检验分析,利用机器学习技术进行智能辅助诊断预测分析,提出了针对心脏病患者病情严重程度分级策略和入院治疗风险的预测方法。
随着生活质量的提升和人口老龄化的加剧,各种疾病威胁着人类的健康,而现有的医疗资源和医疗水平还十分有限,且地区差异巨大,医生的时间与精力也不能满足众多病人个性化的医疗需要。因此,辅助诊断技术开始逐渐被应用到各种医疗诊断中,但是如何从大量医疗数据中挖掘各类病症之间的联系,为患者提供更好的辅助诊断服务,仍需要深入研究和探索。
本书探讨了统计学、机器学习、数据挖掘方法在疾病辅助诊断中的应用,通过实地调研获得了某医院心脏病超声心动图报告和500多份样本数据。首先,运用数据分析和挖掘的有关方法对数据进行预处理、数据筛选等操作;其次,选取了机器学习中的朴素贝叶斯、决策树、BP神经网络、随机森林等方法进行模型学习并对模型参数进行调优;最后,分析了实验的结果,对各个模型的性能进行比较,本书在特征选取时进行统计学检验分析,利用机器学习技术进行智能辅助诊断预测分析,提出了针对心脏病患者病情严重程度分级策略和入院治疗风险的预测方法。
本书创新之处:第一,从实地调研中采集了真实病人的数据,并与医生积极沟通,获得了心脏病患者病情严重程度主要指标及手术风险的评判标准;第二,根据医生经验和特征构建方法对实验数据的特征进行降维处理,极大地降低了变量特征的维度,提高了实验结果的准确性;第三,应用数据科学的研究方法,在诊断分类和入院风险预测中将机器学习与统计分析两种数据挖掘方法结合使用,提升了预测的准确率。
本书共分7章,各章组织如下:第1章介绍医疗数据挖掘与智能辅助诊断系统概述;第2章介绍医疗数据挖掘方法及关键技术;第3章介绍基于统计方法的医疗数据分析与挖掘;第4章介绍基于BP神经网络模型的医疗分类预测;第5章介绍基于随机森林模型的入院风险预测;第6章介绍心脏病辅助诊断原型系统实现;第7章是对本书的总结与展望。
杨成伟,男,出生于1981年11月,就职于管理科学与工程学院,任教师,学历博士,主讲文化产业项目设计与指导。
第1章 医疗数据挖掘与智能辅助诊断系统概述
1.1 研究背景及意义
1.2 研究目的及方法
1.3 国内外研究现状
1.4 本书的主要创新之处
1.5 本书组织结构
1.6 本章小结
第2章 医疗数据挖掘方法与关键技术
2.1 医疗数据的基本特征
2.2 数据预处理方法
2.3 医疗数据挖掘的基本流程
2.4 医疗数据挖掘的关键技术
2.5 本章小结
第3章 基于统计方法的医疗数据分析与挖掘
3.1 基于统计分析的模型及方法
3.2 医疗数据挖掘的主要软件和工具
3.3 基于心脏病数据的医疗统计分析与挖掘
3.4 本章小结
第4章 基于BP神经网络模型的医疗分类预测
4.1 神经网络
4.2 心脏病分类预测实验过程
4.3 本章小结
第5章 基于随机森林模型的人院风险预测
5.1 随机森林
5.2 入院风险预测实验过程
5.3 模型学习及参数调优
5.4 模型评估
5.5 实验总结
5.6 本章小结
第6章 心脏病辅助诊断原型系统实现
6.1 背景及功能
6.2 开发环境
6.3 系统分析与设计
6.4 系统实现
6.5 系统问卷评估
6.6 本章小结
第7章 总结与展望
7.1 本书总结
7.2 不足与展望
附录
附录1 调查问卷
附录2 对用户输入分词预处理代码
参考文献