医学大数据挖掘不仅可以为人类带来更好的医疗健康服务,更为重要的是,可以揭示海量数据中蕴含的深刻科学规律,获取新知识和新发现,促进医学研究和技术的进步。
《医学大数据挖掘方法与应用(2018北医基金)》从医学大数据面临的机遇与挑战讲起,概述了国际上有代表性的医学大数据库内容及特点,之后依次阐述了医学大数据预处理的主要原则、过程和混杂因素的控制方法,以及数据挖掘常用的软件平台和机器学习算法与技术,并就回归方程、数据降维、关联规则、大数据预测建模等常用的数据分析方法进行讲解。
此外,《医学大数据挖掘方法与应用(2018北医基金)》还介绍了生物信息大数据挖掘的常用网站与使用方法,供生物信息挖掘爱好者参考。
《医学大数据挖掘方法与应用(2018北医基金)》的每一章都附有案例,便于读者理解和掌握医学大数据挖掘的相关理论与方法,使《医学大数据挖掘方法与应用(2018北医基金)》具有较高的实用性和可操作性。
随着计算机、互联网、大数据、云计算、人工智能、可穿戴健康医疗设备的产生与发展,人类社会各行各业已进入了全新的数字化时代。健康医疗领域和其他行业一样,随着信息化的逐渐广泛和深入,每天都会产生海量的多源、异构医学大数据。对医学大数据开展多维度的数据挖掘,不仅可以揭示海量医学数据中蕴含的深刻科学规律,获取新知识和新发现,促进医学本身的发展,更为重要的是,可以为人们带来更安全、更有效的健康医疗服务。因此,如何充分认识、挖掘和利用医学大数据,发现医学大数据的价值,把数据库变成知识库,已成为广大医学科研工作者共同关注的焦点。
《医学大数据挖掘方法与应用》一书正是基于以上背景,在从事医学数据挖掘相关专业人员的共同努力下编写而成。本书按照大数据挖掘的基本步骤与原则进行内容编排与组织,力求全面。全书共分20章,第一章介绍医学大数据当前所面临的机遇与挑战;第二章介绍目前国际上有代表性的医学健康相关大数据库的内容及特点;第三章至第六章介绍医学大数据预处理的主要步骤、过程与方法;第七章至第十章针对医学大数据特点,介绍当前常用的一些控制混杂因素的方法;第十一章和第十二章介绍数据挖掘常用的软件平台和机器学习算法与技术;第十三章至第十七章重点介绍回归方程、关联规则、数据降维、大数据预测建模等常用的数据分析方法在医学大数据挖掘中的应用;第十八章介绍生物信息挖掘的常用网站与方法,旨在为生物信息挖掘爱好者提供参考;第十九章和第二十章分别以北京大学信息中心住院病案首页数据和宁波市鄞州区健康大数据平台作为实例,介绍数据挖掘过程与应用方向。
由于我们能力与水平所限,本书难免有错误、疏漏或不当之处,恳请学界前辈、专家、同仁及各方读者提出批评、意见和建议。在医学大数据时代,让我们抓住机遇,共同努力与进步。
第一章 医学大数据面临的机遇与挑战
第一节 医学大数据的基本特点
第二节 医学大数据研究
第三节 医学大数据的应用
第四节 医学大数据面临的挑战
小结
第二章 医学大数据介绍
第一节 医学大数据来源
第二节 大型医学数据库介绍
第三节 医学大数据评估
小结
第三章 数据提取
第一节 数据提取概述
第二节 医学结构化数据的提取
第三节 医学非结构化数据的提取
小结
第四章 数据预处理
第一节 数据挖掘实施步骤
第二节 医学数据的常见问题
第三节 数据预处理
小结
第五章 缺失数据处理
第一节 缺失值产生的原因
第二节 缺失值的处理方法
小结
第六章 离群值处理
第一节 离群值的定义及产生
第二节 离群值的识别及检测
第三节 离群值的处理
小结
第七章 模型验证与敏感性分析在医学大数据研究中的应用
第一节 模型验证与敏感性分析概述
第二节 模型验证与敏感性分析应用实例
小结
第八章 工具变量法在医学大数据挖掘中的应用
第一节 工具变量法的基本原理
第二节 工具变量法的应用实例
第三节 工具变量法在使用过程中的若干问题
小结
第九章 倾向性评分在医学大数据分析中的应用
第一节 背景概述
第二节 倾向性评分的原理和应用条件
第三节 倾向性评分的步骤
第四节 倾向性评分法在医学大数据分析中的实际应用
第五节 倾向性评分匹配法在统计软件中的实现
第六节 倾向性评分的局限性
小结
第十章 竞争性分析
第一节 竞争风险模型的基本应用
第二节 竞争风险模型的应用实例
小结
……
第十一章 大数据挖掘常用的机器学习算法
第十二章 大数据分析和挖掘的常用软件及平台
第十三章 回归方程在医学大数据挖掘中的应用
第十四章 基于变量选择的数据降维模型
第十五章 关联规则挖掘在医学大数据挖掘中的应用
第十六章 医学大数据预测模型的评价与验证
第十七章 XGBoost模型在医学大数据预测建模中的应用
第十八章 生物信息挖掘的基本方法
第十九章 住院病案首页与气象及大气污染数据挖掘应用
第二十章 宁波市鄞州区健康大数据平台在疾病管理中的应用
彩图