全部产品
阿里云办公

心脏病预测

更新时间:2017-06-07 13:26:11

点此咨询顾问

心脏病是人类健康的头号杀手。全世界1/3的人口死亡是因心脏病引起的,而我国,每年有几十万人死于心脏病。 通过采集人体相关的体侧指标,并运用数据挖掘的方式来分析不同特征对于心脏病的影响,可以对于预测和预防心脏病将起到至关重要的作用。

业务痛点及需求

1. 如何通过医疗大数据预测疾病是否发生

数据截图

心脏病预测1

2. 如何评价医疗体系大数据架构的结果准确性

系统架构

采用阿里云机器学习平台子上而下搭建实验

架构图:

心脏病预测2

模型训练和预测

本次实验是监督学习,因为我们已经知道每个样本是否患有心脏病,所谓监督学习就是已知结果来训练模型。解决的问题是预测一组用户是否患有心脏病。

1)拆分首先通过拆分组件将数据分为两部分,本次实验按照训练集和预测集7:3的比例拆分。训练集数据流入逻辑回归二分类组件用来训练模型,预测集数据进入预测组件。

2)逻辑回归二分类逻辑回归是一个线性模型,在这里通过计算结果的阈值实现分类。具体的算法详情推荐大家在网上或者书籍中自行了解。逻辑回归训练好的模型可以在模型页签中查看。

心脏病预测3

3)预测预测组件的两个输入分别是模型和预测集。预测结果展示的是预测数据、真实数据、每组数据不同结果的概率。

评估

通过以上数据探索的流程我们可以得到以下的结论。

1)特征权重我们可以通过过滤式特征选择得到每个特征对于结果的权重。

心脏病预测4

  • 可以看出thalach(心跳数)对于是否发生心脏病影响最大。
  • 性别对于心脏病没有影响

2)模型效果通过上文提供的14个特征,可以达到百分之八十多的心脏病预测准确率。模型可以用来做预测,辅助医生预防和治疗心脏病。

优势

算法成熟度

阿里云机器学习平台提供了成熟的数据挖掘算法。本案例使用的相关图算法全部来自于集团内部项目的沉淀,经历过超大规模数据的锤炼。在算法的精确度和效率方面都是世界领先水平。

简便的操作界面

阿里云机器学习平台采用拖拉拽的方式进行组件操作,及时是毫无数据挖掘经验的从业者,经过简单的学习,也可以轻松通过拖拉等操作玩转大数据。

使用产品

点此咨询顾问