心脏病严重影响人们的生命健康,如果可以通过人体相关体测指标,分析不同特征对心脏病的影响,则可以有效预防心脏病。本实验基于真实的心脏病患者体侧数据,为您介绍如何通过数据挖掘算法构建心脏病预测模型。
数据挖掘流程

数据集
本实验的数据集为UCI开源数据集,详情请参见Heart Disease Data Set。该数据集包含了303条美国某区域的心脏病检查患者的体测数据,具体字段如下。
字段名 | 类型 | 描述 |
---|---|---|
age | STRING | 对象的年龄。 |
sex | STRING | 对象的性别,取值为female或male。 |
cp | STRING | 胸部疼痛类型,痛感由重到轻依次为typical、atypical、non-anginal及asymptomatic。 |
trestbps | STRING | 血压。 |
chol | STRING | 胆固醇。 |
fbs | STRING | 空腹血糖。如果血糖含量大于120mg/dl,则取值为true,否则取值为false。 |
restecg | STRING | 心电图结果是否有T波,由轻到重依次为norm和hyp。 |
thalach | STRING | 最大心跳数。 |
exang | STRING | 是否有心绞痛。true表示有心绞痛,false表示没有心绞痛。 |
oldpeak | STRING | 运动相对于休息的ST Depression,即ST段压值。 |
slop | STRING | 心电图ST Segment的倾斜度,程度取值包括down、flat及up。 |
ca | STRING | 透视检查发现的血管数。 |
thal | STRING | 病发种类,由轻到重依次为norm、fix及rev。 |
status | STRING | 是否患病。buff表示健康,sick表示患病。 |
心脏病预测
- 进入PAI-Studio控制台。
- 登录PAI控制台。
- 在左侧导航栏,选择 。
- 在PAI可视化建模页面,单击进入机器学习。
- 构建实验。
- 运行实验并查看输出结果。
- 单击画布上方的运行。
- 实验运行结束后,右键单击画布中的逻辑回归二分类-1,在快捷菜单,单击 ,即可查看训练完成的心脏病预测模型。
- 右键单击画布中的预测-1,在快捷菜单,单击查看数据,即可查看模型预测结果。
- 查看模型效果。