本文为您介绍如何通过PAI提供的用户特征算法,快速构建用户流失模型。

背景信息

业务发展过程中的重要环节包括开拓新用户和保留老用户。通过建立用户流失预警风控模型,可以预测潜在流失用户,从而提前通过运营手段防范用户流失。

对于用户流失预警监控,主流预警方案均是基于规则实现的,缺少智能化的预测手段和机制,不能准确挖掘潜在流失用户。

解决方案

PAI提供了一套基于标签数据的特征编码、分类模型训练及模型评估的完整方案,具体要求如下:
  • 人力要求:需要具备基础建模的背景知识。
  • 开发周期:1~2天。
  • 数据要求:上千条的标签数据,该数据标记了历史客户在哪种特征情况下流失。

数据集

本实验数据来源于真实的电信领域客户行为脱敏数据,包含用户基本信息及用户流失属性,共7043条样本数据。实验的示例数据如下。用户流失预警实验数据特征数据包括如下字段。
参数 描述
customerid 用户ID。
gender 性别。
SeniorCitizen 是否为市民,其中:
  • 1:是市民。
  • 0:非市民。
Partner 是否有Partner。
Dependents 是否存在从属关系。
tenure 客户在该公司的使用时长。
PhoneService 是否提供手机服务。
MultipleLine 是否存在多条线路。
InternetService 互联网服务商。例如DSLFiber optic
OnlineSecurity 是否存在互联网在线安全问题。
OnlineBackup 是否提供线上支持。
DeviceProtection 是否提供服务保护。
TechSupport 是否申请过技术支持。
StreamingTV 是否提供流TV。
StreamingMovies 是否提供流电影。
Contract 合同时限。例如Month-to-monthTwo year
PaperlessBilling 是否有电子账单。
PaymentMethod 付款方式。
MonthlyCharges 月消费。
TotalCharges 总消费。
目标数据包括如下字段。
参数 描述
churn 用户是否流失。

用户流失预警风控

  1. 进入PAI-Studio控制台。
    1. 登录PAI控制台
    2. 在左侧导航栏,选择模型开发和训练 > Studio-可视化建模
    3. PAI可视化建模页面,单击进入机器学习进入机器学习
  2. 构建实验。
    1. 在PAI-Studio控制台的左侧导航栏,单击首页
    2. 模板列表,单击流失用户监控下的从模板创建
    3. 新建实验对话框,配置参数(可以全部使用默认参数)。
      参数 描述
      名称 输入流失用户监控
      项目 不支持修改。
      描述 输入通过算法挖掘潜在流失用户
      位置 选择我的实验
    4. 单击确定
    5. 可选:等待大约十秒钟,在PAI-Studio控制台的左侧导航栏,单击实验
    6. 可选:我的实验下,单击流失用户监控_XX
      其中我的实验为已配置的实验位置流失用户监控_XX为已配置的实验名称_XX为系统自动添加的实验序号)。
    7. 系统根据预置的模板,自动构建实验,如下图所示。
      用户流失实验
      区域 描述
      实验的数据集。
      通过one-hot编码组件和SQL脚本实现特征工程建模,将原始字符型特征转化为数值型。以目标字段churn为例,原始数据为YesNo,可以通过SQL语句将Yes转化为1,将No转化为0,示例如下。
      select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};
      将数据分为训练数据集和预测数据集。因为某用户只有流失与不流失两种可能性,所以用户流失预警属于二分类问题,可以使用二分类算法进行处理。
      使用二分类评估组件进行模型验证,可以通过AUC、KS及F1Score等指标评估模型效果。
  3. 运行实验并查看模型效果。
    1. 单击画布上方的运行
    2. 实验运行结束后,右键单击画布中的二分类评估-1,在快捷菜单,单击查看评估报告
    3. 评估报告对话框,单击指标数据页签,即可查看模型评估指标数据。
      模型效果其中AUC值表示该实验模型的预测准确率达到了80%以上。