用户流失预警风控

本文为您介绍如何通过PAI提供的用户特征算法,快速构建用户流失模型。

背景信息

业务发展过程中的重要环节包括开拓新用户和保留老用户。通过建立用户流失预警风控模型,可以预测潜在流失用户,从而提前通过运营手段防范用户流失。

对于用户流失预警监控,主流预警方案均是基于规则实现的,缺少智能化的预测手段和机制,不能准确挖掘潜在流失用户。

解决方案

PAI提供了一套基于标签数据的特征编码、分类模型训练及模型评估的完整方案,具体要求如下:

  • 人力要求:需要具备基础建模的背景知识。

  • 开发周期:1~2天。

  • 数据要求:上千条的标签数据,该数据标记了历史客户在哪种特征情况下流失。

数据集

本工作流数据来源于真实的电信领域客户行为脱敏数据,包含用户基本信息及用户流失属性,共7043条样本数据。工作流的示例数据如下。用户流失预警实验数据特征数据包括如下字段。

参数

描述

customerid

用户ID。

gender

性别。

SeniorCitizen

是否为市民,其中:

  • 1:是市民。

  • 0:非市民。

Partner

是否有Partner。

Dependents

是否存在从属关系。

tenure

客户在该公司的使用时长。

PhoneService

是否提供手机服务。

MultipleLine

是否存在多条线路。

InternetService

互联网服务商。例如DSLFiber optic

OnlineSecurity

是否存在互联网在线安全问题。

OnlineBackup

是否提供线上支持。

DeviceProtection

是否提供设备保护。

TechSupport

是否申请过技术支持。

StreamingTV

是否提供流TV。

StreamingMovies

是否提供流电影。

Contract

合同时限。例如Month-to-monthTwo year

PaperlessBilling

是否有电子账单。

PaymentMethod

付款方式。

MonthlyCharges

月消费。

TotalCharges

总消费。

目标数据包括如下字段。

参数

描述

churn

用户是否流失。

用户流失预警风控

  1. 进入PAI-Designer页面。

    1. 登录PAI控制台

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

    3. 在工作空间页面的左侧导航栏选择模型开发与训练 > 可视化建模(Designer),进入Designer页面。

  2. 构建工作流。

    1. PAI-Designer页面,单击预置模板页签。

    2. 在模板列表的流失用户监控区域,单击创建

    3. 新建工作流对话框,配置参数(可以全部使用默认参数)。

      其中:工作流数据存储配置为OSS Bucket路径,用于存储工作流运行中产出的临时数据和模型。

    4. 单击确定

      您需要等待大约十秒钟,工作流可以创建成功。

    5. 在工作流列表,双击流失用户监控工作流,进入工作流。

    6. 系统根据预置的模板,自动构建工作流,如下图所示。

      用户流失工作流

      区域

      描述

      工作流的数据集。

      通过one-hot编码组件和SQL脚本实现特征工程建模,将原始字符型特征转化为数值型。以目标字段churn为例,原始数据为YesNo,可以通过SQL语句将Yes转化为1,将No转化为0,示例如下。

      select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};

      将数据分为训练数据集和预测数据集。因为某用户只有流失与不流失两种可能性,所以用户流失预警属于二分类问题,可以使用二分类算法进行处理。

      使用二分类评估组件进行模型验证,可以通过AUC、KSF1Score等指标评估模型效果。

  3. 运行工作流并查看模型效果。

    1. 单击画布上方的运行

    2. 工作流运行结束后,右键单击画布中的二分类评估,在快捷菜单,单击可视化分析

    3. 二分类评估对话框,单击指标数据页签,即可查看模型评估指标数据。

      模型效果AUC取值越接近1,表示模型的预测准确率越高。本文中的AUC取值达到0.8以上,即模型的预测准确率较高。