在用户增长解决方案中,通过流失用户召回子解决方案可以对用户进行流失预测,从而对高风险流失用户进行召回。本文介绍如何使用PAI-Studio提供的算法组件,构建用户流失预测召回模型。
背景信息
用户增长解决方案包含流失用户召回、用户LTV预测及买量预测等多个子解决方案。通过用户增长解决方案,您可以更精细化地进行流量运营。PAI团队在相关领域具有丰富实践经验,通过机器学习手段帮助多家互联网公司提升其流失用户召回率达30%以上。
在用户增长解决方案中,需要使用阿里云计算平台的多款产品:

- 底层计算引擎使用MaxCompute(阿里云自研大数据平台)或EMR(开源Hadoop体系)计算引擎。
- 数仓层使用DataWorks工具,供数据工程师开发用户标签。
- 模型训练层使用PAI-Studio或EMR-DS等建模工具。

数据准备
在App流失用户召回场景中,首先需要准备一份用户登录相关的数据,数据具体说明如下。
参数 | 类型 | 描述 |
---|---|---|
app_key | STRING | App唯一标识 |
Umid | STRING | 设备ID |
install_channel | STRING | 首次安装渠道 |
app_channel | STRING | App当前渠道 |
sdk_version | STRING | SDK版本 |
app_version | STRING | App当前版本 |
event_name | STRING | 自定义事件名字 |
svr_timestamp | STRING | 服务器时间戳 |
pre_app_version | STRING | 升级前版本 |
screen_width | Bigint | 分辨率宽度 |
screen_height | Bigint | 分辨率高度 |
os_version | STRING | 操作系统版本 |
device_brand | STRING | 设备品牌 |
device_model | STRING | 设备机型 |
country | STRING | 国家 |
province | STRING | 省 |
city | STRING | 城市 |
is_wifi | STRING | 是否使用Wi-Fi,其中:
|
imei | STRING | IMEI |
idfa | STRING | IDFA |
is_new_install | STRING | 新老用户,其中:
|
cli_timestamp | BIGINT | 客户端时间戳 |
event_kv_json | STRING | 参数和参数值数据,JSON结构。 |
session_id | STRING | 会话ID |
provider | STRING | 用户通过第三方账号登录时的标识符 |
puid | STRING | App用户账号ID |
android_id | STRING | Android ID |
oaid | STRING | OAID(匿名设备标识符) |
system_properties | STRING | 系统属性(扩展字段) |
event_type | STRING | 事件类型,其中:
|
构建实验
在PAI-Studio中,已经预置了新用户流失召回实验模板。您可以从实验模板快速创建实验,并在此实验基础上通过拖拽形式构建自定义实验。PAI-Studio提供100余种机器学习算法组件供您使用,在流失预测用户召回场景中,需要使用One-Hot编码、逻辑回归、预测及二分类评估等组件。
后续步骤
您可以将训练完成的模型部署为服务,从而进行在线调用。