文档

智能圈选人群

更新时间:

PAI为您提供智能圈选人群功能,您可以通过策略训练任务选择使用内置的智能算法,对人群数据(训练数据)进行训练,生成圈选策略,再基于圈选策略通过人群圈选任务对人群数据(预测数据)进行智能筛选过滤,产出目标人群数据。本文为您介绍使用智能圈选人群功能的操作步骤。

前提条件

已完成运营活动的创建,具体操作,请参见开通用户增长插件并创建运营活动

步骤一:准备数据

  1. 按照数据格式要求准备数据。

    • 策略训练任务输入数据(训练数据集)。

      您需要为训练数据集准备用户特征数据,即用户基础信息(user)、物品基础信息(item)、用户行为(behavior)和运营记录(operation)4张维表数据。目录及表的各字段要求,详情请参见策略训练任务输入数据格式说明

    • 人群圈选任务输入数据(预测数据集)。

      您需要按照以下两种场景准备预测数据集。

      场景

      输入数据

      训练数据集和预测数据集完全一致。

      您只需准备包含user_iditem_idphone字段的人群数据表即可,系统会自动从训练数据集读取用户特征数据,具体格式要求,请参见策略训练任务数据说明

      人群管理页面,使用已准备的人群数据表手动创建人群,方便后续圈选人群时选择人群,具体操作,请参见管理人群

      训练数据集和预测数据集不完全一致。

      您需要按照训练数据集格式要求,为预测数据集准备全量用户特征数据,即用户基础信息(user)、物品基础信息(item)、用户行为(behavior)和运营记录(operation)4张维表数据。目录及表的各字段要求,详情请参见策略训练任务输入数据格式说明

  2. 将训练数据集和预测数据集上传到OSS,具体操作,详情请参见控制台上传文件

  3. 为OSS Bucket添加pai=plugin标签,具体操作,详情请参见管理存储空间标签

步骤二:创建策略训练任务

您可以根据不同的运营目的,选择不同的算法策略类型,通过PAI预置的模型在后台分析您的数据并进行训练。具体操作步骤如下。

  1. 单击直达策略训练任务页面

    您可以直接打开创建策略训练面板。

  2. 创建策略训练面板,配置参数,并单击提交

    其中关键参数说明如下。

    参数

    描述

    关联运营活动

    选择已创建的运营活动。

    算法类型

    选择不同的算法类型会训练出不同效果的模型,请您根据业务需求和运营目的进行选择。支持以下两种算法类型:

    • 回流概率:更有可能被短信触达召回的用户的概率。

    • 流失预测:根据活跃度对每个用户进行打分,从流失率最高到最低的用户依次进行排序。

    输入数据

    从OSS导入用户基础信息(user)、物品基础信息(item)、用户行为(behavior)、运营记录(operation)四类数据进行模型训练。

    说明

    首次使用时,您需要单击未授权,点击一键授权进行授权,如果一键授权失败,请参见附录:PAI-Plugin相关服务说明

    训练参数

    选择训练数据的起始日期结束日期

    • 当算法类型选择回流概率时,需要配置运营表目标,即运营记录(operation)表中target列的目标值。

    • 当算法类型选择流失预测时,需要配置流失天数

步骤三:创建人群圈选任务

当模型训练完成并生成圈选策略时,即策略训练任务状态为成功时,您可以使用圈选策略对您的目标用户进行预测并圈选,具体操作步骤如下。

  1. 单击直达创建人群圈选页面

    您可以直接打开创建人群圈选面板。

  2. 创建人群圈选面板,配置参数,并单击提交

    重要

    每次进行人群圈选前,为提高预测结果的准确性,请您将最新数据更新到OSS。

    其中关键参数说明如下。

    参数

    描述

    关联运营活动

    选择已创建的运营活动。

    关联策略训练

    选择运营活动下已创建的且状态为成功的策略训练任务。

    输入数据

    支持以下两种输入方式:

    • 选择人群:当您的训练数据集和预测数据集完全一致时,您可以从已创建的人群列表中选择人群。

    • 选定OSS文件或目录:当您的训练数据集和预测数据集不完全一致时,您可以通过该方式上传预测数据集。

    输出数据

    选择输出数据所在的地域和OSS目录。

    重要

    输出数据路径需要为空目录,否则可能会导致输出目录中存在多个任务的人群文件。

    圈选参数

    输入预测阈值,取值范围(0,1),Double类型。

    模型对待圈选用户的打分大于该值时,该用户会被圈选出来。

    人群圈选任务创建成功且圈选完成后,系统会自动在人群管理页签创建来源为算法生成的人群包。您可以在输出数据配置的OSS目录,找到名为output.csv的文件,该文件不包含表头,各字段含义,详情请参见策略训练任务数据说明

后续步骤

智能圈选完成后,您可以在人群管理页面,手动上传圈选出的userid对应的手机号和变量模板的短信内容,具体操作,详情请参见管理人群

  • 本页导读 (1)
文档反馈