PAI为您提供智能圈选人群功能,您可以通过策略训练任务选择使用内置的智能算法,对人群数据(训练数据)进行训练,生成圈选策略,再基于圈选策略通过人群圈选任务对人群数据(预测数据)进行智能筛选过滤,产出目标人群数据。本文为您介绍使用智能圈选人群功能的操作步骤。
前提条件
已完成运营活动的创建,具体操作,请参见开通用户增长插件并创建运营活动。
步骤一:准备数据
按照数据格式要求准备数据。
策略训练任务输入数据(训练数据集)。
您需要为训练数据集准备用户特征数据,即用户基础信息(user)、物品基础信息(item)、用户行为(behavior)和运营记录(operation)4张维表数据。目录及表的各字段要求,详情请参见策略训练任务输入数据格式说明。
人群圈选任务输入数据(预测数据集)。
您需要按照以下两种场景准备预测数据集。
场景
输入数据
训练数据集和预测数据集完全一致。
您只需准备包含user_id、item_id和phone字段的人群数据表即可,系统会自动从训练数据集读取用户特征数据,具体格式要求,请参见策略训练任务数据说明。
在人群管理页面,使用已准备的人群数据表手动创建人群,方便后续圈选人群时选择人群,具体操作,请参见管理人群。
训练数据集和预测数据集不完全一致。
您需要按照训练数据集格式要求,为预测数据集准备全量用户特征数据,即用户基础信息(user)、物品基础信息(item)、用户行为(behavior)和运营记录(operation)4张维表数据。目录及表的各字段要求,详情请参见策略训练任务输入数据格式说明。
将训练数据集和预测数据集上传到OSS,具体操作,详情请参见控制台上传文件。
为OSS Bucket添加
pai=plugin
标签,具体操作,详情请参见管理存储空间标签。
步骤二:创建策略训练任务
您可以根据不同的运营目的,选择不同的算法策略类型,通过PAI预置的模型在后台分析您的数据并进行训练。具体操作步骤如下。
单击直达策略训练任务页面。
您可以直接打开创建策略训练面板。
在创建策略训练面板,配置参数,并单击提交。
其中关键参数说明如下。
参数
描述
关联运营活动
选择已创建的运营活动。
算法类型
选择不同的算法类型会训练出不同效果的模型,请您根据业务需求和运营目的进行选择。支持以下两种算法类型:
回流概率:更有可能被短信触达召回的用户的概率。
流失预测:根据活跃度对每个用户进行打分,从流失率最高到最低的用户依次进行排序。
输入数据
从OSS导入用户基础信息(user)、物品基础信息(item)、用户行为(behavior)、运营记录(operation)四类数据进行模型训练。
说明首次使用时,您需要单击未授权,点击一键授权进行授权,如果一键授权失败,请参见附录:PAI-Plugin相关服务说明。
训练参数
选择训练数据的起始日期和结束日期。
当算法类型选择回流概率时,需要配置运营表目标,即运营记录(operation)表中target列的目标值。
当算法类型选择流失预测时,需要配置流失天数。
步骤三:创建人群圈选任务
当模型训练完成并生成圈选策略时,即策略训练任务状态为成功时,您可以使用圈选策略对您的目标用户进行预测并圈选,具体操作步骤如下。
单击直达创建人群圈选页面。
您可以直接打开创建人群圈选面板。
在创建人群圈选面板,配置参数,并单击提交。
重要每次进行人群圈选前,为提高预测结果的准确性,请您将最新数据更新到OSS。
其中关键参数说明如下。
参数
描述
关联运营活动
选择已创建的运营活动。
关联策略训练
选择运营活动下已创建的且状态为成功的策略训练任务。
输入数据
支持以下两种输入方式:
选择人群:当您的训练数据集和预测数据集完全一致时,您可以从已创建的人群列表中选择人群。
选定OSS文件或目录:当您的训练数据集和预测数据集不完全一致时,您可以通过该方式上传预测数据集。
输出数据
选择输出数据所在的地域和OSS目录。
重要输出数据路径需要为空目录,否则可能会导致输出目录中存在多个任务的人群文件。
圈选参数
输入预测阈值,取值范围(0,1),Double类型。
模型对待圈选用户的打分大于该值时,该用户会被圈选出来。
人群圈选任务创建成功且圈选完成后,系统会自动在人群管理页签创建来源为算法生成的人群包。您可以在输出数据配置的OSS目录,找到名为output.csv的文件,该文件不包含表头,各字段含义,详情请参见策略训练任务数据说明。
后续步骤
智能圈选完成后,您可以在人群管理页面,手动上传圈选出的userid对应的手机号和变量模板的短信内容,具体操作,详情请参见管理人群。