本文为您介绍人群圈选任务的输入数据和输出数据说明。
圈选任务输入数据说明
准备输入数据
- 当您的训练数据集和预测数据集完全一致时,即user_id是完全相同的一批数据,您只需按照下方输入数据格式说明准备人群数据即可。
说明 您无需准备特征数据,系统会从人群圈选任务关联的策略训练任务的输入数据中自动获取。
- 当您的训练数据集和预测数据集不完全一致时,您需要为待圈选用户准备特征数据,即用户基础信息(user)、物品基础信息(item)、用户行为(behavior)和运营记录(operation)4张维表数据,具体格式要求,详情请参见策略训练任务输入数据格式说明。
重要 为保证圈选结果的准确性,请您为待圈选用户准备最新的特征数据。
场景 | 圈选任务输入数据 |
---|---|
其中5万条数据同时为训练数据集和预测数据集。 | 您只需按照输入数据格式说明准备5万条包含user_id、item_id和phone字段的人群数据。 |
其中5万条数据为训练数据集,100万条数据为预测数据集。 | 您需要按照策略训练任务输入数据格式说明,为100万条预测数据集准备用户基础维表(user)、物品基础维表(item)、行为维表(behavior)和运营记录维表(operation)四张维表数据。 |
输入数据格式说明
人群圈选任务包含以下两类输入数据:
- 待圈选人群数据,各字段定义如下表所示。
字段名称 描述 user_id 待圈选的用户ID,String类型,不能为空。 item_id 物品ID,String类型,不能为空。 phone 待圈选的用户的手机号,String类型。 - 当算法类型为回流概率时,输入数据包含user_id、item_id和phone字段。
- 当算法类型为流失预测时,输入数据包含user_id和phone字段。
- 待圈选人群特征数据
系统从人群圈选任务关联的策略训练任务的输入数据中自动获取,请确保每天更新策略训练任务的输入数据。
圈选任务输出数据格式说明
圈选任务圈选完成后,输出的数据格式说明如下表所示。
列名 | 描述 |
---|---|
user_id | 待圈选的用户ID,String类型,不能为空。 |
item_id | 物品ID,String类型,不能为空。 |
phone | 待圈选的用户的手机号,String类型。 |
score | 模型对该user_id的打分。 |