本文为您介绍人群圈选任务的输入数据和输出数据说明。

圈选任务输入数据说明

准备输入数据

  • 当您的训练数据集和预测数据集完全一致时,即user_id是完全相同的一批数据,您只需按照下方输入数据格式说明准备人群数据即可。
    说明 您无需准备特征数据,系统会从人群圈选任务关联的策略训练任务的输入数据中自动获取。
  • 当您的训练数据集和预测数据集不完全一致时,您需要为待圈选用户准备特征数据,即用户基础信息(user)、物品基础信息(item)、用户行为(behavior)和运营记录(operation)4张维表数据,具体格式要求,详情请参见策略训练任务输入数据格式说明
    重要 为保证圈选结果的准确性,请您为待圈选用户准备最新的特征数据。
例如:您一共有100万条用户数据,参考以下两种场景,准备输入数据。
场景 圈选任务输入数据
其中5万条数据同时为训练数据集和预测数据集。 您只需按照输入数据格式说明准备5万条包含user_iditem_idphone字段的人群数据。
其中5万条数据为训练数据集,100万条数据为预测数据集。 您需要按照策略训练任务输入数据格式说明,为100万条预测数据集准备用户基础维表(user)、物品基础维表(item)、行为维表(behavior)和运营记录维表(operation)四张维表数据。

输入数据格式说明

人群圈选任务包含以下两类输入数据:
  • 待圈选人群数据,各字段定义如下表所示。
    字段名称 描述
    user_id 待圈选的用户ID,String类型,不能为空。
    item_id 物品ID,String类型,不能为空。
    phone 待圈选的用户的手机号,String类型。
    • 当算法类型为回流概率时,输入数据包含user_iditem_idphone字段。
    • 当算法类型为流失预测时,输入数据包含user_idphone字段。
  • 待圈选人群特征数据

    系统从人群圈选任务关联的策略训练任务的输入数据中自动获取,请确保每天更新策略训练任务的输入数据。

圈选任务输出数据格式说明

圈选任务圈选完成后,输出的数据格式说明如下表所示。
列名 描述
user_id 待圈选的用户ID,String类型,不能为空。
item_id 物品ID,String类型,不能为空。
phone 待圈选的用户的手机号,String类型。
score 模型对该user_id的打分。