为保证数据顺利快速分析,不同数据表需事先按照特定格式进行数据存储。本章节分别介绍标签数据集、RFM模型、AIPL模型、行为数据集等数据表存储样例。

标签数据集样例

ADS大宽表示例:

user_id ID_type1 ID_type2 性别 最近90天巧克力偏好 注册时间 年龄 最近30天消费金额 ......
a0001 b0001 c0001 0.8 2018/10/21 23 30 ......
a0002 b0002 c0002 0.5 2018/10/21 52 50 ......
说明 user_id用作人群圈选、洞察的用户唯一标识。

标签加工需求:

字段类型 加工方式 数据格式 调度需求
文本型单枚举值 保留原值 string 大宽表建议日粒度更新
文本型多枚举值 不建议,多枚举值将在标签选择时有过多的组合 string
日期型 保留原值 datetime/date
数值型 保留原值 double/bigint

RFM模型样例

RFM模型支持两种数据表:客户数据以及交易数据。两种表样例如下所示。

客户数据

将最近N天的原始数据聚合成以客户为粒度的标签数据(聚合后的数据量建议保持在1亿行以内),表中每个客户只存在一条数据。

客户数据表示例:

user_id lastest_trade_date trade_money_summary trade_count ID_type1 ID_type2 ID_type...
user1 2019/8/23 12:36:54 345.55 2 b0001 c0001 ......
user12 2018/7/12 PM 12:36:54 356.1 1 b0002 c0002 ......

字段格式要求:

字段名 数据格式 描述
user_id string 用户标识,模型中用户标识类型通常选择oneid。字段值唯一
lastest_trade_date 日期型 最近一次交易日期
trade_money_summary 数值型 交易金额汇总
trade_count 数值型 交易次数汇总
ID_type1 string
ID_type2 string
ID_type string

交易数据

适用于分析小规模(建议1亿行以内)的交易数据,每一行表示一条用户交易记录,交易记录包含客户标识、交易日期(日期类型)、交易金额(数值类型)信息。

交易数据表示例:

order_id user_id trade_date trade_money ID_type1 ID_type2 ID_type...
x1 user1 2019/6/24 PM 12:36:54 124 b0001 c0001 ......
x2 user1 2019/8/23 12:36:54 222.55 b0002 c0002 ......
x3 user2 2018/7/12 PM 12:36:54 356.1 b0003 c0003 ......

字段格式要求:

字段名 数据格式 描述
order_id string 订单ID
user_id string 用户标识,模型中用户标识类型通常选择oneid
trade_date 日期型 交易日期
trade_money 数值型 交易金额
ID_type1 string
ID_type2 string
ID_type string

AIPL模型样例

  1. AIPL分析推荐基于用户标签数据,必须要有用户唯一标识。
  2. 设定AIPL的对应规则,如:
    • A:用户最近90天登录过官网
    • I:用户最近90天有过收藏行为
    • P:用户最近90天有过购买行为
    • L:用户最近90天多次购买,且购买金额大于1000

ADS大宽表示例:

user_id 性别 是否有小孩 注册时间 年龄 最近90天消费金额 最近90天登录次数 最近90天收藏次数 最近90天购买次数 ID_type1 ID_type...
a0001 2018/10/21 23 30 1 2 1 b0001 ......
a0002 2018/10/21 52 50 3 5 7 b0002 ......

标签加工需求:

字段类型 加工方式 数据格式 调度需求
文本型单枚举值 保留原值 string 大宽表建议日粒度更新,更新完成的时间要在QuickAudienceAIPL数据集的调度时间之前
文本型多枚举值 不建议,多枚举值将在标签选择时有过多的组合 string
日期型 保留原值 datetime/date
数值型 保留原值 double/bigint

行为数据集样例

ADS行为数据表示例:

user_id ID_type1 ID_type... 行为时间 行为类型 行为次数 行为金额 行为渠道 行为对象属性 行为对象属性值
a0001 b0001 c0001 20190819 支付 1 1000 门店1 品牌 品牌1
a0002 b0002 c0002 20191023 加购 5 789 小程序 一级类目 女装
a0002 b0003 c0003 20191023 浏览 2 789 官方商城 一级类目 女装
a0006 b0004 c0004 20201023 收藏 2 789 官方商城 二级类目 家居服
a0008 b0005 c0005 20200123 收藏 2 789 小程序 品牌 品牌2

字段格式要求:

字段名 数据格式 描述
user_id string 用户标识
ID_type1 string
ID_type... string
行为时间 日期型
行为类型 string
行为次数 数值型
行为金额 数值型
行为渠道 string
行为对象属性 string
行为对象属性值 string

行为类型、行为渠道、行为对象属性名称需要添加维表用于行为筛选,维表结构参考下表:

ID 行为类型
1 支付
2 加购
3 浏览
4 收藏
...... ......