全部产品
大数据开发套件

数据准备

更新时间:2017-06-07 13:26:11   分享:   

本示例假设用户-品牌信息(源数据表)存储在业务方的RDS上,进而利用数加>数据开发套件进行数据同步、数据加工操作来详细阐述常见开发流程“数据产生>数据收集和存储>分析和计算”。

示例中涉及到相关数据如下:

■ 源数据如附件,数据说明如下:

字段 字段说明 提取说明
user_id 用户标识
brand_id 品牌ID
type 用户对品牌的行为类型 点击:0;购买:1;收藏:2;加入购物车:3
visit_datetime 行为时间 格式:年月日(yyyymmdd)

该份数据主要是记录20150415-20150815四个月的用户行为信息,本实例中我们将以该份数据做源数据进行分析产出目标表。

■ 本示例实现过程涉及到的ODPS表说明:

序号 表名 说明
1 s_user_brand_demo 用户-品牌行为信息源表
2 b_cvr_demo 品牌转化率表,前3个月品牌的购买用户数/点击数
3 ub_action_demo 用户偏好表,统计用户最近7天和最近3天的行为次数
4 ub_features_demo 用户-品牌所有特征表

经分析源数据visit_datetime字段刚好是年月日,为了提高后续查询速度,源表s_user_brand_demo建为分区表,以字段visit_datetime转成分区,用户数据每天都不断新增变化,本示例的表我们都以年月日作为分区表。

本文导读目录
本文导读目录
以上内容是否对您有帮助?