一、异常行为分析
分析用户行为表,对上下游行为进行分析。
选择任务类型:异常行为分析,选择相应的行为数据表,填写任务名称。
分区字段:选择相应的ds字段,分区字段显示有两种形式yyyymmdd与yyyy-mm-dd,可下拉选择显示的样式。
用户ID字段:选择能唯一区分用户的字段(如:user_id)。
物品ID字:段选择能唯一区分物品的字段(如:item_id)。
行为字段:选择能区分不同行为事件的字段(如:behavior_type_event_id等)。
上游行为取值:输入待分析的上游行为事件(如:曝光expr),若有多个行为以逗号隔开。
下游行为取值:输入待分析的下游行为事件(如:点击click、购买等),若有多个行为以逗号隔开。
分桶数量:输入需要分桶的数量(如:10),用于对行为数据等距分段分析,统计每个分段中的用户分布。
周期运行:默认选择否,如果不对数据表进行周期分析,此时点击保存并计算后,进入指定重跑任务的业务时间页面,业务时间默认为最近7天,如果想看到其他时间的数据选择相对应的时间即可,此时点击确定即可进行数据诊断任务;若需要进行周期任务,周期运行选择是,对周期运行任务进行配置。
在 用户(user)/物品(item)/用户-物品对(pair) 粒度下, 对上下游行为计数, 并统计转化率, 并统计不同粒度下的异常率, 以及上述统计指标的分布。
上下游行为: 指在事件中存在依赖关系的行为, 可以有多个行为并列作为上游/下游(比如, [曝光]->[点击,加购], [点击]->[点赞,评论,收藏])。
异常: 下游行为计数应该比上游行为计数少, 否则为“异常”。
业务时间,是对落盘到对应日期分区内的数据,而非统计某一天操作写入的数据。
周期运行选择是时,会对用户偏好统计周期分析数据诊断任务的周期运行时间进行选择,选择每天运行的时间点击保存即可。
二、诊断报告
异常行为分析报告,对上下游的行为进行分析,展示了是否有下游行为大于上游行为的异常。
异常比率很低说明下游行为没有大于上游行为的情况。
上游行为计数统计,统计了曝光的计数,分桶分为10个桶,X轴为上游行为计数的均值,Y轴为出现次数。
下游行为计数统计与上游行为计数统计一样。
转化率分析,把转化率分为10个区间,展示了每个区间的数量。
Top统计分析,是对上游行为、下游行为和转化率的前多少进行展示,可以知道相应的用户ID,后续可以对此进行更详细的分析。
默认会对数据导入的全部字段进行分析
上游行为取值:expr
下游行为取值:click
pair: 用户物品组合对, 表示为 'user_id+item_id'
用户物品对平均准化率: 根据user或者item对pair的转化率求分组均值