文档

异常行为分析

一、异常行为分析

image.pngimage.png

分析用户行为表,对上下游行为进行分析。

选择任务类型:异常行为分析,选择相应的行为数据表,填写任务名称。

分区字段:选择相应的ds字段,分区字段显示有两种形式yyyymmddyyyy-mm-dd,可下拉选择显示的样式。

用户ID字段:选择能唯一区分用户的字段(如:user_id)。

物品ID字:段选择能唯一区分物品的字段(如:item_id)。

行为字段:选择能区分不同行为事件的字段(如:behavior_type_event_id等)。

上游行为取值:输入待分析的上游行为事件(如:曝光expr),若有多个行为以逗号隔开。

下游行为取值:输入待分析的下游行为事件(如:点击click、购买等),若有多个行为以逗号隔开。

分桶数量:输入需要分桶的数量(如:10),用于对行为数据等距分段分析,统计每个分段中的用户分布。

周期运行:默认选择否,如果不对数据表进行周期分析,此时点击保存并计算后,进入指定重跑任务的业务时间页面,业务时间默认为最近7天,如果想看到其他时间的数据选择相对应的时间即可,此时点击确定即可进行数据诊断任务;若需要进行周期任务,周期运行选择是,对周期运行任务进行配置。

说明
  • 在 用户(user)/物品(item)/用户-物品对(pair) 粒度下, 对上下游行为计数, 并统计转化率, 并统计不同粒度下的异常率, 以及上述统计指标的分布。

  • 上下游行为: 指在事件中存在依赖关系的行为, 可以有多个行为并列作为上游/下游(比如, [曝光]->[点击,加购], [点击]->[点赞,评论,收藏])。

  • 异常: 下游行为计数应该比上游行为计数少, 否则为“异常”。

重要

业务时间,是对落盘到对应日期分区内的数据,而非统计某一天操作写入的数据。

image.png

周期运行选择时,会对用户偏好统计周期分析数据诊断任务的周期运行时间进行选择,选择每天运行的时间点击保存即可。

二、诊断报告

异常行为分析报告,对上下游的行为进行分析,展示了是否有下游行为大于上游行为的异常。

image.pngimage.png

异常比率很低说明下游行为没有大于上游行为的情况。

image.png

上游行为计数统计,统计了曝光的计数,分桶分为10个桶,X轴为上游行为计数的均值,Y轴为出现次数。

image.png

下游行为计数统计与上游行为计数统计一样。

image.png

转化率分析,把转化率分为10个区间,展示了每个区间的数量。

image.png

Top统计分析,是对上游行为、下游行为和转化率的前多少进行展示,可以知道相应的用户ID,后续可以对此进行更详细的分析。

说明

默认会对数据导入的全部字段进行分析

  • 上游行为取值:expr

  • 下游行为取值:click

  • pair: 用户物品组合对, 表示为 'user_id+item_id'

  • 用户物品对平均准化率: 根据user或者item对pair的转化率求分组均值

  • 本页导读 (0)
文档反馈