本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。
一、用户偏好统计周期分析
选择任务类型:用户偏好统计周期分析,选择相应的行为数据表,填写任务名称。
分区字段:选择相应的ds字段,分区字段显示有两种形式yyyymmdd与yyyy-mm-dd,可下拉选择显示的样式。
用户ID字段:选择能唯一区分用户的字段(如:user_id)。
曾显率统计周期:填入需要计算的周期天数的数字,若有多个周期计算中间用逗号隔开(例如:1,7,15,21,……)。
单日留存率统计周期:填入需要计算的周期天数的数字,若有多个周期计算中间用逗号隔开(例如:1,3,7)。
周期留存率统计周期:可选择按周或是按月。
周期运行:默认选择否,如果不对数据表进行周期分析,此时点击保存并计算后,进入指定重跑任务的业务时间页面,业务时间默认为最近7天,如果想看到其他时间的数据选择相对应的时间即可,此时点击确定即可进行数据诊断任务;若需要进行周期任务,周期运行选择是,对周期运行任务进行配置。
曾现率:在T日来访的用户中(作为分母),在[T-k,T-1]天曾经来访的用户数(作为分子),计算k日曾现率。
第k天的留存率:根据用户行为表计算在T日来访的用户中(作为分母),在T+k天仍然来访的用户数(作为分子),计算k日留存率。
曾期望通过调整k找到曾现率是80%或者90%的k'值,用于后续特征工程计算用户偏好特征和统计训练样本天数。当k'天的曾现率低于90%,则对于剩下的10%用户需要考虑冷启动策略。
周期留存率统计周期,指周期对周期的存留率,比如 1 月份的用户在 2 月份的存留率
周期留存率统计间隔,按周的间隔默认是1周、4周、12周,按月的间隔是1月、2月
业务时间,是对落盘到对应日期分区内的数据,而非统计某一天操作写入的数据。
周期运行选择是时,会对用户偏好统计周期分析数据诊断任务的周期运行时间进行选择,选择每天运行的时间点击保存即可。
二、诊断报告
用户偏好统计周期分析报告,对用户的行为偏好进行了统计分析,展示了用户的留存情况。