文档

数据诊断

概述

数据诊断功能可以帮助您分析上传的数据所存在的问题,并针对具体的诊断项提供修复建议。数据诊断功能指导您修复常见的数据问题,避免了因为数据格式错误、数据错传、漏传等原因导致推荐效果不理想的情况。因此,建议您在POC测试阶段完成历史数据上传后、调试算法效果发现不理想后,首先进入数据诊断模块排查数据问题。此外,也建议您接入正式环境后定期查看数据诊断报告,从而及时发现新的数据问题,从而避免影响线上业务的推荐效果。

操作指导

数据诊断模块每日凌晨会自动产出前一日的数据诊断报告。您也可以选择当日某一时段的数据,通过人工启动数据诊断的方式获取诊断报告。

数据诊断报告包含三个部分的内容:数据概况、诊断结果和诊断详情。

image
    • 数据概况:统计出报告时段内上传的用户数据、物品数据、行为数据的总数,用来直观的检验是否存在漏传、重复传数据等异常情况;

    • 诊断结果:综合所有诊断项的详情,对存在数据问题的严重程度给出判断。您需要依据诊断结果,判断如何处理存在的数据问题;

image
    • 诊断详情:按照数据问题对系统的影响范围,诊断项可以分为服务可用性和算法可用性两类。该模块详细罗列出所有数据诊断项,常见的诊断内容包括关键字段取值合法性、关键字段取值合理性、数据错传、数据漏传以及数据重复传等问题。诊断报告将根据问题的严重程度将诊断项分为高优修复、建议修复和无需修复三个档位,您可以根据实际情况采取措施修复数据问题。此外,对于数据字段取值异常的情况,可以采用抽样明细功能查看数据详情,方便您直观判断产生异常的原因。

image
  • 本页导读 (0)
文档反馈