LOG_USER_META
LOG_ITEM_META
为用户和物品日志增量表UPLOAD_ITEM_META
UPLOAD_ITEM_META_CONFIG
UPLOAD_USER_META
UPLOAD_USER_META_CONFIG
UPLOAD_USER_BEHAVIOR
UPLOAD_REC_ITEM_INFO
为数据
页面配置的离线表USER_BEHAVIOR
ITEM_META
USER_META
REC_ITEM_INFO
ITEM_META_CONFIG
USER_META_CONFIG
为汇总的算法输入表,与数据格式规范中的表一一对应。推荐引擎每张内部表都包含一个DS
分区,表示数据日期,运行数据同步任务引用的分区与API出传入的ds参数或者页面日期选择框选择的一致。
UPLOAD_USER_BEHAVIOR
另外支持一个 ds=’recent’的分区,数据同步的时候每次都会取recent的分区的数据,不需要关注是否ds与选择的数据日期一致。UPLOAD_ITEM_META_CONFIG
UPLOAD_USER_META_CONFIG
UPLOAD_REC_ITEM_INFO
一般是可选输入,如果没有数据,请不要在数据
页面配置,否则数据同步任务会报找不到分区的错误。
如果你在数据
页面勾选了任一使用“日志API”上传数据
,那么日志系统会每15分钟追加归档一次数据到rp3_biz_upload_log
表。当通过页面或者API启动数据同步任务的时候,会把原始日志数据从rp3_biz_upload_log
对应的DS
分区拉取数据写入下面的表。
LOG_USER_META
表中,并且与历史数据汇总,ID相同时已最新的数据为准,历史数据最多保留180天LOG_ITEM_META
表中,并且与历史数据汇总,ID相同时已最新的数据为准,删除日志字段deleted=true的物品,历史数据最多保留180天USER_BEHAVIOR
表的DS
分区。UPLOAD_ITEM_META_CONFIG
的最新分区插入ITEM_META_CONFIG
的 DS
分区。UPLOAD_USER_META_CONFIG
的最新分区插入USER_META_CONFIG
的 DS
分区。UPLOAD_ITEM_META
的最新分区解析插入到ITEM_META
表的DS
分区中,如果同时勾选使用日志服务,则与LOG_ITEM_META
合并,根据item_id去重,ID相同的条目以LOG_ITEM_META
为准。取UPLOAD_USER_META
的最新分区解析插入到USER_META
表的DS
分区中,如果同时勾选使用日志服务,则与LOG_USER_META
合并,根据user_id去重,ID相同的条目以LOG_USER_META
为准。
取UPLOAD_USER_BEHAVIOR
的DS
分区插入至 USER_BEHAVIOR
的DS
分区,如果同时勾选使用日志服务,则与上一步数据合并。
UPLOAD_REC_ITEM_INFO
则把UPLOAD_REC_ITEM_INFO
的最新分区插入 REC_ITEM_INFO
的DS
分区,否则把 ITEM_META
的 item_id,item_info,category,plates 字段插入 REC_ITEM_INFO
的DS
分区,意味着ITEM全集都为推荐候选集。USER_META
检查ID是否重复,数据是否为空,tags字段是否符合规范。ITEM_META
检查ID是否重复,数据是否为空,properties字段是否符合规范。USER_BEHAVIOR
检查数据是否为空。REC_ITEM_INFO
检查数据是否为空。
在文档使用中是否遇到以下问题
更多建议
匿名提交