X2I召回表

基本信息

基于用户偏好召回服务的数据表,X可以是物品、类目、品牌等,I是物品。

数据ID

唯一标识一张表,只能包含大小写字母,必须以字母开头,不能超过30字符

展示名称

可使用中文、字母、数字来加强表ID的可读性

来源存储

指数据存储的来源,一般为MaxCompute, 需要正确填写项目名称和表名称,同时需要保证已经对平台账号授权。

若来源为pai导出,源表字段只有两个,用户需配置item对象分隔符(如空格),item权重分隔符(如:),系统会自动将源表转成KKV表,若为普通的MaxCompute,则必须保证源表中有三个字段,分别对应triggerId,itemId,score

配置索引

pai导出来源 x2表

由于pai导出的表是经过处理变成KKV格式,他的itemId和score都来自源表的第二个子弹

MaxCompute来源x2i表

  • 主键

    • 唯一表示一个物品,在源数据中不能为空,也不能重复

  • 分片字段

    • X2I表的分片字段应为被召回的物品ID

score应为DOUBLE类型

配置调度

pai导出来源 x2表

pai导出的表由于没有分区,所以只能配置定时执行,系统根据用户设置的定时时间触发回流

MaxCompute来源x2i表

  • 调度策略

物品向量表的调度策略只有“依赖数据源产生新分区”, 当用户的新分区以及对应的done分区产出后,系统会触发新的回流任务

  • 分区

若你的分区是ds=20210827,则这里需填写ds,一定要注意认真填写,后续不可更改

配置完成后可立即上线或者先存成草稿状态后续上线