数据表配置

在上一页完成环境配置之后,可以开始“推荐方案定制”的配置;而对于已经创建好的推荐方案,可以点击右侧的“更新方案”开始“推荐方案定制”的配置。“推荐方案定制”是一系列的操作引导,其第一个部分是“数据表配置”,分别添加“行为日志表”、“用户表”、“物品表”。而“实时行为日志表”用于实时特征的计算,这里暂且跳过。

1.添加行为日志表

image.png

行为表中的行为信息配置

  • 行为表名称:选取我们已经注册好的行为表

  • 时间分区:行为表的分区字段

  • 请求ID:行为日志的请求ID字段,有就填写,没有可以不填写,该字段会影响样本精准度和模拟的实时特征、以及实时序列特征的准确性。

  • 行为事件:表示行为类型的字段

  • 行为事件枚举值:也就是行为事件里面包含的枚举值,如曝光,点击,加购,购买等行为

  • 行为的值:表示行为的深度,可以是成交价格,观看时长等字段。

  • 行为时间戳:日志发生的时间,一般是10位时间戳,特殊需要指定格式,精准到秒

  • 时间戳格式:和行为时间戳配合使用

  • 行为场景:表示日志发生的场景字段,如首页,搜索页,或者是商品详情页

  • 重点关注的场景:行为场景重要的值,在下游的特征配置中可以使用

image.png

行为表属于用户侧的字段

  • 用户ID:行为表中用户ID的标识

  • 用户类别特征:行为表中存在的用户类别特征,如网络,操作平台,性别等

  • 用户数值特征:行为表中存在的用户数值特征,如粉丝数量,作品数

  • 用户Tag特征:行为表中存在的用户多值的类目特征,如兴趣爱好等

  • 用户IP: 行为日志可能存在的IP,如果有,则下游会对IP解析成国家,省份,城市等类目特征

  • 用户Text特征:行为表中可能存在的属于user侧的文本特征

  • 用户KV特征:行为表中可能存在,并且属于user侧的多值类目,并带有权重的特征

image.png

行为表输入物品侧的字段

  • 物品ID:行为表中物品ID的标识

  • 建议在行为表的物品侧尽量不要设置以下特征。而是在物品特征表中设置,在这里设置则在请求EasyRec Processor推理服务的时候需要传物品特征。

    • 物品类别特征:行为表中存在的物品类别特征,如类目等

    • 物品数值特征:行为表中存在的物品数值特征,如观看人数等

    • 物品Tag特征:行为表中存在的物品多值的类目特征,如尺码等

    • 物品Text特征:行为表中可能存在的属于item侧的文本特征,如标题等

    • 物品KV特征:行为表中可能存在,并且属于item侧的多值类目,并带有权重的特征

image.png

行为表的其他字段

  • tag特征分隔符:如果存在usertag或者itemtag,则正确填写其多值特征的分割符。默认是竖线“|”,也可以设置为半角的逗号、分号等。

  • 表生命周期:如果填写,则行为表会保存对应的周期,如果不填写,则生成的表将和其上游表同周期

  • datawroks节点名称:如果填写则依赖的就是填写节点的名称,如果不填写则依赖节点的名称和行为表名称一样

2.添加用户表

image.png

  • 用户表名称:选取我们已经注册好的用户表

  • 时间分区:用户表的时间分区字段

  • 用户ID:用户表中的用户ID字段

  • 注册时间戳:该用户注册的时间,一般是10位时间戳,特殊需要指定格式,精准到秒

  • 时间戳格式:和注册时间配置配合使用

  • 类别特征:用户表的类别字段,如性别,年龄段,所属城市等。

  • 数值特征:用户表的数值字段,如作品数,积分

  • tag特征:多值类别字段,使用tag分割符号分割

  • 用户IP:用户表中可能存在的IP字段,下游会自动解析省份,城市等信息

  • kv类特征:用户多值特征并带有分隔符

  • embedding特征:用户侧带有的embedding特征

3.添加物品表

image.png

  • 物品表名称:选取我们已经注册好的物品表。

  • 时间分区:物品表的时间分区字段。

  • 物品ID:物品表中的物品ID字段。

  • 作者ID:商品所属的作者。

  • 注册时间戳:该物品注册的时间,一般是10位时间戳,特殊需要指定格式,精准到秒。

  • 时间戳格式:和注册时间配置配合使用。

  • 类别特征:物品表的类别字段,如类目。

  • 数值特征:物品表的数值字段,如价格、累计销量、点赞量。注意如果是累积值,这个数据需要每天更新,用于天级别的特征。

  • tag特征:多值类别字段,使用“tag特征分隔符”分割。

  • text特征:物品的文本特征,如标题,描述等。

  • kv类特征:物品多值特征并带有分隔符号。

  • embedding特征:物品侧带有的embedding特征。