在上一页完成环境配置之后,可以开始“推荐方案定制”的配置;而对于已经创建好的推荐方案,可以点击右侧的“更新方案”开始“推荐方案定制”的配置。“推荐方案定制”是一系列的操作引导,其第一个部分是“数据表配置”,分别添加“行为日志表”、“用户表”、“物品表”。而“实时行为日志表”用于实时特征的计算,这里暂且跳过。
1.添加行为日志表
行为表中的行为信息配置
行为表名称:选取我们已经注册好的行为表
时间分区:行为表的分区字段
请求ID:行为日志的请求ID字段,有就填写,没有可以不填写,该字段会影响样本精准度和模拟的实时特征、以及实时序列特征的准确性。
行为事件:表示行为类型的字段
行为事件枚举值:也就是行为事件里面包含的枚举值,如曝光,点击,加购,购买等行为
行为的值:表示行为的深度,可以是成交价格,观看时长等字段。
行为时间戳:日志发生的时间,一般是10位时间戳,特殊需要指定格式,精准到秒
时间戳格式:和行为时间戳配合使用
行为场景:表示日志发生的场景字段,如首页,搜索页,或者是商品详情页
重点关注的场景:行为场景重要的值,在下游的特征配置中可以使用
行为表属于用户侧的字段
用户ID:行为表中用户ID的标识
用户类别特征:行为表中存在的用户类别特征,如网络,操作平台,性别等
用户数值特征:行为表中存在的用户数值特征,如粉丝数量,作品数
用户Tag特征:行为表中存在的用户多值的类目特征,如兴趣爱好等
用户IP: 行为日志可能存在的IP,如果有,则下游会对IP解析成国家,省份,城市等类目特征
用户Text特征:行为表中可能存在的属于user侧的文本特征
用户KV特征:行为表中可能存在,并且属于user侧的多值类目,并带有权重的特征
行为表输入物品侧的字段
物品ID:行为表中物品ID的标识
建议在行为表的物品侧尽量不要设置以下特征。而是在物品特征表中设置,在这里设置则在请求EasyRec Processor推理服务的时候需要传物品特征。
物品类别特征:行为表中存在的物品类别特征,如类目等
物品数值特征:行为表中存在的物品数值特征,如观看人数等
物品Tag特征:行为表中存在的物品多值的类目特征,如尺码等
物品Text特征:行为表中可能存在的属于item侧的文本特征,如标题等
物品KV特征:行为表中可能存在,并且属于item侧的多值类目,并带有权重的特征
行为表的其他字段
tag特征分隔符:如果存在user的tag或者item的tag,则正确填写其多值特征的分割符。默认是竖线“|”,也可以设置为半角的逗号、分号等。
表生命周期:如果填写,则行为表会保存对应的周期,如果不填写,则生成的表将和其上游表同周期
datawroks节点名称:如果填写则依赖的就是填写节点的名称,如果不填写则依赖节点的名称和行为表名称一样
2.添加用户表
用户表名称:选取我们已经注册好的用户表
时间分区:用户表的时间分区字段
用户ID:用户表中的用户ID字段
注册时间戳:该用户注册的时间,一般是10位时间戳,特殊需要指定格式,精准到秒
时间戳格式:和注册时间配置配合使用
类别特征:用户表的类别字段,如性别,年龄段,所属城市等。
数值特征:用户表的数值字段,如作品数,积分
tag特征:多值类别字段,使用tag分割符号分割
用户IP:用户表中可能存在的IP字段,下游会自动解析省份,城市等信息
kv类特征:用户多值特征并带有分隔符
embedding特征:用户侧带有的embedding特征
3.添加物品表
物品表名称:选取我们已经注册好的物品表。
时间分区:物品表的时间分区字段。
物品ID:物品表中的物品ID字段。
作者ID:商品所属的作者。
注册时间戳:该物品注册的时间,一般是10位时间戳,特殊需要指定格式,精准到秒。
时间戳格式:和注册时间配置配合使用。
类别特征:物品表的类别字段,如类目。
数值特征:物品表的数值字段,如价格、累计销量、点赞量。注意如果是累积值,这个数据需要每天更新,用于天级别的特征。
tag特征:多值类别字段,使用“tag特征分隔符”分割。
text特征:物品的文本特征,如标题,描述等。
kv类特征:物品多值特征并带有分隔符号。
embedding特征:物品侧带有的embedding特征。