为了帮助用户全面了解一个推荐场景如何配置引擎配置单,本文以猜你喜欢场景为例介绍召回、过滤、特征加载、精排和重排的基础配置,以及如何配置在线数据源Hologres和FeatureStore。
引擎配置的定义逻辑:先定义召回(RecallConfs)、过滤(FilterConfs)、排序(AlgoConfs)、重排(SortConfs)的配置,然后再在场景中进行引用。如先在FilterConfs中定义过滤配置,配置的名称为唯一标识符,配置好之后可以在FilterNames中进行引用。召回配置在SceneConfs中引用,排序配置在RankConfs中引用,重排配置在SortNames中引用。home_feed为场景名称。但是FilterNames中的场景名称为default,代表如果找不到要走的场景配置,则会走default(默认)。
示例详细说明如下:
项目 | 说明 |
数据源 | 本案例配置了Hologres和FeatureStore两种数据源,主要存储供线上服务使用的数据,如用户特征和物品特征、热门召回和i2i召回数据、某个用户已经看过的物品ID作为曝光过滤的依据等。 如果FeatureStore使用FeatureDB作为线上数据源,需要配置FeatureDB的用户名(FeatureDBUsername)和密码(FeatureDBPassword);如果FeatureStore使用其他数据源,则不需配置这两个参数。两个数据源中的 |
召回 | 本案例在RecallConfs中配置了两路召回,分别是U2I召回和全局热门召回,两种召回的数据来源于Hologres。不同召回参数说明如下:
|
过滤 | 本案例在FilterConfs中配置了以下两种过滤方式:
一些参数的解释:
|
特征加载 | 将user特征和item特征加载到引擎中。其中,user特征参与模型的打分,item特征则多用来进行重排。
|
排序 | 排序服务先在AlgoConfs中进行配置,可以定义多个精排服务。在RankConf中设置某个推荐场景引用AlgoConfs中定义的精排服务,以及打分公式和权重调整,可以设置多个目标预测分加权之后再相加或者相乘的方式。 AlgoConfs:
RankConf:
|
重排 | 本案例在SortConfs中配置了如下两个重排策略:
配置参数的一些解释:
|