环境配置

更新时间:2025-01-10 06:05:10

点击“推荐方案定制”下的“方案配置”,点击“创建推荐方案”,如下图:

image

创建方案的第一步是配置“环境配置”:

  • 场景名称:该推荐方案用于什么场景。

  • 离线数据源:MaxCompute项目名称。

  • DataWorks工作空间:用于部署生成的MaxCompute SQL、Python、Hologres等代码。

  • DataWorks调度资源组:部署模型到PAI-EAS、执行FeatureStorePython脚本需要使用旧版独立调度资源组。如果不能创建旧版本独立调度资源组,请联系相关技术人员开通白名单。

  • 业务流程名称:部署到DataWorks的业务流程名称,可以与场景名称一致。

  • slim_mode:若您的DataWorks选购版本对迁移助手中导入的代码包有大小限制,可使用此功能,并将超出大小的代码包手动上传。选择slim_mode为“是”,则不打包fgjar。jar具体信息和用法请参考EasyRecFG文档

  • OSS bucket:设置OSS bucket,用于存储向量召回模型、精排、粗排模型的EasyRec配置、训练中间文件,模型导出文件。

  • 在线数据源:如果开通了Hologres实例,计划把用户特征、物品特征、召回数据存储在Hologres中,则这里选择Hologres。注意绑定Hologres实例。如果使用FeatureStore来存储用户特征、物品特征、召回数据,则可以不选择,在FeatureStore部分选择特征工程项目,设置用户和物品实体ID,然后在后面的召回和排序数据源中选择“FeatureStore”。

  • Flink数据源:当后面需要配置用户和物品侧实时特征的时候,需要配置Flink数据源。

image

下文是设置特征平台(FeatureStore)的项目空间,需要新建和设置用户实体和物品实体(新建特征实体)。如果使用FeatureStoreFeatureDB存储,则需要在FeatureStore的在线数据源中先开通FeatureDB,见配置在线数据源:FeatureDB

image