全部产品

步骤四:配置推荐引擎

更新时间:2017-06-07 13:26:11   分享:   

本章节内容介绍了如何通过管理控制台的图形界面配置推荐引擎,通过简单的界面化操作,完成数据和算法的配置。

操作步骤如下:

  1. 添加资源
  2. 添加推荐业务
  3. 添加配置推荐场景
  4. 了解算法流程模板

1. 添加资源

在数加平台的控制台上,点击左侧导航栏中的“推荐引擎”,进入推荐引擎的管理界面:

5231

进入推荐引擎管理页面后,点击左侧导航栏中的“资源管理”先把我们准备工作中创建的资源配添加进来,让推荐引擎知道后续计算时需要使用的资源:

190

需要添加的资源有三类:大数据计算服务、表格存储服务以及云监控,其中大数据计算服务是存储数据和进行推荐算法计算的地方,表格存储是用来保存结果的,可以支持在线访问,云监控是用来监控整个处理过程的,有问题的时候可以报警。前一项是必选项,后两项是可选项,此处我们只配置必选项。

5232

首先,添加我们开通的ODPS Project到大数据计算服务资源:点击右上角的“添加云计算资源”,在弹出的页面中添加ODPS Project:

5233

其中,“云计算资源标识”是该资源的名称,只要符合命名规则即可,“项目名称”为我们专门创建的ODPS project的名字,此case中为 auto_rec_demo,AccessID和AccessKey可以在阿里云管理控制台首页中去获得,填写完成后点击“提交”。

2. 添加推荐业务

推荐业务是推荐引擎的基本管理单元,业务定义了算法所能使用的数据范围,例如商品推荐业务的数据范围是用户数据、商品数据和行为数据等。在推荐业务中,最重要的事情就是配置需要使用的数据。

点击“我的推荐”,返回推荐引擎管理控制台首页,点击新建业务,添加一个新的推荐业务:

5234

在弹出的“添加业务信息”页面中,包含了三个主要部分,分别是:配置业务信息、配置业务依赖云资源以及配置业务数据表,首先填写“配置业务信息”部分的内容:

注意: 业务Code在推荐引擎中是全局唯一,您填写的名称可能会和其他客户填写的名称冲突。

5235

接下来填写“配置业务依赖云资源”内容:

991

“大数据计算资源”选择 MyFirstRecEngine,在线存储资源选择勾选“使用系统自带在线存储资源”。

最后填写“配置业务数据表”,物品属性维度表不需要填写数据表名称,其他都按要求输入表名:

992

将我们在之前的实验中添加过的数据表名称,分别填写到对应的位置:

“用户表”为movielens_user_meta,

“用户属性维度表”为 movielens_user_meta_config

“物品表”为movielens_item_meta

“行为表”为 movielens_user_behavior

信息填充完成后,点击提交,完成业务的添加和配置。整个提交过程实际上会去初始化环境,整个过程大概需要几分钟的时间,请耐心等待。提交完成后,可以查询该业务的信息:

5236

3. 添加配置推荐场景

一个推荐业务支持包含多个推荐场景,每个推荐场景可以看做是APP或网站中提供个性化推荐的功能模块。场景隶属于某一个业务,使用到的数据就是在业务中配置的数据。

场景包含一个或多个算法流程,每一个算法流程代表一种推荐物品的逻辑,由离线流程和在线流程组合而成,离线流程和在线流程分别由多个算法拼装组成。离线流程用于处理批量数据计算,在线流程用于处理在线数据计算。

创建完推荐业务后,会自动生成两个推荐场景:“详情页推荐”和“首页推荐”:

5237

可以看到这两个场景后都有红色的小图标,表明这两个场景中有算法流程尚未发布,简单的讲,这两个场景还需要进一步的配置。

另外,可以看到两个Tab页,即上方的红色框中的部分。一个是线上生产环境,一个是开发测试环境。用户可以在开发测试环境中新建场景,配置好后发布到线上生产环境中来,本Case中直接使用默认创建的场景,感兴趣的同学可以自己动手去测试:

5238

接下来我们来完成两个场景的配置。首先,点击线上生产环境中的“首页推荐”:

5239

进入“编辑推荐场景”页面,我们看到已有算法流程main,该算法流程并不适用于本case,因此我们需要新建一个算法流程main_new,点击“新建算法流程”:

5240

在弹出的“添加算法流程”对话框里,填写新增算法流程main_new的配置信息:

5241

提交后,点击“发布”,我们需要将刚添加的算法流程从开发测试环境发布到正式环境中去:

5242

勾选main_new算法流程,然后点击下一步:

550022

在设置流量占比时,由于只有一个main_new,所以系统会默认将其流量占比设置成100%,表示所有的首页流量将都将使用算法流程main_new的推荐结果,配置完成后点击“完成”:

535550345

在“编辑推荐场景”页面中,点击完成:

5245

页面返回到“我的推荐”,可以看到“首页推荐”所在行的算法流程中包含了我们新增的算法流程main_new以及该算法流程的流量。红色感叹号标志依然存在是由于还有一个main算法流程没有发布到正式环境中,在本case中我们不用理会这个红色感叹号:

34234234

至此,首页推荐已经完全配置成功。接下来配置“详情页推荐”,操作流程和配置“首页推荐”是完全一样的:点击“详情页推荐”,进入“编辑推荐场景”页:

5247

点击“新增算法流程”:

5248

在弹出的“添加算法流程”窗口中,填写配置信息后提交:

5249

点击“发布”,将场景的detail_new流程从开发测试环境提交到在线生产环境:

5250

在弹出窗口中,选择detail_new算法流程,点击下一步:

2342432

设置流量占比,流程detail_new的流量占比为100%,点击完成:

765756

在“编辑推荐场景”页面中点击“完成”,返回“我的推荐”页面:

5253

在“我的推荐”页面中可以看到两个场景均已经配置成功:

09879

4. 了解算法流程模板

本章节内容为附加阅读内容,可以帮助理解推荐引擎所使用的算法模板(即在上一节配置场景的过程中用到的算法模板)。已经了解的或者不想了解太多技术细节的同学可以跳过,不影响后续试验操作。

离线流程以客户提供的原始离线数据表,包括用户信息,物品信息,用户行为日志开始,通过离线计算得到每个用户、每个物品的特征,以及每个用户可能感兴趣的物品,和每个物品计算出与之相似的物品等,并将这些结果同步到在线存储上。

在线流程从客户的产品发起的推荐API请求开始,根据API的参数获取指定用户在离线流程中计算好的信息,并根据在线流程定义的规则和算法进行过滤和排序处理,并最终返回给客户的产品。

所谓算法流程模板,是指客户可以把配置好的算法流程保存起来作为模板以备后用。目前推荐引擎提供了两类算法流程模板,一种是离线计算模板,一种是在线计算模板。

推荐引擎提供了多个内置的离线计算模板和在线计算模板,用户可以直接使用这些模板,也可以根据自己的实际业务定制自定义的模板。

如想了解模板和算法的详情,请访问内置算法和模板说明

本文导读目录
本文导读目录
以上内容是否对您有帮助?