全部产品
云市场

算法工程的创建和配置

更新时间:2019-05-16 17:29:44

一. 流程简介

首次使用算法平台时,第一步需要先完成算法工程的创建,为算法工程绑定算法功能和数据源后即可在算法工程中进行模型相关的一系列工作了。

二. 名词解释

名词出现阶段 名词 解释
创建算法工程 算法工程 管理模型集合的实体,相当于模型的文件夹,也是算法平台功能的计费单元。
配置算法工程 算法功能 可以理解成模型的用途,每个算法工程目前只能绑定一个算法功能。
人气模型 用来量化每个被索引的文档的静态质量及受欢迎的程度的值的算法功能,其计算得分通常叫人气分。详细介绍可见人气模型文档
关联应用 训练该算法模型使用的数据和最终使用算法模型的OpenSearch应用。
内容数据源 训练算法模型要使用的文档数据来源。
行为数据源 训练算法模型要使用的用户点击或其他交互行为的数据来源。

三. 流程演示

  1. 创建算法工程

在算法工程列表页点击创建按钮进入算法工程购买页。公测期间功能免费,所以价格支付0元即可完成一个算法工程的购买。
1

  1. 配置算法工程

第一步:新购的算法工程会出现在列表中,点击操作列的“配置”按钮进入配置流程,未经过配置的算法工程不能进行后续操作流程。
2

第二步:选择算法功能,目前暂时开放人气模型可供选择。
3

第三步:绑定数据源。首先需要将工程与OpenSearch的存量应用进行关联,可关联的应用要求已开通行为数据采集功能。
目前算法工程的内容数据源暂时就是关联应用中的文档字段,行为数据源就是关联应用开通行为数据采集后推送到OpenSearch上的行为数据。
4

第四步:验证数据
为了保证数据的完整性和可训练性,需要对数据源中的数据进行如下验证,

  • 行为数据采集功能是否已开通
  • 可训练的数据是否存在
  • 行为日志和曝光日志推送是否≥2天
  • 天级曝光文档数是否≥100000
  • 天级IPV(点击次数)是否≥1000

以上验证项只要出现一项未通过就不能进行后续操作。
5