使用须知

若您首次搭建推荐系统,缺乏相关技术经验,且前期存在算法、工程人力不足的情况,我们建议您优先启用端到端行业推荐服务AIRec服务对接,待您已具备相关技术人员,并希望自主掌控推荐链路,我们建议您按照如下步骤进行评估,并与阿里侧架构师完成沟通后,启动服务对接。 如您未完成一、二、三的3个步骤操作,将可能影响您的服务测试体验。

一、完成行为数据采集

搭建推荐服务,一方面依赖用户、物料(待推荐内容)特征的丰富,另一方面依赖用户的行为。 我们建议您在对接推荐服务之前,检查是否已经具备最基础的埋点数据,埋点数据至少需包括发生在推荐页的曝光、点击、消费(加购、收藏、评论、转发、点赞、下单、评价)等行为;为对后续效果提升的数据丰富做好基础,我们也建议您采集全端行为数据,包括但不限于搜索行为、活动参与行为等,以上行为均可应用于模型的训练与校准。 不清楚需要的数据格式?可以参考DEMO数据。

二、明确推荐场景与核心优化指标

在接入服务之前,需要确认需要部署个性化推荐功能的页面以及核心的关注指标,指标定义口径等,方便后续的效果观察与迭代。 如,以某电商 APP为例, 需要部署个性化推荐功能的页面为首页Feed流,其中只要商品内容过审且有库存的商品均可推荐,核心考察的指标为首页推荐引导的加购与成交数据,辅助考察的指标为点击率、用户停留时长。 以下为部分数据口径参考, 如,用户首次对商品的加购行为发生在首页Feed流,则认为由首页转化。 用户从首页Feed流直接下单,或从购物车页下单由首页引导架构的商品,均认为由首页转化。

梳理清楚业务流程、统计口径,将帮助企业更好地治理埋点数据、明确KPI指标,将更多的精力投入到效果的优化与迭代中,提升企业收益。

三、确认已了解并开通如下资源

以下为完成离线建模所需云产品

序号

云资源名称

用途

1

云原生大数据计算服务MaxCompute

数据清洗、特征工程、准备训练样本

2

大数据开发治理平台DataWorks

数据清洗、特征工程、模型训练和评估、更新模型、同步数据到线上存储

3

机器学习PAI

建模、编辑和调度特征工程、样本和模型训练的代码

4

对象存储OSS

存储模型的checkpoint和save model文件,配置文件等

5

PAI-Rec

数据诊断、推荐算法定制、推荐引擎管理、a/b testing实验和报表管理等