一、适配场景
已经对接友盟客户端SDK;
从未进行行为数据采集,需要0-1埋点;
当前埋点方案过于简单,数据维度过少。
二、流程图
三、user、item、behavior数据的上传
I 存量数据
注:
存量数据指的是当前的商品池、用户池、行为数据,是启动服务的初始数据。
user数据和item数据:通过官方文档中服务端SDK进行上传。
behavior数据:当绑定友盟后,会自动上报。
II 增量数据
注:
增量数据指的是这三种数据产生了增加的变化,并需要和存量数据合并的新增数据。
user数据和item数据:通过官方文档中服务端SDK进行上传。
behavior数据:当绑定友盟后,会自动上报。
III 服务端SDK使用方法
如果您使用的是Java语言:
①参考如下链接配置好Java服务端SDK的环境:Java SDK 使用方法。
②通过服务端SDK推送数据请使用如下链接代码:通过服务端SDK 推送数据。
③获取推荐结果请使用如下链接代码:通过服务端SDK 获取推荐结果。
如果您使用的是其他语言,请参考《Java SDK使用方法》的同级目录中其他语言的使用方法。
IV 服务端SDK推送数据的表信息
详见推送数据文档中的参数说明
V 推送数据官方文档例子
详见文档:推送数据
四、具体操作
I 选择行业
注意:实例启动后,您选择的行业不支持变更。
II 选择启动智能推荐服务的方式
由于我们选择的是友盟+服务端SDK,所以此处选择“快速启动”。注:快速启动是通过智能推荐提供的默认数据启动实例。实例启动后会自动删除这些数据。
注意:如上图“体验启动”的方式,用于测试和学习智能推荐控制台的功能。不需要您已经有数据、也不需要您上传数据,可以直接启动实例。与“快速启动”不同的是“体验启动”有一定量的测试数据,可以直接查看各种数据指标,而“快速启动”需要在启动实例后您通过服务端SDK以及友盟上传数据。
III 配置实时数据源
1、选择通过友盟SDK上传行为数据(实时上传)
如您还没有曝光数据的终端埋点,可以按上图方式选择“否,需特殊处理”,即可切换为推荐系统特殊处理模式,即智能推荐会通过服务端下发请求的方式构建曝光数据。
注意:用户系统曝光数据时效原因,将仅支持7天以内的曝光过滤配置,若超出7天将以7天为准。请谨慎修改。
如您认为在回传行为数据时需要回传traceinfo、二跳页面的traceinfo难以回传等开发成本问题,可以按上图方式选择“否,需特殊处理”,即可切换为推荐系统特殊处理模式,即通过后台按照下发时间存储的traceinfo进行效果归因。
点击添加数据源之前需先开通友盟
(1)进入友盟官网登录/注册:https://www.umeng.com/
(2)注册友盟账号,注册完成后要与智能推荐的账号绑定
(3)创建应用
(4)选择相应的应用类型
(5)注册应用
(6)剩下的步骤按照引导提示,完成埋点与验证。
(7)开通友盟U-DOP数据投递服务:
现因友盟业务变更,使用友盟SDK回传数据至AIRec时,需要购买一项友盟DOP投递服务,购买详情可参考:U-DOP开通流程
2、点击添加数据源。
3、点击授权后选择来源应用、来源功能。
注意:
友盟应用:选择将友盟那边配置的哪个app信息上报到智能推荐来,上面列出的都是在友盟已经申请的appkey 。
埋点功能:埋点功能是选择哪些数据希望我们来进行训练模型。
选择友盟应用
IV 配置离线存储
您可以设置您的离线数据存储(实时数据源的离线存储位置),您可以选择将这部分数据直接写回您的自有MaxCompute,也可以写到智能推荐的MaxCompute,由智能推荐托管。
开通离线存储,代表将智能推荐服务训练所需的离线数据存储部署在您的企业账户的MaxCompute中,需要您保证这部分离线数据的稳定性、并具备运维这些数据的能力。
实例启动成功后,可以在控制台-数据源处,查看离线存储表的分区信息。
注意:
1.此处的项目名称建议使用独立的项目空间,避免和启动数据的项目空间一致。
2.配置离线存储数据源之前,需要在MaxCompute中给智能推荐授权可读及可写权限,详见数据源。
3.离线存储项目建议不要修改及删除,且需保持不欠费,建议设置为自动续费。
4.实例启动成功后,可以在控制台-离线存储功能处,查看离线存储表的分区信息。
5.当前版本支持您在您的MaxCompute-cmd中管理离线数据。
支持所有MaxCompute中的操作,高危操作时请谨慎处理,MaxCompute具体操作详见:MaxCompute官方文档。
6.对于产出的所有离线数据不要进行高危操作(增加、删除、改写等),否则将会影响智能推荐服务对离线数据的计算。
V 启动实例(一个半小时左右启动完成)
点击确定启动,启动实例,预计一个半小时左右启动完成
查看实例详情
实例启动后,可以查看实例详情
VI 通过服务端SDK上报数据
后续的增量数据需要通过服务端SDK进行上报。具体使用参考上文的第三模块中:IV服务端SDK推送数据的表信息,以及V推送数据官方文档例子。
注意:要先推送物品数据和用户数据,然后再推送行为数据。
五、配置实例的服务类型(猜你喜欢、相关推荐)
当前版本支持一个实例同时开通猜你喜欢和相关推荐两种服务类型,您可以通过控制台中的场景管理功能创建不同服务类型的场景。
I 点击创建场景
在控制台的业务定制功能栏下,点击-场景管理。
II 选择本场景的推荐服务类型
您可以在当前位置选择本场景为猜你喜欢/相关推荐的服务类型,以及设定场景ID(对应数据规范中的scene_id)等基本信息。
III 场景列表展示
场景管理创建完成后,您可以在场景管理界面处查看您的各个推荐类型的场景。