全部产品
阿里云办公

常见问题

更新时间:2017-12-12 10:53:27

基础组件相关(MaxCompute、OTS、云监控等)

  1. Q:ODPS Table的最大限制?

    A:最大列数 1200 最大分区数 20000 一个字段最大 8M

  2. Q:注册业务成功,但是数据预处理时出错:[ERROR] Mon Jun 27 09:22:31 CST 2016 com.aliyun.odps.OdpsException: No ‘Read’ permission for entity ‘projects/alidata_rp/resources/alidata_recplat.jar’: Authorization Failed [4021], You have NO privilege ‘odps:Read’ on {acs:odps:*:projects/alidata_rp/resources/alidata_recplat.jar}. project ‘alidata_rp’ is protected. You need to contact the project owner to set the exception policy for you.

    A: 因为您注册MaxCompute项目使用的AK不是owner的AK,我们有一个安装package的操作默认只能Owner完成,不过你可以在odps console里面手动操作,

    1. 1. 用项目owner账号登录 odps console
    2. 2. 执行 install package alidata_rp.system_package
    3. 3. package 赋权给注册的在推荐引擎的账号。
  3. Q: 为什么我通过日志API上传的数据,没有15分钟内上传至MaxCompute。

    A: 日志系统处于效率考虑,如果15内的待归档日志小于1KB,则累计至1KB之后再启动归档任务

  4. Q: 为什么我上线场景的时候勾选使用测试环境离线计算的推荐结果数据覆盖当前的线上数据,之后再调试测试环境API会报错:“离线计算数据尚未生成! 请先启动算法计算或等待运算完成”

    A: 因为如果选择测试环境数据覆盖线上数据,我们不会copy数据,而是把测试的数据标记成线上数据,可以理解成线上数据的指针指向这份数据,而测试数据的指针要设置为NUll, 除非你重新计算测试环境的算法流程。

数据上传

  1. Q:实时行为日志上传API所需要的orgCode信息在哪里能查到?

    A:在推荐控制台右上角,点击用户名称-用户信息即可查询到。

  2. Q:通过日志API上传的数据到哪里了,什么时候可用?

    A:首先说明一下,通过日志API上传的数据在推荐引擎中有两条数据消费通道,即离线数据表归档和实时数据处理。

    对于离线数据归档,上传的日志内容会每15分钟追加写入到MaxCompute的rp3_biz_upload_log表中(由于数据写入需要花费一定时间,因此实际归档完成可能等待时间会大于15分钟),这些归档好的数据在经过数据预处理后会作为下一轮推荐离线计算的输入数据。可以通过以下SQL查询按时间排序的当天截止到当前时间的所有日志,其中bizdate为查询日期(如20170701),bizcode为查询业务标识。

    1. select log, upload_time
    2. from rp3_biz_upload_log
    3. where ds = '${bizdate}' and customer_name = '${bizcode}'
    4. order by upload_time desc limit 1000000;

    对于实时数据处理,是指推荐引擎业务场景下的算法策略中绑定的实时流程所配置的处理逻辑,这些实时流程以用户上传的实时日志作为输入,并快速处理掉,形成实时计算结果,您在在线流程中的“数据来源”中可进行勾选使用。

数据格式

  1. Q:输入表中item数据的keywords、properties、bizinfo 这三者有什么区别?使用的时候该如何选择?

    A:keywords字段枚举一组词,mv_enum类型,其中每个词都是业务觉得比较关键的词即可,没有,或者给不出来可以为空propertis字段是最重要的,kv类型,可以用来枚举物品的所有有用信息,比如颜色,材质,价钱等等,都可以;bizinfo字段也是kv类型,可以枚举很多信息,不过bizinfo的信息不参与进行item的特征提取,但是这些信息可以用于规则计算。比如某物品历史累计的点击量,可以用于给冷启动用户的默认推荐

  2. Q:如果item有多级类目,应该怎么处理?

    A:建议在item_meta表的category字段中保存叶子类目,叶子类目之上的父类目可以保存在keywords字段中,也可以以kv方式保存在properties字段中

数据预处理

  1. Q:运行数据预处理,出现“启动数据预处理失败Message:[INVALID_ERROR] 离线日志(ds=XXXX)还未归档完成“错误,这个是什么原因?

    A:当业务的数据勾选为通过API日志上传时,原来离线上传的行为数据就不生效了。而ds=xxxx分区的日志数据未准备好,就会报以上错误。有两种解决方案:

    1)继续使用日志API,则需要等待当天数据归档完成后启动数据预处理

    2)若想用离线数据,则可以编辑业务,去掉勾选“使用本产品日志API接收日志”

  2. Q:执行预处理报错:item_ids are not unique 或者 user_ids are not unique

    A:数据格式检查不通过,要求用户表和物品表的item_id user_id 唯一。

  3. Q:执行预处理报错:input empty!

    A:数据格式检查不通过,要求传入的输入表不为空。

  4. Q:启动预处理任务时明明显示成功,但最后却执行失败是怎么回事?

    A:启动预处理任务时提示的是“预处理任务启动成功”,而不是执行成功。由于预处理是个离线任务,在后台计算,时间可能比较长,产品界面不能等到预处理执行完毕再给出提示。

离线流程

  1. Q:离线任务报错 ERROR:Input item table empty! 或者 ERROR:Input user table empty!

    A:一般是由于模板和输入数据不匹配导致中间数据为空。