全部产品
云市场

常见问题

更新时间:2020-04-01 15:58:55

自然语言处理的服务有何调用限制?

各服务所需资源不同,因此对应的限制不同,具体参看下表:

NLP基础服务:

服务 单用户QPS 最大请求长度(字节)
多语言分词 10 1024
词性标注 10 1024
命名实体 10 1024
情感分析 10 1024
中心词提取 3 512
智能文本分类 3 20480
文本信息抽取 1 92160
商品评价解析 10 1536

NLP自学习平台:

算法类型 单模型QPS 最大请求长度(字节)
文本实体抽取 10 暂无限制
文本分类 10 暂无限制
关键短语抽取 10 暂无限制
关系抽取 10 暂无限制
情感分析 10 暂无限制

常见问题:

  • 问:文本实体抽取预测时文本有没有长度限制?
  • 答:目前没有限制,但是过长的文本会导致超时。建议控制在1000字以内,超长的文本可以根据“\n”或“。”(换行符或句号)对文本进行切分。或使用我们的异步预测接口,该接口支持10000字的预测,使用文档:https://help.aliyun.com/document_detail/148089.html
  • 问:文本实体抽取预测时对长文本进行切分是否会影响模型预测效果?
  • 答:根据“\n”或“。”(换行符或句号)对文本进行切分,并不会影响模型预测的准确率。鼓励将过长的样本进行切分处理后预测。

若近一周日均调用量超过50万的,可与我们联系提高QPS,欢迎提交工单或联系销售经理洽谈。

子帐号授权相关问题

子账号授权操作步骤

  1. 在RAM访问控制的权限管理中新建权限策略(https://ram.console.aliyun.com/policies)1

  2. 输入策略脚本配置(NLP基础服务NLP自学习平台脚本略有不同,详见本页下方子账号脚本配置策略2

  3. 在人员管理用户tab中,对想要授权的子账号进行添加权限操作3

  4. 选择刚刚创建的自定义权限策略,即可完成授权4

子账号脚本配置策略

  • NLP基础服务(包括商品评价解析)策略内容如下
  1. {
  2. "Statement": [
  3. {
  4. "Effect": "Allow",
  5. "Action": "nlp:*",
  6. "Resource": "*"
  7. }
  8. ],
  9. "Version": "1"
  10. }
  • NLP自学习平台策略内容如下
  1. {
  2. "Statement": [
  3. {
  4. "Effect": "Allow",
  5. "Action": "nlp-automl:*",
  6. "Resource": "*"
  7. }
  8. ],
  9. "Version": "1"
  10. }

NLP自学习平台中的子帐号有哪些权限

目前被授权的子账号将拥有几乎全部的平台管理权限(除售卖相关的操作和查看权限):

平台资源 权限 授权子账号是否有对应权限
项目 all
模型 all
数据 all
监控统计 all
售卖相关 all

其他注意事项:

  1. 目前只有主账号有售卖相关的操作和查看权限
  2. 授权的子账号登陆后直接跳转到控制台”我的项目”链接,未授权的子账号跳转到标注中心
  3. 一个标注项目的管理员是:这个标注项目所在项目A的创建人或项目A的授权账号
  4. 主账号拥有标注任务的编辑权限,可以为标注任务增加参加标注的子账号
  5. 标注项目的质检人员是该标注项目的管理员
  6. 所有项目和模型的创建用户Id默认是主账号Id
  7. predict接口(内部和外部)的发起调用时,调用者Id默认是主账号
  8. predict接口推送的sls日志的数据中包含着调用者实际为主账号或子账号的信息
  9. 售卖按主账号计算

NLP自学习平台中的标注注意事项

实体抽取项目

  1. 实体抽取项目中,需要对待标注文档中所有出现的实体予以标注。(建议打开左上角的“同值标注” 功能 同值标注标注示意图
  2. 某文档中对某个实体已经有过标注了,在另一篇文档中还需要对相同实体进行标注吗?

    答:需要

  3. 被标注的实体中不能出现换行符“\n”或句号“。”,否则将不能识别,但不会影响训练。

NLP自学习平台实体抽取项目有没有更高级的规则引擎设置?

问:做实体抽取任务时,我的文档格式比较固定,需要抽取的字段有明确和固定的上下文,有没有不需要大量标注,又好又快的抽取方案?

答: 有!为了提升实体抽取模型的表现和效率,我们还开放了规则引擎模块供用户选择(如有需要,请联系我们加入白名单,钉钉群号:23142693)。在创建模型时可以配置。规则引擎的界面如下:reg1您可以通过规则配置来配置正则、词典、任意字符和模型抽出的实体的组合等“规则”,并且通过规则预览可以测试下您的规则是否生效。

规则配置示例

我有如下裁判文书,需要抽取原告和被告的姓名、性别、出生年月:

原告:橙小二,女,住所地浙江省杭州市余杭区。\n\n被告:王某某,男,2019年10月1日出生,汉族。

就可以使用规则引擎来配置正则表达式,抽取出这些字段:

新增规则组->实体类型选原告->规则要素选择正则表达式->值填入 (?<=原告:)([^,]+)(?=,)

reg2配置好几个规则后,点击规则预览,则可以检查刚刚配置的规则:reg3

NLP自学习平台实体抽取项目有没有常见的抽取字段供选择?

平台提供常见字段的抽取能力,例如日期、手机号码等,勾选后,您创建的模型将可同时抽取勾选字段。(由于创建模型需要标注数据,若想直接使用该功能,您可以随意标注10条数据训练一个模型,注意需在高级设置中勾选您想使用的通用字段)

  • 入口(实体抽取项目->模型中心->创建模型->进入高级设置):常见字段

NLP自学习平台续费时提示模型数量超变更规格数量

在续费页面中,如提示模型数量已超变更规格数量,请先在 概览页https://nlp-automl.aliyun.com/automl/overview)查看模型总量与模型使用量情况,确保已使用量小于等于总量。

  • c-0

若模型使用量大于模型总量(例如:试用时使用了3个模型且未删除,正式付费购买时,仅购买了1个),您可以

  1. 直接删除不准备使用的模型(注意:模型删除后将无法恢复)
  2. 通过 变配 的方式,提升模型总量额度
  • c-2

阿里云的AccessKeyId和AccessKeySecret是否通用?

阿里云各个服务的AccessKeyId和AccessKeySecret是通用的,使用前需先开通对应的服务。

是否提供定制化服务?

如果您有定制化服务的需求,欢迎您发邮件至ai-support@list.alibaba-inc.com与我们进行沟通。