为子业务空间配置邀测模型的调用权限

更新时间:
复制为 MD 格式

对于处于邀测阶段的模型,您使用主账号申请后可以通过默认业务空间的 API-KEY 进行调用。若您需使用子业务空间的 API-KEY 调用这些模型,请参考本文操作。

操作步骤

重要
  • 操作需由主账号完成

  • 主账号已拥有该模型的调用权限

接下来为您介绍如何通过控制台为指定的子业务空间授予邀测模型的调用权限。

1. 选择要授权的子业务空间

访问业务空间管理界面,找到需要授权的子业务空间后,单击其右侧的模型权限流控设置

image

2. 为子业务空间授权
  1. 先单击自定义模型,然后点击批量添加授权

    image

  2. 在弹出的对话框中,输入邀测模型的完整名称,并单击确定

    说明
    • 如果是快照版模型,版本号必须填写完整,例如 qwen-vl-plus-2025-xx-xx。

    • 此操作仅授予模型的调用权限,不涉及模型的训练或部署权限。

    image

以上不支持通过API或命令行操作。

模型调用限流

为确保不同业务场景下模型调用的公平性,可以为主账号下的每个业务空间单独配置邀测模型限流规则。

重要
  • 需主账号操作。

  • 目前,模型调用限流仅适用于实时调用,批量推理(Batch)无法设置限流。

您可以在 业务空间管理模型权限流控设置 自定义模型 页面找到已授权的模型,并设置其限流值。限流统计的是该空间下所有 API Key对该模型的调用总和。百炼支持通过以下两种相互独立的维度对模型调用进行限流。当任一维度的用量达到阈值时,系统将触发限流。

  • 请求数限流 (QPM - Queries Per Minute):每分钟允许的最大请求次数。

  • Token数限流 (TPM - Tokens Per Minute):每分钟允许处理的最大Token数量(包括输入和输出)。

例如:假设您的请求数限流为 20 次/分钟(QPM),而 Token 限流为 100,000 Token/分钟(TPM)。此时,若您在一分钟内向模型发送了20个请求,而仅消耗了1,000Token(并未超过100,000的上限),由于请求数已经达到了 QPM 的限制,就会触发限流。查看错误码

以上不支持通过API或命令行操作。

下一步

为子业务空间完成邀测模型的调用权限后,关于如何通过API调用模型,请参见子业务空间的模型调用