创建和调试Model API-API 网关-阿里云

Model API适用于面向人工智能应用开发的团队，提供了更加灵活和智能的AI网关配置和调试能力。它可以用于各种AI代理、AI观测、消费者鉴权、内容安全防护等插件的预置。本文主要介绍了如何创建、调试Model API。

创建Model API

打开AI网关控制台实例页面，在顶部菜单栏选择目标实例所在地域，并单击目标实例ID。
在左侧导航栏，单击Model API，然后单击创建Model API。
选择使用场景，并单击对应场景的创建按钮。
不同的场景会影响后续协议可选项与系统自动创建的默认路由，当前支持：
- 文本生成（Text）
- 图片生成（Image）
- 视频生成（Video）
- 语音合成（Audio）
- 向量化（Embedding）
- 文本排序（Rerank）
- 其他（Others）
配置基本信息。
在弹窗中先完成选择使用场景，进入创建Model API表单后，您可按以下说明进行配置：
- 协议：不同协议对应该场景下的一组内置默认路由，用于快速生成常用的 OpenAI/DashScope/vLLM 等兼容接口。
- API名称：您可自定义API名称，需注意名称必须全局唯一（同一账号下不可重复），支持英文、数字、下划线“_”、“-”，且不超过64个字符。
- 域名：访问该 API 的域名，支持选择多个。域名与基本路径 BasePath 的组合必须唯一。
  如果还没有域名，请单击右侧添加域名按钮完成创建。
- Base Path：配置API的基本请求路径，默认为 /。可选择是否启用转发至后端服务时移除。
  说明
  开启转发至后端服务时移除后，当请求转发到后端服务时，系统会自动移除请求路径中的BasePath部分。例如：
  - BasePath设置为 /api
  - 原始请求路径 /api/users
  - 实际转发到后端的路径变为 /users
- AI 请求观测: 开启后可查看 Metrics、Logging、Tracing 信息。Logging 与 Tracing 依赖 SLS 日志投递服务。
  重要
  启用后系统会记录所有 AI 请求内容（包括请求体 body）到访问日志，请妥善配置 SLS 并做好数据安全防护。
- 大模型服务: 支持单模型服务、多模型服务（按模型名称）、多模型服务（按权重）。
  - 单模型服务：选择 1 个 AI 服务，并可设置模型名称（可透传或改写）。
  - 多模型服务（按模型名称）：根据请求体中的模型名按规则匹配到不同服务；匹配规则支持通配符 ? 与 *，例如 qwen-* 可匹配 qwen-max、qwen-long。
  - 多模型服务（按权重）：选择多个 AI 服务并设置权重，支持透传或改写模型名。
- Fallback: 可开启并按顺序配置多条 Fallback 策略（可复用同一服务）。
- 资源组：支持选择默认或已有资源组，也可新建。资源组用于对账户资源分组管理、授权与监控。
  如需创建新的资源组，您可以单击创建资源组完成创建。
确认配置参数并单击确定完成创建。

调试Model API

说明

当前只支持文本生成的/v1/chat/completions调试。

打开AI网关控制台实例页面，在顶部菜单栏选择目标实例所在地域，并单击目标实例ID。
在左侧导航栏，选择Model API，单击目标API操作列的调试。
在调试面板中，选择域名和模型，按需开启流式请求开关、配置参数设置和自定义参数。在右侧模型返回页签中，输入调试内容并单击发送进行调试。