AI网关是ESA提供的统一API代理服务,在边缘节点部署AI接口转发能力,为您的AI应用提供可观测性、安全防护和性能优化。
功能简介
AI网关作为您的应用与AI服务提供商之间的代理层,提供以下核心能力:
统一接入:通过单一
endpoint接入多家AI服务提供商,兼容OpenAI API标准,无需修改现有代码即可切换不同模型。性能优化:利用智能缓存机制,对重复请求直接返回缓存结果,降低响应延迟并减少上游API调用成本。
安全防护:内置速率限制、IP白名单、API密钥认证等多层安全机制,保护您的AI服务免受滥用和攻击。
高可用性:支持自动故障切换和请求重试,当主供应商服务异常时自动切换到备用供应商,保障业务连续性。
可观测性:实时监控请求次数、
Token使用量、响应时间和成本统计,提供详细的请求日志和审计追踪。
功能原理
AI网关部署在ESA的全球边缘节点上,请求处理流程如下:
请求接收:客户端应用通过统一的
endpoint发送API请求到最近的边缘节点;安全验证:边缘节点对请求进行认证(API令牌、IP白名单等);
路由转发:根据配置的路由规则,将请求转发到指定的AI服务提供商(如阿里云百炼、OpenAI等);
结果缓存:将上游响应结果缓存到边缘节点,并返回给客户端。
监控记录:记录采样日志以及请求数、Token数、错误数量等指标数据。
路由机制:通过model参数指定目标AI模型,格式为{provider}/{model-name},例如:
openai/gpt-4o:调用OpenAI的GPT-4o模型deepseek/deepseek-chat:调用DeepSeek的chat模型qwen/qwen-plus:调用阿里云百炼的通义千问Plus模型
适用场景
多模型对比测试
场景描述:在选择合适的AI模型前,需要对比不同供应商的模型效果、响应速度和成本。
解决方案:通过AI网关的统一接口,只需修改model参数即可快速切换不同模型进行测试,无需修改应用代码或管理多个API密钥。
示例代码:
import OpenAI from "openai";
const client = new OpenAI({
defaultHeaders: {
"esa_aigw_auth": `Bearer ESA_API_TOKEN`,
},
baseURL: "https://YOUR_DOMAIN/v1",
});
const response = await client.chat.completions.create({
model: "qwen/qwen-plus", //填入使用的模型
messages: [{ role: "user", content: "What is Edge Security Acceleration?" }],
});主备切换
场景描述:依赖单一AI服务提供商存在服务中断风险,需要保障业务连续性。
解决方案:配置故障切换规则,当主供应商服务异常时自动切换到备用供应商,并支持请求重试机制。
配置示例:
import OpenAI from "openai";
const client = new OpenAI({
defaultHeaders: {
"esa_aigw_auth": `Bearer ESA_API_TOKEN`,
"x-ai-route-metadata": "YOUR_IFELSE_CONDITION_RULE", // 配置了ifelse条件时必传
},
baseURL: "https://api.example.com/v1",
});
const response = await client.chat.completions.create({
model: "dynamic/ai-test", // 路由配置
messages: [
{ role: "user", content: "Hello!" }
],
});
console.log(response.choices[0].message.content);安全合规
场景描述:企业级应用需要满足数据安全和合规审计要求。
解决方案:AI网关提供API密钥加密存储、请求日志留存、敏感数据脱敏和访问审计追踪等能力,满足合规要求。
注意事项
API密钥管理:AI网关需要配置上游AI服务提供商的API密钥,请妥善保管密钥并定期轮换。密钥将加密存储在ESA中。
模型兼容性:统一接口遵循OpenAI API标准,部分AI服务提供商的特有功能可能不支持。
监控数据延迟:监控指标数据可能存在1-5分钟的延迟,实时性要求高的场景建议结合日志分析使用。
操作步骤
前提条件
步骤一:创建AI网关
进入AI网关页面。
在AI 网关页面,单击创建 AI 网关,并在创建页面配置以下参数后单击确定:
网关名称:输入网关的名称,例如
my-ai-gateway备注:(可选)输入网关的描述信息
步骤二:配置API Key
在新创建的AI网关应用中,单击API Key 管理页签,单击添加 API Key。
在添加API Key页面,配置以下参数后单击确定:
名称:输入API Key自定义名称,如
qwen-apiAI 服务商:下拉选择对应的AI服务商
API Key:填入API密钥
步骤三:自定义域名绑定
在新创建的AI网关应用中,单击功能配置页签,单击添加域名。
在添加域名区域,输入自定义域名前缀,如
api-gateway,选择控制台根据已接入站点自动补齐的域名,如api-gateway.example.com。单击确定即可。
您可以选择开启身份验证功能,对所有请求进行身份校验。
步骤四:AI网关调用
完成以上操作后,即可进行调用测试:
在新创建的AI网关应用中,单击调用用例页签,选择已配置API Key的模型。
复制右侧示例代码,将其中的
your_domain字段替换为绑定的自定义域名(如开启了身份验证功能,需要将esa_api_token替换为系统生成的身份验证令牌)。运行示例代码即可。以cURL为例:

路由配置
您可以配置不同路由规则,AI网关将根据请求特征,自动匹配模型。还可以增加故障切换规则,当AI主供应商某个模型服务异常时自动切换到备用供应商或该主供应商的其他模型。
在AI网关应用中,选择路由配置页签,单击新增路由,并在新增路由页面填写自定义名称。
完成创建路由配置后,在路由列表单击对应路由配置操作列的编辑按钮。
在编辑页面,可进行可视化的模型路由配置:
配置路由条件:单击可视化模型的开始和模型服务流程之间的添加符号
,单击添加条件即可自动生成If...Else判断流程。单击If...Else流程的点击配置按钮,在右侧弹出框中单击添加条件。metadata.:填写需要进行判断的键,如test-key逻辑符号:选择逻辑符号,等于
==,不等于!=键值:填写
metadata.对应的取值,如ok
说明流程默认判断条件为
true时使用主供应商,为false时使用备用供应商,可以手动编辑模型配置进行调整。配置模型服务:分别配置
true和false分支的添加符号
,单击添加模型服务(也可以继续单击添加条件)后,单击模型服务流程块的点击配置,添加模型信息:AI 服务商:下拉选择AI服务商,如
Qwen模型名称:下拉选择对应的模型,如
qwen3-maxAPI Key:选择已添加的API Key,如
qwen-api-key
可单击添加 fallback 模型添加故障切换的备用模型配置。
配置完成后,单击保存并部署。后续将根据请求中的header
x-ai-route-metadata来匹配路由条件进行模型服务选择。
AI网关数据分析与日志
ESA会统计所有经过AI网关的请求的关键数据,帮助您分析AI应用的运行情况。
在AI网关应用中,选择可观测看板页签。
单击过滤器,选择数据统计范围即可展示:
请求数:在所选时间段内通过此 AI 网关发出的请求数
Token数:在所选时间段内此 AI 网关使用的预计 Token 数
错误数量:在所选时间段内从此 AI 网关发出的错误请求数
采样日志:详细的请求和响应信息,包括边缘状态码、时间、模型、请求、响应等信息。
支持的AI服务商
AI网关支持以下主流AI服务提供商,其他服务商将逐步开放:
供应商 | 支持能力 | 模型示例 |
阿里云百炼 | 通义千问系列 |
|
OpenAI | Chat Completions、Embeddings |
|
深度求索 | DeepSeek系列 |
|
部分AI服务提供商的特有功能(如函数调用、流式响应)可能需要额外配置或存在兼容性限制,具体支持情况请参见各供应商的API文档。
计费说明
AI网关默认为免费模式,无需任何额外计费,适用于广大开发者或者个人业务。后续将推出适用于企业用户的线上业务接入付费模式。
功能项 | 免费模式 |
网关应用数量 | 1个 |
可绑定域名数 | 1个 |
路由配置数 | 1个 |
数据查看时间范围 | 过去24小时 |