AI网关支持专享实例与Serverless两个版本,本文介绍相关版本的各项能力、参数与限制说明,帮助用户选择合适的版本与规格。
版本对比
Serverless:支持自动弹性伸缩,用户无需管理底层资源,实现免运维。服务按调用量计费,助力业务快速接入与低成本启动。
专享实例:提供独立部署的专属资源实例,支持插件扩展、硬件加速和WAF集成等高级能力,保障高安全性并提供更高的SLA服务等级承诺,满足企业对稳定性、安全性与可扩展性的更高要求。
分类 | 特性 | Serverless | 专享实例 |
模型代理 | 文生文 | 支持 | 支持 |
多模态 | 支持 | 支持 | |
内置策略 | 支持 | 支持 | |
MCP Server | MCP 代理 | 支持 | 支持 |
HTTP to MCP | 支持 | 支持 | |
Agent 代理 | 百炼 | 支持 | 支持 |
Dify | 支持 | 支持 | |
自定义 | 支持 | 支持 | |
插件 | 官方插件 | 不支持 | 支持 |
自定义插件 | 不支持 | 支持 | |
规格 | 容量规格 | 自动弹性 | 根据QPS与客户端连接数分为不同容量规格 |
硬件加速 | TLS 硬件加速 | 不支持 | 支持 |
QAT 硬件压缩解压缩 | 不支持 | 支持 | |
安全 | WAF 集成 | 不支持 | 支持 |
可观测 | 监控与告警 | 仅业务指标 说明 Serverless 设计,托管底层系统,用户无需关注系统级运维。 |
|
接入点 | 固定 EIP | 不支持固定EIP,使用共享接入点 | 支持固定 EIP,独享接入点 |
入口带宽 | 多实例共享带宽,单网关实例上限 400Mbps | 独享带宽,单网关实例带宽默认上限 4Gbps,支持动态调整 | |
运维 | 变更配置 | Serverless 设计,性能自动弹性,用户无需关注服务配置。 | 可按需变更配置,无法降级到 Serverless 版 |
稳定性保障 | SLA | 99.9% | 99.99% |
依赖的中间件 | 共享,逻辑隔离 | 独享,物理隔离 | |
版本更新 | 自动 | 手动 |
容量规格
对于专享实例版 AI 网关实例,根据不同实例规格的QPS、客户端连接数的性能差异,提供不同的实例规格。
以下是不同网关实例规格下各项参数详情。
实例规格 | QPS | 客户端连接数 |
aigw.small.x1 | 1500 | 20000 |
aigw.small.x2 | 3000 | 40000 |
aigw.small.x4 | 6000 | 80000 |
aigw.medium.x1 | 12000 | 160000 |
aigw.medium.x2 | 24000 | 320000 |
aigw.medium.x3 | 36000 | 480000 |
aigw.large.x1 | 48000 | 640000 |
aigw.large.x2 | 96000 | 1280000 |
aigw.large.x3 | 144000 | 1920000 |
aigw.large.x4 | 192000 | 2560000 |