网关类型

AI网关支持专享实例与Serverless两个版本,本文介绍相关版本的各项能力、参数与限制说明,帮助用户选择合适的版本与规格。

版本对比

  • Serverless:支持自动弹性伸缩,用户无需管理底层资源,实现免运维。服务按调用量计费,助力业务快速接入与低成本启动。

  • 专享实例:提供独立部署的专属资源实例,支持插件扩展、硬件加速和WAF集成等高级能力,保障高安全性并提供更高的SLA服务等级承诺,满足企业对稳定性、安全性与可扩展性的更高要求。

分类

特性

Serverless

专享实例

模型代理

文生文

支持

支持

多模态

支持

支持

内置策略

支持

支持

MCP Server

MCP 代理

支持

支持

HTTP to MCP

支持

支持

Agent 代理

百炼

支持

支持

Dify

支持

支持

自定义

支持

支持

插件

官方插件

不支持

支持

自定义插件

不支持

支持

规格

容量规格

自动弹性

根据QPS与客户端连接数分为不同容量规格

硬件加速

TLS 硬件加速

不支持

支持

QAT 硬件压缩解压缩

不支持

支持

安全

WAF 集成

不支持

支持

可观测

监控与告警

仅业务指标

说明

Serverless 设计,托管底层系统,用户无需关注系统级运维。

  • 业务指标

  • 系统资源

  • 自定义配置

接入点

固定 EIP

不支持固定EIP,使用共享接入点

支持固定 EIP,独享接入点

入口带宽

多实例共享带宽,单网关实例上限 400Mbps

独享带宽,单网关实例带宽默认上限 4Gbps,支持动态调整

运维

变更配置

Serverless 设计,性能自动弹性,用户无需关注服务配置。

可按需变更配置,无法降级到 Serverless 版

稳定性保障

SLA

99.9%

99.99%

依赖的中间件

共享,逻辑隔离

独享,物理隔离

版本更新

自动

手动

容量规格

对于专享实例版 AI 网关实例,根据不同实例规格的QPS、客户端连接数的性能差异,提供不同的实例规格。

以下是不同网关实例规格下各项参数详情。

实例规格

QPS

客户端连接数

aigw.small.x1

1500

20000

aigw.small.x2

3000

40000

aigw.small.x4

6000

80000

aigw.medium.x1

12000

160000

aigw.medium.x2

24000

320000

aigw.medium.x3

36000

480000

aigw.large.x1

48000

640000

aigw.large.x2

96000

1280000

aigw.large.x3

144000

1920000

aigw.large.x4

192000

2560000