创建AI 网关实例-API 网关(API Gateway)-阿里云帮助中心

本文介绍如何创建AI 网关实例。

操作步骤

登录AI网关控制台。
在左侧导航栏，选择实例，并在顶部菜单栏选择地域。

单击创建实例，在AI网关购买页面中选择相关配置，然后单击立即购买。

配置项	说明
商品类型	支持专享实例（按量付费）、专享实例（包年包月）与Serverless（按量付费），关于三种类型的计费方式请参考计费说明。
地域	选择网关的地域。重要资源创建成功后，不能更换地域。
网关名称	自定义设置网关的名称。推荐用环境或环境加业务领域命名，例如test、order-prod等，最大长度为64个字符。
网关规格	根据实际需求选择节点规格，不同网关规格下的容量规格请参考网关类型。Serverless版本无网关规格。
资源组	支持默认资源组或已有资源组。如需创建新的资源组，单击创建资源组。说明使用资源组对云账号下的资源做分类分组管理，以组为单元进行权限管理、资源部署、资源监控等，而无需单独处理各个资源。
网络访问类型	支持公网、私网、公网+私网三种访问类型。公网：公网访问网关时，将会产生相应的公网流量费用，公网流量将基于云数据传输CDT进行统一计费和出账，采用BGP（多线）模式，详情可参考公网流量。私网：私网无流量费用。公网+私网：公网访问网关时，将会产生相应的公网流量费用，公网流量将基于云数据传输CDT进行统一计费和出账，采用BGP（多线）模式。访问私网无流量费用。
专有网络	选择网关实例运行所在的专有网络环境。如需创建新的专有网络，请前往专有网络管理控制台完成创建。说明网关所在的VPC与服务所在的VPC需保持一致。在选择VPC时，会显示是否存在容器或Nacos集群，避免误选VPC。
可用区选择	选择自动分配或手动选择。自动分配：选择一个交换机，系统会自动分配2个可用区部署网关节点。手动选择：手动选择部署网关节点的可用区和交换机。
交换机	选择网关实例运行的交换机。如需创建新的交换机，您可以前往专有网络管理控制台创建。
日志服务	选中使用日志服务（SLS），开通日志服务SLS并开启网关日志投递功能，提供日志分析和仪表盘。相关内容，请参见开启网关日志投递。
服务关联角色	已自动创建。允许AI网关访问其他云产品等服务。

在确认订单页面中，检查AI网关配置详情后，单击立即购买。

说明
网关实例创建过程预计需要1～5分钟时间。
返回AI网关实例页面，查看已创建的网关信息无误且运行状态为运行中，表示网关创建成功。

高级功能

在创建网关实例时，如需利用日志数据进行监控和分析，或需要对请求响应进行压缩，降低网关流量时，请参考如下操作进行配置。其中开启Gzip硬件加速只能在创建网关实例时进行开启，不支持创建后开启，日志服务无限制。

开启Gzip硬件加速

Gzip硬件加速是指通过专用硬件设备来实现数据的快速压缩和解压缩技术。通过将Gzip格式的解压缩任务从CPU卸载到专用硬件设备上，显著提升处理效率并降低CPU负载。

说明

Serverless版不支持Gzip硬件加速。

操作步骤

在AI网关购买页面，完成创建网关实例的同时，需要进行如下配置完成后单击立即购买：
- 地域：Gzip硬件加速支持的地域为杭州、北京、上海、深圳、乌兰察布、中国香港和新加坡。
  
  目前在支持的地域中，存在部分可用区不支持的情况，具体以产品购买页为准。
- 网关规格：选择aigw.medium.x1以上规格。
- Gzip硬件加速：勾选启用Gzip硬件加速。
- 可用区：勾选支持Gzip硬件加速的可用区，并选择交换机。
实例创建成功后，单击目标实例名称ID/名称，单击左侧导航栏的参数配置，在网关引擎参数区域编辑EnableGzipHardwareAccelerate参数。

说明
若在购买时未勾选启用 Gzip 硬件加速，则无法开启此配置。
开启后，需要客户端能够处理Gzip压缩的数据，对于支持的客户端需要在请求头中添加Accept-Encoding: gzip。

性能参考

开启Gzip压缩后，与开启前相比能节省多少流量？

在使用 Gzip 进行压缩时，压缩比（即压缩后数据大小与压缩前数据大小的比值）很大程度上受到数据本身的影响。压缩比越低，代表压缩的效果越好，压缩比越高，代表压缩的效果越差。

通常来说：如果数据中存在大量重复模式或结构（如文本中的字母、单词和标点），Gzip 压缩效果会更好，压缩比更低。相反，对于随机性高、熵值大的数据（如图片、视频、已压缩文件等），由于其内部重复性较低，压缩比通常较高，压缩效果有限。

不同的客户由于其业务属性不同，在使用Gzip压缩时的压缩比也有较大差异。根据核心地域内已启用 Gzip 的实例统计，大部分实例的压缩比集中在 10% 到 50% 之间，意味着开启 Gzip 后，这些用户平均可节省 50% 以上的流量。

已经开启Gzip的情况下，使用硬件加速可以节省多少实例资源？

开启Gzip硬件加速后，网关将使用专用的硬件设备进行压缩，从而可以节省CPU资源。下面的压测数据对比了在承接相同QPS的流量的情况下，开启Gzip硬件加速的单节点实例，和使用软件Gzip的4节点实例之间的CPU消耗。

例如，压缩的数据是一份大小约为120k的JSON文本：

QPS	硬件加速gzip/aigw.medium.x1/单节点 CPU消耗	软件gzip/aigw.medium.x1/4节点 CPU消耗
2000	9%	11%
5000	26%	28%
10000	56%	56%
13000	69%	72%

从表格数据中可以看到，开启Gzip硬件加速/单节点的CPU消耗与软件Gzip/4节点的CPU消耗基本上持平。相当于原本需要4个节点才能承载，开启Gzip硬件加速后仅需要1个节点，可以节省大约75%的实例资源。

开启网关日志投递

如果需要收集、存储和分析网关运行日志，可以在创建网关实例时开通日志服务（SLS）进行日志分析和大盘监控。

在完成创建网关实例的同时，勾选使用日志服务（SLS），系统将开通日志服务（SLS）并开启网关日志投递功能。

开启日志投递以后，可前往观测分析>日志中心查看网关日志。

日志字段说明

字段名	类型	含义
__time__	long	日志产生的时间。
cluster_id	string	购买的网关实例。
ai_log	json	针对Model API/Agent API/MCP API设计的日志字段，字段格式为json。其他类型的API此字段为空。 api: ai api的名称。 cache_status: Model API中开启内容缓存时该字段会反映请求是否命中缓存。 consumer: 开启消费者鉴权后，此字段会记录当前请求的消费者身份。 fallback_from: Model API中开启fallback策略时，此字段记录请求从哪一条路由fallback过来。 input_token: LLM请求输入token数。 llm_first_token_duration: LLM请求首包RT。 llm_service_duration: LLM请求整体RT。 model: LLM请求的模型名称。 output_token: LLM请求输出token数。 response_type: LLM请求流式/非流式。 safechack_status: LLM请求内容安全检测状态。 token_ratelimit_status: LLM请求是否被限流拦截。
authority	string	请求报文中的Host Header。
bytes_received	long	请求的Body大小（不包含Header）。
bytes_sent	long	响应的Body大小（不包含Header）。
downstream_local_address	string	网关Pod地址。
downstream_remote_address	string	连接到网关的Client端地址。
duration	long	请求的整体耗时。包含从网关收到来自下游的第一个字节开始，到发送出最后一个响应字节为止的时间段。单位毫秒。
method	string	HTTP方法。
path	string	HTTP请求中的Path。
protocol	string	HTTP的协议版本。
request_duration	long	从网关收到来自下游的第一个字节开始，到收到来自下游的最后一个字节为止的时间段。单位毫秒。
request_id	string	网关会为每次请求产生一个ID，并放在Header的`x-request-id`中，后端可以根据这个字段记录并进行排查。
requested_server_name	string	SSL连接时使用的Server Name。
response_code_details	string	提供与响应码相关的额外信息。例如via_upstream表示响应码是由后端服务返回的，route_not_found表示请求没有匹配的路由。
response_tx_duration	long	从网关收到来自上游的第一个字节开始，到给下游发送出最后一个字节为止的时间段。单位毫秒。
route_name	string	路由名。
start_time	string	请求开始时间。格式：UTC。
trace_id	string	Trace ID。
upstream_cluster	string	上游集群。
upstream_host	string	上游IP。
upstream_local_address	string	本地连接上游的地址。
upstream_service_time	long	上游服务处理请求的耗时（毫秒），包括网关访问上游服务的网络耗时和上游服务自身处理耗时两部分。
upstream_transport_failure_reason	string	上游链接失败的原因。
user_agent	string	HTTP Header中的UserAgent。
x_forwarded_for	string	HTTP Header中的`x-forwarded-for`，通常用来表示HTTP请求端真实IP。