本文主要介绍如何将阿里云云原生 AI 网关实例接入到云监控2.0,以便于收集和分析网关的运行指标(监控数据)和详细的请求记录(日志数据)。通过接入配置,您可以实现对 AI 网关性能、流量、延迟和错误率的实时监控与告警,并利用日志进行故障排查和业务分析。
前提条件
已开通并拥有云原生 AI 网关服务实例。
已开通可观测监控Prometheus版 和企业云监控。
若使用 RAM 用户接入,需要授予
AliyunCloudMonitorFullAccess系统策略。
费用说明
指标接入会产生企业云监控实时导出费用及可观测监控Prometheus费用。
日志接入按日志服务SLS计费。
数据接入
登录云监控2.0控制台,选择目标工作空间后,在左侧导航栏单击接入中心,单击云原生 AI 网关开始接入。
新建或选择已有的策略名称,选择接入的实体范围。
根据实际需求勾选需要接入的可观测数据,单击确定。
可观测数据
说明
接入名称
非必填,设置配置项的名称
云原生AI网关监控指标
开启网关的性能监控。接入后,可以查看并配置网关的关键监控指标,例如 QPS(每秒请求数)、延迟、错误率、CPU/内存使用率等。
云原生AI网关日志
开启网关的日志收集。接入后,系统将收集并存储网关的详细请求日志,包括请求时间、源 IP、请求路径、响应状态码、模型调用量统计、模型 Token统计、模型请求风险统计等,方便进行审计和故障排查。
接入后可在实体探索或AI 应用可观测查看接入的实体及相关可观测数据。
存储策略说明
接入云原生 AI 网关后,云监控会创建对应的 SLS Store 和 Prometheus 实例用于存储对应可观测数据。
数据类型 | 默认存储位置 | 备注 |
指标 | Prometheus 实例:RegionShare:{{workspaceName}}:{{regionId}} | 无 |
网关接入日志 | SLS Project:aliyun-product-data-{{userId}}-{{regionId}} SLS Logstore:apig-access-log | 无 |
卸载或修改接入策略
如果期望取消或修改云原生 AI 网关的接入,可以在接入中心的接入管理页,找到对应的接入策略,进行编辑或删除。