将SAE监控数据导入Prometheus并通过Grafana展示

更新时间:
复制为 MD 格式

SAE提供了内置的基础监控能力,但在实际生产环境中,您可能需要将SAE的监控指标导入到可观测监控Prometheus版中,并结合可观测可视化Grafana版创建自定义监控大盘,实现更灵活的可视化监控方案。本文介绍如何通过云服务监控功能将SAE监控数据接入Prometheus,并在Grafana中创建监控大盘。

前提条件

背景信息

SAE的监控数据可以通过可观测监控Prometheus版的云服务监控功能进行采集。采集后的数据存储在Prometheus实例中,您可以在Grafana中创建自定义的监控大盘,实现对SAE应用的全方位可视化监控。

整体流程如下:

  1. ARMS控制台的接入中心,通过云服务监控功能将SAE监控数据接入Prometheus实例。

  2. 创建Grafana工作区并集成Prometheus数据源。

  3. 导入监控大盘模板,实现SAE监控数据的可视化展示。

  4. 配置命名空间,限制监控范围到指定的命名空间。

步骤一:将SAE监控数据接入Prometheus实例

  1. 登录ARMS控制台

  2. 在左侧导航栏,单击接入中心

  3. 接入中心页面,单击云服务监控(批量接入)

  4. 在批量接入向导中,完成以下配置:

    1. 选择所属环境类型:默认已选中云服务,无需修改。

    2. 选择数据存储地域:选择SAE应用所在的地域。

      请确保选择的地域与SAE应用部署的地域一致,否则将无法采集到监控数据。

    3. 配置信息:在云服务组件选择列表中选中阿里云 SAE 服务,单击确定

  5. 等待接入状态检查完成。接入成功后,系统会自动创建一个Prometheus实例。

  6. 在左侧导航栏选择Prometheus监控 > 实例列表,找到名称格式为云服务-${region_id}Prometheus实例。

    请记录该Prometheus实例的ID,后续步骤中需要使用该ID配置数据源名称。

步骤二:创建Grafana工作区并集成Prometheus数据源

  1. 登录ARMS控制台

  2. 在左侧导航栏选择Grafana服务 > 工作区管理

  3. 如果尚未创建Grafana工作区,单击创建工作区,根据业务需要选择地域版本,设置工作区名称Admin 密码,完成购买和创建。

  4. 在工作区管理页面,找到目标工作区,单击操作列中的管理

  5. 云服务集成区域,选择Prometheus 监控服务,选择地域,找到步骤一中创建的Prometheus实例(名称格式为云服务-${region_id}),单击集成将其集成到Grafana工作区中。

步骤三:导入监控大盘

  1. 下载SAE Grafana监控大盘模板文件:sae-grafana-template.json

    需要将模板文件中的`${实例id}`全部替换为步骤一中记录的Prometheus实例ID。

  2. 在工作区管理页面,单击目标工作区对应的访问地址URL,登录Grafana控制台。用户名为admin,密码为步骤二中设置的Admin 密码

  3. 在左侧导航栏中,选择仪表板。在右上角点击新建 > 导入。上传并导入修改后的模板文件。

  4. 导入完成后,即可在Grafana中查看SAE应用的监控大盘,包括应用的CPU、内存、请求量等核心指标。

步骤四:配置命名空间

默认情况下,监控大盘展示该地域下所有命名空间的数据。如果您需要将监控范围限制到指定的命名空间,可以按照以下步骤操作:

  1. Grafana监控大盘页面,单击右上角的齿轮图标(Settings)。

  2. Settings页面,选择Variables选项卡。

  3. 找到namespaceId变量,单击进入编辑页面。

  4. Custom options中,填写需要监控的SAE命名空间ID,例如cn-hangzhou:default。如果需要监控多个命名空间,以英文逗号分隔。

    SAE命名空间ID可以在SAE控制台的命名空间页面查看。

  5. 单击Save dashboard,保存配置。

常见问题

接入SAE后,在Prometheus实例列表中找不到对应的实例?

请检查以下几点:

  • 确认选择的数据存储地域与SAE应用部署的地域一致。

  • 等待几分钟后刷新页面,实例创建可能需要一定时间。

  • 确认您的账号具有ARMS的访问权限。

Grafana大盘导入后没有数据显示?

请排查以下原因:

  • 确认模板文件中的数据源名称已正确修改为prom-${实例ID}格式。

  • 确认Prometheus数据源已成功集成到Grafana工作区。

  • 确认SAE应用正在运行且有流量产生。

  • 检查大盘页面顶部的时间范围筛选是否正确。