全托管服务系统监控和报警配置

本文为您介绍计算巢全托管部署服务下的系统监控和告警配置。

概述

在全托管部署场景中,监控数据归属于服务提供商,并且由服务提供商负责处理监控和告警任务。服务提供商可授权用户查看监控数据。全托管服务支持应用分组模型,允许通过应用分组将模板内的资源进行划分,并为不同分组内的资源配置独立的告警规则,从而实现细粒度的监控和告警。

监控

在该场景中,对于云监控支持的阿里云资源,如账号权限足够,则可在计算巢实例监控界面查看相应的资源监控信息。

服务商侧

  1. 服务商需要在创建、更新时,在服务运维处勾选需要用户授权开启云监控相关的代运维权限。

    image

  2. 由于该场景中,云资源及监控数据属于服务商,所以服务商可直接在用户的服务实例查看监控数据。

    image

用户侧

用户前往监控标签栏查看具体监控数据,以及故障列表等。如下图所示:image

告警配置

在全托管场景中,由服务商进行告警后的运维,因此告警规则和告警联系人均由服务商配置。

服务商配置

在创建、更新服务时,服务商可以选择服务模板中涉及的整体云资源的统一告警,或是将资源按应用分组划分,每个分组可以单独配置一个告警规则。

  1. 统一配置告警模板。

    服务运维(选填)的监控区域中对服务模板涉及的资源统一配置告警模板。image

  2. 应用分组维度设置告警模板。

    对配置了应用分组的服务分组设置告警模板。

    1. 设置应用分组,其中应用分组A应用分组Bimage

    2. 为不同分组配置告警模板。image

      说明

      全托管场景每个服务维度需要配置统一的告警联系人,所以在服务实例维度,即用户创建服务实例时就不用再填写告警联系人。

  3. 代运维配置。

    全托管部署服务附加代运维,是在全托管部署服务的基础上新增了代运维的功能,在这种类型中,用户创建服务实例时,是服务商授予用户可对阿里云资源进行某些操作,比如服务商授予用户监控权限,则用户可以看到监控和告警信息。

    image

    说明

    因此若用户需要接收告警通知,则需要在授权配置中勾选添加告警权限。此处可选择监控权限、只读权限或所有权限。

  4. 查看报警。

    当用户或者服务商创建完服务实例后,可查看应用的报警规则:

    image

相关文档

创建全托管服务