目的

当您的云账号下拥有很多服务器和各种云产品的资源时,如何才能快速的为这些资源创建报警规则,在报警规则不合理时修改报警规则。本文通过一个具体案例讲解大企业用户如何使用应用分组和报警模板功能,管理好各个业务使用的云资源的报警规则。

实战案例

当您的账号下服务器和其他云产品实例非常多时,首先建议您按照业务视角为资源创建不同的应用分组,然后通过应用分组来批量管理资源。

报警模板是如何提升配置报警规则的效率的

  • 报警规则配置在应用分组和配置在单实例上的不同
    • 创建报警规则时资源范围可以选择“实例”或者“应用分组”,如果选择“应用分组”,那么报警规则的作用范围就是整个应用分组内的所有资源。您的业务需要扩容或者缩容时,只需要将相应资源移入或移出应用分组,而不需要增加或删除报警规则。如果需要修改报警规则,也只需要修改这一条报警规则,就生效在组内所有实例上。
    • 如果您选择将报警规则创建在实例上,那么该规则只对单一实例有效。修改报警规则时也只对单一实例生效。当实例增多时报警规则会变得难以管理。
  • 报警模板如何提升配置规则的效率
    • ECS、RDS、SLB等基础服务在配置报警时,监控项和报警阈值相对固定,为这些需要报警的指标建立模板后,新增业务时,创建好应用分组后直接将模板应用在分组上,即可一键创建报警规则。
    • 当您需要批量新增、修改、删除报警规则时,也可以修改模板后,将模板统一应用在分组上,极大的节省操作时间。

操作步骤

下面我们以一个常见的电商网站后台业务为例讲解如何创建应用分组和使用报警模板,快速将业务的云上监控报警体系搭建起来。

  1. 电商后台通常包含库存管理、支付管理、商品管理等模块。首选我们创建一个名为“库存管理线上环境”的应用分组。
    • 进入应用分组页面,单击页面右上角的创建组按钮,进入创建应用分组页面。
    • 为分组填写名称,并且选择库存管理这块业务使用的云资源,我们以最常见的服务器+数据库+负载均衡资源组合为例。


    • 选择通知对象,当应用分组内的报警规则发生报警时,会发送给这里的通知对象。

    • 点击确认后完成分组的创建。
  2. 创建报警模板
    1. 进入报警服务的报警模板页面,点击页面右上角的创建报警模板按钮,进入创建模板页面。
    2. 填写模板基本信息

    3. 添加报警策略,将业务模块需要的报警策略添加到报警模板中。

    4. 点击确认保存模板配置。
  3. 将模板应用在分组上

    在模板列表中选择上一步创建好的模板,应用在库存管理线上环境这个应用分组上。并且选择通知方式