本文为您介绍如何使用云监控产品监控成本优化。

云监控产品自上线以来为数以万计的用户提供了方便的云上一站式监控报警服务。为了给用户持续提供更优质的监控服务,并且帮助用户更高效合理的使用云监控、减少监控报警滥用,云监控已于2018年4月2日正式商用,默认为所有云用户提供免费版。新用户可按需购买付费版本或资源包。

2018年6月1日起,未购买付费版本的老用户,各项用量将调整为免费版配额。超出免费版配额的用量将视为付费版本服务到期来处理,进行相关功能的暂停或用量限制。

付费模式的选择

云监控的计费模式分为购买包年包月的付费版套餐和购买一次性资源包。

  • 套餐说明

    一个云账号会默认开通云监控免费版,云监控免费版可以使用绝大多数云监控功能,如果您是个人开发者、初创型企业、部分业务刚刚迁移上云的企业,免费版即可满足您的运维监控需求。

    如果您的企业在云上的资源使用已颇具规模,免费版的配额和功能难以满足您的需求,可以考虑升级至付费版本。

    如果您只是重度使用了云监控的某一项功能并且免费版配额无法满足您的需求,可以购买自定义套餐,自主调节额度后下单。

  • 资源包说明

    云监控目前推出报警短信包、报警电话包、自定义监控包3种资源包。

    如果您在使用过程中出现报警短信不够用、需要使用报警电话的情况,可以购买短信资源包、电话资源包,避免您的业务报警时无法及时收到通知。

    如果随着业务扩展变化,套餐中的自定义监控配额无法满足您的需要,可以购买自定义监控包提升配额。

    各版本套餐额度和功能差异以及资源包介绍,可查看计费方式

资源消耗查询

登录云监控控制台,点击左侧导航栏中的资源消耗



资源使用优化

  • 报警短信、报警电话、自定义监控时间序列的选择

    在2018年4月2日之后购买的以上资源包,会叠加在您当前的配额上,只有当前配额用尽时才会开始消耗资源包内的配额。例如您曾经通过提工单的方式将短信配额调整到了3000条/月,那么2018年6月1日前您的短信配额仍然是3000条/月。购买一个5000条的短信包后,只有每月的3000条短信用尽才会开始使用短信包内的短信。如果您平时报警短信消耗比较大,建议您提早购买报警短信包。避免2018年6月1日短信配额变为免费版后,造成报警短信配额用尽无法正常报警。

  • 套餐种类的选择

    2018年6月1日前,您的各项监控报警配置不受免费版配额约束,各项功能均可以正常使用。您如果需要购买专业版、企业版或自定义版套餐,只需变配下单即可。

  • 报警规则数量优化

    报警规则条数是计费项之一,分为云产品报警规则和非云产品报警规则。

    • 基础监控报警规则

      基础监控报警规则指设置在云产品本身监控项上的报警规则,比如ECS的CPU使用率、RDS的磁盘使用率等。如果您的云 产品报警规则数量已超过当前版本,可以根据以下方法检查是否已物尽其用。

      报警规则可以从如下三个维度设置:

      • 具体资源

        比如单个ECS实例、CDN域名、SLB实例或具体的SLB端口。不推荐此种设置方式,因为方式会造成报警规则数量多、难以管理的问题。如果您设置在单个资源上的报警规则条件相同,且发送的联系人组也相同,可以将规则直接设置在全部资源上,或者将资源加入分组后设置分组级别规则



      • 应用分组
        • 云监控支持跨地域、跨云产品对资源分组。您可以根据企业的IT管理习惯将资源分组管理后再配置报警。
        • 建议:推荐此种设置方式,从而实现资源有序管理,节约报警规则。



      • 全部资源
        • 将报警规则设置在云资源层面,一条规则作用于所有存量云资源以及新增云资源。
        • 在这种设置下,所有资源只能使用同一个报警阈值,并且发送给相同的联系人组。
        • 建议:此种设置方式适合报警配置的初级阶段,快速使所有实例有报警保障。



      • 举例

        假设您有40个ECS实例,需要对每个ECS的4个监控项配置报警规则:

        • 报警规则全部配置在单实例上,会消耗40*4=160个报警规则。
        • 按业务、环境、规格等维度创建N个应用分组,只消耗N*4=4N个报警规则。
        • 配置在云产品的全部资源维度,只消耗4个报警规则。
      • 快速删除多余的报警规则

        假设您已经有非常多报警规则设置在实例上,希望通过分组管理,或简单配置一些适用于所有资源的规则,可以在控制台报警服务菜单的报警规则列表中删除单个实例的报警规则。我们会尽快优化该页面,方便您快速按维度、产品筛选和清理规则。

    • 非基础监控报警规则

      非基础监控报警规则指除了设置在云产品本身监控上以外的所有报警规则,目前包括站点监控、日志监控、事件监控、自定义监控、可用性监控的报警规则。

      这类报警规则和您的业务强相关,合理按需设置即可

  • 降低站点监控数量

    站点监控推出了新版本,支持全国各地省市运营商线路的网络拨测。所以站点监控是一款定位于互联网网络探测的监控产品,主要用于通过遍布全国的互联网终端节点,发送模拟真实用户访问的探测请求,监控全国各省市运营商网络终端用户到您服务站点的访问情况。

    如果您的站点监控里创建了大量ECS、SLB公网IP、内网IP探测或大量对外网不可访问的内部URL域名的探测,建议使用可用性监控。可用性监控的探测原理是选择一台或多台服务器,并安装好云监控插件。在配置监控任务时,选中安装云监控插件的服务器,并指定探测协议和探测地址(域名、IP),服务器会通过云监控插件发送相关请求到探测地址,收集响应时间和状态码用于报警和图表展示。

    当前可用性监控支持HTTP和Telnet,我们会于近期上线Ping相关的探测功能。

    更多可用性监控使用介绍可查看管理可用性监控内网监控最佳实践

  • 降低报警短信用量

    降低报警短信用量首先要养成好的报警规则配置习惯,避免报警规则的重复设置、选择合理的报警等级(严重程度较高的报警发短信,严重程度较低的报警发邮件、钉钉)。

    其次,报警规则会有一定的压缩机制。压缩机制对设置在应用分组或全部资源上的报警规则生效。这样的规则如果同一个周期内有多个资源发生了报警,会将多条信息压缩成一条发送。

    举个例子:您有20台ECS实例,设置了一个磁盘使用率大于95% 的报警在全部资源/某个应用分组上,检查频率是1分钟。12:31:00-12:31:00有5台ECS实例的磁盘超过了95%,这时5条信息会压缩为1条发送。

说明 欢迎加入云监控用户支持钉钉群(群号:11748452),阿里云研发团队为您在线解答云监控问题。