云监控通过监控弹性公网IP的流出流量、流入流量、流出数据包数、流入数据包数等监控项,帮助您监测服务的运行状态,并支持您对监控项设置报警规则。在您购买弹性公网IP服务后,云监控会自动对上述监控项收集数据。

监控服务

  • 监控项说明
    监控项 含义 维度 单位 最小监控粒度
    网络流入带宽 平均每秒通过EIP流入ECS的流量 实例 bit/s 1分钟
    网络流出带宽 平均每秒ECS通过EIP向外流出的流量 实例 bit/s 1分钟
    流入数据包数 平均每秒通过EIP流入ECS的数据包数量 实例 packages/s 1分钟
    流出数据包数 平均每秒ECS通过EIP向外流出的数据包数量 实例 packages/s 1分钟
    限速丢包速率 由于实际业务带宽使用超过设置的带宽峰值导致的数据包被丢弃的速率。 实例 pps 1分钟
  • 查看监控数据
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的弹性公网IP,进入弹性公网IP监控列表页面。
    3. 单击实例名称或操作中的监控图表,进入监控图表页面。
    4. (可选)单击大小图切换图标,切换大图显示。

报警服务

  • 设置报警规则
    1. 登录云监控控制台
    2. 单击左侧导航栏中云服务监控下的弹性公网IP,进入弹性公网IP监控列表页面。
    3. 单击实例列表操作中的报警规则,进入实例的报警规则页面。
    4. 单击右上角的创建报警规则,选择资源范围、根据参数设置报警规则,选择通知方式,单击确认即可。
  • 参数说明
    • 产品:例如云服务器ECS、RDS、OSS 等。
    • 资源范围:报警规则的作用范围,分为全部资源实例
      • 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如设置了全部资源粒度的MongoDB CPU使用率大于80%报警,则只要用户名下有MongoDB CPU使用率大于80%,就会发送报警通知。资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。
      • 实例:表示该规则只作用在某个具体实例上。例如设置了实例粒度的主机 CPU 使用率大于80%报警,则只要这个实例 CPU使用率大于80% ,就会发送报警通知。
    • 规则名称:报警规则的名称。
    • 规则描述:报警规则的主体,定义在监控数据满足何种条件时,触发报警规则。例如规则描述为网络入流量5分钟平均值>=100Mbytes,则报警服务会5分钟检查一次5分钟内的数据是否满足平均值>=100Mbytes。

      报警规则举例说明:以主机监控为例,单个服务器监控指标15秒上报一个数据点,5分钟有20个数据点。

      • CPU使用率5分钟平均值>90%, 含义是CPU使用率 5分钟的20个数据点平均值大于90%。
      • CPU使用率5分钟总是>90%, 含义是CPU使用率 5分钟的20个数据点全部大于90%。
      • CPU使用率5分钟只要有一次>90%,含义是CPU使用率 5分钟的20个数据点至少有1个大于90%。
      • 公网流出流量5分钟总计>50M ,含义是公网流出流量5分钟的20个数据点求和结果大于50M。
    • 通道沉默时间:指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
    • 连续几次超过阈值后报警:连续几次报警的探测结果符合您设置的规则描述,才会触发报警。例如规则描述为“CPU使用率 1分钟内平均值>80%,连续3次超过阈值后报警”,则连续出现3次 CPU使用率 1分钟内平均值>80%的情况,才会触发报警。
    • 生效时间:报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
    • 通知对象:发送报警的联系人组。
    • 报警级别
      • 电话+短信+邮件+钉钉机器人
      • 短信+邮件+钉钉机器人
      • 邮件+钉钉机器人
    • 邮件主题:默认为产品名称+监控项名称+实例ID。
    • 邮件备注:自定义报警邮件补充信息。填写邮件备注后,发送报警的邮件通知中会附带您的备注。
    • 报警回调:填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。