图数据库GDB已接入云监控平台,通过对重要的监控指标设置报警规则,让您及时得知指标数据或实例发生异常,帮您迅速定位处理故障。
背景信息
云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务,为您提供开箱即用的企业级开放型一站式监控解决方案。您可以创建报警规则、设置监控项,在监控项的报警规则被触发时,云监控将通知报警联系组中的所有联系人。
报警联系人和联系组是云监控发送报警通知的基础。您需要先创建报警联系人和报警联系组,并将报警联系人添加到报警联系组。具体操作,请参见创建报警联系人或报警联系人组。
操作步骤
登录云监控控制台。
在左侧导航栏,单击
。单击创建报警规则。
在创建报警规则页面,根据页面配置向导设置报警规则。
参数
说明
产品
云监控可管理的云产品名称。
根据实例类型,选择图数据库GDB。
资源范围
报警规则作用的资源范围。取值:
全部资源:报警规则作用于指定云产品的全部资源上。
示例:您设置了全部资源粒度的GDB CPU使用率大于80%报警,则只要用户名下有GDB CPU使用率大于80%,就会发送报警通知。资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。
应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上。
实例:报警规则作用于指定云产品的指定资源上。
示例:您如果设置了实例粒度的主机CPU使用率大于80%报警,则当该实例CPU使用率大于80%时,会发送报警通知。
规则描述
报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:
单击添加规则。
在添加规则描述面板,设置规则名称、监控指标类型、监控指标、阈值、报警级别和报警方式等。
单击确定。
说明您可以通过单击添加报警规则设置多条报警规则。
通道沉默周期
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
生效时间
报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
报警联系人组
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。
关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。
标签
报警规则的标签。包括标签名称和标签值。
报警回调
公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调。
说明单击高级设置,可设置该参数。
弹性伸缩
如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。
说明单击高级设置,可设置该参数。
日志服务
如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。您需要设置日志服务的地域、ProjectName和Logstore。
关于如何创建Project和Logstore,请参见快速入门。
说明单击高级设置,可设置该参数。
消息服务MNS-Topic
如果您打开消息服务MNS-Topic开关,当报警发生时,会将报警信息写入轻量消息队列的主题。您需要设置轻量消息队列的地域和主题。
关于如何创建主题,请参见创建主题。
说明单击高级设置,可设置该参数。
函数计算
如果您打开函数计算开关,当报警发生时,会将报警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。
关于如何服务和函数,请参见快速创建函数。
说明单击高级设置,可设置该参数。
无数据处理方法
无监控数据时报警的处理方式。取值:
不做任何处理(默认值)
发送无数据报警
视为恢复
说明单击高级设置,可设置该参数。
设置完成后,单击确认。
创建完成后,您可以在云监控控制台报警规则列表中查看。
相关文档
您也可以在云监控控制台设置事件报警规则,设置方法请参见和管理系统事件报警规则(旧版)。
报警规则设置成功后,您可以在云监控控制台管理报警规则,具体请参见: