DTS产品已接入云监控平台,通过对重要的监控指标设置报警规则,让您及时得知指标数据发生异常,帮您迅速定位处理故障。
背景信息
云监控平台目前支持的监控项为延迟信息和任务状态:监控项目 | 说明 | 配置入口 |
---|---|---|
延迟信息 | 监控增量数据迁移延迟信息,当迁移延迟、同步延迟或订阅延迟的时间超过设定值时(单位为毫秒),触发报警规则。 | 阈值报警 |
任务状态 | 监控任务的状态,当任务的状态为异常或恢复时,触发报警规则。 | 事件报警 |
设置阈值报警
说明 以云监控新版控制台操作举例。
- 登录云监控控制台。
- 在左侧导航栏,选择 。
- 在报警规则列表页面,单击创建报警规则。
- 配置报警规则信息。配置项说明如下表所示:
配置项 说明 产品 待监控的DTS实例类型如下所示: - 数据传输服务 DTS(Migration):数据迁移实例。
- 数据传输服务 DTS(Change_tracking):数据订阅实例。
- 数据传输服务 DTS(Synchronization):数据同步实例。
说明 您也可以在文本框中输入DTS来过滤,可快速查找到目标产品。资源范围 报警规则作用的资源范围。取值: - 全部资源:报警规则作用于指定云产品的全部实例上。说明 报警的资源最多为1000个,超过该值可能导致无法发送报警信息,建议您使用应用分组按业务划分资源后再设置报警。
- 应用分组:报警规则作用于指定云产品指定应用分组内的全部实例上。
- 实例:报警规则仅作用于某个具体实例上,此时您还需要选择目标实例。
规则描述 当满足报警条件时,会触发报警规则。规则描述的设置方法如下: - 单击添加规则。
- 设置规则名称、指标类型、监控指标、阈值及报警级别等参数。
- 单击确定。
通道沉默周期 报警发生后如果未恢复正常,报警通知重新发送的间隔时间。 生效时间 报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。 报警人联系组 发送报警的联系人组。 说明 若您尚未在云监控中创建报警联系人,请参见报警人和报警联系组。报警回调 填入公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。配置方法请参见使用报警回调。 弹性伸缩 选择伸缩规则后,会在报警发生时触发相应的伸缩规则。您需要设置地域、弹性伸缩组和弹性伸缩规则。 说明 若您尚未创建伸缩组,请参见创建伸缩组。日志服务 选择日志服务后,会将报警信息写入到日志服务。您需要设置日志服务的地域、ProjectName和Logstore。 说明 若您尚未创建Project和Logstore,请参见快速入门。消息服务MNS-topic 当报警发生时,会将报警信息写入消息服务的主题。您需要设置消息服务的地域和主题。 说明 若您尚未创建主题,请参见创建主题。无数据报警处理方法 无监控数据时报警的处理方式。取值: - 不做任何处理(默认值)
- 发送无数据报警
- 视为正常
- 单击确定。