DTS产品已接入云监控平台,通过对重要的监控指标设置报警规则,让您及时得知指标数据发生异常,帮您迅速定位处理故障。

背景信息

云监控平台目前支持的监控项为延迟信息和任务状态:
监控项目 说明 配置入口
延迟信息 监控增量数据迁移延迟信息,当迁移延迟、同步延迟或订阅延迟的时间超过设定值时(单位为毫秒),触发报警规则。 阈值报警
任务状态 监控任务的状态,当任务的状态为异常恢复时,触发报警规则。 事件报警

设置阈值报警

说明 以云监控新版控制台操作举例。
  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警规则
  3. 报警规则列表页面,单击创建报警规则
  4. 配置报警规则信息。
    配置项说明如下表所示:
    配置项 说明
    产品 待监控的DTS实例类型如下所示:
    • 数据传输服务 DTS(Migration):数据迁移实例。
    • 数据传输服务 DTS(Change_tracking):数据订阅实例。
    • 数据传输服务 DTS(Synchronization):数据同步实例。
    说明 您也可以在文本框中输入DTS来过滤,可快速查找到目标产品。
    资源范围 报警规则作用的资源范围。取值:
    • 全部资源:报警规则作用于指定云产品的全部实例上。
      说明 报警的资源最多为1000个,超过该值可能导致无法发送报警信息,建议您使用应用分组按业务划分资源后再设置报警。
    • 应用分组:报警规则作用于指定云产品指定应用分组内的全部实例上。
    • 实例:报警规则仅作用于某个具体实例上,此时您还需要选择目标实例。
    规则描述 当满足报警条件时,会触发报警规则。规则描述的设置方法如下:
    1. 单击添加规则
    2. 设置规则名称指标类型监控指标阈值及报警级别等参数。
    3. 单击确定
    通道沉默周期 报警发生后如果未恢复正常,报警通知重新发送的间隔时间。
    生效时间 报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
    报警人联系组 发送报警的联系人组。
    说明 若您尚未在云监控中创建报警联系人,请参见报警人和报警联系组
    报警回调 填入公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。配置方法请参见使用报警回调
    弹性伸缩 选择伸缩规则后,会在报警发生时触发相应的伸缩规则。您需要设置地域弹性伸缩组弹性伸缩规则
    说明 若您尚未创建伸缩组,请参见创建伸缩组
    日志服务 选择日志服务后,会将报警信息写入到日志服务。您需要设置日志服务的地域ProjectNameLogstore
    说明 若您尚未创建Project和Logstore,请参见快速入门
    消息服务MNS-topic 当报警发生时,会将报警信息写入消息服务的主题。您需要设置消息服务的地域主题
    说明 若您尚未创建主题,请参见创建主题
    无数据报警处理方法 无监控数据时报警的处理方式。取值:
    • 不做任何处理(默认值)
    • 发送无数据报警
    • 视为正常
  5. 单击确定

设置事件报警

  1. 登录云监控控制台
  2. 在左侧导航栏,选择事件监控 > 系统事件
  3. 单击事件报警规则页签,再单击创建报警规则
  4. 配置报警规则信息。
    配置 说明
    报警规则名称 填入报警规则的名称。
    产品类型 选择数据传输
    事件类型 保持默认的全部类型
    事件等级 保持默认的全部级别
    事件名称 在下拉框中选择事件名称,目前支持数据迁移、数据同步和数据订阅任务的异常和恢复事件。
    资源范围 支持全部资源应用分组两种范围,当选择应用分组时,您还需要指定目标分组信息。
    报警方式 选择报警通知方式,相关参数说明请参见设置阈值报警步骤4中的配置项说明表。
  5. 单击确定