本文为你介绍如何在Flink全托管开发控制台配置监控告警。

背景信息

在应用实时监控服务ARMS产品中配置监控告警时,需要指定集群、类型、大盘和PromQL等信息。操作复杂、上手成本高、告警配置效率低。除此之外,您还可以在Flink开发控制台,快速配置监控告警,操作简单、易用,效率高。但需要您提前开通ARMS,详情请参见开通和升级ARMS

配置监控告警

  1. 登录实时计算统一控制台
  2. Flink全托管页签,单击目标工作空间操作列下的开发控制台
  3. 在左侧导航栏上,单击作业列表
  4. 单击目标作业名称。
  5. 单击告警配置 > 告警规则页签。
  6. 单击添加告警规则
  7. 单击自定义规则
    如果您已在Flink开发控制台系统管理中配置了告警模板,您也可以单击告警模板名称,继续后续的步骤,加快配置监控告警的效率。告警模板创建步骤请参见创建告警模板
  8. 填写规则信息。
    规则信息
    类别 参数 描述
    具体规则 规则名称 以字母开头,仅包含小写英文字母、数字、下划线(_), 长度限制为3~64个字符。
    描述 规则的备注信息。
    内容 配置触发报警的条件内容,配置完成后会每间隔指定时间,对指定的指标值与阈值进行计算比较,计算结果满足则自动报警。
    其中:
    • 指标:支持两种指标
      • restart count in 1 minute:1分钟内Job Manager重启次数。
      • checkpoint count in 5 minutes:5分钟内Checkpoint成功次数。
    • 检查间隔N:每N分钟检查一次,需要小于等于60分钟,单位为分钟。
    • 运算符:支持>=<=两种。
    • 阈值:与指标进行比较的值。
    生效时间 告警监控的生效时间,可以指定只在白天(9点~18点)生效,默认全天生效。
    告警频率 支持1分钟和1天两种,即每分钟告警一次或每天告警一次。
    通知方式 通知方式 支持以下三种通知方式:
    • DingDing:钉钉
    • Email:邮件
    • SMS:短信
    说明 您可以在联系人中配置联系人的电话、邮箱和钉钉信息。
    联系人组 可以通知联系人或联系组。您可以在单击下面按钮,编辑联系人和联系组。
  9. 单击保存
    保存后的告警规则默认已启用,且出现在告警规则列表中,您可以选择停止、编辑或删除。

创建告警模板

  1. 登录实时计算统一控制台
  2. Flink全托管页签,单击目标工作空间操作列下的开发控制台
  3. 在左侧导航栏上,单击告警模板
  4. 单击添加告警模板
  5. 填写规则信息。
    报警模板
    类别 参数 描述
    具体规则 规则名称 以字母开头,仅包含小写英文字母、数字、下划线(_), 长度限制为3~64个字符。
    描述 规则的备注信息。
    内容 配置触发报警的条件内容,配置完成后会每间隔指定时间,对指定的指标值与阈值进行计算比较,计算结果满足则自动报警。
    其中:
    • 指标:支持两种指标
      • restart count in 1 minute:1分钟内Job Manager重启次数。
      • checkpoint count in 5 minutes:5分钟内Checkpoint成功次数。
    • 检查间隔N:每N分钟检查一次,需要小于等于60分钟,单位为分钟。
    • 运算符:支持>=<=两种。
    • 阈值:与指标进行比较的值。
    生效时间 告警监控的生效时间,可以指定只在白天(9点~18点)生效,默认全天生效。
    告警频率 支持1分钟和1天两种,即每分钟告警一次或每天告警一次。
    通知方式 通知方式 支持以下三种通知方式:
    • DingDing:钉钉
    • Email:邮件
    • SMS:短信
    说明 您可以在联系人中配置联系人的电话、邮箱和钉钉信息。
    联系人组 可以通知联系人或联系组。您可以在单击下面按钮,编辑联系人和联系组。
  6. 单击保存
    保存后的告警规则会出现在告警模板列表中,您可以选择编辑或删除。