本文为您介绍如何配置Prometheus监控报警。

操作步骤

  1. 登录实时计算统一控制台
  2. Flink全托管页签,单击对应工作空间操作列下的开发控制台
  3. 在左侧导航栏上,单击Applications > Deployments
  4. 单击您创建的目标Deployment名称。
  5. 单击MetricsMetrics
  6. 在左侧导航栏上,单击AlertingAlerting
  7. 在左侧导航栏上,单击报警管理 > 报警策略管理
  8. 在页面右上角,单击创建报警 > PrometheusPrometheus
  9. 在报警对话框中,配置如下参数。相关信息
    1. 填写报警名称,例如:网络接收压力报警。
    2. 选择要创建报警的Prometheus监控对应的集群
    3. 类型选择为grafana
    4. 大盘选择为Flink
    5. 按您的业务需要选择图表
    6. 选中同时满足下述规则
    7. 设置报警规则。
      1. 选中同时满足下述规则
      2. 编辑报警规则,例如:N=5时网络接收数据字节(MB)的平均值大于等于3时则报警。
        说明 一个Grafana图表中可能有A、B和C等多条曲线数据,您可根据您的需求设置监控其中的一条线。
      3. PromQL输入框中编辑或重新输入PromQL语句。
        注意 PromQL语句中包含的$符号会导致报错,您需要删除包含$符号的语句中=左右两边的参数。例如:将sum (rate (container_network_receive_bytes_total{instance=~"^$HostIp.*"}[1m]))修改为sum (rate (container_network_receive_bytes_total[1m]))
    8. 选中通知方式,例如:选中短信。
    9. 设置通知对象。在全部联系组中单击联系人分组的名称,该联系人分组出现在已选联系组中,即设置成功。