本文介绍Flink云监控(免费监控服务)的工作空间接入ARMS可观测监控Prometheus版监控服务,可观测监控Prometheus版可通过配置接入参数主动拉取Flink的性能指标,实现对Flink运行状况的实时监控和数据分析。
前提条件
- 已开通可观测监控Prometheus版,详情请参见Prometheus 实例计费。 
- 已开通实时计算Flink版,详情请参见开通实时计算Flink版。 
- 已开通阿里云资源中心,详情请参见开通资源中心。 
操作步骤
- 登录Prometheus控制台,在左侧导航栏单击接入中心。 
- 搜索阿里云Flink服务监控,单击阿里云Flink服务监控卡片。 
- 在阿里云Flink服务监控对话框的开始接入页签中,选择待接入的Flink工作空间,单击确定。  
完整的数据接入大概需要1~2分钟左右。数据未完整接入前,监控大盘不显示数据。
查看监控大盘
可观测监控Prometheus版默认内置了Flink的三张监控大盘,包括Flink Monitoring(Flink ETL作业监控大盘)、Flink Session Cluster Monitoring(Flink Session作业监控大盘)、Flink Change Data Capture Monitoring(Flink CDC作业监控大盘)监控能力,您可以通过以下方式查看监控大盘。
- 登录Prometheus控制台,在左侧导航栏单击接入管理。 
- 在接入管理页面,单击已接入环境页签。选择云服务区域环境,然后单击目标环境名称,进入云服务区域环境详情页面。 
- 在组件管理页签,选择大盘查看Prometheus内置的监控。  
告警规则创建
- 登录Prometheus控制台,单击左侧导航栏实例列表。 
- 在实例列表中单击目标实例名称,进入Prometheus实例详情页面。 
- 单击左侧菜单栏的告警规则,再单击创建告警规则。  - 检测类型:支持通过基于预定义指标配置和自定义PromQL进行指标告警(Flink已支持的告警指标除外)。 
- 筛选条件:命名空间填写项目空间名称;部署作业填写项目空间下目标作业的部署作业ID(在Flink作业部署详情页签查看),选择等于时,对指定作业进行监控告警。 
 - 更多配置参数详情请参见创建Prometheus告警规则。