云监控与ARMS告警服务功能对比

实时计算Flink版支持选择云监控(免费监控服务)或ARMS可观测监控Prometheus版监控服务为您提供作业监控告警功能。本文介绍云监控和ARMS在Flink监控告警上的功能差异,您可以根据实际需要进行选择。

功能对比

对比项

功能

ARMS

云监控

服务可用性

-

Prometheus监控和告警服务可用性都不低于99.9%,详情请参见Prometheus服务等级协议

云监控服务监控指标的可用性不在平台承诺的SLA范围内,告警服务可用性不低于99.9%,详情请参见云监控服务等级协议

成本费用

监控告警费用

Prometheus指标采集以及告警服务按量计费,详情请参见计费说明告警计费说明

无订阅费用、免运维、监控与告警管理免费。通知渠道仅短信和语音按照条数收取少量费用,详情请参见免费额度按量计费

数据存储时长

每月免费额度50 GB,默认90天,详情请参见计费说明

存储免费,默认30天。

监控指标

监控指标展示

Flink开发控制台通过监控图表展示。ARMS控制台支持PromQL语法查询以及Grafana看板展示。

平台预聚合指标,通过实时计算Flink控制台监控图表以及云监控控制台图表展示,相对于ARMS存在一些不足,详情请参见云监控告警相对ARMS有哪些不足?

监控指标数量

Flink作业监控指标

告警管理

配置方式

  • Flink开发控制台。

  • ARMS控制台。

通过Flink开发控制台跳转到云监控控制台进行配置或订阅。

告警指标数量

  • Flink开发控制台支持配置7个监控指标(包括作业失败)的告警,详情请参见配置监控告警

  • 其他监控指标告警需要在ARMS控制台通过PromQL语法自定义配置。

  • 支持在云监控控制台订阅ECS宕机事后处理和ECS主动运维影响事件告警,详情请参见配置监控告警

提供20个监控指标告警以及订阅事件告警(作业失败告警、ECS宕机事后处理、ECS主动运维影响)能力。

支持单指标/多指标

  • 可直接在Flink开发控制台配置单指标(包括作业失败)告警。

  • 多指标告警需要在ARMS控制台通过PromQL语法自定义配置。

  • 支持历史运行作业查看监控指标。

  • 通过Flink开发控制台跳转到云监控控制台,设置单指标/多指标告警规则,并订阅作业失败事件告警。

  • 不支持历史运行作业查看监控指标。

配置告警规则

在云监控创建报警规则

配置告警模板

在云监控创建报警模板

事件告警

不支持事件告警,仅支持作业失败告警。

  • 支持系统或自定义事件告警。

  • 支持将事件报警投递到轻量消息队列(原 MNS)的指定队列、指定函数、公网可访问的URL或日志服务。

告警通知

告警通知方式

  • Flink开发控制台支持通过电话、短信、邮件、钉钉、Webhook告警通知方式,不支持排班通知。

  • ARMS控制台支持通过电话、短信、邮件、钉钉、企业微信、飞书和Webhook方式向联系人发送告警通知,支持排班通知。详情请参见告警通知对象

支持通过电话、短信、邮件、钉钉、企业微信、飞书和Webhook方式向联系人发送告警通知,支持排班通知。详情请参见报警联系人

告警通知策略

  • Flink开发控制台支持告警降噪通知策略。

  • ARMS控制台支持告警静默策略和告警升级通知策略,详情请参见静默通知策略以及升级通知策略

支持动态阈值报警通知合并报警黑名单报警策略

告警回调

支持

支持

一键报警

不支持

支持

OpenAPI

监控告警OpenAPI

说明

指标含义详情请参见Flink指标说明