MSE云原生网关基于应用实时监控服务ARMS提供了应用监控报警功能,可在满足报警条件时通过邮件、短信、钉钉等渠道实时报警,帮助您主动发现异常。在告警管理模块中,您可以管理账号下自定义监控报警规则,并查询告警事件和告警通知的历史记录。
前提条件
背景信息
告警控件本质是数据集的数据展示方式,所以在创建告警控件的同时,会创建一个数据集来存储告警控件的底层数据。
新建告警大约在10分钟内生效,报警判断会存在1 ~ 3分钟的延时。
创建告警规则
登录MSE网关管理控制台,并在顶部菜单栏选择地域。
在左侧导航栏,选择云原生网关 > 告警管理 > 告警规则管理。
在云原生网关告警页面,单击创建云原生网关告警策略管理。
在创建云原生网关告警策略管理页面,配置告警相关参数,完成后单击完成。
参数
描述
告警名称
填写告警规则名称。
Gateway
选择网关。
告警分组
选择告警指标的分组。
告警指标
选择告警指标,不同告警分组所支持的告警指标也不同,请根据实际需求进行选择。
告警条件
设置触发告警的条件,例如:当网关每秒请求量同比昨日降低20%时,发送告警。
筛选条件
默认无筛选,无需设置。
持续时间
设置产生告警事件的时间。
告警等级
设置告警的等级。告警严重程度从默认、P4、P3、P2、P1逐级上升。
告警内容
设置触发该告警时,所显示的告警内容。您可以使用Go template语法在告警内容中自定义告警参数变量,例如:
告警集群的ID:{{$label.envoy_clusterid}} 设置的告警阈值:{{$labels.metrics_params_value}} 触发告警的实际值:{{ printf "%.2f" $value }}
同时,告警内容也会根据告警指标自动进行调整。
告警通知
选择告警通知为极简模式或普通模式。
快速指定通知策略
当告警通知选择为普通模式时,ARMS告警中心会根据配置的通知策略对产生的告警事件进行分派、处理并发送通知。
高级设置
单击图标,设置告警规则标签和注释。
告警检查周期
指定告警检查周期。
标签
单击创建标签,设置告警规则的标签,设置的标签可用作分派规则的选项。
注释
单击创建注释,设置键为message,设置值为{{变量名}}告警信息。设置完成后的格式为:
message:{{$labels.pod_name}}重启}}告警信息
,例如:message:{{$labels.pod_name}}重启
。
后续操作
在云原生网关告警列表页面,在操作列中按需对目标报警规则采取以下操作。
如需编辑告警规则,请单击编辑,并在编辑云原生网关告警策略管理页面修改告警规则,然后单击保存。
如需启用或停止告警规则,请单击启动或停止,并在提示对话框中单击确认。
如需删除报警规则,请单击删除,并提示对话框中单击确认。
如需查看告警历史,请单击告警事件历史,在事件列表页面查看到历史告警信息。
可选:如果您想要批量管理多条告警规则,可选中多条告警规则,然后执行以下操作。
如需批量启动多条告警规则,请单击批量操作>批量启动告警规则,并在提示对话框中单击确认。
如需批量停止多条告警规则,请单击批量操作>批量停止告警规则,并在提示对话框中单击确认。
如需批量删除多条告警规则,请单击批量操作>批量删除告警规则,并在提示对话框中单击确认。
如需批量设置标签,请单击批量操作>批量设置标签,并在提示对话框中单击确定。