告警监控规则触发告警后,日志服务会根据告警策略进一步处理告警信息,包括合并和静默告警。 本文介绍创建告警策略的操作步骤。
第一步:添加策略
登录日志服务控制台。
-
在Project列表区域,单击任意一个Project。
-
在左侧导航栏中,单击告警。在告警中心页面,选择。在告警策略页签中,单击创建。
单击 行动策略 页签。
-
在添加策略对话框中,配置标识符和名称。
对话框下方提供 路由合并策略 和 静默策略 两个页签,可按需选择策略类型后在画布中编排流程。
参数
描述
标识符
告警策略标识符,不可重复。
名称
告警策略的名称。
第二步:路由合并策略
当系统产生大量重复的告警时,通过合并策略可将这些告警合并为一个告警进行通知。您可以在日志服务提供的图形化界面中配置条件和分组合并规则,制定一条路由合并策略。
配置说明
-
条件节点的匹配模式
您在配置告警策略和行动策略时,可添加条件节点,当告警集合中的告警满足条件时才会执行相应的动作。
-
操作符:条件配置支持正则匹配和数据范围匹配。
正则匹配:通过正则表达式完成条件匹配。
例如,在条件配置中,将对象设置为规则名,输入正则表达式
\d+进行匹配。数值范围匹配:通过数值比较(例如等于、数值大于等于等)完成条件匹配。
例如,选择对象为时间相关,字段为恢复时间,操作符选择数值范围,并输入条件值
[*,100003]。配置完成后单击确认。您也可以单击高级模式切换配置方式。 -
模式:您可以通过标准模式或高级模式添加多个条件。
标准模式:多个条件之间为AND关系。
例如,在标准模式下添加筛选条件:将对象设置为严重度,操作符设置为数值等于,值设置为严重;将对象设置为所属区域,操作符设置为等于,值设置为
cn-huhehaote。单击每行右侧的加号或减号按钮可增删条件,完成后单击确认。高级模式:多个条件之间可以为AND或OR关系,并支持您使用圆括号将多个条件归为一组。
例如在高级模式下,每行条件可分别设置对象(如严重度、所属区域、规则名)、操作符(如数值等于、等于)和对应的值,行间通过或或且连接符组合逻辑关系,并可通过右侧加减号按钮增删条件行。
-
-
合并基准、行动策略、首次等待、变化等待和重复等待,配置说明请参见告警分组合并。
配置示例
-
在路由合并策略页签中,单击
图标。 -
配置判断条件。
在条件面板中,将对象设置为阿里云账号ID,操作符设置为等于,并在值输入框中输入目标账号ID,然后单击确认。
-
配置合并告警的规则。
如果env标签为prd,按照告警源项目合并,执行SLS内置行动策略;如果env标签为test,按照告警规则合并,执行test行动策略。
两个分组合并配置的等待时间均为:首次等待 30秒、变化等待 10分钟、重复等待 4小时。
-
单击条件和合并告警对话框对应的
图标,结束配置。
第三步:静默策略
在静默时间内,符合条件的告警,不会触发告警通知。您可以在日志服务提供的图形化界面中配置条件和静默时间,制定一条静默策略。
配置说明
配置示例
-
在静默策略页签中,单击
图标。 -
配置判断条件和静默时间。
符合告警严重度为中,监控规则所属项目的名称包含test-project,标签expired为true等条件的告警,静默1个小时;否则没有owner标签的告警持续静默。示例中第一个条件节点包含三个条件:告警严重度数值大于等于中、监控规则所属项目正则匹配
test-project.*、标签.expired等于true。满足条件时,静默时间类型选择特定时间范围(如 2022-06-10 17:18:47 至 2022-06-10 18:18:47);不满足时进入第二个条件节点:标签.owner不存在。满足该条件时,静默时间类型选择持续;不满足则不做静默处理,流程直接结束。
删除节点和添加节点说明
-
删除节点
将鼠标悬浮在目标节点上,单击右键,然后单击删除节点。
-
添加节点
此处以路由合并策略为例。
说明如果您已经添加了结束节点,则删除结束节点后,才能继续添加条件、分组合并等节点。
-
单击
图标,添加条件节点。 -
单击
图标,添加分组合并节点。 -
单击
图标,添加结束节点。
在工作流编辑器中,条件节点的判断条件设置为「阿里云账号ID 等于 指定账号ID」。当条件结果为是时,流程连接至分组合并节点,按照配置的合并规则对告警进行分组合并处理;当条件结果为否时,流程连接至后续操作节点,可继续添加相应的处理动作。所有分支最终连接至结束节点,完成路由合并策略的流程。
-