本文为您介绍如何配置报警管理。
召回引擎版默认报警
为了更加方便快捷的创建报警规则,召回引擎版提供了默认报警组(包含多种常见的报警规则)功能。
报警规则包含:索引变化率、ha3通用查询耗时、查询节点内存使用率、查询节点cpu使用率、数据节点内存使用率、数据节点cpu使用率和数据节点磁盘使用率相关的报警, 目标集群为所有集群。用户只需要添加报警通知人、报警方式并开启报警即可使用。
引擎监控报警
数据切换报警:
项目  | 报警指标  | 报警阈值  | 通知间隔  | 
全量延迟  | opensearch.ha3suez.searcher.index.full_delay_hours  | 自定义  | 5分钟  | 
批次延迟  | opensearch.ha3suez.searcher.index.batch_inc_delay_minutes  | 15分钟  | 5分钟  | 
引擎默认报警:
项目  | 报警指标  | 报警阈值  | 通知间隔  | 
索引变化率  | opensearch.ha3suez.searcher.index.rate_of_change  | WARNING:>20 CRITICAL:>20  | 5分钟  | 
数据节点cpu使用率  | opensearch.ha3suez.searcher.proc_cpu  | WARNING:>60 CRITICAL:>80  | 5分钟  | 
ha3通用查询耗时  | opensearch.ha3suez.qrs.basic.qrssessionlatencynormal  | WARNING:>400 CRITICAL:>800  | 5分钟  | 
数据节点磁盘使用率  | opensearch.ha3suez.searcher.disk_use_ratio  | WARNING:>80 CRITICAL:>90  | 5分钟  | 
查询节点cpu使用率  | opensearch.ha3suez.qrs.proc_cpu  | WARNING:>60 CRITICAL:>80  | 5分钟  | 
数据节点内存使用率  | opensearch.ha3suez.searcher.proc_mem_used_ratio  | WARNING:>80 CRITICAL:>90  | 5分钟  | 
查询节点内存使用率  | opensearch.ha3suez.qrs.proc_mem_used_ratio  | WARNING:>80 CRITICAL:>90  | 5分钟  | 
更多监控指标参考:监控指标
开启默认报警
1.在报警组列表页,点击默认报警按钮,并在弹出框点击确认:

2.找到新创建好的默认报警,点击报警规则列表按钮:

3. 在报警规则列表页面点击开启按钮:

用户也可以点击修改报警规则按需修改默认报警的阈值、通知间隔、通知人和通知方式:

仅支持创建一个向量检索版默认报警
自定义报警组
创建报警组
1.登录开放搜索-召回引擎版控制台,单击页面左侧菜单栏报警管理>报警组列表,点击创建报警组:

2.在创建报警组弹框中填写报警组名称以及描述备注信息,单击完成即可(也可以点击完成并添加报警规则,后续步骤参考新建报警规则):

新建报警规则
1.在报警组列表页,单击新建报警规则:

2.在新建报警规则弹出框中填写报警规则名称、可以修改目标集群(实例id)、报警指标、报警阈值、报警通知间隔、报警通知人(若没有可选的通知人需先创建联系人)以及通知方式(短信或电话),确认无误后点击创建即可:

3.配置好报警规则之后,点击开启按钮,再点击确定按钮即可。

查看报警规则
1.在报警组列表页,单击查看报警规则,即可在报警规则列表弹窗中查看该报警组下的报警规则,并且支持新建、修改、复制、删除、关闭(可按指定时间)报警规则功能,操作完成之后,点击确认即可:

删除报警组
1.在报警组列表页,单击删除,会弹出是否确认删除的提示框,点击确认即可删除该报警组。(该报警组中的所有报警规则也会被删除,请谨慎操作)。
