您可以在这里方便、快速地针对不同向量检索版实例配置报警指标、阈值配置报警规则。报警服务支持电话、短信以及钉钉群三种报警通知方式。
引擎监控报警
为了更加方便快捷的创建报警规则,向量检索版提供了默认报警组(包含多种常见的报警规则)功能。
报警规则包含:数据切换延迟、索引变化率、ha3通用查询耗时、查询节点内存使用率、查询节点cpu使用率、数据节点内存使用率、数据节点cpu使用率和数据节点磁盘使用率相关的报警, 目标集群为所有集群。用户只需要添加报警通知人、报警方式并开启报警即可使用。
报警规则列表
数据切换报警:
|
项目 |
报警指标 |
报警阈值 |
通知间隔 |
|
全量延迟 |
opensearch.ha3suez.searcher.index.full_delay_hours |
自定义 |
自定义 |
|
批次延迟 |
opensearch.ha3suez.searcher.index.batch_inc_delay_minutes |
自定义 |
自定义 |
引擎默认报警:
|
项目 |
报警指标 |
报警阈值 |
通知间隔 |
连续触发次数 |
|
索引变化率 |
opensearch.ha3suez.searcher.index.rate_of_change |
WARNING:>20 CRITICAL:>20 |
5分钟 |
1次 |
|
数据节点cpu使用率 |
opensearch.ha3suez.searcher.proc_cpu |
WARNING:>60 CRITICAL:>80 |
5分钟 |
1次 |
|
ha3通用查询耗时 |
opensearch.ha3suez.qrs.basic.qrssessionlatencynormal |
WARNING:>400 CRITICAL:>800 |
5分钟 |
1次 |
|
数据节点磁盘使用率 |
opensearch.ha3suez.searcher.disk_use_ratio |
WARNING:>80 CRITICAL:>90 |
5分钟 |
1次 |
|
查询节点cpu使用率 |
opensearch.ha3suez.qrs.proc_cpu |
WARNING:>60 CRITICAL:>80 |
5分钟 |
1次 |
|
数据节点内存使用率 |
opensearch.ha3suez.searcher.proc_mem_used_ratio |
WARNING:>80 CRITICAL:>90 |
5分钟 |
1次 |
|
查询节点内存使用率 |
opensearch.ha3suez.qrs.proc_mem_used_ratio |
WARNING:>80 CRITICAL:>90 |
5分钟 |
1次 |
表中的报警阈值、通知间隔及连续触发次数为默认值,您也可在修改报警规则中按需修改。
更多监控指标参考监控指标。
开启默认报警
-
在报警组列表页,点击默认报警按钮,并在弹出框点击确认:
弹出框提示将自动创建通用查询耗时、查询节点内存使用率、查询节点CPU使用率、数据节点内存使用率、数据节点CPU使用率和数据节点磁盘使用率相关的报警,目标集群为所有集群。请添加报警通知人等信息后开启使用。
-
找到新创建好的默认报警,点击报警规则列表按钮。
-
在报警规则列表页面点击开启按钮:
默认报警规则的状态均显示为永久关闭,在对应规则的操作列单击开启即可启用。
用户也可以点击修改报警规则按需修改默认报警的阈值、连续触发次数、通知间隔、通知人和通知方式:
报警阈值分为 WARNING 和 CRITICAL 两个级别,均可设置阈值条件(如 >=)和对应数值。通知方式支持短信、电话和钉钉群。
向量检索版仅支持创建一个默认报警。
自定义报警组
创建报警组
-
登录向量检索版控制台,单击页面左侧菜单栏报警管理>报警组列表,点击创建报警组。
-
在创建报警组弹框中填写报警组名称以及备注信息,单击完成即可(也可以点击完成并添加报警规则,后续步骤参考新建报警规则):
报警组名称确定后无法修改,请谨慎填写。
新建报警规则
-
在报警组列表页,单击新建报警规则。
-
在新建报警规则弹出框中填写报警规则名称、选择目标集群(实例id)、报警指标、填写报警阈值、连续触发次数,选择报警通知间隔,最后选择好对应的通知人(若没有可选的通知人需先创建联系人)以及通知方式(短信、电话及钉钉群),确认无误后点击创建即可。
查看报警规则
在报警组列表页,单击查看报警规则,即可在报警规则列表弹窗中查看该报警组下的报警规则,并且支持新建、修改、复制、删除、关闭(可按指定时间)报警规则功能,操作完成之后,点击确认即可。
删除报警组
在报警组列表页对选定的报警组单击删除,会弹出是否确认删除的提示框,点击确认即可删除该报警组。
删除报警组后该报警组中的所有报警规则也会被删除,请谨慎操作。