高级监控报警概述

高级监控报警服务是基于Elasticsearch开发的一种SAAS服务,具备对集群指标和日志数据的采集、加工、监控、检索、可视化和报警等多种能力,为云上用户提供了一种开箱即用的一站式监控报警解决方案。通过使用高级监控报警服务,您可以实现对所有区域的Elasticsearch集群集中管理,查看或根据业务需要配置监控大屏,自由定制指标及日志报警规则等。此服务能够帮助您更加方便地监控Elasticsearch集群下各维度的信息,实时了解集群状况,及时定位并解决问题。

功能特性

高级监控报警服务支持的功能特性如下表所示。

类别

功能

说明

相关文档

服务

默认自动开通高级监控报警服务

阿里云Elasticsearch会为您自动开通高级监控报警服务,并将您账号下的存量实例和新购实例接入监控报警服务。

监控

指标监控

您可以在指标监控页面监控所有集群的基础指标和引擎侧指标,也可以根据实例、索引和节点等筛选数据,精确掌握实时信息。

日志监控

您可以在日志监控页面查看所有集群的日志概况,也可以根据实例、索引、节点和检索条件等查询各类日志,快速发现和定位问题。

自定义监控

您可以在自定义监控页面根据业务需要配置监控大屏,并查看您自定义的监控大屏和日志报警大盘。

报警

日志报警

日志报警配置

您可以通过日志监控页面的入口进入到日志报警配置界面,可参考系统为您提供的日志报警模板,自定义日志报警规则并添加报警联系人。

日志报警

日志报警管理

您可以在Grafana报警页面,查看所有已配置的日志报警规则、修改配置、管理报警规则的生效状态等。

指标报警

指标报警组和报警规则

一个指标报警组可以包含一个或多个报警规则,同一个报警规则可以加入多个报警组。

通过指标报警规则配置,您可以设置多维度的监控指标和Tags,帮助您快速定位Elasticsearch的性能问题,提高运维排查效率。

指标报警联系人和联系人组

指标报警联系人组可以包含一个或多个报警联系人。同一个报警联系人,也可以被加入到多个报警联系人组中。

在指标报警规则设置中,您可以添加报警联系人组或报警联系人,将报警通知发送给该组下所有联系人或某个指定的联系人。

指标报警通知和报警事件

您可以在概览页面,查看所有指标报警组的通知记录和报警事件;也可以在报警组列表页面,查看单个报警组的通知记录和报警事件。

优势

  • 海量指标全覆盖

    基于阿里云自身丰富的运维经验,对集群指标和日志的采集实现了全方位覆盖,特别是提供了全面的自研引擎侧指标数据。

  • 集中管理

    数据汇总,操作集中,易于管理,方便用户随时掌握集群整体情况;且默认为您账号下的存量实例和新购实例提供高级监控报警服务,便捷省力。

  • 数据可视化,监控自定义

    内嵌多组图表大盘,将复杂信息清晰展示,帮助用户快速了解集群状况和变化趋势;支持用户根据自身业务需要自由定制监控大盘和各类报警规则。