高级监控报警服务是基于Elasticsearch开发的一种SAAS服务,具备对集群指标和日志数据的采集、加工、监控、检索、可视化和报警等多种能力,为云上用户提供了一种开箱即用的一站式监控报警解决方案。通过使用高级监控报警服务,您可以实现对所有区域的Elasticsearch集群集中管理,查看或根据业务需要配置监控大屏,自由定制指标及日志报警规则等。此服务能够帮助您更加方便地监控Elasticsearch集群下各维度的信息,实时了解集群状况,及时定位并解决问题。
功能特性
高级监控报警服务支持的功能特性如下表所示。
类别 | 功能 | 说明 | 相关文档 | |
服务 | 默认自动开通高级监控报警服务 | 阿里云Elasticsearch会为您自动开通高级监控报警服务,并将您账号下的存量实例和新购实例接入监控报警服务。 | 无 | |
监控 | 指标监控 | 您可以在指标监控页面监控所有集群的基础指标和引擎侧指标,也可以根据实例、索引和节点等筛选数据,精确掌握实时信息。 | ||
日志监控 | 您可以在日志监控页面查看所有集群的日志概况,也可以根据实例、索引、节点和检索条件等查询各类日志,快速发现和定位问题。 | |||
自定义监控 | 您可以在自定义监控页面根据业务需要配置监控大屏,并查看您自定义的监控大屏和日志报警大盘。 | |||
报警 | 日志报警 | 日志报警配置 | 您可以通过日志监控页面的入口进入到日志报警配置界面,可参考系统为您提供的日志报警模板,自定义日志报警规则并添加报警联系人。 | |
日志报警管理 | 您可以在Grafana报警页面,查看所有已配置的日志报警规则、修改配置、管理报警规则的生效状态等。 | |||
指标报警 | 指标报警组和报警规则 | 一个指标报警组可以包含一个或多个报警规则,同一个报警规则可以加入多个报警组。 通过指标报警规则配置,您可以设置多维度的监控指标和Tags,帮助您快速定位Elasticsearch的性能问题,提高运维排查效率。 | ||
指标报警联系人和联系人组 | 指标报警联系人组可以包含一个或多个报警联系人。同一个报警联系人,也可以被加入到多个报警联系人组中。 在指标报警规则设置中,您可以添加报警联系人组或报警联系人,将报警通知发送给该组下所有联系人或某个指定的联系人。 | |||
指标报警通知和报警事件 | 您可以在概览页面,查看所有指标报警组的通知记录和报警事件;也可以在报警组列表页面,查看单个报警组的通知记录和报警事件。 |
优势
海量指标全覆盖
基于阿里云自身丰富的运维经验,对集群指标和日志的采集实现了全方位覆盖,特别是提供了全面的自研引擎侧指标数据。
集中管理
数据汇总,操作集中,易于管理,方便用户随时掌握集群整体情况;且默认为您账号下的存量实例和新购实例提供高级监控报警服务,便捷省力。
数据可视化,监控自定义
内嵌多组图表大盘,将复杂信息清晰展示,帮助用户快速了解集群状况和变化趋势;支持用户根据自身业务需要自由定制监控大盘和各类报警规则。