本文档简单介绍了运维事件中心的产品简介、产品架构、功能概况。
什么是运维事件中心
运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能;一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障恢复时长、更连续的业务运营体验。
产品架构
功能概况
您可以在运维事件中心获得以下功能的入口:
模块 | 能力概述 | 功能描述 |
服务 | 管理企业的各个服务(Service) | 服务是企业业务运营下最小管理单元,在运维事件中心建立好每一个需要运营的服务有助于全方位的保障业务的良好稳定性运行。
|
集成配置 | 简单、方便的实现上游监控系统的快速集成 | 支持简单、快速集成现有常用的监控系统。
|
流转规则 | 统一的策略管理中心 | 将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,并设置事件流转的默认分派通知规则。
|
通知订阅 | 统一的通知订阅管理 | 合理的配置通知渠道,有利于聚焦核心通知,提升问题处理效率,避免不必要的打扰。
|
事件中心 | 统一的报警、事件、故障任务流转处理 | 事件中心是统一的任务流转中心,统一管理整个企业业务系统运行过程中的所有报警、事件、故障。
|
升级策略 | 针对所有事件,按照不同优先级、影响程度,制定系列不同时间、通知策略的规则合集。 | 通过灵活自定义的升级通知策略,帮助用户及时关注并解决关键事件。
|
云钉协同 | 基于钉钉打通多端、多团队的协同,加速运维事件处理。 | 基于阿里云“云钉一体”的战略目标,将阿里云运维事件中心和钉钉进行深度集成、打通,实现对事件和故障的关键操作的多端拓展,并且结合钉应用创建的场景群,帮助用户在企业环境内高效、实时的解决运维事件和故障。
|
统计分析 | 帮助企业了解整体生产环境下事件的运行趋势。 | 可以查看全局、服务组、个人事件的统计数据,包括各等级的事件数量、总数量、总(MTTA、MTTR)、整体完结率等核心指标。 服务维度的统计分析,从业务的视角统计服务下所有事件、告警的处理情况,可通过不同服务、不同指标的对比了解运维对业务的影响。 服务组维度的统计分析,是服务组下每个成员所处理事件的数据总和;企业生产环境下的不同应用服务通常由多个或1个服务组(团队)负责,可以通过对比服务组之间的事件趋势和处理情况进一步了解不同服务的运行情况。 个人维度的统计分析,可以了解每个人的事件处理量、处理效率; 通过对比人员之间的事件处理量和处理效率,实现更合理的运维资源分配。 |
欢迎加入运维事件中心用户交流钉群,点击加入钉群或钉钉搜索群号:35645045。我们会在钉群里定期进行产品分享、交流、新功能发布等。