基本概念

告警监控系统的架构图如下所示:术语 说明 告警监控规则(Alert monitoring rule)告警监控规则包括告警监控相关的配置,例如查询和分析语句、查询和分析的对象(日志库、时序库和资源数据)以及相关的监控编排等配置项。更多信息,请参见 ...

落标监控概述

Dataphin的公共系统属性内置了常用的元数据监控,您可以在创建标准集时引用该系统属性,则该标准集下创建的数据标准默认继承系统属性的监控配置,详情请参见:新建和管理公共标准集属性。内容质量监控 基于标准对资产对象添加内容质量监控...

落标监控概述

Dataphin的公共系统属性内置了常用的元数据监控,您可以在创建标准集时引用该系统属性,则该标准集下创建的数据标准默认继承系统属性的监控配置,详情请参见:新建和管理公共标准集属性。内容质量监控 基于标准对资产对象添加内容质量监控...

全景监控

同时,全景监控提供统一的监控接入标准,全方位对接各种应用系统监控信息,实现覆盖所有系统、全流程的监控管理。数据全链路保障是指通过采集数据汇聚、数据融合、数据分析挖掘等阶段的各项任务状态信息,对异常状态进行预警和处置,实现对...

功能简介

同时,全景监控提供统一的监控接入标准,全方位对接各种应用系统监控信息,实现覆盖所有系统、全流程的监控管理。数据全链路保障是指通过采集数据汇聚、数据融合、数据分析挖掘等阶段的各项任务状态信息,对异常状态进行预警和处置,实现对...

功能简介

同时,全景监控提供统一的监控接入标准,全方位对接各种应用系统监控信息,实现覆盖所有系统、全流程的监控管理。数据全链路保障是指通过采集数据汇聚、数据融合、数据分析挖掘等阶段的各项任务状态信息,对异常状态进行预警和处置,实现对...

通过命令行(CLI)上报事件监控数据

当RAM用户使用AccessKey上报监控数据时,需要授权云监控管理权限。操作方法如下:使用阿里云账号登录 RAM控制台。创建RAM用户。操作方法请参见 创建RAM用户。为RAM用户创建访问密钥。操作方法请参见 创建AccessKey。为RAM用户授权...

通过命令行(CLI)上报监控数据

当RAM用户使用AccessKey上报监控数据时,需要授权云监控管理权限。操作方法如下:使用阿里云账号登录 RAM控制台。创建RAM用户。操作方法请参见 创建RAM用户。为RAM用户创建访问密钥。操作方法请参见 为RAM用户创建访问密钥。为RAM用户...

云资源监控

您可以结合自身的监控管理方式,选择以下的一种或多种治理方法对当前账号下的资源进行监控管理:一键报警 当您对目标云产品的监控指标或报警阈值不熟悉时,采用此方法进行治理。开启一键报警后,建议您多关注该款云产品的报警情况和资源...

前端监控场景

现有的Server端监控系统相对已经很成熟了,而页面加载和页面运行时的状态监控一直比较欠缺。主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况...

Java应用监控和诊断方案

基于ARMS的应用监控方案 ARMS提供的 应用监控 功能,脱胎于阿里巴巴内部的分布式跟踪与监控系统(内部称为“鹰眼系统”),可以在不修改任何现有代码的情况下帮助网站开发人员和运维人员解决上述问题。调用拓扑图 您可以在ARMS中看到应用的...

接入外部报警

如果您设置了安全词,则云监控对外部系统的报警内容进行验证,当报警内容包含该安全词时,云监控会给报警联系组中的报警联系人发送报警通知;反之,云监控不发送报警通知。如果您未设置安全词,则云监控忽略校验安全词,直接给报警联系组中...

什么是ARMS前端监控

现有的服务器端监控系统相对已经很成熟,而页面加载和页面运行时的状态监控一直比较欠缺。例如:无法第一时间获知用户访问您的站点时遇到的错误。各个国家、各个地区的用户访问您的站点的真实速度未知。每个应用内有大量的异步数据调用,而...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

使用系统事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍创建和调试系统事件报警规则的方法。背景信息 云监控支持的事件类型...

应对大规模资源的监控

您可以通过标签或资源组创建应用分组,将资源动态地划分到不同的应用分组中,将监控管理的对象由资源转变为应用分组,以应对频繁变化的、多种类的、大规模的资源监控问题。您还可以通过创建报警模板,并将其应用到不同的应用分组,从而实现...

消费-搭建监控系统

日志服务为监控系统提供了:统一的机器管理:安装一次logtail,所有的后续操作在日志服务端进行。统一的配置管理:需要收集哪些日志文件,只要在服务端配置一次,配置会自动下发到所有机器。结构化的数据:所有数据格式化成日志服务的数据...

插件概览

监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...

快速构建主机监控能力

主机监控是维护和管理IT系统的重中之重,您可以借助云监控快速构建主机监控能力。对于已安装云监控插件的阿里云主机(ECS实例),您可以通过 主机监控 以可视化的方式查看其监控数据,也可以通过一键报警为主机的关键指标快速设置报警规则...

ARMS统一告警管理最佳实践

本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常会选择使用...

如何处理云监控配额不足的问题?

具体操作,请参见 管理监控大盘。如果您由于即时查询监控数据,导致配额不足,则建议您选择 开通按量付费。报警短信 当您设置报警规则或订阅事件时,报警通知方式包含短信。开通按量付费 订购报警短信包 报警电话 当您设置报警规则或订阅...

环境分类说明

在 ARMS 中,环境指的是根据监控目标的不同类型进行的分类,旨在集中管理监控探针及其关联数据存储。容器环境 考虑到容器集群可能涉及大量数据采集,通常是将单个容器集群定位为一个监控环境。针对此类环境,为 ACK、ACK Serverless集群 ...

环境分类说明

在 ARMS 中,环境指的是根据监控目标的不同类型进行的分类,旨在集中管理监控探针及其关联数据存储。容器环境 考虑到容器集群可能涉及大量数据采集,通常是将单个容器集群定位为一个监控环境。针对此类环境,为 ACK、ACK Serverless集群 ...

如何处理查询API额度已用尽或即将用尽问题?

查询监控数据API调用次数的免费额度为100万次/月,当其额度用尽时,会被限流。本文为您介绍查询监控数据API调用次数用尽的现象、原因以及...具体操作,请参见 管理监控大盘。相关文档 如何处理云监控配额不足的问题?如何查询API调用次数?

使用自定义事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍自定义事件报警规则的创建方法。前提条件 请确保您已上报自定义事件...

管理自定义事件报警规则

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的自定义事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。背景信息 说明 旧版系统事件报警规则功能已不再升级,功能会逐步下线,建议您...

产品优势

监控是阿里巴巴集团多年来监控技术研究积累的成果,结合阿里云计算平台强大的数据分析能力,为您提供云产品监控、站点监控和主机监控等功能,为您的云产品保驾护航。即开即用 云监控无需您购买和开通。当您注册阿里云账号后,自动开通云...

如何卸载云监控插件?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

配置报警任务

该部分包括两部分内容监控项:系统监控支持的监控指标名称。例如(Agent)CPU使用率、(Agent)内存等指标。更多信息,请参见 系统监控报警任务。说明 不同伸缩组类型的伸缩组,系统监控支持的监控项也不同,请您以控制台实际页面显示最...

附录1 云产品监控指标

表格存储 PCDN 安全加速 智能媒体管理 云通信 物联网平台-服务端订阅 物联网平台-实例 监控管理 操作审计 视频服务 媒体处理 音视频通信RTC 视频直播 视频点播 视频点播-播放质量 大数据(数加)分析型数据库 数据总线DataHub 阿里云...

管理系统事件报警规则(旧版)

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。背景信息 说明 旧版系统事件报警规则功能已不再升级,功能会逐步下线,建议您使用...

只读访问监控大屏

系统策略 说明 AliyunCADTReadOnlyAccess 只读管理云速搭(CADT)的权限 AliyunLogReadOnlyAccess 只读访问日志服务(Log)的权限 AliyunCloudMonitorReadOnlyAccess 只读访问云监控(CloudMonitor)的权限 权限管控效果 通过添加以上系统...

产品升级公告

​ 从2023年10月10日起,原运维编排服务(OOS)将进行产品升级,本次产品升级涉及到的具备内容如下:产品名称改变,但产品缩写不变:产品名称从原来的「运维编排服务(Operation Orchestration Service,OOS)」变更为「系统运维管理...

基础术语

管理通知时,可通过通知组订阅,将报警内容发送给通知组内所有的通知人。维度 Dimension 指用于监控分析的基准要素,通常是日志中的某个字段,如接口、方法、耗时等。在自定义监控中,日志筛选及列值分组都需要选取维度。应用服务被调用 ...

2021年

2021-08-19 应用监控:华东1(杭州)华东2(上海)华南1(深圳)华北1(青岛)华北2(北京)华北3(张家口)前端监控:华东1(杭州)v2.8.1.2 应用监控和前端监控告警内容优化 指标名称规范化,优化不必要符号。告警内容增加单位后缀,以...

错误码和状态码说明

500 服务器内部错误 服务器内部错误,无法完成请求,请联系系统管理员协助检查。501 尚未实施 服务器不具备完成请求的功能。例如,当服务器无法识别请求方法时,服务器可能会返回此状态码。502 错误网关 服务器作为网关或代理。云监控从...

监控自定义权限策略参考

操作文档 创建自定义权限策略 修改自定义权限策略内容和备注 删除自定义权限策略 管理权限策略引用记录 管理自定义权限策略版本 常见自定义权限策略场景及示例 授予RAM用户导出监控数据的权限,示例如下所示:{"Version":"1","Statement":...

功能特性

定时运维 告警运维任务 系统运维管理 OOS(CloudOps Orchestration Service)支持创建云产品监控指标阈值报警运维任务。当我们监控到云产品资源的监控指标达到指定的阈值后,执行指定的模板,进行告警运维。告警运维任务会一直执行并监控,...

监控与日志

监控站点资源 监控服务器级别资源 Linux操作系统独享云虚拟主机 除了监控站点资源的使用情况,包括站点运行情况,流量使用情况、网页空间使用情况、数据库空间使用情况外,还支持监控服务器级别的资源,包括CPU、内存和带宽等监控信息,...

如何使用Prometheus监控Windows

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 视图计算 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用