JVM监控

相关文档 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能会出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。

实例监控

说明 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能会出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。...

进程监控

监控采集CPU消耗Top5进程的CPU使用率,可能存在以下问题:如果您的进程占用多个CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内...

ARMS统一告警管理最佳实践

本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常选择使用...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

禁用ECS的内网后不能使用云监控

因为云监控的通讯地址open.cms.aliyun.com是解析在内网上的,通过内网来进行通讯获取数据,如果禁用了内网,云监控服务会出现无法正常使用,所以为了能够正常的使用云监控服务,必须要确保在服务器上能连通open.cms.aliyun.com的80端口。...

监控与日志

通过应用分组进行资源分类后,云产品产生的系统事件自动与组中资源关联,帮助您集成各类监控信息,方便您在业务故障时,快速分析并定位问题。云监控同时还为您提供事件的报警功能,您可以根据事件等级配置报警,通过 短信、邮件、钉钉...

常见问题概述

接入ARMS Prometheus监控后,为什么会产生额外的费用?如果不需要某些自定义指标,应该如何避免收费?大盘相关 为什么在创建Grafana大盘时,没有Kubelet和API Server的监控指标?为什么Exporter对应的大盘看不到具体的指标?其他 如何查看...

GxP欧盟附录11标准合规包

16.1 为了提供支持关键过程的计算机系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...

基本概念

集成中心 名词概念 说明 监控源 监控源表示上游监控系统,包括阿里云监控系统、开源监控系统、其他云厂商监控系统、业界商业化监控系统。监控源产生的告警是整个报警、事件、故障的源头。集成接入 集成接入是将监控源跟运维事件中心数据...

操作系统监控

监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集丰富的操作系统层面的监控指标,您可以为操作系统监控指标设置报警规则。当某个监控指标达到报警条件时,给您发送报警通知,以便您及时关注其动态。前提...

常见问题

案例:某公司自己的监控系统发现OSS请求数据有延迟 某公司因业务需求搭建了一套监控系统监控OSS的数据,发现访问OSS延迟较大,可通过如下步骤排查:排查公司网络是否正常,可通过ping其他网站的形式测试延迟。在OSS同地域创建一个ECS服务器...

常见问题概述

本章节汇总了使用 可观测监控 Prometheus 版 的常见问题。计费相关 什么是性能监控套件与集群事件采集能力?如何调整指标的存储时长?包年包月方式如何续费?购买时长到期后,已上报指标数据将如何处理 何时自动释放实例资源?接入后,为...

前端监控场景

现有的Server端监控系统相对已经很成熟了,而页面加载和页面运行时的状态监控一直比较欠缺。主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况...

可观测性的设计原则

监控系统的指标可以让组织了解系统的健康状况和性能情况,以便在系统出现异常时快速发现问题。监控指标可以通过监控工具来实现,并允许在发生异常时发送警报。有很多监控工具可以使用,例如Prometheus、Grafana、Zabbix等,以及阿里云提供...

如何处理云监控识别多台相同镜像主机异常问题

当您的非阿里云主机采用镜像方式部署时,在安装云监控插件后,将自动生成序列号相关信息,导致云监控识别多台相同镜像的非阿里云主机时出现异常。不同操作系统主机的处理方法如下:Windows 在注册表中删除目录 计算机\HKEY_LOCAL_MACHINE...

监控服务概览

OSS监控服务为您提供系统基本运行状态、性能以及计量等方面的监控数据指标,并且提供自定义报警服务,帮助您跟踪请求、分析使用情况、统计业务趋势,及时发现以及诊断系统的相关问题。OSS监控指标主要分为基础服务指标、性能指标和计量指标...

Java应用监控和诊断方案

基于ARMS的应用监控方案 ARMS提供的 应用监控 功能,脱胎于阿里巴巴内部的分布式跟踪与监控系统(内部称为“鹰眼系统”),可以在不修改任何现有代码的情况下帮助网站开发人员和运维人员解决上述问题。调用拓扑图 您可以在ARMS中看到应用的...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

什么是ARMS前端监控

现有的服务器端监控系统相对已经很成熟,而页面加载和页面运行时的状态监控一直比较欠缺。例如:无法第一时间获知用户访问您的站点时遇到的错误。各个国家、各个地区的用户访问您的站点的真实速度未知。每个应用内有大量的异步数据调用,而...

插件概览

监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

数据预上报

在某些情况下,例如SDK尚未完成初始化时,导致数据上报出现问题。本文介绍如何使用ARMS前端监控SDK实现数据预上报。导致数据上报出现问题的情形 以下情形导致数据上报出现问题:在页面刚刚加载时,有一些数据需要上报,但此时SDK可能...

基本概念

本文列出了ARMS应用实时监控服务产品的主要术语。B|C|J|S|Y|Z B 报警规则 关于如何基于数据集生成报警以及通过何种渠道发送报警通知的规则。报警的优先级分为警告、错误和致命。[回到顶部]C 采集规则 关于在自定义监控任务中如何从数据源...

如何处理Kubernetes同步组数据不准确问题

问题原因 由于 应用分组列表 中的 Kubernetes同步组 不再维护,可能会出现数据不准确问题。处理方法 推荐您使用云监控中的Kubernetes容器监控功能,查看容器服务Kubernetes的监控数据。更多信息,请参见 概览。说明 当您调用云监控的API时...

计费概述

本文介绍ARMS应用监控的计费版本、计费方式和开通方式。计费版本 重要 ARMS基础版已不支持开通,并将于2024年03月31日起停止提供技术支持。更多信息,请参见【计费变更】ARMS基础版停止提供技术支持公告。计费版本 计费方式 计费项 说明 ...

预付费资源包

应用监控专家版支持购买预付费资源包。本文介绍应用监控提供的资源包规格和使用方法。重要 本文所涉及价格请以产品购买页面为准。计费项 专家版 不区分调用链和指标,统一按Agent×Hour计费。资源包规格 专家版提供如下6种资源包。您可在 ...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

按量付费

应用监控专家版支持按量付费模式。按量付费按照您的实际用量结算,在每个结算周期生成账单并从账户中扣除相应费用。本文介绍基础版按量付费的计费项以及公共云、金融云、政务云的按量付费说明。重要 本文所涉及价格请以产品购买页面为准。...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

性能监控概念

什么是性能监控,以及性能监控的对象有哪些。伴随着突发流量、系统变更或代码腐化等因素,性能退化随时发生。如在周年庆大促期间由于访问量暴涨导致请求超时无法下单;应用发布变更后,页面频繁卡顿导致客诉上升;线上系统运行一段时间后...

什么是调用链

调用链可以帮助运维人员解决以下问题故障排查:当请求失败或出现错误时,调用链可以显示整个请求的路径和每个服务的执行情况,从而帮助运维人员快速定位问题所在。性能优化:通过调用链,运维人员可以了解请求在系统中的执行时间和瓶颈...

区间检测

当某个服务的响应时间突然超出正常范围,系统会立即发出异常警告,从而使管理员能够快速定位和解决问题。服务器资源优化:可以监测服务器的CPU和内存使用情况。如果某台服务器的资源使用率持续超过预设阈值,那么系统会自动生成异常事件。...

区间检测

当某个服务的响应时间突然超出正常范围,系统会立即发出异常警告,从而使管理员能够快速定位和解决问题。服务器资源优化:可以监测服务器的CPU和内存使用情况。如果某台服务器的资源使用率持续超过预设阈值,那么系统会自动生成异常事件。...

查看实例监控信息

实例是否安装云监控插件导致在ECS管理控制台查看到的监控数据不同:实例已安装云监控插件:ECS管理控制台的监控项中,CPU、内存、系统负载数据为云监控的操作系统监控项,其他监控项与云监控的基础监控项一致。实例未安装云监控插件:在...

前端监控常见问题

本文解答了关于前端监控的常见问题。计费相关 如何停止计费?如何设置消费限制?如何设置资源包预警?使用相关 为什么有些监控页面或API名称中出现了星号(*)?为什么页面访问量列表和页面访问速度列表不一致?为什么API日志中没有生成...

诊断网页加载过慢的问题

问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类问题的难点如下:复现困难 假设您的一位用户是A,当A访问某网页时,该页面加载在A本地的浏览器上。由于页面的加载耗时受地域、网络情况、浏览器或者运营商...

监控系统权限策略参考

本文描述云监控支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制(RAM)产品提供...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 视图计算 负载均衡 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用