什么是用户体验监控

RUM)专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

版本升级说明

升级原因监控插件版本的升级原因如下:云监控插件会一直迭代新版本,从而增加新特性、修复稳定性问题和优化性能。如果云监控插件长期不更新,可能会导致一些稳定性问题,进而影响业务,例如:发生内存泄露。旧版本云监控插件(3.5.8及...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

什么是应用实时监控服务ARMS?

专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能...

为什么ACK集群应用安装探针后没有监控数据?

可能原因 应用监控被暂停。应用所在pod的探针没有被正确加载。解决方案 步骤一:检查 应用监控 是否被暂停 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 应用列表 页面顶部选择目标地域,然后单击目标应用名称。如果未找到...

查看应用分组

创建应用分组后,您可以查看应用分组的组内资源、监控视图、故障列表、可用性监控等数据,并执行相关操作。通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

基本概念

集成中心 名词概念 说明 监控监控源表示上游监控系统,包括阿里云监控系统、开源监控系统、其他云厂商监控系统、业界商业化监控系统。监控源产生的告警是整个报警、事件、故障的源头。集成接入 集成接入是将监控源跟运维事件中心数据...

FAQs

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。GTM 是现有云解析DNS中全局负载均衡(GSLB)的升级和替代产品,GTM比GSLB支持...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

功能架构

监控数据满足阈值条件时,第一时间通知对应的运维人员,帮助其发现异常及原因。企业级特性 在企业级特性层面,业务智能可观测服务包含的能力如下:提供多层级业务和资源隔离机制,比如租户、workspace 等,保证监控数据的安全性。支持...

常见问题-FAQ

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。全局流量管理(GTM)的CNAME接入域名是否能直接通过URL访问?答:不可以使用 ...

接入ARMS监控

故障演练时通过接入应用实时监控服务ARMS(Application Real-Time Monitoring Service)可以对演练过程的指标进行监控,包含JVM内存、JVM线程数、JVMGC相关、网络出入口流量、磁盘、CPU等指标。本文介绍如何在故障演练中接入ARMS并监控演练...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

通过站点监控功能监控DNS解析异常

通过站点监控功能监控中国三大运营商(中国移动、中国电信、中国联通)各省份用户访问某个域名时的解析结果。当域名解析异常时,您可以通过报警信息分析异常原因,还可以根据探测结果排查问题。DNS解析原理 域名解析(DNS)就是将域名转换...

什么是故障演练

验证监控告警的时效性 通过对系统注入故障,验证监控指标是否准确,监控维度是否完善,告警阈值是否合理,告警是否快速,告警接收人是否正确,通知渠道是否可用等,提升监控告警的准确性和时效性。定位与解决问题的应急能力 通过故障突袭,...

查看智能洞察事件列表

前提条件 已创建应用监控,具体操作,请参见 应用监控接入概述。功能入口 入口一 登录 ARMS控制台。在左侧导航栏选择 智能洞察>事件列表。在顶部菜单栏,选择地域。在页面右上角的时间选择框,选择需要查看的时间段。在事件列表页面顶部的...

版本说明

本文为您介绍云监控插件的版本...当系统负载较重或其他原因导致云监控插件的系统资源占用超过限制时,插件会自动退出。修复问题 解决Go版本的云监控插件自动修改系统时间等问题。早期版本 云监控插件的早期版本说明,请参见 早期版本说明。

应用中心

边缘视频图像处理 图像处理 通过图像处理功能,CDN可直接在回源节点对图片进行处理和分发,可减轻源站压力,减少回源链路,节省回源流量。云备源 CDN备源 通过云备源服务,定时将主源站内容同步至备源。当主源站出现故障时,CDN将回源请求...

如何使用Prometheus监控Windows

本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...

如何使用Prometheus监控Windows

本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...

监控添加进程监控报错:Add Task Error

本文为您介绍云监控添加进程监控报错的原因及解决方法。在云监控中添加进程监控的时候,遇到 Add Task Error:add error 的报错。原因:是由于服务器上没有安装安骑士(云盾客户端)。解决办法:请在服务器上安装安骑士(云盾客户端)。

监控ECS的Windows主机CPU监控数值异常

本文为您介绍云监控ECS的Windows主机CPU监控数值异常的原因及解决办法。云监控中的ECS CPU监控数值如果出现为0或者负数(实际CPU使用率不是0),其他监控值都正常。这个问题主要出现在Windows的机器上,一般原因是Windows内部的性能计数器...

如何处理云监控插件异常停止问题?

当某个主机的云监控插件的状态为 已停止 时,云监控将不能对该主机进行监控。您需要判断该主机的云监控插件的停止原因,并恢复其运行状态。问题分析 云监控插件默认每3分钟一次心跳。如果15分钟没有心跳,则主机判断插件已停止运行。云监控...

概览

应用场景 您可以使用主机监控功能查询主机的资源使用情况和故障指标。主机监控的应用场景如下:混合云监控解决方案 主机监控通过云监控插件采集您主机的监控项。该插件支持安装在非阿里云主机上,解决您云上和云下双重环境的基础监控问题。...

管理站点监控任务

查看站点监控任务 您可以查看其任务详情、监控分析和报警规则,便于您及时查看站点的异常数据,并处理故障。登录 云监控控制台。在左侧导航栏,选择 网络分析与监控>站点监控。在 站点监控 页面,您可以查看站点监控列表中的所有报警任务数...

前端监控场景

主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。业务痛点 定位性能瓶颈困难 当用户反馈页面...

如何配置流转规则

告警来源:触发事件&报警&故障 重要 以下规则仅适用监控源为:Prometheus/京东云云监控/阿里云云监控等 除业务监控外 的其他所有监控源。在 新增规则 页面,选择 触发规则的类型;选择 仅触发报警 需要配置 报警触发规则、优先级 和 默认...

如何处理云监控配额不足的问题?

资源 消耗原因 处理方法 查询监控数据API调用数量 使用应用实时监控服务ARMS服务(Prometheus实例for云服务)。直接调用API。调用 DescribeMetricLast、DescribeMetricList、DescribeMetricData 和 DescribeMetricTop 接口的数量,不包含...

故障发现

7*24监控值班 对于有条件的企业,可以设立全球运行指挥中心(Global Operations Center,简称GOC),实现7*24监控值班,时刻关注核心业务线上异常与故障。对于完成监控覆盖的核心业务场景,在异常上报时,通过工具自动检测或值班人员人工...

通过PC端探测目标站点的网络质量

监控通过站点监控的探测点(请求方)模拟最终用户的访问行为,从而获得各地域探测点到目标地址(监控地址)的访问数据。当您希望通过阿里云网络、运营商网络和海外云服务提供商网络探测目标站点时,用PC端探测。前提条件 请确保您已创建...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 图像搜索 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用