健康检查(TCP)

连续失败次数 在执行TCP监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

HTTP(s)健康检查

监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。功能说明 检查协议 检查协议请选择HTTP(s),它是指对目标IP地址进行HTTP(s)监控监控IP地址的Web服务器网络可达性、服务可用性、首包延时等指标...

健康检查(PING)

连续失败次数 在执行PING监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

HTTP(S)健康检查

监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。配置参数说明 检查协议 检查协议请选择HTTP(S),它是指对目标IP地址进行HTTP(S)监控监控IP地址的Web服务器网络可达性、服务可用性、首包延时等...

Ping健康检查

连续失败次数 在执行Ping监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

可观测性的设计原则

监控系统的指标可以让组织了解系统的健康状况和性能情况,以便在系统出现异常时快速发现问题。监控指标可以通过监控工具来实现,并允许在发生异常时发送警报。有很多监控工具可以使用,例如Prometheus、Grafana、Zabbix等,以及阿里云提供...

如何处理云监控识别多台相同镜像主机异常问题?

当您的非阿里云主机采用镜像方式部署时,在安装云监控插件后,将自动生成序列号相关信息,会导致云监控识别多台相同镜像的非阿里云主机时出现异常。不同操作系统主机的处理方法如下:Windows 在注册表中删除目录 计算机\HKEY_LOCAL_MACHINE...

性能监控最佳实践

同时,还需要设置告警规则,以便在系统出现异常时及时通知管理员。整合监控工具:将多个监控工具整合在一起,形成一个统一的监控平台。这可以通过使用开源的监控集成工具,如Prometheus、Grafana等来实现。这些工具可以将不同的监控数据...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

ARMS统一告警管理最佳实践

本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常会选择使用...

如何使用Prometheus监控Windows

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控Windows

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

H5 性能

JS 异常监控 实时监控并展示出现 JS 异常的 H5 页面、异常最近上报时间以及上报次数,帮助您快速定位 JS 错误位置。可查看所有或指定异常页面的所有 JS 异常,同时支持按异常上报时间对异常页面进行排序。如需异常页面数据,单击列表右上方...

TCP健康检查

连续失败次数 在执行TCP健康检查时,如果连续多次探测出现异常系统才将应用服务判断为异常,防止因为网络瞬间抖动等因素影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为异常。...

异常数据告警

您可以监控用户入会异常占比、推(拉)流成功率、卡顿率、模糊率等指标,同时您还可以配置报警规则实时监控并上报异常指标。注意事项 云监控服务仅提供指标的异常监控和报警功能。如果您需要实时查看全链路详细通信数据,请参见 观星台。...

云资源监控

监控报告 PTS除了在压测过程中提供监控数据,也在报告中整合了压测数据,以便在压测结束后,复盘压测过程时比对业务数据与负载数据使用,帮助您快速地定位负载情况、系统是否异常等。监控报告中的明细数据展现了在压测前配置的监控对象数据...

性能监控概念

性能监控对象 性能监控的对象包括计算机系统、网络、应用程序等,主要分为以下几类:服务器:包括物理服务器和虚拟服务器,监控服务器的CPU、内存、磁盘、网络等资源使用情况。操作系统监控操作系统的运行状态、进程、服务、文件系统等。...

监控

创建并配置报警规则 您可以根据业务的实际情况,创建并配置监控指标的阈值报警,当监控指标超过设定阈值后,系统自动发送报警通知,帮助您及时发现监控数据的异常并快速处理。创建并配置报警规则的步骤如下:登录 云监控控制台。在左侧导航...

概览

本文为您介绍站点监控的含义、典型应用场景和监控类型。站点监控是一款定位于网络探测的监控产品,主要用于通过遍布全国的探测点,发送模拟真实用户访问的探测请求,监控全国各省市运营商网络终端用户到您服务站点的访问情况。计费说明 当...

概览

(ECS)所有磁盘读取BPS(ECS)所有磁盘写入BPS(ECS)所有磁盘每秒读取次数(ECS)所有磁盘每秒写入次数 边界以外 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或者服务出现异常,某些应用程序或者服务在...

邮件推送监控服务

监控服务入口 邮件推送监控服务处于云监控控制台中。可以通过如下两种方式进入:在 邮件推送控制台 概览页点击云监控入口链接,跳转到云监控控制台的邮件推送监控页面。进入 云监控控制台。在左侧导航栏,单击 云产品监控,然后搜索 邮件推...

前端监控场景

现有的Server端监控系统相对已经很成熟了,而页面加载和页面运行时的状态监控一直比较欠缺。主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

基于日志关键字设置告警

将日志采集到日志服务后,您可以通过日志服务告警系统实现基于日志关键字...告警通知 创建上述告警监控规则后,只要当前4小时内出现异常的次数超过5次,您就可以在钉钉群中收到告警通知。您还可以单击 详情,查看告警发生时的日志,进行溯源。

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

指标含义与异常处理建议

查询算法差异性:例如,阿里云Elasticsearch集群监控和Kibana监控采集数据时都会受集群稳定性的影响,集群监控QPS指标会因集群的抖动会出现监控突增、负值或无监控等状况,而Kibana监控可能显示为空。说明 如果集群监控提供的指标比Kibana...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作,...

常见问题

案例:某公司自己的监控系统发现OSS请求数据有延迟 某公司因业务需求搭建了一套监控系统监控OSS的数据,发现访问OSS延迟较大,可通过如下步骤排查:排查公司网络是否正常,可通过ping其他网站的形式测试延迟。在OSS同地域创建一个ECS服务器...

接入指南

MapReduce 阿里云Elasticsearch 阿里云Hologres 阿里云Logstash 阿里云Cloud NAT 阿里云OSS 阿里云PolarDB 阿里云RDS PostgreSQL 阿里云RDS MySQL 阿里云Redis 阿里云SLB 阿里云SLS 阿里云RDS SQLServer 阿里云WAF 开源监控系统 ...

安全管理

接入信息核验商品后,您可以通过设置监控告警监测信息核验API服务的稳定性及异常请求,在出现稳定性事件或异常请求时,可通过电话、短信、钉钉等方式进行告警通知,并支持对异常请求实施拦截。步骤一:配置监控规则 您可以通过监控规则配置...

发现和排查实例问题

利用报警服务自动通知 使用云监控的报警服务,您可以针对关注的事件或者实例运行指标设置报警规则,在发生指定事件或实例运行指标出现异常时,自动以邮件等方式通知到联系人,减轻人工运维压力。更多信息,请参见 设置事件通知 和 设置ECS...

快速构建主机监控能力

主机监控是维护和管理IT系统的重中之重,您可以借助云监控快速构建主机监控能力。对于已安装云监控插件的阿里云主机(ECS实例),您可以通过 主机监控 以可视化的方式查看其监控数据,也可以通过一键报警为主机的关键指标快速设置报警规则...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

插件概览

监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 视图计算 负载均衡 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用