系统类故障排查

一般情况下如果这个数除以逻辑CPU的数量,结果高于5(具体数值需要根据实际服务器CPU处理能力以及系统使用情况而定)的时候就表明系统在超负荷运转了。结合“%CPU”占比较高的PID基本可定位是什么程序(COMMAND)在大量占用CPU。逻辑CPU...

拉高服务器 CPU 占用率

若您需要测试应用在 CPU 占用率高的情况下是否能正常运行,通过 PelicanDT 可轻松地模拟服务器 CPU 占用率高的测试环境。本文将介绍使用 PelicanDT 拉高服务器 CPU 占用率的方法。前提条件 您已安装 PelicanDT SDK,请参见 安装 PelicanDT ...

如何解决Linux系统的ECS服务器CPU负荷过高

概述 本文主要介绍如何解决Linux系统的ECS服务器CPU负荷过高。详细信息 如果在ECS服务器系统内无法通过top和htop等命令查询到消耗CPU资源的具体进程,可以查询异常时间节点和连接情况进而确定问题的原因。查看ECS实例的监控数据。检查系统...

使用云监控功能监控网站环境(部署于ECS实例)

CPU使用率为例,需要给服务器预留部分处理性能保障服务器正常运行,建议根据实际业务情况为您需要监控的ECS实例设置报警规则,例如CPU告警阈值为70%,连续三次超过阈值后开始报警。如果您还需要设置其他资源的报警规则,单击 添加报警...

查询报警规则

CpuAlarmThreshold String 80 CPU报警阈值,单位百分比。MemAlarmThreshold String 80 内存报警阈值,单位百分比。DiskAlarmThreshold String 80 磁盘报警阈值,单位百分比。Phones String 186*7653 报警接收电话。如果有多个,用逗号(,)...

创建报警规则

CpuAlarmThreshold Long 否 30 CPU报警阈值,单位为%。MemAlarmThreshold Long 否 40 Mem报警阈值,单位为%。DiskAlarmThreshold Long 否 100 磁盘报警阈值,单位为%。Phones String 是 186*7654 报警电话,多个用逗号(,)隔开。RegionId ...

修改报警规则

当已有报警规则不能满足您指定云产品...无数据报警处理方法 无监控数据时报警的处理方式。取值:不做任何处理(默认值)发送无数据报警 视为恢复 说明 单击 高级设置,可设置该参数。标签 报警规则的标签。包括标签名称和标签值。单击 确定。

基本概念

后端服务器 处理负载均衡分发的前端请求的ECS实例。默认服务器组 一组处理负载均衡分发的前端请求的ECS实例。如果监听未配置指定的虚拟服务器组或主备服务器组,则将流量转发给默认服务器组中的后端服务器。虚拟服务器组 一组处理负载均衡...

创建指标报警

本文以服务器CPU 使用率指标为例说明如何设置基础设施监控报警。操作步骤 在左侧导航栏,选择 基础设施监控。点击 Machine 进入服务器监控页面。在 Basic Metrics 的 CPU Util.卡片上,点击报警图标,点击以下任意维度,选择一条监控线...

代价计算

QUERY PLAN-Index Only Scan using test_id_idx on test(cost=0.29.72.66 rows=30 width=4)Index Cond:(id=1414)(2 rows)计算公式如下:RUN_COST=CPU代价+IO代价 CPU代价=索引 CPU代价+表 CPU代价 索引CPU代价=选择率*索引行数*(cpu_index_...

创建报警规则

云原生多模数据库 Lindorm 支持为实例的重要监控项创建...无数据报警处理方法 无监控数据时报警的处理方式。取值:不做任何处理(默认值)发送无数据报警 视为恢复 标签 报警规则的标签。您可以设置标签键和标签值。设置完成后,单击 确定。

常见问题

由于挖矿程序导致服务器CPU异常占用,如何处理服务器无法访问GitHub是什么原因?如何隐藏Windows系统中的IIS版本信息?在Ubuntu服务器中提示“The following signatures were invalid:KEYEXPIRED 1544811256”报错如何处理?如何在Apache...

监控指标说明

指一段时间内CPU正在处理以及等待CPU处理的进程数之和的统计信息。通常可以理解为CPU的繁忙程度,和CPU核数相关,Flink里面的CPU Load是CPU Usage/CPU核数。大于这个值,说明CPU处理可能有堵塞。说明 实时计算引擎VVR 6.0.6及以上版本不...

监控报警

本文主要介绍如何通过控制台查看向量检索服务的监控数据、创建报警...在云监控 报警规则 页面,可以对已创建的报警规则执行修改、禁用、启用和删除操作,还可以查看报警历史,并及时处理报警资源。报警规则的详细说明,请参见 管理报警规则。

日志同步报警

说明 若图标右上角带有红点,可能表示有待处理报警,请关注并及时处理。在 日志同步报警 页签,可查看报警记录,如下图所示。鼠标移动到失败原因上方,将显示详细失败原因,便于您快速定位问题。常见失败原因有4类:jdbc连接失败 创建...

作业超时监控告警

本文为您介绍作业超时报警的监控指标、配置方法及处理报警方式。前提条件 在配置作业超时报警功能前,请您确认已开通阿里云 云监控 服务。背景信息 监控作业运行时长的指标如下。指标名称 实现原理 适用场景 作业运行时长 以MaxCompute项目...

管理报警规则

创建报警规则后,您可以对其执行修改、禁用、启用和删除操作,您还可以查看报警历史,并及时处理报警资源。修改报警规则 当已有报警规则不能满足您指定云产品的监控指标的报警需求时,您可以根据所需进行修改。登录 云监控控制台。在左侧...

管理报警规则

为某个应用分组创建报警规则后,您可以对其执行修改、禁用、启用和删除操作,您还可以查看报警历史,并及时处理报警资源。修改报警规则 当某个应用分组的已有报警规则不能满足您指定云产品的监控指标的报警需求时,您可以根据所需进行修改...

如何排查收不到报警回调的问题?

如果您已为报警规则配置报警回调地址(Webhook地址),当报警触发后,您只收到了报警通知(电话、短信和 邮件),未收到报警回调数据,请按照如下方法排查原因。操作步骤 登录 云监控控制台。在左侧导航栏,选择 报警服务>报警历史。在 ...

为指定资源的指定监控项设置多条阈值报警规则

接口说明 本文将提供一个示例,为云服务器 ECS acs_ecs_dashboard 的实例 i-uf6j91r34rnwawoo*中的监控项 cpu_total 设置阈值报警规则。该报警规则的报警联系组为 ECS_Group、报警规则名称为 test123、报警规则 ID 为 a151cd6023eacee2f...

如何提高Nginx Web服务器的安全性

本文介绍如何提高Nginx Web服务器的安全性的操作步骤。背景信息 Nginx是一个轻量级的,高性能的Web服务器以及反向代理和邮箱(IMAP或POP3)代理服务器。它运行在UNIX、GNU、linux、BSD、Mac OS X、Solaris和Windows各种版本。根据调查统计...

新功能发布记录

2023-12-18 全部地域 管理通知模板 阈值报警通知支持推送至Microsoft Teams(微软视频会议软件)云监控的报警通知可以通过报警回调功能推送到Microsoft Teams,您可以通过Microsoft Teams的事件处理能力来接收报警通知,也可以在Microsoft ...

智能基线

报警通知配置完成后,可以在列表中单击 操作 列的 查看报警记录,查看并批量处理报警内容。指标说明 智能基线支持检测的数据指标如下。指标项 数据指标 消息上下行 通过MQTT协议平台发出的消息量 平台发出的消息量(HTTP/2)通过HTTP/2发送...

监控、诊断和故障排除

以下几种情况会导致服务器记录请求的状态码变为499:服务器在收到读写请求处理之前,会检查连接是否可用,不可用则为499。服务器正在处理请求时,客户端提前关闭了连接,此时请求被记录为499。在请求过程中,客户端主动关闭请求或者客户端...

基于ALB的单机QPS监控指标实现弹性扩缩容

弹性伸缩的系统报警任务支持基于ALB服务器组的单机QPS监控指标,本文为您介绍基于ALB服务器组的单机QPS监控指标实现弹性伸缩的扩缩容活动。前提条件 已注册阿里云账号。如果还未注册,请先 注册阿里云账号。说明 如果您使用RAM用户,您还...

使用Prometheus配置报警规则的最佳实践

索引 配置Prometheus报警规则 在阿里云Prometheus监控自定义PromQL配置报警规则 在开源Prometheus监控自定义PromQL配置报警规则 报警规则说明 配置Prometheus报警规则 在阿里云Prometheus监控自定义PromQL配置报警规则 在阿里云Prometheus...

什么是云监控

支持您从业务角度集中管理服务器、数据库、负载均衡、存储等资源,从而按实际业务需求来管理报警规则,查看监控数据,提升运维效率。主机监控 主机监控通过在阿里云和非阿里云主机上安装插件,监控主机的CPU、内存、磁盘、网络等监控项,并...

产品优势

不支持,需要业务服务器处理。数据流转 通过规则引擎配置,支持近10种云产品流转。不支持,需要投入人力开发。设备影子 支持设备和平台的缓存状态同步。OTA升级 支持多维度设备OTA升级方式。日志服务 支持日志查询,海量日志存储。实时监控...

Windows实例升级CPU后配置未生效

问题描述 在ECS管理控制台中,已经将Windows实例的CPU配置升级为8 vCPU,但是在服务器中虚拟处理器显示为2。问题原因 在Windows实例中手动将虚拟处理器的个数修改为2所导致。解决方案 说明 如果您对实例或数据有修改、变更等风险操作,务必...

神策分析服务实例部署文档

报警规则说明 神策分析服务实例的报警规则如下:ECS实例相关的报警规则:CPU使用率>90%且持续超过60分钟时报警报警级别为:info。云监控会通过邮件的方式通知报警联系组。磁盘使用率>=95%且持续超过15分钟时报警报警级别为:warn。...

常见问题

下面是一些 Load 的参考信息(Load 已经归一化处理,如果是 N 核 CPU,那么相应 Load*N):0.7不错的状态,有新任务也可以及时处理;Load=1:即将有任务需要额外的等待时间才能被处理,需要引起关注;Load>5:任务需要等待时间很长,需要干预...

配置伸缩规则

说明 如果您在创建步进规则时创建报警任务,该报警任务的 监控资源 自动设置为当前伸缩组,报警触发规则 自动设置为当前步进规则。执行的操作 基于报警任务触发条件继续设置分步步骤,指定违例规模及相应操作,在报警任务触发后,弹性伸缩...

ECS实例某个CPU的SI状态占用率高

问题原因 该ECS实例,中断只在某个core处理,如何设置irq和affinity都无效,只会在一个CPU处理。解决方案 执行如下命令,开启irqbalance服务,让系统自动调整网卡中断在多个CPU核上的分配。systemctl start irqbalance 适用于 云服务器...

安装备份客户端

在使用 云备份 备份本地数据中心的服务器或虚拟机中的文件目录前,您需要在本地服务器安装备份客户端。客户部包括Windows版本和Linux版本,按照您服务器的操作系统选择即可。(推荐)使用RAM用户AccessKey RAM是阿里云提供的用户身份管理与...

功能特性

证书无需上传到后端服务器,解密处理在 CLB 上进行,降低后端服务器CPU开销。✔ SNI支持 CLB HTTPS监听支持挂载多个证书,将来自不同访问域名的请求转发至不同的后端服务器组。✔ 重定向 CLB 支持HTTP访问重定向至HTTPS。✔ WS/WSS原生...

根据实时负载自动扩缩容ECI实例

由于示例的伸缩规则中以CPU使用率作为扩缩容指标,目标值为60%,扩容报警触发的阈值次数为1,缩容报警触发的阈值次数为10,则在CPU使用率出现一次60%以上时,将触发自动扩容;在CPU使用率连续10次低于60%时,将触发自动缩容。测试过程如下...

备份ECS文件

错误处理 当客户端或者备份任务 状态 异常时,您可以参考以下建议进行处理。客户端状态:未安装 ECS实例未安装备份客户端,说明您未对该ECS实例进行备份保护。强烈建议您使用该功能对重要数据进行备份操作。备份ECS实例中文件,无需您手动...

ALB状态码说明

ALB 后端服务器没有及时完成请求处理,请排查后端服务器的日志,并查看对应后端服务器CPU、内存等的占用率。503(Service Temporarily Unavailable)暂时无法使用服务器,通常是由于流量超限或者后端服务器不可用。可能原因:后端服务器...

CLB状态码说明

访问日志中的upstream_response_time代表后端处理请求的时间,建议排查后端服务器CPU、内存、网络是否存在性能瓶颈。客户端设置的请求超时时间太短,导致客户端未发送完HTTP请求就因为请求超时关闭了连接。建议排查访问日志中的request_...

概览

展示多个实例的监控数据实时分布 例如:通过热力图展示ECS实例的CPU使用率分布情况,以及每台服务器CPU使用率和其他服务器的差异。单击色块,您可以查看该服务器一段时间内的监控数据走势。全屏展示 Dashboard支持全屏展示和自动刷新,您...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 轻量应用服务器 Web应用防火墙 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用