版本说明

系统进程数超过5000个(可配置)时,不再继续监控进程,避免占用多地域的客户资源。升级安装插件时,先自动下载安装包,然后在安装成功后自动删除安装包。提升JSON配置文件的兼容性,支持:C风格的注释、允许尾部逗号、允许非标UTF-8编码。...

指标含义与异常处理建议

阿里云Elasticsearch为运行中的集群提供了多项基础监控指标(例如集群状态、集群查询QPS、节点CPU使用率、节点磁盘使用率等)和高级监控报警指标(例如Cluster、Index、Note Resource等),用来监测集群的运行状况。您可以根据这些指标,...

优势

实时监控利用文件传输、流式计算、分布式文件存储、时序数据存储,数据可视化、数据建模等技术,提供实时、智能、可定制、多视角、全方位的监控...低资源占用 在完成大量监控数据可靠传输的同时,保证对宿主机的 CPU、内存等资源极低占用率。

进程监控

进程监控 页面,您可以查看拉取进程和写入进程监控信息,并针对不同状态下的进程进行不同操作。查看进程监控数据 拉取进程监控 在 拉取进程监控 页签下,默认展示所有拉取进程列表及其监控数据。您可以通过切换地域类型,选择数据库...

资源监控

您可以结合自身的监控管理方式,选择以下的一种或多种治理方法对当前账号下的资源进行监控管理:一键报警 当您对目标云产品的监控指标或报警阈值不熟悉时,采用此方法进行治理。开启一键报警后,建议您多关注该款云产品的报警情况和资源...

下载智能水位分析报表

您可以将智能水位分析报表下载到本地,便于云下查看资源监控数据。前提条件 如果您使用RAM用户执行本操作,请确保该用户已授予系统权限策略AliyunCloudMonitorFullAccess。具体操作,请参见 为RAM用户授权。操作步骤 登录 云监控控制台。...

资源监控

资源监控和实时监控:按客户端IP维度来统计监控数据,每个客户端IP都唯一归属于某个区域或者某个运营商,因此资源监控和实时监控只能按区域或者运营商(可以使用区域+运营商的组合)来查询监控数据。具体内容请参见 资源监控 和 实时监控。...

修改应用分组

删除应用分组中的资源 删除目标应用分组中的资源后,您无法通过该应用分组查看资源监控数据,也无法收到该资源的报警通知。登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在...

云产品监控

您可以查看各云产品的监控图表,了解资源的运行状况。您也可以通过设置报警规则,帮助您监控资源的运行状况。当符合报警规则时,云监控自动发送报警通知,便于您及时获悉资源的运行状况。背景信息 在每个云产品监控页面,您可以查看的监控...

监控添加进程监控报错:Add Task Error

本文为您介绍云监控添加进程监控报错的原因及解决方法。在云监控中添加进程监控的时候,遇到 Add Task Error:add error 的报错。原因:是由于服务器上没有安装安骑士(云盾客户端)。解决办法:请在服务器上安装安骑士(云盾客户端)。

应对大规模资源监控

随着企业上云的推进,企业在云上的资源种类与数量不断增加,资源的变化也日趋频繁,如何监控频繁变化的大规模的资源将逐渐成为企业上云后不得不面对的挑战。您可以通过标签或资源组创建应用分组,将资源动态地划分到不同的应用分组中,将...

插件概览

由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源低,特别当云监控负载较高时,C++版本插件的资源占用明显低于Go和Java版本,因此建议您使用C++版本插件安装。云监控插件版本的详细说明如下表所示。语言 版本号 说明 参考文档 C...

通过火焰图定位性能瓶颈

下图为一张资源占用较高的火焰图,火焰图中性能瓶颈的具体分析步骤如下:通过火焰形状可以判断这是一张栈底在上,栈顶在下的冰柱状火焰图,因此需要从下往上分析。分析下方的栈顶,可以发现右侧较宽的栈顶为 java.util.LinkedList.node(int...

什么是阿里云应用监控 eBPF 版

阿里云 应用监控 eBPF 版 的优势 整体而言,与开源Kubernetes监控相比,阿里云 应用监控 eBPF 版 的优势体现为:创新的资源关联交互 阿里云 应用监控 eBPF 版 通过监控网络请求,构建出网络拓扑,便于您查看服务依赖状态。丰富的数据多样性...

进程监控

监控采集CPU消耗Top5进程的CPU使用率,可能存在以下问题:如果您的进程占用多个CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内...

作业编辑

作业提交进程使用YARN模式 作业提交进程是Worker节点上的一个进程占用YARN的一个Container,受YARN监控。Yarn-Cluster模式 Driver端是独立的一个进程,与Spark-Submit不在一个进程中。Driver端占用YARN的一个Container。

管理报警规则

为某个应用分组创建报警规则后,您可以对其执行修改、禁用、启用和删除操作,您还可以查看报警历史,并及时处理报警资源。修改报警规则 当某个应用分组的已有报警规则不能满足您指定云产品的监控指标的报警需求时,您可以根据所需进行修改...

运维操作

启动、停止、重启 与 销毁 拉取进程 拉取进程名称:可在 进程监控 页面获取,例如 100.88.8.144-7104:alipay_dev_dzf-1-0:0000006460。详见 进程监控。单击 确认。新建写入进程 进入 数据同步服务>运维,单击 新建写入进程操作。在新弹出的...

概览

企业云监控针对企业级应用场景为用户提供一站式的监控解决方案。目前企业云监控包括监控大盘、秒级监控、智能水位分析和实时数据导出。开通企业云监控 当您首次使用企业云监控时,需要单独开通。具体操作,请参见 开通企业云监控。应用场景...

工作负载推荐配置

这样操作存在两个问题:判断Pod整体的资源占用会变复杂,不方便实施Pod Resource涉及到的Request和Limit。容器内只有一个进程的情况下,如果进程中断,外部的容器引擎可以清楚地感知到,并且重启容器。如果容器内有多个进程,某个进程挂了...

查看监控数据

在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的左侧导航栏,单击 日志监控。单击目标监控项对应 操作 列的 图标。您可以查看目标监控项的监控图表,及其同比昨天和同比上周的监控...

API概览

ModifyGroupMonitoringAgentProcess 修改应用分组内的进程监控 调用ModifyGroupMonitoringAgentProcess接口修改应用分组内的进程监控。DeleteGroupMonitoringAgentProcess 删除组进程监控任务 调用DeleteGroupMonitoringAgentProcess接口...

删除可用性监控任务

在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的左侧导航栏,单击 可用性监控。删除可用性监控任务。单个删除 先单击目标可用性监控任务对应 操作 列的 图标,然后单击 删除。在 ...

启用可用性监控任务

当您需要继续探测资源的本地或远程指定路径和端口时,可以重新启用应用分组中的可用性监控任务。前提条件 请您确保可用性监控任务的 监控状态 为 禁用。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 ...

禁用可用性监控任务

当您暂时不需要探测资源的本地或远程指定路径和端口时,可以禁用应用分组中的可用性监控任务。前提条件 请您确保可用性监控任务的 监控状态 为 启用。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页...

网络监控

监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,采集网络监控的网卡带宽、网卡流入包数、网卡错误包数和网络连接数等监控指标的监控数据,您还可以为这些监控指标设置报警规则。当某个监控指标达到报警条件时,会给...

监控主机

监控可以监控阿里云主机和非阿里云主机。本文以监控阿里云主机(ECS实例),并为CPU使用率设置报警规则为例,为您介绍监控主机的具体操作流程。前提条件 请您确保已创建阿里云主机(ECS实例)。具体操作,请参见 实例创建方式介绍。请您...

查看自定义事件

在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的左侧导航栏,单击 自定义事件。在 事件监控 页签,选择待查看的事件级别、事件名称和时间段,单击 确定。在事件列表中,单击目标...

创建报警规则

当您需要监控应用分组中各云产品资源的使用情况时,可以创建报警规则。如果资源监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>...

查看系统事件

在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的左侧导航栏,单击 系统事件。在 事件监控 页签,选择待查看的云产品、事件类型、事件名称和时间段,单击 确定。在事件列表中,单击...

云盘

监控通过安装在阿里云主机(ECS实例)上的云监控插件,采集云盘的IOPS读取、IOPS写入、BPS读取和BPS写入等监控指标的监控数据,您还可以为这些监控指标设置报警规则。当某个监控指标达到报警条件时,会给您发送报警通知,以便您及时关注...

删除应用分组

在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,删除目标应用分组。单个删除 单击目标应用分组对应 操作 列的 删除组。在 确认删除组 对话框,单击 删除。批量删除 先单击所有目标应用分组复选框,然后单击 批量删除。在 确认...

为什么CPU负载高?

执行 top 命令,查看进程的系统资源占用信息,通常可以看到Java进程占用CPU较高。执行 top-H 命令,查看线程的资源占用,找到CPU较高的线程ID。根据线程ID,执行[printf"%x"线程_id]转换为十六进制。部分ALPINE镜像可能不支持 top-H 命令,...

通过企业监控大盘实现本地日志监控

监控插件将本地日志根据配置解析成具体的监控指标后,将其上报到云监控的指标仓库,并以图表形式展示。之后您还可以通过企业云监控提供的监控大盘(简称企业监控大盘)创建多样化的监控图表,并设置Prometheus报警,接收报警通知。前提...

使用系统事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍创建和调试系统事件报警规则的方法。背景信息 云监控支持的事件类型...

授权日志监控

在您首次使用日志监控功能时,需要授权云监控访问日志服务...在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的左侧导航栏,单击 日志监控。在 云监控服务关联角色 对话框,单击 确定。

暂停应用分组的报警通知

在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,暂停目标应用分组的报警通知。单个暂停 单击目标应用分组对应 操作 列的 暂停通知。在 通知暂停发送 对话框,设置暂停报警通知的时间范围。单击 通知暂停发送。批量暂停 先单击...

资源组设计最佳实践

使用资源组对资源进行分类管理后,会带来以下好处:提升管理效率:资源完成分组后,您能够以资源组为单位进行资源部署、资源监控和权限管理等,而不是单独处理各个资源。例如:如果您想限制某项目组的成员只拥有该项目组资源的权限,那么,...

Linux服务器内存消耗过高

问题描述 Linux服务器的内存持续消耗过高,重启后可以恢复正常,但业务运行后问题依旧存在,而且没有明显高消耗内存进程存在。问题原因 slab消耗内存过多。解决方案 登录问题Linux服务器。执行free和top命令确认不存在占用大量内存的进程。...

资源消耗

您可以查看当前账号的网络分析与监控、基础云监控和企业云监控资源消耗情况,还可以开通或关闭他们的按量付费,购买网络分析与监控和基础云监控资源包。背景信息 关于网络分析与监控、基础云监控和企业云监控的计费方式和计费标准,请...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 弹性公网IP 视图计算 轻量应用服务器 短信服务
新人特惠 爆款特惠 最新活动 免费试用