例如,如果您想根据ERROR出现的次数进行监控,可以使用以下的SQL语句来统计ERROR的数量:*|select 'ERROR',count(1)as total group by 'ERROR' 这条SQL语句会筛选出所有包含ERROR字段的记录,并统计其数量,然后按照ERROR进行分组。...
相关文档 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能会出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。
说明 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能会出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。...
开源Prometheus采集能力存在一定的瓶颈,且为单点运行无法做到弹性伸缩,业务高峰时可能出现监控数据采集性能瓶颈。方案二:采用云厂商提供的Prometheus产品 使用该方案您将面临以下几点挑战:跨云厂商:不同云厂商提供的Prometheus产品...
开源Prometheus采集能力存在一定的瓶颈,且为单点运行无法做到弹性伸缩,业务高峰时可能出现监控数据采集性能瓶颈。方案二:采用云厂商提供的Prometheus产品 使用该方案您将面临以下几点挑战:跨云厂商:不同云厂商提供的Prometheus产品...
告警通知 创建上述告警监控规则后,只要日志中出现ERROR关键字,您就可以在钉钉群中收到告警通知。您还可以单击 详情,查看告警发生时的日志,进行溯源。案例二:根据关键字出现的次数设置告警 如果您希望在一定时间范围内日志关键字出现的...
云监控统计日志服务(Log Service)中关键字的数量,并在关键字数量达到一定条件时报警,是日志的常见需求之一。通过本文您可以快速掌握日志关键字监控和设置报警的操作方法。...当日志服务中出现ERROR级别的日志时,您会收到报警通知。
插件类型为:ERROR 说明 ERROR 用于监控 Error 指标。mosnErrorCode MOSN 的错误码 次 可选择自定义配置或框架配置日志,框架配置日志的文件采集路径为:/home/admin/logs/mosn/alert.default.log。插件类型为:MM 说明 MM 全称为 ...
智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...
如果出现云监控插件进程已退出的情况,则可能是云监控自身缺陷导致,建议您直接提工单,并保留问题。查看插件日志 Windows 以Administrator用户登录待安装云监控插件的主机。进入云监控插件日志所在目录 C:\Program Files\Alibaba\...
问题描述 Quick BI配置监控告警报错“监控指标保存失败,Api request error”。问题原因 该问题大概率是因为监控告警的服务出现问题。解决方案 联系阿里技术支持工程师(相关运维同学)检查服务是否正常可用。适用于 Quick BI(独立部署)
“Script error.”的产生原因和解决办法 为什么有些监控页面或API名称中出现了星号(*)?ARMS前端监控的页面统计是以实际打开的页面URL为基础,对各个维度进行统计。监控页面或API名称中的星号(*)并不是真实页面URL的一部分,而是表示这...
因为云监控的通讯地址open.cms.aliyun.com是解析在内网上的,通过内网来进行通讯获取数据,如果禁用了内网,云监控服务会出现无法正常使用,所以为了能够正常的使用云监控服务,必须要确保在服务器上能连通open.cms.aliyun.com的80端口。...
云监控中的ECS CPU监控数值如果出现为0或者负数(实际CPU使用率不是0),其他监控值都正常。这个问题主要出现在Windows的机器上,一般原因是Windows内部的性能计数器损坏了。可以通过 typeperf"\Processor(_Total)\%Processor Time"查看...
说明$Average>0 中的$Average 为一个占位符,格式为$监控结果字段值,云监控会将其替换为对应的统计值或原始的监控值。Average>80 Times integer Info 级别报警连续出现次数。报警连续出现这个次数,且超过阈值才会触发报警。3 Threshold ...
您可以在日志监控中创建监控项及其报警规则,并对该监控项执行修改和删除操作。前提条件 请确保您已在日志服务SLS中创建Project和Logstore。具体操作,请参见 快速入门。请确保您已授权云监控访问日志服务SLS的权限。具体操作,请参见 授权...
您可以在日志监控中创建监控项,并对该监控项执行修改和删除操作。重要 云监控已于2022年09月13日停止日志监控、自定义监控和自定义事件监控服务。2022年09月13日前正在使用上述三个服务的用户仍然可以在2024年09月13日前正常使用。其他...
日志筛选 对日志数据进行过滤,相当于SQL中的where条件,例如:Key为level,Value中需要监控的关键字为ERROR,该参数设置为 level>=ERROR。选择过滤的日志字段名不能包含中文。Group-By 对数据进行空间维度聚合,相当于SQL中的Group By。...
error%s'%st.to_string())发送到钉钉群的消息通知示例如下:任务Hang重启通知示例 用户自定义消息通知示例 配置自定义容错关键字 容错监控功能已内置了常见的可重试错误的监控模块,如果您希望任务异常实例日志中出现某些关键字时也进行...
SLS日志接入云监控后,您可以创建监控大盘,通过监控大盘查看指定监控指标的监控图表。前提条件 请确保您已在日志服务SLS中创建日志项目(Project)和日志库(Logstore)。具体操作,请参见 快速入门。请确保您已创建指标仓库。具体操作,...
堆内存泄露分析 ARMS提供了完善的堆内存泄露定位分析能力,用户可以通过JVM堆内存监控查看是否出现堆内存缓慢增长,如果存在相关堆内存持续增长趋势,可以通过ARMS提供的 内存快照 或 持续剖析 功能排查定位堆内内存泄露位置。堆外内存泄露...
例如:日志中有 Level 和 Error 字段,如果需要统计每分钟 Error 出现的次数,则统计方法可以定义为对 Level 求和,并且 Level=Error。Key string 否 日志匹配的字段名名称。N 的取值范围:1~10。lh_source Value string 否 日志匹配的字段...
例如:日志中有 Level 和 Error 字段,如果需要统计每分钟 Error 出现的次数,则统计方法可以定义为对 Level 求和,并且 Level=Error。Key string 日志匹配的字段名称。hostName Value string 日志匹配的字段值。portal Operator string ...
调用DescribeMetricTop接口先查询指定云产品的指定监控项的最新监控数据,再查询该监控项排序后的监控数据。接口说明 使用限制 单个 API 的调用次数限制为 10 次/秒。一个阿里云账号及该账号下的 RAM 用户共用 10 次/秒。注意事项 各云产品...
例如:日志中有 Level 和 Error 字段,如果需要统计每分钟 Error 出现的次数,则统计方法可以定义为对 Level 求和,并且 Level=Error。Key string 日志匹配的字段名。hostName Value string 日志匹配的字段值。portal Operator string 字段...
在JS错误诊断过程中,ARMS前端监控提供用户行为回溯功能,全面还原错误发生时的用户行为,能够辅助您快速定位解决问题。背景信息 ARMS前端监控将页面上发生的各个事件节点定义为用户行为,包括控制台行为、页面跳转、用户点击、用户输入、...
本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...
调用CreateHybridMonitorTask接口创建阿里云产品的数据接入任务或SLS日志的监控项。接口说明 前提条件 请确保您已开通企业云监控。具体操作,请参见 开通企业云监控。如果您需要创建 SLS 日志的监控项,请确保您已开通 SLS 日志服务,且已...
本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...
分页查询应用监控或前端监控的相关监控指标。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略...
分页查询应用监控或前端监控的相关监控指标。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略...
当应用出现业务异常问题时,您可以通过分析业务日志,精准定位业务异常。日志分析功能支持分析日志服务SLS或直接采集的日志,本文介绍如何开通日志分析功能并分析直接采集的日志。前提条件 ARMS Agent版本为v2.7.1.4或以上。登录 ARMS控制...
对于前端应用来说,JS错误的发生直接影响前端应用的质量,因此对于JS错误的定位及诊断显得尤为重要。ARMS前端监控提供的JS错误诊断功能可以辅助排查JS错误,能够...用户行为回溯 相关文档 JS错误诊断“Script error.”的产生原因和解决办法
在使用Spring Boot应用过程中,为了对系统的状态进行持续地观测,您可以将Spring Boot应用接入Prometheus监控。本文介绍如何将Spring Boot应用快速接入Prometheus监控。背景信息 对于开发者而言,大部分传统SSM结构的MVC应用背后的糟糕体验...
在使用Spring Boot应用过程中,为了对系统的状态进行持续地观测,您可以将Spring Boot应用接入Prometheus监控。本文介绍如何将Spring Boot应用快速接入Prometheus监控。背景信息 对于开发者而言,大部分传统SSM结构的MVC应用背后的糟糕体验...
监控配置 业务监控提供了一种日志数据分析&统计的监控方式,支持用户根据不同的服务,配置多个业务监控项。以下为监控项配置过程引导。一、打开页面 点击菜单【监控中心-业务监控】,打开业务监控页面。本页面展示已配置的监控项,支持按...
应用监控提供了应用分析能力,将应用相关的 Error、Service、SAL、CAL、DAL、OS、JVM、CE Thread、MOSN、端口等服务指标,和 CPU、内存、磁盘等系统指标进行聚合透出,从 IDC/LDC/单机 的空间分布和时间分布上进行对比分析,一个入口总览...
云监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集最近一段时间内活跃进程的CPU使用率、内存使用率和文件打开数。您还可以添加进程监控,查看其进程数,并为这些进程设置报警规则,及时关注进程数的变化,确保...
Error-error 应用总量、LDC 总量、IDC 总量、服务器、应用实例 系统监控-system 应用总量、LDC 总量、IDC 总量、服务器、应用实例、serviceidc、单机IP PV-pv 应用总量、LDC 总量、IDC 总量、URL 总量、服务器、应用实例 调用外部服务-sal ...
本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常会选择使用...