本文为ARMS 2023年的版本发布记录,介绍历次发布的特性变更情况。

202312

模块

功能名称

变更类型

功能描述

相关文档

应用监控

告警规则

优化

针对JVM监控提供更丰富的告警规则。

告警规则指标说明

应用监控

控制台

新增

全新控制台全量上线,提供更精细的场景化可观测能力、更强大的链路查询分析能力。

查看监控详情(新版)

应用监控

应用接入

新增

新增.NET应用和Node.js应用自动埋点接入方案指引与Demo。

应用监控

探针

优化

大幅提升探针在线状态列表加载速度。

-

前端监控/用户体验监控

数据分析

新增

支持多维筛选分析能力,提供灵活的数据查询探索能力。

数据探索

监控数据

新增

完整展示网页、资源(API请求等)加载过程中的错、慢等异常情况。

资源加载

监控大盘

新增

联动Prometheus、Grafana,预置常见前端监控场景相关看板。

-

控制台

新增

全新的控制台交互体验,观测分析能力更直观、高效。

-

可观测监控 Prometheus 版

组件接入

新增

新增支持阿里云图计算服务GraphCompute监控接入。

云服务接入

组件接入

新增

新增支持阿里云大数据计算服务MaxCompute监控接入。

云服务接入

组件接入

新增

企业云监控数据接入支持自动抓取实例资源组、地域、账号ID等元信息,并自动将其作为监控指标的Label写入实例的指标中,同时支持用户自定义实例的标签指标的Label写入指标中。

-

指标

新增

青岛、张家口、新加坡地域的Prometheus实例支持OpenTelemetry指标上报。

-

云拨测

定时拨测

新增

HTTPS请求支持SSL证书校验。

-

云拨测

即时拨测

优化

即时拨测URL输入内容自动补全。

发起即时拨测

告警管理

告警通知

优化

集成支持在IM端(钉钉/飞书/企业微信)快速选择和执行。

在告警通知群中处理告警

告警管理

告警通知

优化

IM端(钉钉/飞书/企业微信)操作屏蔽告警后,将会发送一天屏蔽通知并记录在告警活动中。

在告警通知群中处理告警

202311

模块

功能名称

变更类型

功能描述

相关文档

产品计费

计费方案

新增

ARMS面向新用户(202311200点后开通)支持按写入可观测数据计费方案。

【计费变更】ARMS上线新版计费模式

应用监控 eBPF 版

应用监控 eBPF 版

新增

全新上线应用监控 eBPF 版,基于eBPF技术提供零入侵、语言无关、高性能的应用可观测体验。

什么是阿里云应用监控 eBPF 版

应用监控

探针

新增

支持Spring Boot 3.0,满足Spring Boot 3.0监控需求。

探针(Agent)版本说明

标签

新增

容器环境下支持通过Pod Label添加应用标签,方便容器用户管理应用。

添加并使用标签

接入

优化

容器环境下,控制台支持应用白屏化一键接入,提升容器用户接入效率。

接入指南

自定义配置

优化

自定义配置界面全面优化,精简多个自定义配置项。

自定义配置

云拨测

HTTPS拨测

新增

HTTPS请求拨测详情支持链路追踪,增加调用链分析能力。

云拨测任务如何集成链路追踪?

开服地域

新增

云拨测国际站开服,满足国际站用户拨测需求。

什么是云拨测

告警管理

集成

新增

新增支持行动集成,提供函数计算FCWebhook两种集成方式,可根据实际告警情况选择执行合适的行动集成,如快速恢复告警的预案场景,提升应急响应能力。

-

告警指标

新增

应用告警规则的JVM指标类型中支持元空间,满足对应用JVM元空间设置告警的需求。

应用监控指标说明

告警规则

优化

删除应用时关联告警规则将不会被级联删除,减少告警规则重复创建工作。

-

告警规则

优化

优化Prometheus告警规则和规则模板列表页面,可自定义显示条数,满足多条目批量导入导出等场景需求。

Prometheus告警规则

可观测监控 Prometheus 版

指标

新增

指标中心上线,开通GB计费用户支持指标中心。

指标说明

接入

新增

新版接入中心上线,开通GB计费用户支持新版接入中心。

接入指南

云监控

优化

优化企业云监控数据采集链接,提升采集稳定性。

-

202310

模块

功能名称

变更类型

功能描述

相关文档

应用监控

探针

新增

探针支持Java 21应用,Java探针监控覆盖至最新版本JDK。

ARMS应用监控支持的Java组件和框架

调用链

新增

调用链信息展示HTTP状态码,方便用户在查看调用链时同时查看HTTP状态,缩短问题定位时间。

调用链路查询

调用链

优化

  • 调用链信息区分返回错误与执行异常。

  • 调用链分析支持更丰富的查询能力。

调用链分析

NoSQL调用

优化

NoSQL调用展示更多信息。

NoSQL调用分析

云拨测

计费

新增

上线资源包,覆盖云主机、PC、移动端等不同拨测点,满足网站监控、CDN优化等日常主动监控需求。

资源包

告警管理

告警规则

新增

新增可观测链路 OpenTelemetry 版应用告警规则,支持丰富的告警管理操作。

应用监控告警规则

通知对象

优化

告警通知对象支持钉钉酷应用的方式,对接钉钉新能力,提供全新的钉钉告警处理方式,支持告警统计吊顶,告警卡片实时刷新等新能力。

-

可观测监控 Prometheus 版

指标

新增

中国地域支持指标总览,支持统一的查看、搜索界面。

指标说明

Prometheus for 云服务

新增

Prometheus for 云服务实例支持密钥管理服务KMS集成,提升Prometheus云服务组件监控覆盖率。

Prometheus实例 for 云服务

Prometheus for 云服务

新增

Prometheus for 云服务实例支持阿里云无影云桌面,提升Prometheus云服务组件监控覆盖率。

开服地域

新增

Prometheus for ECS实例新增泰国曼谷、菲律宾马尼拉、韩国首尔地域。

-

Prometheus for ECS

优化

优化Prometheus for ECS实例中Prometheus Agent自监控大盘。

Prometheus Agent自监控大盘

可观测可视化 Grafana 版

数据源

新增

新增对MaxCompute(ODPS)数据源的支持,MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速地解决用户海量数据计算问题,有效降低企业成本。

添加并使用MaxCompute(ODPS)数据源

可观测可视化 Grafana 版

AIOps小智机器人

新增

新增AIOps小智机器人,能够轻松、高效地完成Prometheus数据查询、告警配置等工作,帮助用户免去翻阅繁琐文档和学习PromQL的烦恼。

如何使用PromQL小工具

202309

模块

功能名称

变更类型

功能描述

相关文档

应用监控

持续剖析

新增

新增代码热点功能,通过持续剖析技术定时采集请求线程堆栈快照,真实还原代码执行第一现场。

使用代码热点诊断慢调用链的问题

API

优化

完善自定义配置的API接口SaveTraceAppConfig,方便用户按需调用。

API概览

探针

优化

优化预聚合处理逻辑,探针CPU开销降低10%以上。

-

调用链分析

优化

支持多维聚合,基于已存储的全量链路明细数据,自由组合筛选条件与聚合维度进行实时分析,可以满足不同场景的自定义诊断需求。

调用链分析

控制台

优化

全面优化对链路中异常信息和错误信息的展示与交互,优化控制台使用体验。

-

云拨测

网站劫持

新增

新增网站劫持拨测功能,实时检测站点安全性,保障用户安全。

创建拨测任务

资源组

优化

支持拨测任务资源组配置,方便企业用户管理多组拨测任务。

创建拨测任务

可观测监控 Prometheus 版

指标探索

新增

中国内地区域新增指标探索功能。

-

Prometheus实例 for 云服务

新增

Prometheus实例 for 云服务实例新增对阿里云全球加速GA和函数计算FC的集成。

Prometheus实例 for 云服务

Node Exporter

新增

Node Exporter集成新增支持textfile方式采集指标。

Node Exporter类型组件接入

开服地域

新增

Prometheus实例 for ECS实例和Prometheus实例 for ACK Serverless示例开服地域新增泰国、菲律宾、首尔和沙特。

开服地域

实例列表

优化

实例列表默认展示实例ID信息。

Prometheus实例列表

告警管理

告警规则

优化

应用监控告警规则新增,便于快速查询当前正在告警中的告警规则。

应用监控告警规则

优化

前端监控告警规则支持RAM用户下资源维度的权限管理功能,满足多RAM用户分权管理需求。

借助RAM用户实现分权

事件详情

优化

优化事件详情页面,完善事件标签字段和事件注释字段展示,便于从事件中提取变量配置通知模板。

查看告警事件历史

可观测可视化 Grafana 版

Grafana 10.0.x上线

新增

Grafana 10.0.x不仅引入新功能,还支持更好的分析洞察能力、更高的协同效率及更美观的仪表盘。

Grafana v10.0.x新增功能特性

开服地域

新增

新增北京、上海、广州、深圳、杭州、香港、成都、青岛、河源、张家口、乌兰察布、呼和浩特地域。

开服地域

云服务

新增

新增开服金融云。

开服地域

高级版

新增

高级版新增支持自定义用户账号数量,工作区账号数量上限支持为2000个,您可以按需购买。

计费规则

私网域名

新增

新增支持私网域名功能,通过在可观测可视化 Grafana 版中安装私网网卡,可使Grafana工作区访问VPC内未开通公共访问的数据源,并可获取仅能在VPC内部访问的域名。

私网域名与白名单设置

202308

模块

功能名称

变更类型

功能描述

相关文档

应用监控

调用链分析

新增

  • 新增散点图,提供更直观、全面的性能数据展示,帮助您快速定位问题。

  • 链路详情支持方法栈分析总览,在查看调用链时可同时查看方法栈分析,缩短问题定位时间。

调用链分析

探针

优化

探针新增对Eclipse Vert.x 4.X的支持。

ARMS应用监控支持的Java组件和框架

ack-onepilot组件

优化

ack-onepilot组件新增对ARM架构的支持。

如何安装ack-onepilot和卸载arms-pilot

Demo

新增

新增免登录体验Demo,无需登录阿里云账号,即可查看应用监控各项能力。

-

可观测监控 Prometheus 版

开服地域

新增

泰国(曼谷)区域开服。

开服地域

Agent组件

新增

Prometheus Agent组件4.0.0版本正式发布,提升稳定性和性能,同时支持多项新能力。

【组件升级】Helm1.1.17/Agent v4.0.0的升级内容与升级方式

组件监控

新增

Prometheus for 容器服务实例支持 Memcached监控集成。

Memcached组件接入

组件监控

新增

Prometheus for 容器服务实例支持SQL Server监控集成。

SQLServer组件接入

组件监控

新增

Prometheus for 云服务实例支持阿里云智能计算灵骏监控集成。

云服务接入

RAM权限

新增

Prometheus全局聚合实例在企业资源目录授权访问之外新增基于RAM进行多账号聚合查询。

基于Prometheus全局聚合实例进行多账号统一监控

Terraform

新增

Prometheus ServiceMonitor、PodMonitor等服务发现能力支持 Terraform。

使用Terraform管理Prometheus实例的Monitoring

资源管理

优化

Prometheus实例支持企业资源管理,支持资源管理中统一标签管理。

-

RAM权限

优化

优化RAM子用户使用Prometheus控制台权限相关监测和提示。

-

大盘

优化

阿里云容器服务控制台集群管理相关界面全面集成Prometheus监控大盘。

-

云拨测

API

新增

新版云拨测开放OpenAPI,您可以根据实际需求扩展云拨测功能。

API概览

版本升级

优化

旧版云拨测支持一键升级至新版云拨测,您无需重新配置和创建任务,即可将旧版拨测任务无缝迁移到新版拨测任务列表中。

云拨测升级说明

告警管理

告警规则

优化

应用监控告警规则支持导入导出功能,简化多账户场景下应用监控告警规则配置的复杂度。

应用监控告警规则

告警通知

优化

告警通知支持在控制台进行屏蔽操作。

查看告警发送历史

Prometheus告警规则模板

优化

金融云支持Prometheus告警规则模板功能。

Prometheus告警规则模板

202307

模块

功能名称

变更类型

功能描述

相关文档

应用监控

自定义配置

优化

新增对JVM系统参数、K8s Yaml、方法入参、Arthas环境变量的信息脱敏功能。

自定义配置

调用链分析

优化

调用链分析新增分享与导出功能。

调用链分析

监控指标

优化

支持ZGC垃圾回收器的相关指标展示,满足JDK 11场景下的垃圾回收性能监控。

探针

优化

全面优化reactor-netty的自动埋点,提供更加准确的请求次数、响应时间统计。

探针(Agent)版本说明

可观测监控 Prometheus 版

Prometheus for 云服务实例新增支持Region

新增

支持主要区域进行实例创建,支持基于不同区域内网读取Prometheus实例数据。

Prometheus实例 for 云服务

全局聚合实例支持同步云服务实例大盘

新增

方便全局聚合实例用户查看云服务实例大盘

如何创建跨账号GlobalView实例

支持MicroMeter数据集成

新增

Micrometer可收集更多的应用程序度量数据,例如请求处理时间、线程池大小、内存使用情况等,这些数据可以为Prometheus提供更详细的监控数据,帮助用户更精细地了解系统运行情况和性能瓶颈。

使用Prometheus监控MicroMeterJava应用

费用账单详情新增实例名称标签

优化

方便用户基于实例名称对费用进行分析优化。

查看账单

ACK Serverless集群 Prometheus Agent支持托管

新增

降低用户的资源成本,Agent更稳定。

Prometheus实例 for 容器服务

可观测可视化 Grafana 版

国际站多语言大盘设置功能上线

新增

支持通过参数配置Dashboard的语言。

参数设置

日志服务SLS插件升级2.29版本

优化

支持语言高亮提示以及Panel类型选择提示。

插件管理

共享版大盘支持快捷导入专家版

新增

共享版大盘支持快捷导入专家版,简化用户大盘导入流程。

如何将共享版大盘导入Grafana专家版

数据报表自动邮件功能优化

优化

优化数据报表的文案及布局。

数据报表

可观测可视化 Grafana 版

支持资源组标签功能

优化

方便用户通过资源组标签管理工作区。

查看工作区信息

告警管理

告警规则

优化

应用告警规则支持P99等分位数、慢调用次数,满足各种告警配置场景需求。

告警事件

优化

告警支持手动管理恢复状态,满足人为应急响应处理管理和数据度量的需求。

告警规则

优化

Prometheus自监控类产品告警规则优化,支持在ARMS告警管理平台统一查询和展示,并支持快速跳转至云产品控制台规则列表页面进行管理。

告警规则

优化

【邀测中】应用告警规则新增支持区间检测模式,满足周期稳定类型的指标采用动态阈值的需求。

告警规则

优化

【邀测中】应用告警规则支持静态阈值推荐及告警数预测,简化用户告警规则的阈值设定,校验阈值配置的合理性。

202306

模块

功能名称

变更类型

功能描述

相关文档

应用监控

探针新增支持的组件

优化

探针新增支持SequoiaDB、Informix、ElasticJob、OceanBase、DB2等组件。

内存快照

优化

内存快照功能全面升级为阿里云应用诊断分析平台(ATP)方案,进一步增强内存快照能力,提供了更全面、更强大的应用诊断和分析能力。

内存快照

链路追踪产品全面升级为可观测链路 OpenTelemetry 版

优化

支持多语言通过OpenTelemetry接入,可以实现数据的统一收集、格式化和处理,提供更全面、一致和灵活的监控和分析能力,为客户提供更好的可观测性和数据驱动的决策能力。

什么是可观测链路 OpenTelemetry 版

全链路聚合与全链路拓扑

优化

优化全链路聚合查询中体验不佳的问题。

应用监控告警规则

优化

支持选择历史数据进行告警规则测试,确保告警规则条件及通知策略设置符合预期。

应用监控告警规则

应用监控

持续剖析

优化

支持部署在海外Region的应用使用持续剖析功能。

接入持续剖析功能

可观测监控 Prometheus 版

Promethues for ECS实例支持自建Cassandra数据库集成

新增

丰富Prometheus for ECS实例的可观测覆盖率,提供更全面的监控解决方案。

如何使用Prometheus监控Cassandra

全局聚合实例支持配置告警规则

新增

支持GlobalView类型的Prometheus实例的告警配置。

如何创建跨账号GlobalView实例

金融云支持阿里云MongoDB集成

新增

支持金融云客户对阿里云MongoDB可观测。

Prometheus实例 for 云服务

Prometheus for 容器服务实例支持ACK One容器服务

新增

Prometheus实例覆盖容器服务新类型ACK One,确保阿里云用户在阿里云上拥有更全面的容器可观测解决方案。

Prometheus实例 for 容器服务

优化Promethues for ECS 实例接入流程

优化

优化实例接入过程中体验不佳的问题。

Prometheus实例 for ECS

优化ACK工作负载监控大盘

优化

优化ACK工作负载大盘的指标。

可观测可视化 Grafana 版

参数设置

优化

大盘支持中英文界面设置。

参数设置

云拨测

云拨测2.0

新增

云拨测从功能体验、场景、价格等方面的全面升级。

云拨测升级说明

告警管理

告警事件分析

新增

新增告警事件分析页面,告警事件分析功能支持对告警事件趋势进行查看、分析、手动恢复等操作。

告警事件分析

202305

模块

功能名称

变更类型

功能描述

相关文档

应用监控

资源组

新增

应用监控支持资源组功能,您可以通过资源组快速筛选应用。

资源消耗统计

优化

应用监控支持查看应用级粒度出账明细,便于进行成本计算。

账单和用量查询

应用列表

优化

应用列表突出实例状态,方便识别历史过期实例以及当前离线状态的实例。

应用监控告警规则

优化

告警规则列表支持基于标签进行告警规则快速筛选与分组操作。

应用监控告警规则

告警管理

告警集成

新增

告警集成类型新增ARMS-云拨测,提升使用ARMS云拨测的用户配置通知策略的体验及效率。

可观测监控 Prometheus 版

Prometheus全局聚合实例支持添加多账号下Prometheus实例

优化

全局聚合实例可通过阿里云控制台资源管理中的资源目录添加多个云账号下的Prometheus实例,方便用户针对多个地域多个云账号下的Prometheus实例进行统一管理。

如何创建跨账号GlobalView实例

Prometheus for 云服务

新增

  • 云服务类型的Prometheus实例新增支持CPFS。

  • 云服务类型的Prometheus实例通过云服务自监控方式集成的云产品支持采集云实例的元数据信息。

Prometheus实例 for 云服务

阿里云容器服务ACK集群改名优化

优化

Prometheus实例自动同步容器服务ACK集群命名变更。

Prometheus实例 for 容器服务

Prometheus告警规则

新增

  • 告警规则列表支持基于标签进行告警规则快速筛选与分组操作。

  • 告警规则支持快速复制,简化规则配置工作量。

Prometheus告警规则

可观测可视化 Grafana 版

Grafana支持多区域统一控制台

新增

Grafana支持多区域统一控制台,所有区域的工作区支持在同一控制台下进行展示和管理,无须进行区域切换。

什么是可观测可视化 Grafana 版

202304

模块

功能名称

变更类型

功能描述

相关文档

应用监控

新增支持的数据库类型

优化

数据库调用支持OceanBase。

数据库调用

自定义配置

优化

自定义配置支持按模块进行批量设置,同时支持自定义初始化设置。

自定义配置

应用监控

Insights

优化

Insights增加单机错误率突增、RT突增问题巡检。

巡检配置

可观测监控 Prometheus 版

Prometheus Agent v4.0.0版本发布

新增

  • 新增Multi-Master机制,可应对超大规模集群服务发现和Targets调度。

  • 新增收集集群事件指标的采集任务,新增Kubernetes Deployment大盘中展示集群事件。

  • 支持Staleness能力与开源保持对齐。

  • ServiceMonitor支持BasicAuth认证方式,Secret需要与ServiceMonitor在同一个命名空间下。

  • 新增自监控指标4个。包括Master扩容失败、Master调度Targets耗时、Master下发Targets次数、Master同步Worker耗时。

  • 优化多租场景Informer监听逻辑,多租场景下节省CPU开销。

【组件发布】Prometheus Agent发布公告

Prometheus支持Terraform

新增

使用Terraform AliCloud Provider,用户可以自动化地创建和管理Prometheus实例资源,在不同的环境以相同的方式使用Prometheus监控。

Terraform概述

Prometheus操作审计

新增

满足企业级安全需求,提高资源操作的安全性。

接入中心云服务接入优化

更新

优化用户在云服务接入的体验。

云服务接入

202303

模块

功能名称

变更类型

功能描述

相关文档

应用监控

可观测链路 OpenTelemetry 版

新增

可观测链路 OpenTelemetry 版支持通过自定义策略为RAM用户授权。

可观测链路 OpenTelemetry 版自定义RAM授权策略

应用监控告警规则

优化

  • 应用监控告警规则上线创建告警新手指引流程。

  • 告警指标类型应用提供服务统计支持按照接口调用类型维度进行过滤。

  • 告警规则的告警条件参数支持设置告警持续时间。

应用监控告警规则

可观测监控 Prometheus 版

云服务监控独享实例

新增

云服务监控数据集成企业云监控和云服务自监控,独享实例支持多种存储时长和数据导出能力。

云服务接入

告警管理

标签

新增

告警规则支持自定义告警等级后,在设置通知策略、事件处理流功能选择事件匹配规则时,告警等级Value将会通过系统内置用户自定义标签区分。

可观测可视化 Grafana 版

数据源插件

新增

新增支持Lindorm ML插件。

使用Grafana进行异常检测算法调优

202302

模块

功能名称

变更类型

功能描述

相关文档

应用监控

ECS应用白屏接入

新增

ARMS已支持白屏接入ECS环境上的Java应用。初次接入时,您只需重启一次应用进程即可完成探针接入,无需修改应用启动脚本。后续探针的升级、维护,也将由ARMS探针底座自动完成,无需人工参与。

ECS环境自动安装探针

应用监控告警规则

优化

  • 告警规则列表支持根据指标类型、告警应用筛选告警规则。

  • 告警规则支持直接配置P1~P4的告警等级。

  • 告警规则新增异常监控指标类型,支持根据特定异常进行告警配置。

  • JVM监控指标类型新增堆内存使用率指标。

应用监控告警规则

前端监控

SourceMap

优化

前端监控支持OSS批量上传SourceMap。

可观测监控 Prometheus 版

集成中心

新增

集成中心上线TiDB监控和Nebula监控。

集成中心

优化

集成组件自动创建默认告警规则,支持一键启用,方便灵活。

Prometheus告警规则

告警管理

自定义RAM授权策略

新增

告警管理支持通过自定义策略为RAM用户授权。

告警管理自定义RAM授权策略

可观测可视化 Grafana 版

告警管理

新增

可观测可视化 Grafana 版ARMS告警管理融合,支持通过电话、短信、邮件、钉钉、企业微信、飞书和Webhook方式向通知对象发送告警通知。

告警管理(ARMS告警)

VPC数据源接入

优化

通过在可观测可视化 Grafana 版中安装VPC数据源通道,可以使Grafana工作区访问到VPC内未开通公网访问的数据源。

VPC数据源通道管理

202301

模块

功能名称

变更类型

功能描述

相关文档

可观测监控 Prometheus 版

集成中心

新增

集成中心上线Knative监控。

Knative组件接入

告警规则

优化

告警规则新增自动中断状态。

Prometheus告警规则

告警管理

地区

新增

支持切换以下地区:

  • 中国

  • 东南亚

  • 北美

  • 欧洲

  • 日本

排班管理

优化

排班管理支持在企业微信和飞书群中发送通知。

排班管理

可观测可视化 Grafana 版

共享版工作区

优化

共享版工作区升级为9.0.x版本Grafana。

Grafana v9.0.x新增功能特性

SmartMetrics

优化

新增Holiday功能,支持配置定制化事件,提高了动态基线告警的准确率。

SmartMetrics Holiday功能