2023年

更新时间: 2023-10-31 18:03:40

本文为ARMS 2023年的版本发布记录,介绍历次发布的特性变更情况。

2023年09月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

CPU&内存诊断

新增

新增代码热点功能,通过持续剖析技术定时采集请求线程堆栈快照,真是还原代码执行第一现场。

使用代码热点诊断慢调用链的问题

API

优化

完善自定义配置的API接口SaveTraceAppConfig,方便用户按需调用。

SaveTraceAppConfig - 应用监控自定义设置

探针

优化

优化预聚合处理逻辑,探针CPU开销降低10%以上。

-

调用链分析

优化

支持多维聚合,基于已存储的全量链路明细数据,自由组合筛选条件与聚合维度进行实时分析,可以满足不同场景的自定义诊断需求。

调用链分析

控制台

优化

全面优化对链路中异常信息和错误信息的展示与交互,优化控制台使用体验。

-

云拨测

网站劫持

新增

新增网站劫持拨测功能,实时检测站点安全性,保障用户安全。

创建拨测任务

资源组

优化

支持拨测任务资源组配置,方便企业用户管理多组拨测任务。

创建拨测任务

可观测监控 Prometheus 版

指标探索

新增

中国内地区域新增指标探索功能。

-

Prometheus实例 for 云服务

新增

Prometheus实例 for 云服务实例新增对阿里云全球加速GA和函数计算FC的集成。

Prometheus实例 for 云服务

Node Exporter

新增

Node Exporter集成新增支持textfile方式采集指标。

Node Exporter类型组件接入

开服地域

新增

Prometheus实例 for ECS实例和Prometheus实例 for ACK Serverless示例开服地域新增泰国、菲律宾、首尔和沙特。

开服地域

实例列表

优化

实例列表默认展示实例ID信息。

Prometheus实例列表

告警管理

告警规则

优化

应用监控告警规则新增,便于快速查询当前正在告警中的告警规则。

应用监控告警规则(新版)

优化

前端监控告警规则支持RAM用户下资源维度的权限管理功能,满足多RAM用户分权管理需求。

借助RAM用户实现分权

事件详情

优化

优化事件详情页面,完善事件标签字段和事件注释字段展示,便于从事件中提取变量配置通知模板。

查看告警事件历史

可观测可视化 Grafana 版

Grafana 10.0.x上线

新增

Grafana 10.0.x不仅引入新功能,还支持更好的分析洞察能力、更高的协同效率及更美观的仪表盘。

Grafana v10.0.x新增功能特性

开服地域

新增

新增北京、上海、广州、深圳、杭州、香港、成都、青岛、河源、张家口、乌兰察布、呼和浩特地域。

开服地域

云服务

新增

新增开服金融云。

开服地域

高级版

新增

高级版新增支持自定义用户账号数量,工作区账号数量上限支持为2000个,您可以按需购买。

计费规则

私网域名

新增

新增支持私网域名功能,通过在可观测可视化 Grafana 版中安装私网网卡,可使Grafana工作区访问VPC内未开通公共访问的数据源,并可获取仅能在VPC内部访问的域名。

私网域名与白名单设置

2023年08月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

调用链分析

新增

  • 新增散点图,提供更直观、全面的性能数据展示,帮助您快速定位问题。

  • 链路详情支持方法栈分析总览,在查看调用链时可同时查看方法栈分析,缩短问题定位时间。

调用链分析

探针

优化

探针新增对Eclipse Vert.x 4.X的支持。

ARMS应用监控支持的Java组件和框架

ack-onepilot组件

优化

ack-onepilot组件新增对ARM构架的支持。

如何安装ack-onepilot和卸载arms-pilot

Demo

新增

新增免登录体验Demo,无需登录阿里云账号,即可查看应用监控各项能力。

-

可观测监控 Prometheus 版

开服地域

新增

泰国(曼谷)区域开服。

开服地域

Agent组件

新增

Prometheus Agent组件4.0.0版本正式发布,提升稳定性和性能,同时支持多项新能力。

【组件升级】Helm1.1.17/Agent v4.0.0的升级内容与升级方式

组件监控

新增

Prometheus for 容器服务实例支持 Memcached监控集成。

Memcached组件接入

组件监控

新增

Prometheus for 容器服务实例支持SQL Server监控集成。

SQLServer组件接入

组件监控

新增

Prometheus for 云服务实例支持阿里云智能计算灵骏监控集成。

云服务接入

RAM权限

新增

Prometheus全局聚合实例在企业资源目录授权访问之外新增基于RAM进行多账号聚合查询。

通过自定义鉴权方式实现跨账号聚合实例数据

Terraform

新增

Prometheus ServiceMonitor、PodMonitor等服务发现能力支持 Terraform。

使用Terraform管理Prometheus实例的Monitoring

资源管理

优化

Prometheus实例支持企业资源管理、支持资源管理中统一标签管理。

-

RAM权限

优化

优化RAM子用户使用Prometheus控制台权限相关监测和提示。

-

大盘

优化

阿里云容器服务控制台集群管理相关界面全面集成Prometheus监控大盘。

-

云拨测

API

新增

新版云拨测开放OpenAPI,您可以根据实际需求扩展云拨测功能。

云拨测(新版)

版本升级

优化

旧版云拨测支持一键升级至新版云拨测,您无需重新配置和创建任务,即可将旧版拨测任务无缝迁移到新版拨测任务列表中。

云拨测升级说明

告警管理

告警规则

优化

应用监控告警规则支持导入导出功能,简化多账户场景下应用监控告警规则配置的复杂度。

应用监控告警规则(新版)

告警通知

优化

告警通知支持在控制台进行屏蔽操作。

查看告警发送历史

Prometheus告警规则模板

优化

金融云支持Prometheus告警规则模板功能。

Prometheus告警规则模板

2023年07月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

自定义配置

优化

新增对JVM系统参数、K8s Yaml、方法入参、Arthas环境变量的信息脱敏功能。

自定义配置

调用链分析

优化

调用链分析新增分享与导出功能。

调用链分析

监控指标

优化

支持ZGC垃圾回收器的相关指标展示,满足JDK 11场景下的垃圾回收性能监控。

探针

优化

全面优化reactor-netty的自动埋点,提供更加准确的请求次数、响应时间统计。

探针(Agent)版本说明

可观测监控 Prometheus 版

Prometheus for 云服务实例新增支持Region

新增

支持主要区域进行实例创建,支持基于不同区域内网读取Prometheus实例数据。

Prometheus实例 for 云服务

全局聚合实例支持同步云服务实例大盘

新增

方便全局聚合实例用户查看云服务实例大盘

如何创建跨账号GlobalView实例

支持MicroMeter数据集成

新增

MicroMeter可收集更多的应用程序度量数据,例如请求处理时间、线程池大小、内存使用情况等,这些数据可以为Prometheus提供更详细的监控数据,帮助用户更精细地了解系统运行情况和性能瓶颈。

使用Prometheus监控MicroMeter的Java应用

费用账单详情新增实例名称标签

优化

方便用户基于实例名称对费用进行分析优化。

查看账单

ACK Serverless集群 Prometheus Agent支持托管

新增

降低用户的资源成本,Agent更稳定。

Prometheus实例 for 容器服务

可观测可视化 Grafana 版

国际站多语言大盘设置功能上线

新增

支持通过参数配置Dashboard的语言。

参数设置

日志服务SLS插件升级2.29版本

优化

支持语言高亮提示以及Panel类型选择提示。

插件管理

共享版大盘支持快捷导入专家版

新增

共享版大盘支持快捷导入专家版,简化用户大盘导入流程。

如何将共享版大盘导入Grafana专家版

数据报表自动邮件功能优化

优化

优化数据报表的文案及布局。

数据报表

可观测可视化 Grafana 版

支持资源组标签功能

优化

方便用户通过资源组标签管理工作区。

查看工作区信息

告警管理

告警规则

优化

应用告警规则支持P99等分位数、慢调用次数,满足各种告警配置场景需求。

告警事件

优化

告警支持手动管理恢复状态,满足人为应急响应处理管理和数据度量的需求。

告警规则

优化

Prometheus自监控类产品告警规则优化,支持在ARMS告警管理平台统一查询和展示,并支持快速跳转至云产品控制台规则列表页面进行管理。

告警规则

优化

【邀测中】应用告警规则新增支持区间检测模式,满足周期稳定类型的指标采用动态阈值的需求。

告警规则

优化

【邀测中】应用告警规则支持静态阈值推荐及告警数预测,简化用户告警规则的阈值设定,校验阈值配置的合理性。

2023年06月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

探针新增支持的组件

优化

探针新增支持SequoiaDB、Informix、ElasticJob、OceanBase、DB2等组件。

内存快照

优化

内存快照功能全面升级为阿里云应用诊断分析平台(ATP)方案,进一步增强内存快照能力,提供了更全面、更强大的应用诊断和分析能力。

内存快照

链路追踪产品全面升级为可观测链路 OpenTelemetry 版

优化

支持多语言通过OpenTelemetry接入,可以实现数据的统一收集、格式化和处理,提供更全面、一致和灵活的监控和分析能力,为客户提供更好的可观测性和数据驱动的决策能力。

什么是可观测链路 OpenTelemetry 版

全链路聚合与全链路拓扑

优化

优化全链路聚合查询中体验不佳的问题。

应用监控告警规则

优化

支持选择历史数据进行告警规则测试,确保告警规则条件及通知策略设置符合预期。

应用监控告警规则(新版)

应用监控

CPU&内存诊断

优化

支持部署在海外Region的应用使用CPU&内存诊断功能。

接入CPU&内存诊断功能

可观测监控 Prometheus 版

Promethues for ECS实例支持自建Cassandra数据库集成

新增

丰富Promethues for ECS实例的可观测覆盖率,提供更全面的监控解决方案。

如何使用Prometheus监控Cassandra

全局聚合实例支持配置告警规则

新增

支持GlobalView类型的Prometheus实例的告警配置。

如何创建跨账号GlobalView实例

金融云支持阿里云MongoDB集成

新增

支持金融云客户对阿里云MongoDB可观测。

Prometheus实例 for 云服务

Prometheus for 容器服务实例支持ACK One容器服务

新增

Prometheus实例覆盖容器服务新类型ACK One,确保阿里云用户在阿里云上拥有更全面的容器可观测解决方案。

Prometheus实例 for 容器服务

优化Promethues for ECS 实例接入流程

优化

优化实例接入过程中体验不佳的问题。

Prometheus实例 for ECS

优化ACK工作负载监控大盘

优化

优化ACK工作负载大盘的指标。

可观测可视化 Grafana 版

参数设置

优化

大盘支持中英文界面设置。

参数设置

云拨测

云拨测2.0

新增

云拨测从功能体验、场景、价格等方面的全面升级。

云拨测升级说明

告警管理

告警事件分析

新增

新增告警事件分析页面,告警事件分析功能支持对告警事件趋势进行查看、分析、手动恢复等操作。

告警事件分析

2023年05月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

资源组

新增

应用监控支持资源组功能,您可以通过资源组快速筛选应用。

资源消耗统计

优化

应用监控支持查看应用级粒度出账明细,便于进行成本计算。

账单和用量查询

应用列表

优化

应用列表突出实例状态,方便识别历史过期实例以及当前离线状态的实例。

应用监控告警规则

优化

告警规则列表支持基于标签进行告警规则快速筛选与分组操作。

应用监控告警规则(新版)

告警管理

告警集成

新增

告警集成类型新增ARMS-云拨测,提升使用ARMS云拨测的用户配置通知策略的体验及效率。

可观测监控 Prometheus 版

Prometheus全局聚合实例支持添加多账号下Prometheus实例

优化

全局聚合实例可通过阿里云控制台资源管理中的资源目录添加多个云账号下的Prometheus实例,方便用户针对多个地域多个云账号下的Prometheus实例进行统一管理。

如何创建跨账号GlobalView实例

Prometheus for 云服务

新增

  • 云服务类型的Prometheus实例新增支持CPFS。

  • 云服务类型的Prometheus实例通过云服务自监控方式集成的云产品支持采集云实例的元数据信息。

Prometheus实例 for 云服务

阿里云容器服务ACK集群改名优化

优化

Prometheus实例自动同步容器服务ACK集群命名变更。

Prometheus实例 for 容器服务

Prometheus告警规则

新增

  • 告警规则列表支持基于标签进行告警规则快速筛选与分组操作。

  • 告警规则支持快速复制,简化规则配置工作量。

Prometheus告警规则

可观测可视化 Grafana 版

Grafana支持多区域统一控制台

新增

Grafana支持多区域统一控制台,所有区域的工作区支持在同一控制台下进行展示和管理,无须进行区域切换。

什么是可观测可视化 Grafana 版

2023年04月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

新增支持的数据库类型

优化

数据库调用支持OceanBase。

数据库调用

自定义配置

优化

自定义配置支持按模块进行批量设置,同时支持自定义初始化设置。

自定义配置

应用监控

Insights

优化

Insights增加单机错误率突增、RT突增问题巡检。

巡检配置

可观测监控 Prometheus 版

Prometheus Agent v4.0.0版本发布

新增

  • 新增Multi-Master机制,可应对超大规模集群服务发现和Targets调度。

  • 新增收集集群事件指标的采集任务,新增Kubernetes Deployment大盘中展示集群事件。

  • 支持Staleness能力与开源保持对齐。

  • ServiceMonitor支持BasicAuth认证方式,Secret需要与ServiceMonitor在同一个命名空间下。

  • 新增自监控指标4个。包括Master扩容失败、Master调度Targets耗时、Master下发Targets次数、Master同步Worker耗时。

  • 优化多租场景Informer监听逻辑,多租场景下节省CPU开销。

【组件发布】Prometheus Agent发布公告

Prometheus支持Terraform

新增

使用Terraform AliCloud Provider,用户可以自动化的创建和管Prometheus实例资源,在不同的环境以相同的方式使用Prometheus监控。

Terraform概述

Prometheus操作审计

新增

满足企业级安全需求,提高资源操作的安全性。

接入中心云服务接入优化

更新

优化用户在云服务接入的体验。

云服务接入

2023年03月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

可观测链路 OpenTelemetry 版

新增

可观测链路 OpenTelemetry 版支持通过自定义策略为RAM用户授权。

可观测链路 OpenTelemetry 版自定义RAM授权策略

应用监控告警规则

优化

  • 应用监控告警规则上线创建告警新手指引流程。

  • 告警指标类型应用提供服务统计支持按照接口调用类型维度进行过滤。

  • 告警规则的告警条件参数支持设置告警持续时间。

应用监控告警规则(新版)

可观测监控 Prometheus 版

云服务监控独享实例

新增

云服务监控数据集成企业云监控和云服务自监控,独享实例支持多种存储时长和数据导出能力。

云服务接入

告警管理

标签

新增

告警规则支持自定义告警等级后,在设置通知策略、事件处理流功能选择事件匹配规则时,告警等级Value将会通过系统内置用户自定义标签区分。

可观测可视化 Grafana 版

数据源插件

新增

新增支持Lindorm ML插件。

使用Grafana进行异常检测算法调优

2023年02月

模块

功能名称

变更类型

功能描述

相关文档

应用监控

ECS应用白屏接入

新增

ARMS已支持白屏接入ECS环境上的Java应用。初次接入时,您只需重启一次应用进程即可完成探针接入,无需修改应用启动脚本。后续探针的升级、维护,也将由ARMS探针底座自动完成,无需人工参与。

ECS环境自动安装探针

应用监控告警规则

优化

  • 告警规则列表支持根据指标类型、告警应用筛选告警规则。

  • 告警规则支持直接配置P1~P4的告警等级。

  • 告警规则新增异常监控指标类型,支持根据特定异常进行告警配置。

  • JVM监控指标类型新增堆内存使用率指标。

应用监控告警规则(新版)

前端监控

SourceMap

优化

前端监控支持OSS批量上传SourceMap。

可观测监控 Prometheus 版

集成中心

新增

集成中心上线TiDB监控和Nebula监控。

集成中心

优化

集成组件自动创建默认告警规则,支持一键启用,方便灵活。

Prometheus告警规则

告警管理

自定义RAM授权策略

新增

告警管理支持通过自定义策略为RAM用户授权。

告警管理自定义RAM授权策略

可观测可视化 Grafana 版

告警管理

新增

可观测可视化 Grafana 版与ARMS告警管理融合,支持通过电话、短信、邮件、钉钉、企业微信、飞书和Webhook方式向通知对象发送告警通知。

告警管理(ARMS告警)

多VPC数据源接入

优化

通过在可观测可视化 Grafana 版中安装VPC数据源通道,可以使Grafana工作区访问到VPC内未开通公网访问的数据源。

VPC数据源通道管理

2023年01月

模块

功能名称

变更类型

功能描述

相关文档

可观测监控 Prometheus 版

集成中心

新增

集成中心上线Knative监控。

Knative组件接入

告警规则

优化

告警规则新增自动中断状态。

Prometheus告警规则

告警管理

地区

新增

支持切换以下地区:

  • 中国

  • 东南亚

  • 北美

  • 欧洲

  • 日本

排班管理

优化

排班管理支持在企业微信和飞书群中发送通知。

排班管理

可观测可视化 Grafana 版

共享版工作区

优化

共享版工作区升级为9.0.x版本Grafana。

Grafana v9.0.x新增功能特性

SmartMetrics

优化

新增Holiday功能,支持配置定制化事件,提高了动态基线告警的准确率。

SmartMetrics Holiday功能

阿里云首页 应用实时监控服务ARMS 相关技术圈