云服务指标接入阿里云 Prometheus 说明

阿里云可观测监控 Prometheus 版支持多款云服务指标接入,云服务的指标主要有2个来源,一个来源云监控,一个来源于阿里云可观测监控 Prometheus 版从云产品侧直接采集的指标,即高级指标。

云监控指标

云监控支持的指标列表请参见云产品指标列表,所有云产品指标理论上都支持接入阿里云可观测监控 Prometheus 版(如在接入中心没有看到需要接入的云产品可以提交工单处理)。

可观测监控 Prometheus 版探针自 V1.1.32(v5.1-e0c90c68) 版本后,接入的云产品指标会自动和云监控指标对齐,即云产品新增上报的云监控指标无需额外配置即可自动接入可观测监控 Prometheus 版,接入后指标名称会自动加上Aliyun${ProductName}_前缀以防止不同云产品指标名称重复,例如云服务器 ECS CPUUtilization 指标接入可观测监控 Prometheus 版后对应的指标名称为 AliyunEcs_CPUUtilization。云监控指标接入 Prometheus 后该云服务实例所有地域下的指标会被接入,不区分地域。

说明

可观测监控 Prometheus 版中接入云产品后,如果发现云产品在云监控中新增的指标在 Prometheus 中查询不到,可以登录ARMS控制台,在接入管理 > 已接入环境 > 云服务区域环境页面找到并进入对应环境,在探针设置页签确认下探针版本是否为 V1.1.32及之后版本,如果探针版本满足需求,可以在组件管理页面找到对应组件,确认下组件是否是最新版本,如果不是,请升级组件。

云监控指标接入 Promethues 后的转换规则:

指标名格式统一为 Aliyun${ProductName}_${MetricName}

  • ${MetricName}:将云监控指标名中特殊字符(大小写字母、数字、下划线之外的字符)统一替换为下划线(_)。

  • ${ProductName} 标准规则:针对云产品指标所属命名空间(Namespace)做如下处理。

    • 去掉前缀acs_

    • 去掉后缀_dashboard

    • 删除中间的下划线(_)。

    • 云产品名称缩写的第一个字母大写,其他字母均小写。

    ${ProductName} 特殊规则:由于历史原因,部分云产品 ProductName 被特殊定义了,名单如下:

    命名空间(Namespace)

    产品系列(ProductCategory)

    ProductName

    acs_cc

    cc_iot

    Cciot

    acs_newbgpddos

    newbgpddos

    ddos-pro

    acs_bandwidth_package

    sharebandwidthpackages

    Ebwp

    acs_vpc_eip

    eip

    Eip、Vpceip

    acs_elasticsearch

    elasticsearch

    Es、Elasticsearch

    acs_elasticsearch

    logstash

    Logstash

    acs_global_acceleration

    acs_global_acceleration、globalaccelerationplus

    Ga

    acs_hbaseserverless

    hbaseserverless

    Hbase、Hbaseserverless

    acs_nat_gateway

    nat_gateway、enhanced_nat_gateway、nat_bandwithpackage

    Nat、Natgateway

    acs_pai_dlc

    dlc

    Paidlc

    acs_pai_dsw

    dsw

    Paidsw

    acs_pai_quota

    quota

    Paiquota

    acs_kvstore

    kvstore_sharding、kvstore_splitrw、kvstore_standard、kvstore_old

    Redis、Kvstore

    waf

    waf、hybrid_waf、wafv3、hybrid_wafv3

    Waf

    acs_kafka

    kafkaV3、kafka

    AliKafka

    acs_amqp

    amqp_instance

    Amqp_instance

    acs_disk

    disk_replica_pair_async、dbsc、disk、disk_replica_group_async

    Dbsc、Disk

    acs_disk

    disk_replica_pair_async、dbsc、disk、disk_replica_group_async

    Dbsc

    acs_gws

    gws

    Ecd

    acs_emr

    emr、emr_serverless_starrocks、emr_workflow

    Starrock、Emr

    acs_fnf

    functionflow

    Functionflow

    acs_hybriddb

    gpdb

    Gpdb

    acs_hologres

    hologres_follower

    Hologres_follower

    acs_hologres

    hologres_shared

    Hologres_shared

    acs_hologres

    hologres_standard

    Hologres_standard

    acs_hologres

    hologres_warehouse

    Hologres_warehouse

    acs_hitsdb

    influxdb、tsdb

    Influxdb

    acs_ipv6_bandwidth

    ipv6gateway_gw

    Gw

    acs_learn

    learn_eas

    Learn_eas

    acs_learn

    learn_eas_resource

    Pai_learn_eas_resource

    acs_maxcompute_prepay

    maxcompute_common

    Maxcompute_common

    acs_maxcompute_prepay

    maxcompute_subscription

    Maxcompute_subscription

    acs_maxcompute_prepay

    maxcompute_tunnel_subscription

    Maxcompute_tunnel_subscription

    acs_mongodb

    mongodb_replicaset

    Mongodb_replicaset

    acs_mongodb

    mongodb_replicaset

    Mongodb_replicaset

    acs_mongodb

    mongodb_singlenode

    Mongodb_singlenode

    acs_rds_dashboard

    rds

    Rds

    acs_rds_dashboard

    rds_cluster

    Rds、Rds_cluster

    acs_rds_dashboard

    postgresql

    Rds

    acs_rds_dashboard

    sqlserver

    Rds、Sqlserver

    acs_rocketmq

    rocketmq

    Rocketmq5

    acs_physical_connection

    port、vbr

    Port、Vbr

高级指标

高级指标是阿里云 Prometheus 直接从云产品侧采集的,指标更详细,指标周期更短。目前主要有以下产品支持高级指标,且高级指标接入是不支持全地域实例接入,不同产品默认接入策略会有差异,高级指标的指标名称会保留原始指标名称,接入 Prometheus 不会重命名。

支持高级指标接入的云产品:

云产品

接入策略

微服务引擎 MSE

默认只会接入和“选择数据存储地域”同地域的云服务实例指标

容器服务Kubernetes版 ACK

按集群维度接入

Serverless 容器服务 ASK

按集群维度接入

容器计算服务 ACS

按集群维度接入

分布式云容器平台 ACK One

按集群维度接入

实时计算 Flink

按工作空间维度接入

云原生多模数据库 Lindorm

默认只会接入和“数据存储地域”同地域的云服务实例指标

云消息队列 Confluent

默认只会接入和“数据存储地域”同地域的云服务实例指标

云消息队列 Kafka 版

默认只会接入和“数据存储地域”同地域的云服务实例指标

云消息队列 RocketMQ 版(5.0)

默认只会接入和“数据存储地域”同地域的云服务实例指标

服务网格 ASM

默认只会接入和“数据存储地域”同地域的云服务实例指标

PAI EAS 模型在线服务

默认只会接入和“数据存储地域”同地域的云服务实例指标

智能计算灵骏

默认只会接入和“数据存储地域”同地域的云服务实例指标

存储策略

云服务指标接入可观测监控 Prometheus 版后会自动创建 Promethues 实例进行存储,具体存储策略请参见数据存储说明