基础云监控
| 功能集 | 功能 | 功能描述 | 参考文档 | 
| 应用分组 | 应用分组管理 | 应用分组提供跨云产品、跨地域的云产品资源分组管理功能,支持用户从业务角度集中管理业务线涉及到的服务器、数据库、负载均衡、存储等资源。从而按业务线来管理报警规则、查看监控数据,迅速提升运维效率。 | 应用分组管理 | 
| 云产品监控 | 云产品监控大盘 | 用户可以查看各云产品的监控图表,了解资源的运行状况。 | 云产品监控大盘 | 
| 主机监控 | 主机监控 | 通过在主机上安装插件,为用户的主机提供监控功能。无论用户的主机是云服务器ECS,还是其他云厂商的虚拟机或物理机,都可以使用云监控的主机监控功能。 | 主机监控 | 
| Kubernetes容器监控 | Kubernetes容器监控 | 云监控自动获取用户阿里云账号下容器服务Kubernetes版的所有集群,实现跨地域、集中化和全局化监控容器服务。 | Kubernetes容器监控 | 
| 监控大盘 | 自定义大盘 | 用户可以借助自定义大盘创建符合自身业务需要的图表视图。 | 自定义大盘 | 
| 网络监控大盘 | 用户可以查看云服务器ECS公网IP地址和绑定在ECS上弹性公网IP(EIP)的监控数据。默认为用户提供公网流出带宽、公网流入带宽和公网流出带宽使用率(经典网络)的监控大盘。 | 网络监控大盘 | |
| 报警服务 | 报警规则配置 | 用户设定云资源指标的阈值,当资源的监控指标达到报警条件时,云监控会自动发送报警通知,帮助用户及时获悉异常监控数据。 | 报警规则配置 | 
| 报警历史 | 用户可以按照云产品、应用分组、报警级别、报警联系人组等维度查看报警历史信息。 | 报警历史 | |
| 报警模板 | 用户可以通过将不同产品的指标报警规则进行统一配置保存为报警模板实现对应用分组报警规则的快速设定 | 报警模板 | |
| 一键报警 | 帮用户在面对多种云产品的监控项时,能够快速建立云产品的报警体系,及时知晓关键监控项的异常并进行处理 | 一键报警 | |
| 报警联系人 | 用户通过维护报警联系人信息和报警联系人组实现报警信息的定向通知。 | 报警联系人 | |
| 报警黑名单 | 用户可以根据报警黑名单策略对报警通知进行屏蔽。当阈值报警规则中某个云产品的某个实例中的某个指标无需发送报警通知时,可以为其设置报警黑名单策略,对报警通知进行屏蔽。 | 报警黑名单 | |
| 资源消耗 | 资源消耗 | 用户可以查看当前账号的网络分析与监控、基础云监控和企业云监控的资源消耗情况,还可以开通或关闭他们按量付费,购买网络分析与监控和基础云监控的资源包。 | 资源消耗 | 
| 基础能力计费 | 按量付费 | 根据资源的实际使用量收费。当用户开通基础云监控的按量计费后,如果资源的实际使用量超过免费额度,则开始按量收费。 | 按量付费 | 
| 预付费 | 开通基础云监控的按量计费,且订购其资源包后,如果资源的实际用量超过免费额度,则开始从资源包抵扣。 | 预付费 | 
企业云监控
| 功能集 | 功能 | 功能描述 | 参考文档 | 
| 企业监控大盘 | 企业监控大盘 | 可以为监控数据创建监控大盘,通过监控大盘查看指定监控指标的监控图表。 | 企业监控大盘 | 
| 高精度监控 | 秒级监控 | 秒级监控功能应用于对云产品的监控指标有高精度要求的监控场景。 | 秒级监控 | 
| 智能水位分析 | 智能水位分析报告 | 智能水位分析用于资源梳理、使用量判断和成本分析等场景。用户可以对使用量高的资源进行升配,提高资源的性能;对使用量低的资源进行降配或释放,降低成本。 | 智能水位分析报告 | 
| 实时数据导出 | 实时数据导出 | 当用户需要导出云上监控数据时,可以使用云监控提供的实时数据导出功能。 | 实时数据导出 | 
| 基础能力计费 | 按量付费 | 企业云监控采用按量计费的计费方式。开通企业云监控不会产生任何费用,后续将按照实际使用量进行计费。 | 
CloudLens
| 功能集 | 功能 | 功能描述 | 参考文档 | 
| CloudLens for Hologres | 接入管理 | 开启CloudLens for Hologres后,CloudLens for Hologres将展示当前阿里云账号下所有符合条件的Hologres实例。 单击目标Hologres实例,系统将跳转至实时数仓Hologres控制台。您可以查看Hologres实例详情以及执行登录实时数仓等操作。 | 接入管理 | 
| 查询分析 | 选择目标Hologres实例ID,选择对应的Logstore日志,您可以查看对应的原始日志,统计图表、日志聚类、字段分析并执行查询分析操作 | 查询分析 | |
| 报表中心 | SQL审计概览仪表盘通过分析审计日志,展示访问用户数、审计日志条数、访问客户端数、日志数量趋势等指标数据。 | 报表中心 | 
网络分析与监控
| 功能集 | 功能 | 功能描述 | 参考文档 | 
| 站点监控 | 站点监控 | 通过全球互联网节点发送模拟真实用户的拨测请求,感知不同地域运营商环境终端用户到您目标站点、IP的访问情况,提供端到端全链路、可视化的监控过程分析呈现。 | 站点监控 | 
| 一次性拨测 | 一次性拨测工具 | 通过全球互联网节点向目标发起HTTP、PING、DNS、MTR、TRACE等协议拨测情况,实时了解不同地域运营商环境终端用户到您目标站点、IP的服务请求可用性及网络状况。 | 一次性拨测工具 | 
| 浏览器探测 | 浏览器探测 | 借助浏览器探测,可以获得不同地域、不同网络环境下基于真实浏览器访问探测目标的请求和响应数据,从而知晓不同环境下的用户访问探测目标的网络质量情况。 | 浏览器探测 | 
| 网络质量分析器 | 网络质量分析器 | 提供的SDK集成到用户应用程序或者SDK中,配合云端配置的探测策略,即可获取丰富的、可视化的业务相关网络数据。可以结合业务场景进行网络故障的定界定位、网络质量的优化以及与其他云产品联动。 | 网络质量分析器 | 
| 基础能力计费 | 按量付费 | 根据资源的实际使用量收费。当用户开通网络分析与监控的按量计费后,根据运营商探测点的实际使用量收费。 | 按量付费 | 
| 预付费 | 当用户开通网络分析与监控的按量计费,且订购探测次数资源包后,优先使用资源包中的探测次数进行抵扣,再按量付费。 | 资源包 | 
Prometheus 监控
| 功能集 | 功能 | 功能描述 | 参考文档 | 
| 接入中心 | 容器服务接入 | 将创建的容器服务集群接入Prometheus监控平台,实现集群及工作负载的一体化监测。 | 容器服务接入 | 
| 自定义接入 | 支持添加自定义集成服务发现,进行自定义采集接入,查看自定义集成的指标、大盘和告警等信息。 | 自定义数据接入 | |
| 云服务接入 | 支持企业云监控集成和云产品自监控集成,用户可以通过可观测监控Prometheus版提供的指标、大盘以及告警查看这些云产品的监控数据。 | 云服务接入 | |
| 组件监控接入 | 一键安装配置各种类型的组件,并提供开箱即用的专属监控大盘。 | 组件监控接入 | |
| 实例管理 | 大盘列表 | 查看不同类型的Prometheus实例下的所有大盘信息和对应的核心指标。 | 大盘列表 | 
| 服务发现 | 提供默认服务发现、ServiceMonitor、PodMonitor和自定义服务发现。使用这些服务发现机制,可以优化用户对Kubernetes集群和ECS的监控范围,确保采集到所需的指标数据,以便对不同的服务和Pod进行监控和分析。 | ||
| 指标管理 | 提供实例的基础指标、自定义指标的上报量和写入量数据。 | ||
| 设置 | 查看Prometheus探针的基本信息和健康检查结果、设置Agent副本数以及重启探针。 | 接入管理 | |
| 全局配置 | 聚合实例 | 提供地域级别的GlobalView聚合实例的功能。GlobalView聚合实例功能可以为用户提供在当前地域下所有Prometheus实例的一个虚拟聚合实例。通过该虚拟聚合实例,可以实现统一的指标查询和告警。 | GlobalView聚合实例 | 
| 告警管理 | Prometheus告警规则 | 通过创建Prometheus监控告警规则,用户可以制定针对特定Prometheus实例的告警规则。当告警规则设置的条件满足后,系统会产生对应的告警事件。如果想要收到通知,需要进一步配置对应的通知策略以生成告警并且以短信、邮件、电话、钉群机器人、企业微信机器人或者Webhook等方式发送通知。 | Prometheus告警规则 | 
| Prometheus告警规则模板 | 当用户拥有多个跨地域的Prometheus实例,并且需要为其中多个Prometheus实例创建相同的Prometheus告警规则时,可以使用Prometheus告警模板功能。 | Prometheus告警规则模板 | |
| 数据投递 | 创建数据投递任务 | 该功能可以将数据从一个Prometheus实例远程写入(Remote Write)到另一个Prometheus实例中,还可以轻松将数据流转至各云产品中,例如Kafka和MaxCompute等。 | 创建数据投递任务 | 
| 基础能力计费 | 按量付费 | Prometheus支持按指标上报量和数据写入量两种按量付费模式。 | 计费说明 | 
| 预付费 | 支持节省计划,用户可以通过承诺在一定期限内消费一定的金额,来换取较低的按量付费折扣。 | 节省计划 | 
性能测试
| 功能集 | 功能 | 功能描述 | 参考文档 | 
| 压测场景 | PTS压测 | PTS压测支持HTTP、HTTPS协议压测,广泛适用于Web应用和小程序压测,涉及电商、车联网、多媒体、金融保险、物流快递、广告营销、社交等众多行业。PTS压测可模拟海量用户的真实业务场景,全方位验证业务站点的性能、容量和稳定性。 | 创建PTS压测场景 | 
| JMeter压测 | Apache JMeter是Apache的开源压测工具,支持参数化、断言等功能。其丰富的开源生态提供了各种协议和控制器的扩展,同时可以通过自定义脚本编写参数处理等逻辑。PTS支持JMeter原生引擎的压测,并在此基础上,为客户提供便捷的横向扩展能力,同时结合云监控集成功能持续补强JMeter在高并发和监控定位方面的能力和体验。 | 创建JMeter场景 | |
| Access Log 压测 | Access Log压测功能,仅依赖网关日志,对服务端零侵入,通过PTS界面的简单配置,可以快速实现真实的网关流量回放 | Access Log 压测 | |
| 多协议压测 | 支持构建于VPC内的微服务应用,包括Dubbo、SpringCloud、gRPC等微服务的压测,支持 MSE、云原生 API 网关等压测场景 | ||
| 导入场景 | PTS支持将JMeter(JMX)、Postman(JSON)、HTTP Archive Format(.har)、YAML和Swagger脚本(.yml,.json)转换为PTS原生的能力进行压测,提供RPS压测模式,支持实时调速、细致到单接口的监控等。 | 导入场景 | |
| SLA管理 | SLA管理 | 服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。 | SLA管理 | 
| 压测场景录制 | PTS Chrome插件录制场景 | 通过在Chrome浏览器上安装插件,可以便捷地录制用户在浏览器中的操作链路和业务接口。用户可以在PC Chrome浏览器上模拟压测场景的操作,插件会录制下压测请求URL,包括Header、Body等信息。插件录制后的内容可以直接创建成压测场景。 | 使用PTS Chrome插件录制场景 | 
| Charles录制压测场景 | Charles是常用的网络封包截取工具,用户可以使用Charles配置录制信息,完成云端录制。 | 使用Charles录制压测场景 | |
| JMeter录制压测脚本 | JMeter是Apache的开源压测工具,支持参数化、断言等功能。其丰富的开源生态提供了各种协议和控制器的扩展。 | 使用JMeter轻松录制压测脚本 | |
| 接口测试 | 接口压测 | 接口压测作为PTS统一管理HTTP接口的入口,可方便用户对HTTP接口进行快速调试和压测。 | 接口压测 | 
| 系统管理 | 访问控制 | 借助访问控制RAM(Resource Access Management)的RAM用户,用户可以实现权限分割的目的,按需为子账号赋予不同权限,并避免因阿里云账号(主账号)密钥暴露造成安全风险。 | 访问控制 | 
| 管理接收人 | 使用SLA和定时压测等功能时,需要发送通知给特定人员。 | ||
| 压测报告分析和可观测 | 云资源性能分析 | 性能测试过程中,往往需要实时观察各项指标是否正常。PTS本身已经具备强大的客户端指标,以及应用服务器、数据库、中间件和网络入口等方面的指标。更重要的是,监控的过程是发现系统瓶颈的过程,监控数据是性能基线管理、容量规划甚至是高可用架构的重要基础。 | 云资源监控 | 
| PTS压测报告分析 | PTS压测结束后,系统会自动获取压测过程中的数据,例如压测场景指标、业务详情数据、监控详情数据和API采样日志等,并形成压测报告供用户查看和导出。 | 查看PTS压测报告 | |
| JMeter压测报告分析 | 使用JMeter压测模式完成压测后,系统将自动获取压测过程中的数据,形成压测报告。 | JMeter压测报告分析 | |
| 压测数据导出到Prometheus | 对于2023年01月04日后发起的PTS压测与JMeter公网压测,默认压测指标将写入阿里云可观测监控Prometheus版。PTS内置了一些Grafana大盘,用户可以基于PTS的压测指标自定义Grafana大盘。 | 使用Prometheus查看监控数据 | |
| 基础能力计费 | 按量计费 | 按量计费以压测任务为主体,每次压测任务结束后系统会根据本次压测所消耗的VUM数量来计费。 | 按量计费 | 
| 预付费 | 按量抵扣资源包以测试任务为主体,每次测试任务执行完毕后根据本次任务所消耗的VUM进行抵扣。 | 预付费 | 
Grafana 服务
| 功能集 | 功能 | 功能描述 | 参考文档 | 
| 工作区管理 | 工作区信息 | 在工作区信息页面,用户可以查看或修改工作区的基本信息和连接信息,并集成云服务。 | 基本信息 | 
| 云服务集成 | 支持一键集成并同步阿里云云服务的数据源及其配套大盘。 | 云服务集成 | |
| 账号管理 | 在账号管理页面,用户可以修改当前工作区的Admin账号密码或管理授权用户的账号权限。 | ||
| 性能监控 | 性能监控功能可以实现对Grafana工作区性能的实时监控,以便发现异常时及时处理,从而保证Grafana工作区的可用性。 | ||
| 告警管理 | ARMS告警管理是开箱即用的智能告警服务,能够接收Prometheus等各类客户端发送的告警信息。通过自动去重、分组和算法降噪处理后,可以按标签内容将告警发送至不同的通知对象,帮助运维团队降低项目风险。 | ||
| 参数设置 | Grafana存在多种配置项,用户可以在.ini配置文件下修改Grafana环境变量等参数。 | 参数设置 | |
| 数据安全性 | 当用户需要通过公网或私网访问可观测可视化Grafana版工作区时,可将待访问设备的IP地址加入到工作区的公网或私网对应的访问白名单组中。 | ||
| 数据迁移 | 可以将自建Grafana迁移至Grafana工作区统一管理。 | 迁移自建Grafana | |
| 域名管理 | 支持将Grafana工作区解析到指定的域名下,满足个人或者企业统一域名的需求。 | ||
| 数据报表 | 数据报表支持将指定的整张大盘导出,也可以定时将指定大盘发送到预设的邮箱。 | 数据报表 | |
| 数据备份 | 数据备份支持为工作区的大盘、数据源、组织和账号等信息创建备份。 | 数据备份 | |
| VPC数据源通道管理 | 通过在可观测可视化Grafana版中安装VPC数据源通道,使Grafana工作区能够访问到VPC内未开通公网访问的数据源。 | VPC数据源通道管理 | |
| 计费 | 按量付费 | 容器监控Pro版根据集群的节点规模收费。 | 容器监控Pro版功能服务介绍与计费规则 | 
| 预付费 | 提供预付费开发者版、专家版和高级版这三种模式。 | 计费规则 |