基本概念

本文汇总使用云服务器ECS过程中涉及的基本概念,方便您查询和了解相关概念。

通用概念

概念

说明

工作空间(WorkSpace)

工作空间(WorkSpace)是云监控2.0中用于表示一组资源集合的抽象层,为企业团队提供统一的管理和资源分组数据隔离能力,所选地域用于存储工作区接入的数据和配置信息。通过使用工作空间,可以创建多个独立的资源环境,每个资源环境都可以拥有自己的对象集(如云服务、基础设施、服务端和前端应用、中间件等),每个组内的资源是相互隔离的,这可防止不同组之间的资源冲突,提高资源使用的安全性。

应用(App)

可观测App是对WorkSpace下的数据源进行读写操作的载体,在WorkSpace中可以打开或隐藏,App通常是对于某一特定场景的可观测领域知识的呈现。

实体(Entity)

实体Entity是指可观测的实体对象,例如一个容器集群或者一台ECS服务器,对应一个实体Entity。

模型(Umodel)

UModel是一个可观测数据模型定义规范,用于定义各类可观测对象的模型,包括日志、指标、Trace、实体等,以及这些可观测对象之间的关联关系,以实现可观测数据的统一定义和管理。

接入中心名词概念

名词概念

描述

CloudResource

CloudResource 是用于采集、存储和查询阿里云云资源的解决方案。云监控 2.0 会为每一个用户(主账号)创建 1 个 CloudResource,存储在用户名下的 SLS Logstore 中,其地域的选择默认情况下尽可能遵循首次接入原则,即第一个工作空间创建时的区域。

CloudResource 创建后会自动进行云资源数据采集,用户在接入中心能够查询到的云产品实例等资源则代表数据采集成功。当用户在工作空间内执行了可观测数据接入时,接入中心会根据接入时选择的实体范围,将相关的资产同步到工作空间下的 EntityStore。

IntegrationPolicy/接入策略

接入策略是接入中心为了归类管理接入配置的业务模型。

对于容器类云产品,通常一个接入策略对应一个集群的接入配置。细分模式下,一个集群可以对应多个接入策略,不同策略下的指标采集探针会读取不同容器 Namespace 下的采集配置。

对于非容器类云产品,默认一个产品的接入配置会归类到一个策略中。用户也可以根据管理需要灵活编排策略。

Addon/接入项

接入项是指针对一种可观测能力的插件化组件封装,目前主要由产品官方开发相关组件提供给用户选择。在接入中心的接入列表中,1 个接入卡片入口代表 1 个 Addon。1 个 Addon 根据特性的不同,可以支持 1 次或多次接入操作,即生成 AddonRelease。

接入组件有版本化管理,用户可以操作 AddonRelease 选择最新的组件版本进行升级。

AddonRelease/接入配置

接入配置是指针对一个 Addon 接入动作的用户入参。用户通过选择 1 个 Addon 并输入对应的 Values 参数,可以生成 1 条或 1 组 AddonRelease 记录。AddonRelease 记录可以被幂等更新。

Addon+AddonRelease 的设计思路是类似于云原生的 HelmChart/HelmRelease ,是面向 GitOps 模式下的云原生可观测模型。

集群探针

主要指集群化部署的可观测数据采集探针,包括 PrometheusAgent,LoongCollector 等。

主机探针

主要指在 ECS 或虚拟机上部署的可观测数据采集探针,目前包括 LoongCollector,Node Exporter,Process Exporter 等。

Exporter 探针

主要指其他通用模式下的可观测数据生成器 Exporter,与开源 Promethues Exporter 是同一个概念。

应用概念

概念

描述

基础云监控

提供阿里云服务的基础监控指标查询与告警服务

企业云监控

提供阿里云服务监控指标的企业级查询分析告警服务

可观测监控Prometheus

Prometheus全托管云服务,实现高性能监控系统

应用监控

对应用程序性能进行实时监控与故障诊断

可观测链路OpenTelemetry

OpenTelemetry的全托管后端服务,100%兼容OT数据

LLM 应用监控

针对大型语言模型应用的端到端监控服务

应用安全

保护应用免受攻击,确保数据安全

用户体验监控

监测并优化用户使用产品的体验

云拨测

模拟真实用户访问,评估云服务和应用的可用性

容器洞察

深入分析kubernetes集群的运行状态

SLS洞察

提供使用日志服务的深入分析

OSS洞察

针对对象存储服务的深度监控

ALB洞察

负载均衡服务的高级监控与分析

CLB洞察

提供经典负载均衡器的监控信息

PolarDB洞察

PolarDB数据库的详细监控支持

Redis洞察

提供Redis缓存服务的专业监控

RDS洞察

关系型数据库服务的深入监控

Flowlog日志中心

网络流量日志的集中管理平台

AI Infra洞察

人工智能基础设施的监控与优化

ECS洞察

弹性计算服务的高级监控功能

日志审计

记录并审查操作日志

通用数据库审计

对多种数据库的操作进行审计

成本管家

帮助用户管理和优化云服务成本

大盘

展示关键指标的综合仪表板

告警中心

集中管理所有告警信息

可观测可视化Grafana

使用Grafana进行数据可视化

指标探索

探索和分析各种监控指标

调用链探索

分析应用调用链路,定位性能瓶颈。

日志分析

分析应用调用链路,定位性能瓶颈

观测对象探索

探索不同观测对象的状态和性能

事件中心

探索不同观测对象的状态和性能

接入中心

提供各种观测对象和数据的接入与管理

应用中心

集中管理所有应用及其相关服务

性能测试

评估应用程序的负载和响应能力