Prometheus® 云托管实例介绍
本云托管实例针对容器集群监控场景,具备完整的采集、存储、监控、告警、图表展现的数据监控服务。通过与 Kubernetes 平台解耦合,使得 Prometheus 监控服务不受被监控平台自身性能、稳定性、可靠性等诸多因素的影响。并通过提供全托管服务,用户无需部署运维 Prometheus 监控实例,整个容器平台 DevOps 流程更专业、更可靠、更安全。
Prometheus 适用场景
- Prometheus 适用于记录任何纯数字取值的时间序列。 它适用于以机器为中心的监控以及高度动态的面向服务架构的监控。 在微服务的世界中,它对多维数据收集和查询的支持是一种特殊的优势。Prometheus 专为提高可靠性而设计,是您在停电期间可以快速诊断问题的系统。 每个 Prometheus 服务器都是独立的,不依赖于网络存储或其他远程服务。 当基础架构的其他部分损坏时,您可以依赖它,并且您不需要设置大量的基础架构来使用它。
Prometheus 历程与特点
Prometheus 是一套开源的系统监控报警框架。它启发于 Google 的 borgmon 监控系统,由工作在 SoundCloud 的 Google 前员工在 2012 年创建,作为社区开源项目进行开发,并于 2015 年正式发布。2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目。作为新一代的监控框架,Prometheus 具有以下特点:
- 强大的多维度数据模型:
- 时间序列数据通过指标 (metric) 名和键值对 (key/value pairs) 来识别。
- 所有的指标 (metric) 都可以设置任意的多维标签 (label)。
- 数据模型更随意,不需要刻意设置为以点分隔的字符串。
- 可以对数据模型进行聚合,切割和切片操作。
- 支持双精度浮点类型,标签可以设为全 unicode。
- 灵活而强大的查询语言 PromQL, 在同一个查询语句,可以对多个指标 (metrics) 进行乘法、加法、连接、取分数位等操作。
- 使用拉取 (pull) 模式采集时间序列数据,避免有问题的服务器推送有问题的指标 (metrics)。
- 可以兼容采用推送 (push) 模式,利用 Pushgateway 把时间序列数据推送至 Prometheus 服务。
- 可以通过服务发现或者静态配置去获取监控的目标 (targets)。
- 有多种可视化图形界面。