Knative基于Kubernetes的Serverless应用框架,制定了云原生Serverless容器编排标准,帮助您部署和管理现代化的Serverless工作负载,打造企业级Serverless容器平台。此外,阿里云容器服务从Knative早期版本开始产品化集成,持续与Knative社区功能同步更新,结合容器服务ACK、消息、存储、网络、监控等云产品,提供了生产级别的Knative能力。您可以将Knative组件接入Prometheus,实现对Knative服务的监控和指标收集,帮助您提升服务性能。本文介绍如何一键安装Knative组件,开启Prometheus监控。
前提条件
-
已开通可观测监控Prometheus版。具体操作,请参见Prometheus 实例计费。
-
已创建Kubernetes集群。具体操作,请参见创建ACK托管集群、创建ACK专有集群(已停止新建)或创建ACK Serverless集群。
-
已部署Knative。具体操作,请参见部署与管理Knative组件。
-
已开通阿里云资源中心。具体操作,请参见开通资源中心。
接入Knative
登录Prometheus控制台,在左侧导航栏单击接入中心。
-
单击Knative卡片,然后根据控制台指引完成组件接入。
metrics采集间隔(秒):
监控数据采集时间间隔,默认15s。
已接入的组件可单击Prometheus控制台左侧导航栏中的接入管理查看。接入管理页面包括已接入环境、已接入组件和大盘查询页签,您可以查看Targets、指标、大盘、告警等信息。
在 Knative 可观测插件详情页面,包含环境列表、大盘列表和告警列表页签。单击大盘列表页签,选择目标环境后可查看对应的大盘,例如 Knative Serving 大盘。
查看Knative大盘数据
在接入管理页面的已接入组件页签中,单击Knative卡片,可以查看其监控大盘的详情数据。
可观测监控 Prometheus 版提供的Knative大盘数据包括请求量、Pod数、响应延迟、并发数等。
-
展开Overview行,您可以查看Knative的请求量、请求成功率、4xx(客户端错误)、5xx(服务器端错误)等数据。
说明大盘数据的纵轴ops/sec表示每秒处理请求数。

-
展开Response Time行,您可以查看Knative的响应延迟数据,包括P50、P90、P95和P99。

-
展开Autoscaler行,您可以查看Knative的请求并发数等数据。

-
展开Resource Usages行,您可以查看Knative的资源使用量情况,包括CPU和内存。

Knative关键指标说明
|
指标名 |
说明 |
|
queue_average_concurrent_requests |
Pod的并发请求数。 |
|
queue_requests_per_second |
Pod每秒请求数(Requests Per Second)。 |
|
revision_request_latencies |
响应延迟。 |
|
revision_request_count |
Revision请求数。 |