Kubernetes监控支持查看集群下的Service和Workload的网络拓扑,以及各资源与云服务之间的网络拓扑。本文介绍了如何查看集群下的网络拓扑。

功能入口

  1. 登录ARMS控制台
  2. 在左侧导航栏单击Kubernetes监控
  3. 在顶部菜单栏,选择地域。
  4. Kubernetes监控页面,单击Kubernetes集群名称。
  5. 在左侧导航栏单击集群拓扑
    集群拓扑页面默认显示全部命名空间下的Workload网络拓扑,即Deployment、StatefulSet和DaemonSet的网络拓扑,以及各资源与云服务之间的网络拓扑。容器监控-Deployment业务流量拓扑
  6. 可选:单击Service视图页签,查看Service之间的网络拓扑,以及Service与云服务之间的网络拓扑。
    容器监控-业务流量拓扑

查看拓扑

您可以执行以下操作筛选拓扑节点:
  • 在页面右上角时间选择框,您可以选择需要查看的时间段。例如:最近30分钟、最近1小时、最近12小时等。
  • 在左侧节点过滤下拉框中选择命名空间或云服务,查看目标命名空间或云服务下的资源列表。
在集群拓扑的展示页面,您可以执行以下操作:
  • 命名空间节点右下角出现数字图标表示当前命名空间下存在告警事件,单击数字图标可以查看当前命名空间下的所有告警事件列表。更多信息,请参见告警事件。创建告警规则的操作,请参见创建Kubernetes监控告警规则
    说明
    • 云服务产品需接入阿里云Prometheus监控,并创建对应的Prometheus告警才可以查看告警事件。具体操作,请参见云服务报警配置
    • 命名空间中间数字(资源数量)外围的圆圈显示了当前命名空间的告警分布情况,其中,红色表示告警事件状态为Critical,黄色表示告警事件状态为Warning,蓝色表示无告警。
  • 资源节点右上角出现数字图标表示当前资源下存在告警事件,单击数字图标可以查看当前资源下的所有告警事件列表。更多信息,请参见告警事件
  • 在拓扑图中,单击命名空间或云服务节点右上角的扩展图标图标,可以展开当前命名空间或云服务;单击右上角的收缩图标图标,可以收起当前命名空间或云服务。
  • 将鼠标悬浮于拓扑图中的资源上,可以在页面底部查看目标资源的请求数、错误数和平均响应时间。单击目标资源节点,在右侧弹出目标资源详情面板。更多信息,请参见节点详情
    说明 仅接入阿里云Prometheus监控的云服务支持查看节点详情。
  • 将鼠标悬浮于节点之间的连线上,可以在页面底部查看资源之间的请求数、错误数和平均响应时间。单击节点之间的连线,在右侧弹出目标连线详情面板。更多信息,请参见节点连线详情
  • 右键拓扑图中的资源,在弹出的对话框中单击查看容器层(3D),可以查看目标资源的容器层3D拓扑。更多信息,请参见查看容器层3D
  • 右键拓扑图中的资源,在弹出的对话框中单击只看下游只看下游只看上下游,可以提取目标资源对应的上下游拓扑。
  • 在页面空白处右键,在弹出的对话框中单击全部收起全部展开,可以收起或展开所有命名空间。
在集群网络拓扑的展示页面的底部,您可以执行以下操作:
  • 页面底部出现提示图标图标,表示当前Kubernetes集群关联的部分云服务还未接入阿里云Prometheus监控。单击图标可以进入接入云服务页面,具体操作,请参见新建Prometheus实例(云服务)。云服务接入阿里云Prometheus监控后,在拓扑图中单击云服务节点,可以查看云服务的详细信息。
  • 单击页面底部告警图标图标,可以查看当前Kubernetes集群下的所有告警事件。
  • 单击页面底部查看表格图标,可以通过表格形式展现节点连接情况。
  • 单击页面底部查询图标图标,可以查询并快速定位目标节点。
  • 单击页面底部展开拓扑图图标,可以展开所有命名空间。
  • 单击页面底部收起拓扑图图标,可以收起所有命名空间。
  • 单击页面底部适应页面大小图标,可以将拓扑图调整为适应页面大小。
  • 单击页面底部放大图标图标或滑动鼠标滚轮,可以放大拓扑图。
  • 单击页面底部缩小图标图标或滑动鼠标滚轮,可以缩小拓扑图。
  • 单击页面底部刷新图标,可以刷新当前拓扑图。

节点详情

在集群拓扑中单击拓扑节点,可以在弹出的节点详情面板中查看节点的详细信息。

节点详情面板

在节点详情面板,单击协议页签可以查看各协议节点的请求数、错误数、平均响应时间、慢调用数和实例数,以及对应的时序曲线。

在请求数、错误数、平均响应时间、慢调用数和实例数区域单击明细列表,可查看指标的详细信息。更多信息,请参见多协议指标详情

如果当前资源存在告警,在当前告警页签可以查看当前资源下的告警事件详情。更多信息,请参见告警事件

节点连线详情

单击拓扑节点之间的连线,可以在节点连线详情面板查看节点连线的详细信息。

拓扑节点连线详情

在节点连线详情面板,单击协议页签可以查看各协议节点连线的请求数、错误数、平均响应时间和慢调用数,以及对应的时序曲线。

在请求数、错误数、平均响应时间和慢调用区域单击明细列表,可以查看指标的详细信息。更多信息,请参见多协议指标详情

告警事件

单击告警数字图标,可以查看目标命名空间的告警列表和当前Kubernetes集群下的所有告警规则。

当前告警页签,您可以执行以下操作:
  • 单击目标事件区域的编辑规则可以修改当前事件对应的告警规则。更多信息,请参见创建Kubernetes监控告警规则
  • 单击目标事件区域的查看详情可以查看当前事件的详细信息。更多信息,请参见事件详情
告警事件列表
告警规则页签显示了当前Kubernetes集群下的所有告警规则。在告警规则页签,您可以执行以下操作:
  • 单击创建告警规则,可以进入创建告警规则页面。更多信息,请参见创建Kubernetes监控告警规则
  • 单击目标告警规则前的开关,可以快速开启或关闭对应的告警规则。
集群拓扑告警规则面板