集群运维管理

更新时间:
复制为 MD 格式

本文为您介绍如何使用灵骏智算服务的集群运维管理功能,包括数据大盘、镜像与机型、运维任务中心等。

数据大盘

数据大盘提供集群资源概览和操作日志查询功能,帮助您实时监控集群状态和追踪操作记录。

查看资源概览

  1. 登录灵骏控制台

  2. 在左侧导航栏,单击数据大盘 > 数据概览

  3. 您可以在数据概览页面查看集群数、分组数等基本信息,以及使用率汇总、集群磁盘信息、集群网络带宽使用等趋势图。

查看操作日志

  1. 在左侧导航栏,单击数据大盘 > 操作日志

  2. 您可以在事件查询页签,查看事件时间、事件名称和用户名等。

    操作记录包括:节点重装、集群创建、节点查看等。您可以在下拉列表中选择起始日期及结束日期,对日志记录进行筛选。

镜像与机型

镜像与机型功能帮助您查看和管理集群中的节点机型和镜像信息。

查看节点机型

  1. 登录灵骏控制台

  2. 在左侧导航栏,选择镜像与机型 > 节点机型

  3. 您可以查看机型名称、GPU、CPU、磁盘和节点数等信息。单击具体机型名称后的操作列的相关节点按钮,会跳转到节点管理界面,显示与机型相关的节点实例信息。

查看镜像中心

  1. 在左侧导航栏,选择镜像与机型 > 镜像中心

  2. 您可以查看镜像ID、操作系统平台、版本号和节点数等信息。单击具体镜像名称后的操作列的相关节点按钮,会跳转到节点管理界面,显示与镜像相关的节点实例信息。

运维任务中心

运维任务中心展示不同类型任务的详细信息,帮助您监控和管理运维任务的执行状态。

  1. 登录灵骏控制台

  2. 在左侧导航栏单击任务中心。您可以查看任务ID、任务类型、任务状态、任务进度等基本信息。

  3. 单击具体任务ID后的查看详情,会跳转到任务详情页面。您可以单击step列表任务流程图页签,查看任务的每一步操作信息和任务的流程图。

    重要

    对于执行失败的运维任务,您可以单击任务状态后的重试,重新执行失败的任务Step。