监控作业

提交作业到E-HPC集群后,您可以在控制台查看作业监控数据,包括运行、提交、排队和完成作业数,便于您了解集群内作业的运行情况,及时调整集群规模和作业任务,提升集群工作效率。

前提条件

支持作业监控的集群需满足以下条件:

  • 调度器为PBS。

  • 客户端版本为1.2.16及以上版本。

操作步骤

  1. 登录弹性高性能计算控制台

  2. 在顶部菜单栏左上角处,选择地域。

  3. 在左侧导航栏,选择作业与性能管理 > 作业

  4. 作业页面,选择目标集群,单击作业监控页签。

  5. 设置筛选条件。

    支持设置的筛选条件如下:

    • 时间段:过滤某一时间段内的作业数据。可快速选择查看距离当前时间前1小时、4小时、12小时或1天的数据,也可以精确设置时间段,但所选的时间段范围不能超过一周。

    • 用户:过滤某一用户提交的作业数据。可单击选择用户,在弹出面板中选择某一用户。

  6. 查看作业监控数据。

    • 作业监控数据包括运行、提交、排队和完成作业数的折线图;鼠标移动到图示上方,可显示对应的详细数据。

    • 作业数据统计的窗口期为5分钟,即间隔5分钟统计一次数据。

      • 对于提交作业数和完成作业数,统计的是作业提交时间和作业完成时间在5分钟窗口期内的作业数总和。

      • 对于运行作业数和排队作业数,统计的是5分钟窗口期内最终状态为运行中或排队中的作业数。

    作业监控