PAI-TF日志查看方式

重要

本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。

PAI-TF日志分为工作流运行状态日志和Logview日志,其中PAI-TFLogview日志蕴含更多的工作流信息。如果您的工作流在运行过程中报错,则可以通过该操作查看具体报错信息。

警告

公共云GPU服务器即将过保下线,您可以继续提交CPU版本的TensorFlow任务。如需使用GPU进行模型训练,请前往DLC提交任务,具体操作请参见创建训练任务

无论以何种方式提交PAI-TF任务,都可以得到如下图所示的日志。image

序号

描述

该链接日志即为Logview日志,可以在浏览器中打开。

运行状态日志。

运行状态日志

运行状态日志主要展示分布式作业的服务器运行情况。通常以参数1/参数2/参数3/格式展示该日志,其中:

  • 参数1:表示正在计算的节点数。

  • 参数2:表示已经计算结束的节点数。

  • 参数3:表示总的计划节点数。

实验进度100%表示实验已经结束。

Logview日志

Logview日志包含实验的Debug信息,您可以通过如下方式查看相关日志:

  1. 在浏览器中打开上图①中的链接,进入如下页面。image

  2. 如果工作流报错查看报错日志,或需要查看工作流运行过程中代码Print信息,则双击实例。image

  3. Worker运行页面,可以根据需要选择查看的Task实例及Worker对应的实例。image

  4. 如果需要查看代码运行过程中Print函数打印的信息,则单击Stdout列下的image图标。

  5. 如果需要查看产品报错信息Debug,则单击StdErr列下的image图标。