查看实验详情

成功创建实验后,您可以实时查看实验详情,包括实验的基本信息、Trial列表、各个Trial的运行详情以及日志。本文为您介绍实验中支持查看的详细内容。

查看实验的基本信息

  1. 进入自动机器学习(AutoML)页面。

    1. 登录PAI控制台

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

    3. 在左侧导航栏,选择模型开发与训练 > 自动机器学习(AutoML)

  2. 在实验列表页面中,单击实验名称,进入实验详情页面。

  3. 实验详情页面的基本信息页签,您可以查看该实验的基本配置、Trial配置、执行配置、搜索配置和Trial的执行进度。

    • 基本配置区域,您可以查看该实验的ID、状态等。实验可能的状态如下:

      • CREATED:在实验的创建初期,系统正在执行创建管理进程、解析各个配置模块的内容,以及向DLCMaxCompute等后台提交任务等操作。此时,Trial还没有开始运行。

      • FINISHED:当实验下的所有Trial都执行完成,且Trial的状态至少有一个为FINISHED时,实验状态会变为FINISHED。

      • FAILED:当实验下的所有Trial都执行完成,且Trial的状态均为FAILED时,实验状态会变为FAILED。当手动停止实验下的所有Trial时,实验状态会变为FAILED。

      • RUNNING:当实验下的Trail状态为RUNNING时,实验状态为RUNNING。

      • TERMINATING:当手动停止实验后,实验状态会变为TERMINATING。

      • USER_CANCELED:当手动停止实验且实验完全停止后,实验状态会变为USER_CANCELED。

      • NO_MORE_TRIAL:当实验已经运行的Trial数量达到了实验设置的最大Trial数量时,不会再生成新的Trial。在最后一个Trial运行结束后,实验会自动从NO_MORE_TRIAL状态转换为Finished状态。

      • TUNER_NO_MORE_TRIAL nuner:当实验缺乏足够的信息来确定下一组需要测试的超参数时,Tuner会停止生成新的Trial。此时的实验状态为TUNER_NO_MORE_TRIAL nuner

    • Trial配置执行配置搜索配置区域,您可以查看该实验的参数配置详情。

    • Trial执行进度区域,您可以查看Trial的执行进度和状态统计信息。

查看Trial列表

  1. 进入实验详情页面。具体操作,请参见查看实验的基本信息

  2. Trial列表页签中,展示该实验下自动生成的所有Trial列表。

    根据配置的算法,每次实验都会生成超参数组合,并为每组超参数组合创建一个Trial。同时,每个Trial可能会对应一个DLC任务,也可能对应1个或多个MaxCompute任务。任务的类型取决于实验的执行配置。后续将通过配置的任务来执行Trial。

查看Trial的运行详情

Trial列表页签,您可以查看实验下的Trial详情,包括执行状态、最终指标和超参数组合等。image.png

  • 状态:Trial可能的状态如下:

    • RUNNING:正在执行中。

    • FINISHED:已执行成功。

    • FAILED:执行失败。

    • USER_CANCELED:手动停止。

    • EARLY_STOPPED:Trial被提前终止。

  • 最终指标:根据实验中的指标权重配置,系统将使用加权求和值作为最终的评估指标。

  • 超参数组合:根据实验配置的算法自动生成的超参数组合。每个Trial对应一组超参数组合。

通过对比每个Trial最终指标,并根据在搜索配置中配置的优化方向,您可以判断哪个Trial使用的超参数组合是最优的。

查看日志

当实验或Trial执行失败时,您可以通过操作日志来有效定位实验和Trial的异常情况。

查看实验的日志

  1. 进入实验详情页面。具体操作,请参见查看实验的基本信息

  2. 您可以单击页面右侧的日志按钮,或在基本信息页签的基本配置区域中,单击状态后的日志按钮。

  3. 实验日志配置面板中,查看日志详情。包括以下两种日志:

    • nnimanager.log

      该日志记录了与实验管理相关的信息,包括实验的启动、停止和错误信息等。

    • dispatcher.log

      该日志记录与任务调度和资源管理相关的信息,包括Trial的分配、资源的分配等。

查看Trial的日志

  1. 进入实验详情页面。具体操作,请参见查看实验的基本信息

  2. Trial列表页签,单击目标Trial操作列下的日志

  3. Trial日志配置面板中,查看Trial的日志详情。

    Trial日志包括以下三种日志:

    • trial.log

      该日志记录了Trail的详细执行过程。

    • stdout

      该日志中记录了Trial的标准输出,包括打印语句和输出内容等,有助于您了解代码的调试信息和执行结果。

    • stderr

      该日志记录了Trial的标准错误,包括一些异常、错误信息和警告等。当Trial任务出现问题时,stderr日志提供了有关错误的详细描述,帮助您进行故障排查和错误处理。