迁移Studio实验至Designer

为了给您提供更便捷优质的操作体验,阿里云PAI对操作控制台进行优化升级,可视化建模平台从PAI-Studio升级为Designer。如果您希望后续使用更优的Designer(推荐),可以将旧版控制台Studio中的实验一键迁移至新版Designer中进行管理维护。 本文介绍如何将Studio中积累的实验一键迁移到Designer。

背景信息

全新的云原生可视化建模平台Designer,是未来会代替Studio的新一代可视化建模工具平台。提供阿里自研百余种传统机器学习和深度学习算法,支持跨计算资源的工作流串联,并支持您通过更灵活的方式进行建模。

您可以使用同步助手和Designer组件两种方式一键迁移Studio平台的实验,通过试运行迁移、增量迁移和多次覆盖迁移将PAI Studio 1.0中最新的实验迁移到Designer中。迁移结果会保存在迁移实验ID映射表和迁移错误表两个结果表中,您可以通过查看两个结果表了解迁移成功和迁移失败的实验信息。

注意事项

以下几种实验不支持迁移操作,如果Studio平台包含以下几种实验,迁移过程会跳过该实验,不影响其他实验的迁移操作。

  • 使用了流式组件的实验。

  • 使用了自定义算法组件的实验。

  • 使用了Designer暂不计划支持的算法的实验,比如OSS数据同步、MySQL数据同步等。

使用同步助手迁移实验

  1. 进入PAI-Designer页面。

    1. 登录PAI控制台

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

    3. 在工作空间页面的左侧导航栏选择模型开发与训练 > 可视化建模(Designer),进入Designer页面。

  2. 执行一键迁移。

    1. Designer页面右上角,单击同步助手

    2. 在同步助手页面,配置以下参数,单击运行

      参数

      说明

      同步类型

      支持迁移的实验类型。

      • 复制我创建的实验:迁移您自己创建的实验。

      • 复制我管理的MC项目下的实验:迁移您作为ownerMaxCompute项目下所有的实验。

      需要同步哪些实验

      支持同步的实验范围。

      • 全部:您有权限的全部工作空间下的实验。

      • 当前工作空间内:当前工作空间(MaxCompute项目)范围内的实验。

      同步后实验(工作流)可见范围

      实验同步到Designer后的可见范围。

      • 仅自己可见:仅您自己可见。迁移后的实验会放在我的工作流目录,Migrate From Pai Studio 1.0子目录下,只有自己和工作空间的管理员可以看到。

      • 工作空间内公开可见:工作空间内公开可见。迁移后的实验会放在工作空间公开工作流目录,Migrate From Pai Studio 1.0子目录下,并按创建实验的账号(账号ID)进行区分。

      重要

      如果实验已经迁移过一次,后续以覆盖的方式重新执行迁移,迁移时修改了配置参数中的可见范围,结果不会影响已经迁移过的实验,以第一次迁移结果为准。

      是否覆盖已同步过的实验

      • 不选中为不覆盖,会忽略已经迁移过的实验,不会将PAI Studio 1.0中修改过的实验迁移到Designer。

      • 选中为覆盖,会将PAI Studio 1.0中最新的实验迁移到PAI Designer。

        重要

        如果PAI Designer中对应的工作流已经发生了修改(可能只是单击保存或运行按钮),则PAI Studio 1.0中对应的实验会迁移失败,需要您手动删除PAI Designer中的实验后重新迁移。

  3. 查看迁移结果。

    1. 迁移结束后,按照下图操作指引,查看迁移结果表名称。查看结果表名称

    2. 单击上述步骤中查询到的table表名称,进入DataWorks数据地图页面。在数据预览页签查看迁移结果表内容。查看迁移表内容

    后续您可以按照下图操作指引,在数据分析页面查看迁移结果表详细内容。数据分析页面

    迁移结果表包括迁移实验ID映射表和迁移错误表,具体表字段详情请参见附录:迁移结果表字段详情

使用Designer组件迁移实验

Designer提供了一个名为 PAI Studio 1.0实验迁移的组件,支持用户将已有的Studio实验迁移至Designer中。具体操作步骤如下。

  1. 进入空白工作流。

    1. 新建空白电子流,具体操作请参见操作步骤

    2. 在工作流列表,选择已创建的空白工作流,单击进入工作流

  2. 运行实验,执行一键迁移。

    1. 在左侧组件列表的搜索框中,搜索PAI Studio 1.0实验迁移,找到PAI Studio 1.0实验迁移组件。

    2. PAI Studio 1.0实验迁移组件拖入右侧画布中,画布中自动生成一个名称为PAI Studio 1.0实验迁移-1的工作流节点。

    3. 在画布中选中PAI Studio 1.0实验迁移-1节点,在右侧节点参数配置页面配置相关参数,具体参数设置如下表所示。

      参数

      描述

      迁移类型

      支持以下迁移类型。

      • 迁移自己的实验:迁移您自己创建的实验。

      • 迁移负责项目下的实验:迁移您作为ownerMaxCompute项目下所有的实验。

      说明

      迁移后的工作流的创建人会继承原实验的创建人,与同步任务的执行者无关。

      实验可见度

      实验迁移到Designer后的可见范围。

      • 私有:仅您自己可见。迁移后的实验会放在我的工作流目录,Migrate From Pai Studio 1.0子目录下,只有自己和工作空间的管理员可以看到。

      • 公开:工作空间内公开可见。迁移后的实验会放在工作空间公开工作流目录,Migrate From Pai Studio 1.0子目录下,并按创建实验的账号(账号ID)进行区分。

      重要

      如果实验已经迁移过一次,后续以覆盖的方式重新执行迁移,迁移时修改了配置参数中的可见范围,结果不会影响已经迁移过的实验,以第一次迁移结果为准。

      需要迁移的项目ID列表

      需要迁移的工作空间ID列表,多个工作空间ID以半角逗号(,)隔开。

      • 默认为空,如果设置为空。

        • 如果迁移类型是迁移自己的实验,会同步自己所有有权限的项目下的实验。

        • 如果迁移类型是迁移负责项目下的实验,会同步自己作为owner的所有项目下的实验。

      • 如果不为空,您必须有这些项目的权限,如果没有权限迁移任务会运行失败。

      试运行

      选中试运行,运行时会检查所有需要迁移的实验,判断是否支持迁移,不会实际执行迁移,迁移检查结果会写在实验迁移结果表中。

      是否覆盖已经迁移的实验

      • 不选中为不覆盖,会忽略已经迁移过的实验,不会将PAI Studio 1.0中修改过的实验迁移到Designer。

      • 选中为覆盖,会将PAI Studio 1.0中最新的实验迁移到PAI Designer。

        重要

        如果PAI Designer中的对应的工作流已经发生了修改(可能只是单击保存或运行按钮),则PAI Studio 1.0中对应的实验会迁移失败,需要您手动删除PAI Designer中的实验后重新迁移。

    4. 按照下图指引,执行迁移操作。运行组件

  3. 查看迁移结果。

    任务运行结束后,右键单击画布中的PAI Studio 1.0实验迁移-1组件,在快捷菜单,单击查看数据。选择迁移实验ID映射表迁移错误表, 可以直接预览结果表数据。结果表具体表字段详情,请参见附录:迁移结果表字段详情查看数据

    重要

    在此处预览有条数限制,完整表内容可以复制表名后在MaxComputeDataWorks中进行查询和下载,具体操作请参见通用数据查询与管理

附录:迁移结果表字段详情

迁移任务会生成两个结果表,分别是迁移实验ID映射表和迁移错误表。

  • 迁移实验ID映射表

    该表中保存了迁移前后StudioDesigner的实验ID的映射关系,其结构如下所示。迁移实验id映射表

    列名

    描述

    workspace_id

    工作空间ID。

    source_exp_id

    迁移前Studio中的实验ID。

    dest_exp_id

    迁移后Designer中的工作流ID。

    creator

    Studio中实验的创建人。

    already_exists

    本次迁移时Designer中实验对应的工作流是否已经存在(不是第一次同步)。

    updated

    是否更新了实验。假如实验之前已经迁移过,且没有选择覆盖,则为False。

    source_exp_url

    迁移前Studio中的实验URL。

    dest_exp_url

    迁移后Designer中的工作流URL。

  • 迁移错误表

    该表中保存了迁移失败的实验记录,其结构如下所示。迁移错误表

    列名

    描述

    workspace_id

    工作空间ID。

    source_exp_id

    迁移前Studio中的实验ID。

    source_exp_url

    迁移前Studio中的实验URL。

    creator

    Studio中实验的创建人。

    error_code

    迁移错误码。

    error_message

    迁移错误信息。