管理离线/实时数据集

离线/实时数据集创建完成后,可在离线/实时数据集列表中进行相关管理操作。本文为您介绍数据集相关的管理操作。

  1. 在Dataphin顶部菜单栏中,选择标签 > 标签工作台

  2. 在左侧导航栏中,选择数据准备 > 离线数据集实时数据集

  3. 离线数据集实时数据集页面分别展示离线数据集列表和实时数据集列表,列表中包含数据集名称加工方式更新方式负责人数据集状态运行状态下游标签最近修改时间等信息。

    • 运行状态:当运行状态为任务出错时,可单击运行状态列的image查看图标,查看具体原因。

    • 下游标签:数据集存在下游标签时,您可以单击下游标签列的image查看图标,查看具体标签信息。

  4. (可选)可选择加工方式、数据集状态、更新方式(仅离线数据集支持此筛选项)、负责人、运行状态,或输入数据集名称/code、来筛选目标数据集;还可选中只看我的快速筛选出当前用户为负责人的数据集。

  5. 在离线/实时数据集列表中,可对数据集进行以下操作。

    操作项

    说明

    复制

    复制当前数据集信息创建新的数据集。

    编辑

    对于编辑中已发布发布失败已下线的离线数据集,可以编辑当前数据集的可编辑信息,包括基本信息运维配置(仅离线数据集支持编辑运维配置)、加工逻辑

    说明
    • 对于通过表映射SQL加工的离线数据集,编辑时支持修改指标的来源字段,修改的来源字段类型需要符合指标的值类型表单加工的离线数据集支持切换指标的统计字段统计函数,切换的统计字段统计函数的选择结果必须符合指标的值类型

    • 对于离线映射数据集、离线表单数据集的来源表提示未获取到表结构信息时,请检查来源表是否被删除或表名称是否更改。

    详情

    可查看当前数据集的配置详情信息。

    查看实例

    可查看当前离线数据集的运行实例。并且在实例列表中支持查看实例详情、运行日志及重跑操作。

    说明

    仅离线数据集支持此操作。

    下线

    已发布的离线数据集支持下线操作

    运行

    手动更新方式的离线数据集进行运行操作。在运行对话框中,支持选择业务日期运行,即读取的来源表分区为选择的业务日期,默认为昨天(T-1)

    说明
    • 仅离线数据集支持此操作。

    • 手动运行后将更新数据集数据以及引用该数据集的标签数据。

    前往运维

    跳转至当前离线数据集的运维页面。更多信息,请参见查看并管理脚本任务

    说明

    仅离线数据集支持此操作。

    补数据

    对当前更新方式为周期更新方式的离线数据集进行补数据操作。

    说明
    • 仅离线数据集支持此操作。

    • 补数据后将更新数据集数据以及引用该数据集的标签数据。

    删除

    编辑中已下线的离线/实时数据集支持删除操作