离线/实时数据集创建完成后,可在离线/实时数据集列表中进行相关管理操作。本文为您介绍数据集相关的管理操作。
在Dataphin顶部菜单栏中,选择标签 > 标签工作台。
在左侧导航栏中,选择数据准备 > 离线数据集或实时数据集。
离线数据集、实时数据集页面分别展示离线数据集列表和实时数据集列表,列表中包含数据集名称、加工方式、更新方式、负责人、数据集状态、运行状态、下游标签、最近修改时间等信息。
运行状态:当运行状态为任务出错时,可单击运行状态列的查看图标,查看具体原因。
下游标签:数据集存在下游标签时,您可以单击下游标签列的查看图标,查看具体标签信息。
(可选)可选择加工方式、数据集状态、更新方式(仅离线数据集支持此筛选项)、负责人、运行状态,或输入数据集名称/code、来筛选目标数据集;还可选中只看我的快速筛选出当前用户为负责人的数据集。
在离线/实时数据集列表中,可对数据集进行以下操作。
操作项
说明
复制
复制当前数据集信息创建新的数据集。
编辑
对于编辑中、已发布、发布失败、已下线的离线数据集,可以编辑当前数据集的可编辑信息,包括基本信息、运维配置(仅离线数据集支持编辑运维配置)、加工逻辑。
说明对于通过表映射和SQL加工的离线数据集,编辑时支持修改指标的来源字段,修改的来源字段类型需要符合指标的值类型;表单加工的离线数据集支持切换指标的统计字段、统计函数,切换的统计字段、统计函数的选择结果必须符合指标的值类型。
对于离线映射数据集、离线表单数据集的来源表提示未获取到表结构信息时,请检查来源表是否被删除或表名称是否更改。
详情
可查看当前数据集的配置详情信息。
查看实例
可查看当前离线数据集的运行实例。并且在实例列表中支持查看实例详情、运行日志及重跑操作。
说明仅离线数据集支持此操作。
下线
已发布的离线数据集支持下线操作。
运行
对手动更新方式的离线数据集进行运行操作。在运行对话框中,支持选择业务日期运行,即读取的来源表分区为选择的业务日期,默认为昨天(T-1)。
说明仅离线数据集支持此操作。
手动运行后将更新数据集数据以及引用该数据集的标签数据。
前往运维
跳转至当前离线数据集的运维页面。更多信息,请参见查看并管理脚本任务。
说明仅离线数据集支持此操作。
补数据
对当前更新方式为周期更新方式的离线数据集进行补数据操作。
说明仅离线数据集支持此操作。
补数据后将更新数据集数据以及引用该数据集的标签数据。
删除
编辑中、已下线的离线/实时数据集支持删除操作。