Dataphin标签基于离线计算引擎,支持通过SQL加工方式开发视图指标,对来源物理表字段进行预加工后供离线标签使用。本文将指导您如何通过SQL加工创建离线视图。
前提条件
创建离线视图前需先创建视图所归属的标签项目。详情请参见创建标签项目。
操作步骤
在Dataphin首页,单击顶部菜单栏的标签。默认进入资产市场页面。
按照下图操作指引,进入新增视图对话框。
在新增离线视图对话框中,单击SQL加工。
在新建SQL加工配置页面,配置视图的基本信息。
参数
描述
视图名称
填写视图的名称信息。支持中英文、数字、下划线(_),需在64字符以内。
视图code
离线视图的唯一标识。在存在相同离线视图名称时,可帮助您定位具体离线视图。必须以字母开头,允许小写英文字母、数字、下划线(_),64字符以内。
视图更新方式
支持周期更新与手动更新方式。
周期更新:在一定时间的间隔内自动更新视图。
手动更新:通过手动操作方式更新视图。
负责人
请选择该离线视图的负责人。
描述
填写离线视图的简单描述,1000字符以内。
配置离线视图的加工逻辑。
参数
描述
加工逻辑(SQL)
请输入对数据源进行加工的SQL代码。SQL代码说明如下:
通过SQL加工的方式构造主体与指标间的映射关系。
SELECT查询至少存在两个字段。
通常会把第一个字段解析为“主体”,例如:SQL中的'subjectId';后续的若干字段解析为“指标”,例如:'indicatorA','indicatorB'。若解析主体标识不准确,您可以通过下方指标定义处进行调整。
支持跨项目表加工,表名格式为:
项目英文名.项目下物理表名
。SELECT subjectId, indicatorA, indicatorB FROM project_en_name.source_table WHERE ds = ${bizdate};
指标定义
字段名称
请填写视图所需定义的字段名称。必须以字母开头,由字母、数字、下划线(_)组成。
主键/指标展示名称
请填写您的主键/指标的展示名称。支持英文、下划线(_)、64字符以内。
值类型
支持字符串、长整型、双精度浮点数、日期、布尔、十进制小数。
是否主键
若字段为主键,可单击开启。
配置码表
支持整型、Decimal、布尔型及字符串类型字段配置码表。
单击进入配置码表对话框。
在配置码表对话框中,配置相关参数。
配置码表:默认为不配置,可以选择码表为指标配置对应码表。
码表来源:目前仅支持手动配置。
码表名称:请输入码表名称。支持中文、英文数字及特殊字符,128个字符以内。
码表描述:请输入码表的简单描述,1000个字符以内。
批量输入框:可以批量输入代码值及代码名称,每组按行分割,代码值和代码名称中间用半角冒号(:)分隔。
代码信息:支持手动输入代码值、代码名称。
说明单击点击识别,系统将自动解析批量输入框的代码信息并填入代码信息列表。
单击一键清除,系统将自动清除信息列表。
代码值:支持所有字符类型,不可为空,且填写的代码值需唯一。
代码名称:支持所有字符类型,不可为空,且填写的代码值需唯一。
说明单击支持删除当前已创建的代码值。
单击确定,完成代码值配置。
描述
填写字段的简单描述,128个字符以内。
操作
单击可删除当前字段。
配置离线视图的运维配置。
说明若视图更新方式为手动更新,无需进行配置。
调度周期
支持按天的某一时刻进行调度。即任务每天自动运行一次,您可以根据需要,指定运行的时间点。
调度依赖
调度依赖即节点间的上下游依赖关系,在Dataphin中,上游任务节点运行完成且运行成功,下游任务节点才会开始运行。
自动解析
系统将根据任务血缘自动解析上游依赖节点并做关联,数据更新将依赖上游数据产出。
说明若自动解析的结果不符合预期。您可以单击关闭生效按钮,关闭后表示不选择依赖该节点。
默认本周期依赖。
添加依赖
若自动解析无法解析出调度依赖关系或自动解析生成的上游依赖配置与实际应用不符时,您可以手动单击+添加依赖添加节点的上游依赖。
单击保存并发布,完成离线视图的创建。
说明保存成功后,您可以单击预览。系统将根据配置的加工逻辑展示对应数据信息,以帮助您验证加工逻辑是否正确。
后续步骤
完成离线视图的创建和配置后,您可以为离线视图创建对应的离线标签。更多信息,请参见离线标签概述。
- 本页导读 (0)