码表也称lookup表、数据字典表,一般由中英文名称编码组成,由可枚举数据构成,存储枚举数据名称与编码的映射关系。码表可用于标准属性值取值范围的约束。本文为您介绍如何创建及管理标准代码(码表)。
5分钟快速了解
权限说明
超级管理员、数据标准管理员支持新建及管理所有码表、码表目录及引入模板库。
标准集维护人员可以在已加入的码表下编辑或删除码表。
使用限制
创建码表目录层级不超过10级。
所有层级的码表目录总数不超过1000层。
每个码表最多添加10000个码值,并且单个码表下的码值不可重复。
码表列表
码表列表为您提供编辑和查看两种展示模式,在码表页面,单击右上角图标进行切换查看。
在查看模式下,可以查看已配置的码表目录和码表信息,但不支持操作,适用于浏览的场景。
在编辑模式下,除了查看已配置的码表目录和码表外,支持对码表执行查看引用、编辑、导出码表、删除操作,可对码表目录执行编辑、删除等操作。仅有码表管理权限的账号可以进入编辑模式。
在码表列表页面,您可以查看码表目录及码表信息,左侧码表目录从业务或组织架构视角出发,对码表进行分类、分层管理,选中某一层级目录后,右侧列表为您展示归属当前目录的码表信息,包括码表的名称、所属目录、描述、状态、定义方式、码值数、负责人、最近更新人/时间。您也可以单击全部码表,查看全量码表信息。
(可选)您可根据码表的名称、编码搜索目标,也可根据码表所属目录、负责人等对码表范围进行筛选。
您可以对目标码表目录及码表执行如下操作。
操作项
描述
码表目录
新建码表
单击目录行右侧的新建码表图标,可在当前目录下创建码表,特殊的,若定位在全部码表目录,则创建的码表直接归属于全部码表目录下。
从模板库引入码表
单击目录行右侧的从模板库引入码表图标或鼠标悬停新建码表按钮后的下拉箭头单击从模板库引入码表,可在当前目录下引入码表模板。
码表列表
查看详情
单击操作列下的查看详情,查看码表详情、引用信息。
编辑
单击操作列下的编辑,支持修改码表的配置信息。
若定义方式变更、来源表及字段变更,仅数据获取成功,保存发布后才会覆盖更新已有配置,否则保留已有配置不更新。
导出
单击操作列下的导出或选中码表列表的码表后单击底部的批量导出,可将码表及码值信息导出为Excel文件,方便信息维护和发送给相关业务人员查询。导出配置详情请参见批量导入导出码表。
更新码值
仅定义方式为从表引入时支持操作。单击操作列下的更多,选择更新码值,系统将按照引入配置自动获取最新的码值数据,获取成功后,需保存发布才会更新已有码值配置。
编辑码值
仅定义方式为从表引入时支持操作。单击操作列下的更多,选择编辑码值,可以直接修改码值定义,适用于需要对从表引入的原始码值信息进行简单修改的场景。
查看引用
单击操作列下的更多,选择查看引用,查看码表被标准模板引用的详情,单击标准模板的名称,可快捷查看标准模板信息,包括模板的属性信息、引用信息、历史版本。
删除
单击操作列下的更多,选择删除,码表删除后不可撤销,请谨慎操作。
管理码表目录
在Dataphin首页的顶部菜单栏,选择治理 > 数据标准。
在左侧导航栏选择参考数据 > 标准代码(码表),在码表目录页签,单击编辑图标。
在码表目录管理面板,您可以对码表目录执行新建、移动、编辑、删除操作。
操作项
描述
新建
请填写目录的名称。同一目录下的同级目录不支持重名。不支持输入字符正斜杠(/),128个字符以内。
支持添加目录至指定层级的下一级。若未选择归属目录,将直接归属码表根目录。
编辑
可修改目录的名称。
移动
支持移动码表的所属上级目录。
删除
若当前目录下有子目录或码表,则不支持删除。
新建码表
在码表列表页面,单击+新建码表按钮。
在新建自定义码表对话框中,配置参数。
参数
描述
码表名称
码表的名称,不超过128个字符,且在所属上级目录下名称唯一。例如:全国地区代码表。
码表编码
用于唯一识别码表,输入不超过128个字符,支持输入英文字母、数字和任意半角符号。例如:DQ001。
所属目录
选择码表归属的目录,若当前定位在某个码表目录下,创建码表时默认填充该码表目录;若未选择归属目录,将直接归属根目录。如需新建目录,请参见管理码表目录。
负责人
选择码表的负责人。
描述
可添加码表含义的描述,输入不超过1000个字符。
代码信息
支持自定义及从表引入两种定义方式。
自定义创建码表
填写码表的信息,同时可对代码信息进行编辑和删除操作。您可单击新增码值,增加码值数量。
例如:代码值:2900,代码名称:上海市,代码英文名称:Shanghai City,代码描述:用2900标识上海市。
代码值:必填,码表内唯一,最多输入64个字符。
代码名称:必填,最多输入64个字符。
代码英文名:非必填,最多输入64个字符,支持输入英文大小写字母、数字以及特殊符号
()^~`!@#$%&*_+\-=[]{}|;':",./<>·?
。代码描述:非必填,最多可输入256个字符。
单击保存并发布,完成码表的创建。
从表引入
说明获取码值数据时,不会基于行级权限进行过滤,也不会进行脱敏查询,请选择可公开的数据来源。
码表的定义方式为从表引入时,不建议使用分区表,如果需要,建议使用每个分区均存储全量数据的表。
由于每个码表最多添加10000个码值,仅查询符合条件的前10000条表数据。
当前操作人需对选中的来源表字段具有select权限。
系统会将从来源表读取到的数据自动转换为string类型进行存储。如果代码名称和码值的来源字段类型无法转换,则整行记录添加失败;如果英文名和描述的来源字段无法转换,则对应配置项留空,不影响整条记录的添加。
支持引用不同数据表快速创建码表,降低配置成本。
在代码信息区域,配置如下信息。
来源表(必填):支持引用除元表、镜像表之外的Dataphin表以及支持数据预览的数据源表。您可以根据表全名、表描述进行模糊搜索,也可以单击筛选图标,根据所属板块/项目/数据源、表类型快速筛选所需数据表。
代码值(必填):选择所属来源表的字段,代码值需在码表内唯一,若来源字段值重复,系统则自动获取第一条记录对应的数据,如果来源数据输入超过64个字符,则整条记录添加失败。
代码名称(必填):选择所属来源表的字段,如果来源数据输入超过64个字符,则整条记录添加失败。
代码英文名(可选):选择所属来源表的字段,支持输入英文大小写字母、数字以及特殊符号
()^~`!@#$%&*_+\-=[]{}|;':",./<>·?
,如果来源数据输入超过64个字符,系统则自动截断或留空。代码描述(可选):选择所属来源表的字段,如果来源数据输入超过256个字符,系统则自动截断或留空。
数据过滤(可选):支持基于已选表的字段添加分区、空值或重复值等过滤条件对来源数据进行过滤。当表为MaxCompute计算源表或Dataphin逻辑表,系统将自动开启并填充分区过滤条件;若为其他源类型,可按需开启。
配置完成后,单击预览数据按钮,对本次填写的参数、权限及语法进行校验。
参数:校验必填参数是否填写完整。
权限:校验当前操作人是否具有新建码表权限。
过滤条件:校验过滤条件语句是否正确。
校验通过后,获取码表数据,将码表添加至Dataphin。
当码表数据获取中,您可单击取消或关闭对话框,终止查询并退出,已配置数据将不保存;若单击上一步,将返回上一步并终止查询,您需要重新获取数据。
当码表数据获取失败,您可单击重试,重新获取数据,或单击查看日志,查看失败原因。
当码表数据获取成功,您可以预览码值信息,单击保存并发布,将码表添加至Dataphin。如果存在部分记录数据获取失败,将为您展示异常列表,您可在异常列表查看具体原因。
后续步骤
码表创建完成后,您可以在配置标准模板属性的取值约束时,选择对应的码表,详情请参见创建及管理标准模板。