创建及管理词根

词根可以用于管理业务名词、物理表、字段规范命名及其标准化翻译。建立和维护可收敛的词根库,能够为资产统一管理提供依据,让数据流通且通畅无歧义。本文为您介绍如何创建及管理词根。

权限说明

所有成员均可批量导出词根。

词根列表

您可以在词根列表页面查看已经配置的词根信息,并进行搜索、编辑、删除词根等操作。

image.png

区域

描述

搜索区

支持按照词根名称、全称、缩写进行搜索。

词根列表

为您展示词根的名称、全称、缩写、描述、最近更新人、最近更新时间信息。同时,您可对词根执行编辑、删除操作。

  • 编辑:可修改词根的信息。

  • 删除:删除后不可撤销,请谨慎操作。

新建词根

  1. 在Dataphin首页,在顶部菜单栏选择治理 > 数据标准

  2. 在左侧导航栏选择参考数据 > 词根,在词根页面,单击+新建词根按钮。

  3. 新建词根对话框,填写参数。

    参数

    描述

    词根名称

    词根的名称,如:金额。不超过128字符。

    全称

    词根的全称,如:amount。不超过64字符。

    缩写

    词根的缩写,如:amt。不超过64字符。

    描述

    可添加词根含义和使用场景等描述,不超过256字符。

  4. 单击确定,完成词根的创建。

批量导入词根

  1. 词根列表页面,单击右上角的批量导入导出,选择批量导入词根

  2. 批量导入词根对话框,配置相关参数。

    参数

    描述

    导入场景

    不同导入场景对应的配置模板不同,其中下载的更新模板文件将包含词根信息,您只需要修改需要修订的信息,再重新导入即可。支持新增更新两种导入场景。

    导入场景仅影响配置模板的生成,实际导入过程中,将根据词根名称是否存在决定是新增还是更新。

    STEP 1 下载配置模板--新增

    配置模板

    若没有模板,可点击文件名称或下载image.png图标下载.xlsx文件;若已有模板,可直接执行上传配置文件并导入。

    说明

    导入词根需要有创建或编辑词根的权限,否则会使权限校验失败,无法导入。

    STEP 1 下载配置模板--更新

    更新范围

    选择需要更新的词根,支持选择全部或指定需更新的词根,单次选择词根个数不超过10000个。

    配置模板

    根据所选的词根范围生成,若更新范围选择全部,则可直接下载模板;若更新范围选择指定,则点击生成模板,生成.xlsx格式的模板文件后下载。

    说明
    • 若没有模板,可点击文件名称或下载image.png图标下载.xlsx文件;若已有模板,可直接执行上传配置文件并导入。

    • 导入词根需要有创建或编辑词根的权限,否则会使权限校验失败,无法导入。

    STEP 2 上传配置文件

    上传文件

    • 单次最多导入10000个词根的.xlsx文件,单个文件大小不超过20M。

    • 如文件类型不一致或有多个工作表或词根信息超出10000行,则无法导入。如果修改了字段名称,或增删字段,可能会导致模板无法解析,导入失败。

    • 填写模板时,请按照模板说明进行填写,导入过程中将基于词根名称进行唯一性、规范性校验,如校验不通过则导入失败。

    • 词根名称:必填,全局唯一,最多输入128字符。导入时将根据词根名称识别词根对象,如果词根名称已经存在,则视为更新词根操作,结合冲突策略配置执行导入;如果词根名称不存在,则视为新增词根操作。

    • 全称:必填,可重复;最多输入64字符,支持输入中文+英文字母+数字+特殊字符-、_、()、空格、’

    • 缩写:必填,最多输入64字符,支持输入英文字母+数字+任意半角符号。

    • 描述:非必填,最多输入256字符。

    STEP 3 冲突解决策略

    校验字段

    词根名称(全局唯一,大小写不敏感)。

    处理策略

    针对本次导入的词根名称若和已有的词根名称相同时的处理策略,支持选择冲突则跳过冲突则覆盖更新

    • 冲突则跳过:如果导入的词根名称和已有词根名称重复,则跳过记录不处理。

    • 冲突则覆盖更新:如果导入的词根名称和已有词根名称重复,以本次导入的内容为准更新线上已有的词根的其他信息,如词根名称、描述等。

    说明

    词根名称全局唯一,如果导入的词根名称和已存在的词根名称重复,或单次导入中有多条记录的词根名称重复,会按照处理策略,跳过记录不处理或以新记录覆盖原有对象。

  3. 单击开始导入,在查看词根导入记录对话框,支持查看导入结果或下载异常记录等。

    参数

    描述

    导入结果

    可查看导入进度、导入结果、执行时间。

    异常记录

    • 为您展示校验不通过而无法导入的词根记录,包括记录在原始文件中对应的行号、词根名称、缩写、异常字段和异常提示。

    • 单击异常记录页签,再单击下载异常记录,将对应的原始记录下载成Excel文件。

    跳过记录

    • 如果冲突策略配置为冲突则跳过,则针对在指定词根中已经存在的名称记录会被跳过,展示在跳过记录列表中,包括记录在原始文件中对应的行号、词根名称缩写和简称。

    • 单击跳过记录页签,再单击下载跳过记录,将对应的原始记录下载成Excel文件。

    执行日志

    可查看导入过程的执行日志并复制。

    导入完成后,若您想快速查看导入结果,可关闭导入配置对话框,关闭对话框不会终止导入任务的执行。您可以在词根列表,单击查看导入记录,并选择需要查看的历史导入记录。

批量导出词根

  1. 词根列表页面,单击右上角的批量导入导出,选择批量导出词根

  2. 批量导出词根对话框中,根据导出范围导出词根。

    导出范围:选择需导出的词根范围,支持选择导出全部词根或指定选择的词根。支持选择不超过10000个词根。

  3. 单击确定,完成词根的导出。您可在查看导入记录中查看历史导入记录。

查看词根导入记录

  1. 词根列表页面,单击右上角的批量导入导出选择查看导入记录

  2. 词根批量操作记录弹框,查看词根的导入操作记录,包括序号、创建人、导入的状态、导入场景、创建时间、结束时间信息。同时,您可单击操作列下的查看图标,查看词根的导入详情。