创建及管理数据分类

数据分类用于定义数据在安全领域的业务属性,可对数据进行多级分类打标,更贴合行业标准,本文为您介绍如何创建及管理数据分类。

权限说明

  • 安全管理员和拥有数据分类-管理权限的全局自定义角色支持新建及管理数据分类目录、数据分类。

  • 一级分类目录的管理员可管理所负责的一级目录及其子目录包含的所有数据分类。

  • 普通成员可查看所有全部分类,但只能查看权限为公开的分类详情。

使用说明

数据分类目录不超过10级。

管理数据分类目录

  1. 在Dataphin首页,在顶部菜单栏选择治理 > 数据安全

  2. 在左侧导航栏选择通用配置 > 数据分类,在数据分类页面,单击数据分类页签。

  3. 您可以对数据分类目录执行添加分类目录、从模板库引入分类、编辑、移动、删除操作。

    image

    区域

    描述

    搜索及收展区

    • 您可以根据数据分类目录名称进行模糊搜索。

    • 您可以单击展开全部分类image..png或收起全部分类image..png图标,展开或收起分类目录。

    操作区

    • 添加分类目录

      • 上级目录:默认填充当前所定位的数据分类目录,支持修改。

      • 目录名称:填写目录的名称,不支持使用斜线(/),不超过128个字符。

      • 批量添加目录:您可单击+继续添加按钮,批量创建同级目录。

    • 从模板库引入分类:您可从模板库直接引用并添加为可用的数据分类。配置详情请参见从模板库引入数据分类

    • 编辑:一级目录支持设置管理员和分类详情查看权限,子目录支持修改目录名称。

      • 目录名称:默认填充当前定位的目录名称,支持修改,不支持使用斜线(/),最多128个字符。

      • 管理员:一级目录的管理员,最多选择不超过5个管理员。

        说明

        管理员可以管理当前目录及其子目录,以及归属其目录的数据分类。

      • 分类详情:支持公开和仅管理员可查看。

        • 公开:所有用户均可查看该目录下的数据分类的分类详情。

        • 仅管理员可查看:拥有数据分类-管理权限的全局自定义角色以及数据分类所属一级目录的管理员可以查看分类详情信息。

    • 移动:支持移动数据分类目录。

      • 若当前目录为一级目录,移动为子目录时,则需要遵循新的一级目录管理及查看权限设置,已有权限设置将被清除。

      • 若当前目录为子目录,移动为一级目录时,则需要设置管理员和分类详情查看权限。

    • 删除:将同步删除当前所选分类目录及其子目录以及包含的所有数据分类,并删除数据分类对应的识别规则引用关系、识别结果、脱敏规则和脱敏白名单,请谨慎操作。

新建数据分类

  1. 数据分类页面,单击数据分类页签,单击新建分类按钮。

  2. 新建分类对话框中,配置参数。

    参数

    描述

    基本信息

    分类名称

    填写数据分类的名称,不超过512个字符。例如:姓名。

    分类缩写

    可根据分类名称填写缩写,不超过128个字符。例如:N。

    分类描述

    填写分类的描述。不超过2048个字符。例如:用N表示姓名。

    分类目录

    选择数据分类的所属目录。

    分级信息

    数据分级

    选择已创建的数据分级。如需创建,请参见新建数据分级

    扫描方式

    识别特征

    识别特征用于统一管理内置识别表达式,如手机号、身份证号等。如需创建,请参见创建及管理识别特征

    多个识别特征之间为或的关系,支持选择不超过20个。

    优先级

    数据分类的优先级,等级从高到低为1、2、3、4、5,相同优先级时,会根据字段识别结果详情(分类优先级>识别记录的更新时间>分类修改时间)综合判断最终生效分类。

    高级配置

    支持选择按内容扫描按字段名称扫描按字段描述扫描按数据类型扫描按表名扫描按表中文名扫描

    • 按内容扫描:根据采样读取目标字段数据内容进行识别和判断。

      • 正则(大小兼容):在输入框中输入正则表达式。例如:您需要匹配所有名称中带有test,则正则表达式定义为.*test.*,可匹配存在test、Test、TEST等大小写兼容的名称。

      • 正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*

      • 识别阈值:只有内容匹配率超过识别阈值,该规则才会被认为是有效识别,进入该字段的识别结果中比较。

    • 按字段名称扫描:根据元数据中的字段名称进行扫描判断。如果字段名称匹配率为100%,该规则进入该字段的识别结果;否则该规则不进入该字段的识别结果。

      • 正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*,可匹配存在test、Test、TEST等大小写兼容的名称。

      • 正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*

      • 包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。

    • 按字段描述扫描:根据元数据中的字段描述进行扫描判断。

      • 正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*,可匹配存在test、Test、TEST等大小写兼容的名称。

      • 正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*

      • 包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。

    • 按数据类型扫描:根据元数据中的字段的数据类型进行扫描判断。扫描条件支持属于正则(大小兼容)正则表达式包含不包含

      • 属于:可选择的数据类型包括tinyint、smallint、mediumint、int、bigint、decimal、bit、date、datetime、timestamp、varchar、text、json。

      • 正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*,可匹配存在test、Test、TEST等大小写兼容的名称。

      • 正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*

      • 包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。

    • 按表名扫描:根据数据表的名称进行扫描判断。

      • 正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*,可匹配存在test、Test、TEST等大小写兼容的名称。

      • 正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*

      • 包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。

    • 按表中文名扫描:根据数据表的中文名称进行扫描判断。

      • 正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有信息,则正则表达式定义为.*信息.*

      • 正则表达式:在输入框中输入正则表达式。例如,您需要匹配所有名称中带有信息,则正则表达式定义为.*信息.*

      • 包含/不包含:关键词匹配,比如匹配用户信息表,输入信息

    说明
    • 至少配置一条规则。如需添加规则,请单击+添加规则按钮。

    • 最多配置5条规则,且最多配置2层关系。

    • 过滤条件之间的关系可配置为且、或。

    说明

    若未配置扫描方式(识别特征、高级配置),则后续识别规则不能自动扫描,需手动指定。

  3. 单击确定,完成数据分类创建。

从模板库引入数据分类

通过已选目录和引入范围配置决定从模板库引入的数据分类范围,以及引入后的所属目录。

  1. 数据分类页面,单击数据分类页签,单击新进分类后的下拉箭头,选择从模板库引入分类

  2. 从模板库引入分类对话框中,配置参数。

    参数

    描述

    引入到目录

    默认填充当前所定位的数据分类目录,支持修改。特殊的,若定位在全部分类目录,则引入的数据分类直接归属于全部分类目录下。

    模板库

    选择需引入的模板,根据数据分类目录选择该模板下需引入的数据分类。

    引入范围

    选择是否引入数据分类目录,支持选择分类目录+分类仅引入分类,不引入目录

    • 分类目录+分类:将所有选中的分类目录及其包含的所有数据分类添加到指定位置的下一级,如果添加后超过最大目录限制,则会添加失败。同一目录下的分类如果和已有分类名称重复,将跳过不添加。

    • 仅引入分类,不引入目录:将所有选中的分类目录下的所有数据分类平铺添加到指定位置的下一级。同一目录下的分类如果和已有分类名称重复,将跳过不添加。

    优先级

    数据分类的优先级,等级从高到低为1、2、3、4、5,相同优先级时,会根据字段识别结果详情(分类优先级>识别记录的更新时间>分类修改时间)综合判断最终生效分类。

  3. 单击确定,完成从模板库引入分类。

查看数据分类

数据分类页面,您可以查看所选分类目录及其归属该目录下的所有数据分类的详细信息,并可执行编辑、删除等操作。

image

区域

描述

筛选及搜索区

您可根据数据分类名称的关键字快速搜索数据分类。也可根据生效状态是否生效未生效数据分级筛选数据分类。

数据分类信息

为您展示数据分类的名称、描述、分类缩写、数据分级、优先级、生效字段数、生效状态、所属分类目录、是否配置脱敏信息。

  • 优先级:相同优先级时,会根据字段识别结果详情(分类优先级>识别记录的更新时间>分类修改时间)综合判断最终生效分类

  • 生效字段数:统计当前数据分类打标生效中的字段数。

操作区

您可对数据分类执行修改生效状态、查看详情、编辑、移动到新目录、设置脱敏、删除等操作。

  • 修改生效状态:新建识别规则、添加识别结果、新建脱敏规则、新建脱敏白名单时仅支持选择生效的数据分类;置为不生效后,识别规则执行、识别结果仲裁、脱敏规则执行等场景将忽略该数据分类不做处理。

  • 查看详情:可查看有查看权限的数据分类信息,包括数据分类的基本信息、分级信息和扫描方式。

  • 编辑:可修改数据分类的信息。

  • 移动到新目录:可以将数据分类移动到指定分类目录下。

  • 设置脱敏:可为数据分类设置脱敏规则。配置详情请参见创建及管理动态脱敏规则

  • 删除:删除数据分类后,会将已关联的识别规则引用关系、识别结果、识别记录、脱敏规则和脱敏白名单删除,请谨慎操作。

批量操作区

您可对数据分类批量执行指定数据分级、开启或停用生效状态、移动到新目录、删除操作。

指定数据分级:可为数据分类批量指定数据分级。

后续步骤

数据分类创建完成后,您可在识别规则中引用数据分类。详情请参见创建及管理识别规则