数据分类用于定义数据在安全领域的业务属性,可对数据进行多级分类打标,更贴合行业标准,本文为您介绍如何创建及管理数据分类。
权限说明
安全管理员和拥有数据分类-管理权限的全局自定义角色支持新建及管理数据分类目录、数据分类。
一级分类目录的管理员可管理所负责的一级目录及其子目录包含的所有数据分类。
普通成员可查看所有全部分类,但只能查看权限为公开的分类详情。
使用说明
数据分类目录不超过10级。
管理数据分类目录
在Dataphin首页的顶部菜单栏,选择治理 > 数据安全。
在左侧导航栏选择通用配置 > 数据分类,在数据分类页面,单击数据分类页签。
您可以在数据分类页签查看分类目录及分类信息,左侧分类目录从业务或组织架构视角出发,对分类进行分层管理,选中某一层级目录后,右侧列表为您展示归属当前目录及其子目录的分类信息。您也可以单击全部分类,查看全量分类信息。
优先级:影响字段识别结果的仲裁逻辑。当字段有多个识别记录时,会根据每个识别结果(分类优先级 > 识别记录的更新时间 >分类修改时间)综合判断最终生效的识别结果。
生效字段数:统计识别结果为当前分类的字段总数。
(可选)您可以在分类目录列表根据数据分类目录名称进行模糊搜索,可在分类列表根据数据分类名称的关键字快速搜索数据分类,或根据生效状态是否生效、未生效、数据分级筛选数据分类。
您可以对数据分类目录及分类执行如下操作。
操作项
描述
分类目录
添加分类目录
单击目录行右侧的添加分类目录,在当前目录下创建子目录。
上级目录:默认填充当前所定位的数据分类目录,选择正斜线(/)代表无上级目录,直接创建一级目录,支持修改。
目录名称:填写目录的名称,不支持使用正斜线(/),不超过128个字符。
批量添加目录:您可单击+继续添加按钮,批量创建同级目录。
从模板库引入分类
单击目录行右侧的从模板库引入分类图标或鼠标悬停新建分类按钮后的下拉箭头单击从模板库引入分类,可在当前目录下引入分类模板,特殊的,若定位在全部码表目录,则引入的分类模板直接归属于全部分类目录下,配置详情请参见从模板库引入数据分类。
编辑
单击目录行右侧的更多图标,选择编辑,一级目录支持设置管理员和分类详情查看权限,子目录支持修改目录名称。
目录名称:默认填充当前定位的目录名称,支持修改,不支持使用斜线(/),最多128个字符。
管理员:一级目录的管理员,最多选择不超过5个管理员。
说明管理员可以管理当前目录及其子目录,以及归属其目录的数据分类。
分类详情:支持公开和仅管理员可查看。
公开:所有用户均可查看该目录下的数据分类的分类详情。
仅管理员可查看:拥有数据分类-管理权限的全局自定义角色以及数据分类所属一级目录的管理员可以查看分类详情信息。
移动
单击目录行右侧的更多-移动,可将当前目录移动到其他分类目录下,若需设置为一级目录,上级目录请选择正斜线(/)。
若当前目录为一级目录,移动为子目录时,则需要遵循新的一级目录管理及查看权限设置,已有权限设置将被清除。
若当前目录为子目录,移动为一级目录时,则需要设置管理员和分类详情查看权限。
删除
单击目录行右侧的更多-删除,将同步删除当前所选分类目录及其子目录以及包含的所有数据分类,并删除数据分类对应的识别规则引用关系、识别结果、脱敏规则和脱敏白名单,请谨慎操作。
数据分类
修改生效状态
在生效状态列下开启或关闭开关,或单击底部批量操作区的开启、停用图标,可修改分类的生效状态,仅生效状态的分类可作为识别结果。
查看详情
单击操作列下的查看图标,可查看有查看权限的数据分类信息,包括数据分类的基本信息、分级信息和扫描方式。
编辑
单击操作列下的编辑图标,可修改数据分类的信息。
移动到新目录
单击操作列下或底部批量操作区的移动到新目录图标,可以将数据分类移动到指定分类目录下。如果分类没有指定目录,可选择正斜线(/);后续可通过定位在左侧的全部分类查询。
设置脱敏
单击操作列下更多图标,选择设置脱敏,可为数据分类设置脱敏规则。配置详情请参见新建及管理动态脱敏规则。
删除
单击操作列下或底部的删除图标,删除数据分类后,会将已关联的识别规则引用关系、识别结果、识别记录、脱敏规则和脱敏白名单删除,请谨慎操作。
指定数据分级
单击底部的指定数据分级图标,可为数据分类批量指定数据分级
新建数据分类
在数据分类页面,单击数据分类页签,单击新建分类按钮。
在新建分类对话框中,配置参数。
参数
描述
基本信息
分类名称
填写数据分类的名称,不超过512个字符。例如:姓名。
分类缩写
可根据分类名称填写缩写,不超过128个字符。例如:N。
分类描述
填写分类的描述。不超过2048个字符。例如:用N表示姓名。
所属目录
选择数据分类的所属目录。
分级信息
数据分级
选择已创建的数据分级。如需创建,请参见新建数据分级。
扫描方式
识别特征
识别特征用于统一管理内置识别表达式,如手机号、身份证号等。如需创建,请参见添加识别特征。
多个识别特征之间为或的关系,支持选择不超过20个。
优先级
数据分类的优先级,等级从高到低为1、2、3、4、5,相同优先级时,会根据字段识别结果详情(分类优先级>识别记录的更新时间>分类修改时间)综合判断最终生效分类。
高级配置
支持选择按内容扫描、按字段名称扫描、按字段描述扫描、按数据类型扫描、按表名扫描、按表中文名扫描。
按内容扫描:根据采样读取目标字段数据内容进行识别和判断。
正则(大小兼容):在输入框中输入正则表达式。例如:您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。识别阈值:只有内容匹配率超过识别阈值,该规则才会被认为是有效识别,进入该字段的识别结果中比较。
按字段名称扫描:根据元数据中的字段名称进行扫描判断。如果字段名称匹配率为100%,该规则进入该字段的识别结果;否则该规则不进入该字段的识别结果。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按字段描述扫描:根据元数据中的字段描述进行扫描判断。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按数据类型扫描:根据元数据中的字段的数据类型进行扫描判断。扫描条件支持属于、正则(大小兼容)、正则表达式、包含、不包含。
属于:可选择的数据类型包括tinyint、smallint、mediumint、int、bigint、decimal、bit、date、datetime、timestamp、varchar、text、json。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按表名扫描:根据数据表的名称进行扫描判断。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按表中文名扫描:根据数据表的中文名称进行扫描判断。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有信息,则正则表达式定义为
.*信息.*
。正则表达式:在输入框中输入正则表达式。例如,您需要匹配所有名称中带有信息,则正则表达式定义为
.*信息.*
。包含/不包含:关键词匹配,比如匹配用户信息表,输入信息。
说明至少配置一条规则。如需添加规则,请单击+添加规则按钮。
最多配置5条规则,且最多配置2层关系。
过滤条件之间的关系可配置为且、或。
说明若未配置扫描方式(识别特征、高级配置),则后续识别规则不能自动扫描,需手动指定。
单击确定,完成数据分类创建。
后续步骤
数据分类创建完成后,您可在识别规则中引用数据分类。详情请参见新建及管理识别规则。