数据分类用于定义数据在安全领域的业务属性,可对数据进行多级分类打标,更贴合行业标准,本文为您介绍如何新建及管理数据分类。
前提条件
权限说明
安全管理员支持新建及管理数据分类。
新建数据分类
在Dataphin首页,单击顶部菜单栏的资产。
按照下图操作指引,进入新建分类对话框。
在新建分类对话框,配置参数。
参数
描述
分类名称
填写数据分类的名称,不超过128个字符。如:姓名。
分类缩写
可根据分类名称填写缩写,不超过128个字符。如:N。
分类描述
填写分类的描述。不超过512个字符。如:用N表示姓名。
数据分类层级
选择数据分类的所属层级。
数据分级
选择已创建的数据分级。如需创建,请参见新建数据分级。
识别特征
识别特征用于统一管理内置识别表达式,如手机号、身份证号等。
多个识别特征之间为或的关系,支持选择不超过20个。
优先级
数据分类的优先级,等级从高到低为1、2、3、4、5,相同优先级时,会根据字段识别结果详情(分类优先级>识别记录的更新时间>分类修改时间)综合判断最终生效分类。
高级配置
支持选择按内容扫描、按字段名称扫描、按字段描述扫描、按数据类型扫描、按表名扫描、按表中文名扫描。
按内容扫描:根据采样读取目标字段数据内容进行识别和判断。
正则(大小兼容):在输入框中输入正则表达式。例如:您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。识别阈值:只有内容匹配率超过识别阈值,该规则才会被认为是有效识别,进入该字段的识别结果中比较。
按字段名称扫描:根据元数据中的字段名称进行扫描判断。如果字段名称匹配率为100%,该规则进入该字段的识别结果;否则该规则不进入该字段的识别结果。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按字段描述扫描:根据元数据中的字段描述进行扫描判断。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按数据类型扫描:根据元数据中的字段的数据类型进行扫描判断。扫描条件支持属于、正则(大小兼容)、正则表达式、包含、不包含。
属于:可选择的数据类型包括tinyint、smallint、mediumint、int、bigint、decimal、bit、date、datetime、timestamp、varchar、text、json。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按表名扫描:根据数据表的名称进行扫描判断。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
,可匹配存在test、Test、TEST等大小写兼容的名称。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
按表中文名扫描:根据数据表的中文名称进行扫描判断。
正则(大小兼容):在输入框中输入正则表达式。例如您需要匹配所有名称中带有信息,则正则表达式定义为
.*信息.*
。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有信息,则正则表达式定义为
.*信息.*
。包含/不包含:关键词匹配,如匹配用户信息表,输入信息。
说明至少配置一条规则。如需添加规则,请单击+添加规则按钮。
最多配置5条规则,且最多配置2层关系。
过滤条件之间的关系可配置为且、或。
说明若未配置扫描方式(识别特征、高级配置),则后续识别规则不能自动扫描,需手动指定。
单击确定,完成数据分类创建。
从预置模型引入数据分类
通过已选层级和引入范围配置决定从预置模型引入的数据分类范围及引入后的所属层级。
按照下图操作指引,进入从预置模型引入分类对话框。
在从预置模型引入分类对话框中,配置参数。
参数
描述
引入分类位置
默认填充当前所定位的数据分类层级,支持修改。特殊的,若定位在全部分类层级,则引入的数据分类直接归属于全部分类层级下。
引入预置模型
选择需引入的预置模型,并按层级选择该模型下需引入的数据分类。
引入范围
选择是否引入数据分类层级,支持选择分类层级+分类、仅引入分类,不引入层级。
分类层级+分类:将所有选中的分类层级及其包含的所有数据分类添加到指定位置的下一级,如果添加后超过最大层级限制,则会添加失败。同一层级下的分类如果和已有分类名称重复,将跳过不添加。
仅引入分类,不引入层级:将所有选中的分类层级下的所有数据分类平铺添加到指定位置的下一级。同一层级下的分类如果和已有分类名称重复,将跳过不添加。
优先级
数据分类的优先级,等级从高到低为1、2、3、4、5,相同优先级时,会根据字段识别结果详情(分类优先级>识别记录的更新时间>分类修改时间)综合判断最终生效分类。
单击确定,完成从预置模型引入分类。
查看数据分类
在生效模型页面,您可查看所选分类层级及其归属该层级下的所有数据分类的详细信息,并可执行编辑、删除等操作。
区域 | 描述 |
①筛选及搜索区 | 您可根据数据分类名称的关键字快速搜索数据分类。也可根据生效状态是否生效、未生效、数据分级筛选数据分类。 |
②数据分类信息 | 为您展示数据分类的名称、描述、分类缩写、数据分级、优先级、生效字段数、生效状态、所属分类层级、脱敏配置信息。
|
③操作区 | 您可对数据分类执行查看、编辑、移动到新层级、设置脱敏、删除操作。
|
④批量操作区 | 您可对数据分类批量执行指定数据分级、开启或停用生效状态、移动到新层级、删除操作。
|
后续步骤
数据分类创建完成后,您可在识别规则中引用数据分类。详情请参见新建及管理识别规则。
- 本页导读 (0)