识别规则用于识别Dataphin内的敏感数据。您可以对安全要求比较高的业务数据配置识别规则,帮助您及时识别敏感数据。本文为您介绍如何创建及管理识别规则。
权限说明
安全管理员支持新建及管理识别规则。
创建识别规则
在Dataphin首页,在顶部菜单栏选择治理 > 数据安全。
在左侧导航栏选择数据识别 > 识别规则,在识别规则页面,单击新建识别规则按钮。
在新建识别规则对话框中,配置参数。
参数
描述
基础配置
识别规则名称
识别规则的名称。命名规则如下:
包含中文、字母、数字、下划线(_)。
不能超过12个字符。
识别规则说明
自定义识别规则备注信息。不超过128个字符。
数据分类分级
数据分类
可通过数据分类目录圈选数据分类,支持选择全部分类、指定目录下所有分类、指定数据分类。
全部分类:指当前租户下所有生效的数据分类。
指定目录下所有分类:指定目录及其子目录下所有生效的数据分类。
指定数据分类:根据上级目录筛选当前目录及其子目录下所有生效的数据分类,如需增加数据分类,可单击新增一组分类添加多个目录。
说明当计算引擎为StarRocks且字段类型为HLL(HyperLoglog)时,暂不支持按内容识别。
扫描范围
扫描范围
识别方式支持且、或两种方式。
识别类型包括数据板块、项目和数据表。
识别条件支持全部、属于、不属于、包含、不包含、正则(大小兼容)、正则表达式。
全部:即选择了当前Dataphin内的全部范围。
属于/不属于:选择多个具体的资源。
包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。
正则(大小兼容):在输入框中输入正则表达式。例如,如果您需要匹配所有名称中带有test的内容,则正则表达式定义为
.*test.*
,同时进行扫描结果的大小写兼容处理。正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为
.*test.*
。
说明扫描范围的规则不超过5条,关系不超过2层。
数据板块和项目选择不超过100个对象。
单击确定,完成识别规则创建。
完成识别规则创建后,在识别规则列表中生成一条新的识别规则,且识别规则的生效状态默认是打开的,次日开始按照规则运行配置中设置的定时调度时间自动扫描数据。
识别规则列表
识别创建完成后,您可以在识别规则列表中对规则进行查看、编辑、删除、转交、设置脱敏等操作。
序号 | 描述 |
①搜索和筛选区 | 您可以根据识别规则名称的关键字进行快捷搜索,也可以根据数据分类、负责人、仅看我的进行精确筛选。 |
②规则介绍区 | 您可以查看识别规则、数据抽样、识别结果及识别管理的介绍说明。 |
③列表区 | 为您展示识别规则的名称、数据分类、负责人、更新时间、是否生效信息。同时,您可在操作列下对识别规则进行重置、查看详情、编辑、复制、转交、删除等操作。
|
④批量操作区 | 您可以批量选择任务,进行重置、删除、转交、测试操作。
|
手动触发识别规则
在识别规则页面,单击手动规则扫描,进入手动规则扫描对话框。
在手动规则扫描对话框,配置参数。
参数
描述
扫描范围
支持通过全库扫描、项目扫描或表扫描来圈选识别规则的扫描范围。
全库扫描:适用于需要立即执行Dataphin内所有识别规则进行扫描数据的场景。
项目扫描:选择需要扫描的项目。适用于需要立即执行特定项目下的所有识别规则进行扫描数据的场景。
表扫描:选择该项目下需要扫描的数据表,不超过10张数据表。适用于需要立即执行特定项目下的数据表所有识别规则进行扫描数据的场景。
规则执行范围
支持通过仅生效规则、全部规则(含未生效规则)来圈选识别规则的执行范围。
仅生效规则:指Dataphin内所有执行状态为生效的识别规则。
全部规则(含未生效规则):指Dataphin内所有识别规则(不论识别规则是否生效)。
说明需要先在自动继承配置中开启自动继承,并选中规则运行触发场景,详情请参见自动继承配置。
选中后,手动扫描识别规则时,下游会根据字段血缘关系自动继承直接上游字段的敏感等级,帮助您更完善覆盖扫描范围,并提升关联数据识别结果一致性;若未选中,则不执行字段血缘自动继承识别结果。
开启自动继承扫描会扩大扫描范围,造成额外的计算资源消耗,请根据业务实际情况合理配置。
单击确定,即可触发对已选资产对象进行扫描。
您可以前往运行记录查看,根据您选择的扫描数据的大小,扫描数据进程不同,请您耐心等待。
后续步骤
您可以在运行记录列表查看识别规则扫描到的敏感数据,详情请参见管理识别结果。