创建及管理识别规则

识别规则用于识别Dataphin内的敏感数据。您可以对安全要求比较高的业务数据配置识别规则,帮助您及时识别敏感数据。本文为您介绍如何创建及管理识别规则。

权限说明

安全管理员支持新建及管理识别规则。

注意事项

MaxCompute的表会默认使用MaxCompute Tunnel加速,提高识别速度、降低识别成本。如有不支持Tunnel的场景,则会使用普通SQL进行安全识别。

创建识别规则

  1. 在Dataphin首页,在顶部菜单栏选择治理 > 数据安全

  2. 在左侧导航栏选择数据识别 > 识别规则,在识别规则页面,单击新建识别规则按钮。

  3. 新建识别规则对话框中,配置参数。

    参数

    描述

    基础配置

    识别规则名称

    识别规则的名称。命名规则如下:

    • 包含中文、字母、数字、下划线(_)。

    • 不能超过12个字符。

    识别规则说明

    自定义识别规则备注信息。不超过128个字符。

    数据分类分级

    数据分类

    可通过数据分类目录圈选数据分类,支持选择全部分类、指定目录下所有分类、指定数据分类。

    • 全部分类:指当前租户下所有生效的数据分类。

    • 指定目录下所有分类:指定目录及其子目录下所有生效的数据分类。

    • 指定数据分类:根据上级目录筛选当前目录及其子目录下所有生效的数据分类,如需增加数据分类,可单击新增一组分类添加多个目录。

    扫描范围

    扫描范围

    • 识别方式支持两种方式。

    • 识别类型包括数据板块项目数据表

    • 识别条件支持全部属于不属于包含不包含正则(大小兼容)正则表达式

      • 全部:即选择了当前Dataphin内的全部范围。

      • 属于/不属于:选择多个具体的资源。

      • 包含/不包含:关键词匹配,如匹配用户信息表,输入user_info。

      • 正则(大小兼容):在输入框中输入正则表达式。例如,如果您需要匹配所有名称中带有test的内容,则正则表达式定义为.*test.*,同时进行扫描结果的大小写兼容处理。

      • 正则表达式:在输入框中输入正则表达式。例如您需要匹配所有名称中带有test,则正则表达式定义为.*test.*

    说明
    • 扫描范围的规则不超过5条,关系不超过2层。

    • 数据板块和项目选择不超过100个对象。

  4. 单击确定,完成识别规则创建。

    完成识别规则创建后,在识别规则列表中生成一条新的识别规则,且识别规则的生效状态默认是打开的,次日开始按照规则运行配置中设置的定时调度时间自动扫描数据。

识别规则列表

识别创建完成后,您可以在识别规则列表中对规则进行查看、编辑、删除、转交、设置脱敏等操作。image

序号

描述

搜索和筛选区

您可以根据识别规则名称的关键字进行快捷搜索,也可以根据数据分类、负责人、仅看我的进行精确筛选。

规则介绍区

您可以查看识别规则、数据抽样、识别结果及识别管理的介绍说明。

image.png

列表区

为您展示识别规则的名称、数据分类、负责人、更新时间、是否生效信息。同时,您可在操作列下对识别规则进行重置、查看详情、编辑、复制、转交、删除等操作。

  • 是否生效:开启后,识别规则根据规则运行配置的定时扫描调度时间以及实时扫描开关执行并生成执行记录;关闭后,您可根据业务情况选择需执行的规则范围手动触发。

    说明

    规则置为不生效后,不会影响之前已生成的识别结果。

  • 重置:针对已选规则识别范围内的数据,先清空已有的打标结果,再重新执行一次识别,作为最新的识别结果。

  • 查看详情:支持查看识别规则的配置详情。

  • 编辑:支持修改识别规则信息。

  • 复制:支持快速复制识别规则,相当于克隆。

  • 转交:转交识别规则负责人,选择需要转交的新负责人后,单击确定。识别规则仅支持转交给安全管理员。

  • 删除:删除规则后,已生成的识别结果不受影响。

批量操作区

您可以批量选择任务,进行重置删除转交测试操作。

  • 重置:针对已选规则识别范围内的数据,先清空已有的打标结果,再重新执行一次识别,作为最新的识别结果。

  • 删除:批量删除规则后,将会对应用本规则的所有识别数据的分类分级打标进行删除,相关打标删除操作,次日生效。

  • 转交:转交识别规则负责人,选择需转交的新负责人后,单击确定。识别规则仅支持转交给安全管理员。

  • 测试:您可选择需测试的项目或数据表,测试将会对抽取的样例数据进行分类分级及规则打标,最多选择10个项目或10张表。

    测试完成后,您可以单击查看测试结果查看结果详情。

    说明
    • 测试对抽取的样例数据仅作结果展示,不实际打标。

    • 测试运行也会进行数据扫描和计算,将会消耗计算资源,建议精确设置测试范围;基于所选的范围的规则个数和复杂度,执行进度会有所不同,请耐心等待。

    • 测试仅用于判断单条识别规则是否能识别出敏感数据,实际执行会对多个符合条件的规则进行判断并按照优先级最终确定一个识别规则,因此测试打标结果可能和实际的规则打标结果不一致。

手动触发识别规则

  1. 识别规则页面,单击手动规则扫描,进入手动规则扫描对话框。

  2. 手动规则扫描对话框,配置参数。

    参数

    描述

    扫描范围

    支持通过全库扫描项目扫描表扫描来圈选识别规则的扫描范围。

    • 全库扫描:适用于需要立即执行Dataphin内所有识别规则进行扫描数据的场景。

    • 项目扫描:选择需要扫描的项目。适用于需要立即执行特定项目下的所有识别规则进行扫描数据的场景。

    • 表扫描:选择该项目下需要扫描的数据表,不超过10张数据表。适用于需要立即执行特定项目下的数据表所有识别规则进行扫描数据的场景。

    规则执行范围

    支持通过仅生效规则全部规则(含未生效规则)来圈选识别规则的执行范围。

    • 仅生效规则:指Dataphin内所有执行状态为生效的识别规则。

    • 全部规则(含未生效规则):指Dataphin内所有识别规则(不论识别规则是否生效)。

    说明
    • 需要先在自动继承配置中开启自动继承,并选中规则运行触发场景,详情请参见自动继承配置

    • 选中后,手动扫描识别规则时,下游会根据字段血缘关系自动继承直接上游字段的敏感等级,帮助您更完善覆盖扫描范围,并提升关联数据识别结果一致性;若未选中,则不执行字段血缘自动继承识别结果。

    • 开启自动继承扫描会扩大扫描范围,造成额外的计算资源消耗,请根据业务实际情况合理配置。

  3. 单击确定,即可触发对已选资产对象进行扫描。

    您可以前往运行记录查看,根据您选择的扫描数据的大小,扫描数据进程不同,请您耐心等待。

后续步骤