识别规则用于识别Dataphin内的敏感数据。您可以对安全要求比较高的业务数据配置识别规则,帮助您及时识别敏感数据。识别规则创建完成后默认每天凌晨进行调度扫描数据,您也可以自定义识别规则的调度周期或手动触发识别规则立即扫描数据。本文为您介绍如何创建及配置识别规则。

背景信息

创建识别规则的过程中您可以通过业务板块、项目,筛选需要扫描的数据表,并配置识别规则的分类、分级及优先级,具体操作请参见创建识别规则。已创建的识别规则默认每天凌晨会定时进行调度扫描数据,您也可以根据业务情况调整识别规则的调度周期,具体操作请参见配置识别规则的调度周期;如果需要立即开始扫描数据,则您可以手动触发识别规则开始扫描数据,具体操作请参见手动触发识别规则

前提条件

在执行操作前,请确认您已满足如下条件:

使用限制

仅支持超级管理员创建、配置及手动触发识别规则。

创建识别规则

  1. 登录Dataphin控制台
  2. 在Dataphin控制台页面,选择工作区地域后,单击进入Dataphin>>
  3. 在Dataphin首页,单击资产
  4. 按照下图指引,进入新建识别规则
    gagaga
  5. 新建识别规则对话框,配置如下参数,配置完成后单击确定
    1. 配置识别规则的规则名称扫描范围区域的参数。
      gagga
      参数 描述
      规则名称 规则名称的命名规则如下:
      • 包含汉字、字母、数字、下划线(_)。
      • 不能超过12个字符。
      业务板块 选择需要识别数据表所在的业务板块:
      • 选中全部,即选择了当前Dataphin内所有的业务板块。
      • 选中枚举后,在下拉列表中选择多个业务板块。
      • 选中自定义后,在输入框中输入正则表达式。例如您需要匹配所有名称中带有test的业务板块,则正则表达式定义为.*test.*
      项目 选择需要识别数据表所在的项目:
      • 选中全部,即选择了当前Dataphin内所有的项目。
      • 选中枚举后,在下拉列表中选择多个项目。
      • 选中自定义后,在输入框中输入正则表达式。例如您需要匹配所有名称中带有test的项目,则正则表达式定义为.*test.*
      数据表 选择需要识别的数据表:
      • 选中全部,即选择已选中项目下的所有表。
      • 选中自定义后,在输入框中输入正则表达式。例如您需要匹配所有名称中带有test的数据表,则正则表达式定义为.*test.*
    2. 配置识别规则的数据分类、数据分级及优先级的参数。
      v
      参数 描述
      数据分类 用于定义识别规则扫描出来的敏感数据的分类。选择此前已创建的数据分类。
      数据分级 用于定义识别规则扫描出来的敏感数据的分级。选择此前已创建的数据分级。
      优先级 优先级包括1、2、3、4和5,优先级从1至5依次降低。当一个数据表配置了多个识别规则时,优先级较高的识别规则优先生效;优先级相同的识别规则,最近更新过的识别规则优先生效。
    完成识别规则创建后,在识别规则列表中生成一条新的识别规则,且识别规则的生效状态默认是打开的,次日凌晨开始每天定时自动扫描数据。dagg您也可以根据业务情况进行调整识别规则的调度周期或手动触发识别规则立即开始扫描数据,具体操作请参见配置识别规则的调度周期手动触发识别规则

配置识别规则的调度周期

  1. 识别规则页面,单击页面右上方的调度任务配置
    gasga
  2. 识别任务调度配置对话框,配置参数。
    gaga
    参数 描述
    调度任务周期 识别规则默认每天调度一次,可以根据业务情况进行调整调度周期。调度周期调长可以优化性能,但会有敏感数据识别滞后的风险。支持选择,详细说明如下:
    • 调度:识别规则每天自动运行一次。您可以单击图标后指定运行的时间点。
    • 调度:识别规则在每周的特定几天,特定时间点自动运行。您可以根据业务需求选择具体的星期后,单击图标指定运行的时间点。
    • 调度:识别规则在每月的特定几天,特定时间点自动运行。您可以根据业务需求选择具体的日期后,单击图标指定运行的时间点。
    调度任务并行度 用于设定识别规则在后台会同时对多少个数据表进行扫描,默认配置为16,您可以根据业务需求进行调整,配置的并行度为正整数且范围为1~100。

    增大并行度会加快扫描进度,但会占用更多的运行资源,请您合理评估。

    调度黑名单 某个特殊的时间段内,为了保障线上任务的运行,您可以打开调度黑名单开关并配置调度黑名单的时间段。在调度黑名单的时间段内,Dataphin内所有的识别规则不进行扫描数据。
  3. 单击确定,完成识别规则调度周期的配置。
    Dataphin所有的识别规则均会按照已配置的调度周期进行调度扫描数据。

手动触发识别规则

  1. 识别规则页面,单击页面右上方的手动规则扫描
    faga
  2. 手动规则扫描对话框,选择扫描数据的范围。
    gagag您可以通过全库扫描项目扫描,选择需要立即执行的识别规则:
    • 全库扫描:适用于需要立即执行Dataphin内所有识别规则进行扫描数据的场景。
    • 项目扫描:适用于需要立即执行特定项目下的所有识别规则进行扫描数据的场景。选择了项目扫描后需要选择扫描的项目。
  3. 单击确定,即可触发已选择的识别规则进行扫描数据。
    页面提示规则扫描中...,根据您选择的扫描数据的大小,扫描数据进程不同,请您耐心等待。

后续步骤

查看识别规则扫描到的敏感数据,具体操作请参见查看识别记录