查看敏感数据识别结果并手动修正

本文将为您介绍如何在敏感数据识别页面查看识别结果,并对规则识别不准确的数据进行手动修正。

说明

手动修正的数据结果,在第2天才会生效展示。

前提条件

  1. 已创建数据识别规则,并开启识别任务,详情请参见配置数据识别规则并执行识别任务

背景信息

DataWorks支持您按照数据的敏感级别和所属分类定义数据识别规则,通过运行敏感数据识别任务,帮助您识别组织内的敏感数据,得出敏感数据识别结果。对于识别结果不准确的数据,您可以通过手动修正识别结果,并在敏感数据概况模块为您展示最近的通过数据识别规则命中的、按照项目细分的全部敏感字段分布情况。

进入敏感数据识别结果

  1. 登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的数据治理 > 安全中心,在右侧页面中单击进入安全中心

  2. 单击左侧导航栏的数据使用安全 > 敏感数据管理,单击立即体验,进入数据保护伞。

    说明

    • 若阿里云主账号已授权,则直接进入数据保护伞的首页。

    • 若阿里云主账号未授权,则进入数据保护伞的授权页面。进入数据使用安全 > 敏感数据管理,在页面弹窗内,首次需选择数据保护伞,授权后才可使用保护伞的相关功能。

  1. 单击左侧导航栏的规则配置 > 敏感数据识别,点击页面左上角的识别结果,进入识别结果页面。

查看识别结果

识别结果页面内,可切换识别有结果、识别无结果、未识别的字段类型。在识别结果页面内,为您展示了识别情况、字段数量、表数量、识别结果详情等信息。下图以识别有结果为例,为您展示识别结果页面内容。

image

操作

描述

筛选引擎类型

在上图的区域①,您可以通过下拉选择数据引擎。

说明

目前支持对ODPS、EMR、CDH_HIVE、HOLO引擎中的敏感字段识别结果进行修正。

筛选

在上图的区域②,您可以通过筛选条件过滤需要查询的识别结果。

可以根据项目空间表名字段名等条件进行筛选,还支持您单击展开查看更多筛选条件,进一步通过分类分级敏感字段类型等条件进行筛选。

  • 分类:当前租户默认分类分级模板中的分类信息。详情请参见:配置敏感数据分类分级

  • 分级:当前租户默认分类分级模板中的分级信息。

查询识别结果

在上图的区域③可进行查询和重置操作,对符合筛选条件的识别结果进行查询或重新筛选。

识别结果列表

在上图的区域④为您展示识别结果列表,您可以单击显示字段设置勾选您需要关注的字段信息,刷新识别结果列表详情。列表默认为您展示项目空间表名称字段名称分类分级敏感字段类型是否手动修正最新更新时间,同时,您还可以单击操作列的血缘分析进入数据血缘(公测)模块查看字段级别的数据血缘关系。

手动修正识别结果

DataWorks支持您对数据识别规则识别不准确的敏感数据进行手动修正,手动修正数据的使用逻辑如下图所示。

image

进入手动修正

  1. 进入数据识别规则。详情请参见:进入数据识别规则页面

  2. 单击识别结果页签,进入识别结果页面。

  3. 手动修正识别结果不准确的数据。image

    操作

    描述

    筛选引擎类型

    在上图的区域①,您可以通过下拉选择数据引擎。

    说明

    目前支持对ODPS、EMR、CDH_HIVE、HOLO引擎中的敏感字段识别结果进行修正。

    筛选

    在上图的区域②,您可以通过筛选条件过滤需要查询的识别结果。

    可以根据项目空间表名字段名等条件进行筛选,还支持您单击展开查看更多筛选条件,进一步通过分类分级敏感字段类型等条件进行筛选。

    • 分类:当前租户默认分类分级模板中的分类信息。详情请参见:配置敏感数据分类分级

    • 分级:当前租户默认分类分级模板中的分级信息。

    修正单个数据

    在上图的区域③为您展示识别结果列表,您可以单击显示字段设置勾选您需要关注的字段信息,刷新识别结果列表详情。列表默认为您展示项目空间表名称字段名称分类分级敏感字段类型是否手动修正最新更新时间,同时,您还可以单击操作列的血缘分析进入数据血缘(公测)模块查看字段级别的数据血缘关系。

    对于敏感字段类型识别结果有误的字段,单击右侧敏感字段类型列的下拉框,列表中为您展示当前租户下默认分类分级模板中已发布的敏感字段类型。您可以查看已有的敏感字段类型是否满足需求:

    • 满足需求:则选择其他已有敏感字段类型,并单击右侧的查看图标进入数据识别规则页面修改原敏感字段类型对应的识别规则和修改后的敏感字段类型对应的识别规则,以保证后续识别的准确性。

    • 不满足需求:您可以单击右侧的查看图标进入数据识别规则页面,或滑动至下拉框底部,单击管理敏感字段类型,默认跳转至数据识别规则页面并打开新建敏感字段类型弹窗,新增敏感字段类型,并配置识别规则。详情请参见:配置数据识别规则并执行识别任务

    批量修正数据

    选中需要批量修正的字段,单击上图区域④的批量修正按钮,弹出批量修正识别结果对话框,敏感字段类型下拉框列表中为您展示当前租户下默认分类分级模板中已发布的敏感字段类型,您可以选择正确的敏感字段类型,单击保存,完成批量修正识别结果的操作。

导出识别结果

对于系统识别有结果的数据,支持单击导出识别结果,将筛选条件下的识别结果导出至本地。

  • 导出识别结果:单击image,自动为您导出当前筛选条件下的识别结果。

    说明

    最多支持导出10万条数据。