DataWorks的数据血缘功能支持可视化展示敏感数据的血缘关系,自动分析字段之间的异常关联关系、敏感数据识别结果异常的字段,帮助您梳理敏感数据的扩散情况及影响面,提高数据识别效率。本文为您介绍如何查看血缘关系图。
背景信息
数据血缘为您提供如下功能:
- 可视化血缘图谱
数据保护伞基于敏感字段之间的血缘关系,绘制成敏感数据血缘可视化图谱,帮助您清晰的了解数据的来龙去脉。
- 提升数据识别效率
敏感数据自动识别任务可基于敏感字段血缘关系,将其中敏感字段类型相同的血缘关系进行识别结果扩散,极大提高识别效率。
- 异常血缘关系分析
- 关联关系异常的字段分析
系统根据敏感字段的血缘关系,自动分析字段之间的异常关联关系(例如,SELECT_CONCAT、SELECT_SUBSTRING等关系),避免相关人员通过字符拼接、拆解的方式绕过敏感数据的识别和使用审计。
- 关联但识别结果不一致的字段分析
帮助您识别出与查询字段有血缘关系,但敏感字段类型识别结果不一致的字段。例如,查询A字段,敏感数据类型为姓名,与其有血缘关系的字段有B(姓名)、C(省份),则识别结果不一致的字段是C。
- 关联关系异常的字段分析
使用限制
仅DataWorks企业版及以上版本用户才可以使用数据血缘功能。版本升级详情请参见DataWorks版本服务计费说明。
进入数据血缘
查看血缘关系图
数据血缘页面为您可视化展示敏感数据的血缘关系。
类别 | 描述 |
---|---|
分析场景 | 当前默认分析场景为单个字段的血缘关系,后续会陆续上线其他场景,敬请期待。 |
筛选 | 在上图的模块②区域,支持您输入要查询的字段所属项目、所属表和字段名,单击查询,页面将为您展示对应字段的一层血缘关系,查询的字段会高亮显示。 |
过滤条件 | 在上图模块③区域,您可以根据需求选择过滤条件:
|
血缘关系图 | 在上图模块④区域,为您展示对应查询字段的一层血缘关系图,您可以单击对应字段或字段中间的边关系按钮,查看字段信息和边信息。
|
批量修正数据
您可以通过以下两种方式,对敏感数据识别结果不准确的字段进行批量修正。
- 通过血缘关系图查看当前字段的上、下游关联字段详情,批量选中字段进行修正。
- 进入手动修正数据页面,批量选中字段进行修正。详情请参见:手动修正数据。