数据保护伞是一款数据安全管理产品,提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文示例使用内置规则对xc_dpe_e2_dev
项目的phone
数据脱敏,并设置导出风险审计,为您演示数据保护伞的基本使用流程。
进入数据保护伞
- 登录DataWorks控制台。
- 在左侧导航栏,单击工作空间列表。
- 选择工作空间所在地域后,单击相应工作空间后的数据开发。
- 单击左上角的
图标,选择 。
单击立即体验,即可进入数据保护伞首页。您可根据下文操作流程进行相关功能配置。
操作流程
- 步骤一:配置数据分类分级
用于对您当前的数据按照数据价值、内容敏感程度、影响和分发范围进行敏感级别划分。不同敏感级别的数据管控原则和数据开发要求存在差异。
- 步骤二:配置敏感数据识别规则
根据数据的来源、用途,定义数据分类并配置敏感字段类型,识别当前工作空间中的敏感数据。DataWorks提供了内置数据分类及识别规则,您也可根据需要自定义数据分类及敏感数据识别规则。
- 步骤三:配置数据脱敏规则
用于对识别到的敏感数据配置脱敏规则。根据业务管控要求,不同敏感级别的数据脱敏管控存在差异。
- 步骤四:配置风险识别规则
根据智能化的分析技术,通过风险识别规则,主动发现风险操作并预警。帮助您进行更加全面的风险管理,有效识别并规避风险。
- 步骤五:查看数据
完成上述配置后,您可在数据保护伞对应功能模块查看数据。
步骤一:配置数据分类分级
您可对当前的数据资产按照数据价值、内容敏感程度、影响和分发范围进行敏感级别划分,不同敏感级别的数据有不同的管控原则和数据开发要求。DataWorks提供了内置的分类分级模板,您也可基于业务需要,在数据保护伞界面,单击左侧导航栏的数据分类分级。
,编辑数据分类分级。本文示例使用DataWorks提供的默认数据分级。更多数据分类分级详情,请参见步骤二:配置敏感数据识别规则
DataWorks支持按照数据的敏感级别和所属分类,定义敏感字段类型,帮助您识别工作空间内的敏感数据。您可使用内置识别规则和自定义识别规则,配置敏感字段类型,详情请参见数据识别规则。
本文示例配置phone
敏感字段类型,使用内置识别规则将手机号定义为敏感数据,识别xc_dpe_e2_dev
工作空间下的手机号。
- 在数据保护伞界面,单击左侧导航栏的敏感数据识别界面。 ,进入
- 配置数据的分类分级。在分类分级配置区域,为您提供了默认数据分类,您也可根据需要创建新的分类。本文示例使用默认分类
基本信息
。 - 配置敏感字段类型。
步骤三:配置数据脱敏规则
用于对识别到的敏感数据进行脱敏规则配置。根据业务管控要求,不同敏感级别的数据脱敏管控存在差异。DataWorks目前支持动态脱敏和静态脱敏,更多数据脱敏介绍,详情请参见数据脱敏管理。
本文示例对步骤二的phone
规则识别到的敏感数据,配置相应脱敏规则phone
。
- 在数据保护伞界面,单击左侧导航栏的数据脱敏管理界面。 ,进入
- 配置数据脱敏规则。
- 开启工作空间数据脱敏。脱敏规则配置后,需确保目标工作空间已开启查询内容脱敏。开启后,脱敏规则才会生效。
- 进入数据开发(DataStudio)。
- 在左下角单击
图标,进入设置页面。
- 在安全设置与其他页签的数据安全区域,启用页面查询内容脱敏。
- 验证数据脱敏规则是否生效。您可在数据开发(DataStudio)界面,创建临时查询任务,查询相关手机号数据,通过查询结果验证手机号脱敏效果。具体表数据及查询语句请根据实际业务配置。示例展示的脱敏效果如下。
步骤四:配置风险识别规则
风险识别管理提供了多维度的关联分析及算法,智能化的分析技术帮助您通过风险识别规则,主动发现风险操作并预警,使用可视化方式进行一站式审计。DataWorks内置了多种场景的风险识别规则,您也可根据业务场景自定义风险规则。更多风险识别规则的介绍,请参见风险识别管理(新版)。
本文示例新建自定义规则,对步骤二配置的phone
规则所识别的敏感数据进行风险识别。当10分钟内,xc_dpe_e2_dev
项目下满足phone
规则的数据导出次数大于等于10次时,则将该导出操作识别为高风险操作。
- 在数据保护伞界面,单击左侧导航栏的风险识别管理界面。 ,进入
- 配置风险识别规则。
- 启用规则。创建的自定义规则默认不生效,您需在风险识别管理页面,找到创建的
phone数据的导出风险
规则,单击重新生效,手动启用该规则。
步骤五:查看数据
敏感数据识别规则、风险识别规则等配置完成后,您可进入数据保护伞的各个功能模块,查看风险数据。风险数据结果是(T+1)天产生。功能模块 | 描述 |
---|---|
数据发现 | 从工作空间、分级等不同维度,为您提供可视化的数据资产展示。您可在该页面查看命中识别规则的字段总数、表总数及对应占比,命中规则的字段各分级、项目数量分布和清单。 |
数据访问 | 展示基于配置规则识别出的敏感数据的访问量、访问趋势、导出量和导出明细等,帮助您掌控每一次访问敏感数据的情况。 |
数据风险(新版) | 从多维度呈现了通过配置的风险识别规则命中的风险数据,方便您了解不同维度的风险分布、指定时间的风险趋势及风险项目空间排名,获取风险高发的时间及项目空间,也可查看产生风险的用户、时间、操作等详情,及时定位并处理风险。 |
数据血缘(公测) | 可视化展示敏感数据的血缘关系,自动分析字段之间的异常关联关系、敏感数据识别结果异常的字段,帮助您梳理敏感数据的扩散情况及影响面,提高数据识别效率。 |
数据溯源 | 通过提取数据泄露文件中数据的水印信息,帮助您定位到可能会泄露目标数据的责任人。 |