数据脱敏是保障数据安全的重要措施。DataWorks支持静态脱敏、动态脱敏和引擎脱敏等多种方式,帮助组织在不同场景下保护敏感数据。通过配置具体的脱敏规则和脱敏策略,可以对敏感数据实施精准的脱敏处理,确保敏感数据在数据开发、分析等环节中的安全性。
功能介绍
数据脱敏功能旨在保护敏感数据在使用和流转过程中的安全,防止其在非授权场景下被直接暴露。它通过对已识别的敏感数据(依赖于“数据分类分级”的结果)应用各种“遮蔽”或“变形”算法,确保数据在不同场景下以安全的方式呈现。
静态脱敏
作用:在数据从源端写入目标端的过程中,直接对敏感数据进行永久性的替换和脱敏。目标数据源中存储的即是脱敏后的数据,原始数据不再存在。
场景:主要用于 DataWorks数据集成的实时同步任务。例如,将生产库的真实用户数据脱敏后,同步到开发或测试环境,供开发人员安全使用。
特点:
物理替换:脱敏结果是固化的,安全性高。
数据水印:支持在脱敏过程中嵌入不可见的数字水印,一旦发生数据二次泄露,可通过水印信息追溯到原始泄露来源。
动态脱敏
作用:在用户查询和访问数据时,根据预设的策略实时地对敏感数据进行脱敏处理。物理存储的原始数据保持不变,不同的人访问同一份数据会看到不同的结果。
场景:用于控制生产环境中不同角色用户的数据可见性。例如,普通客服查询用户表时,手机号显示为“138****1234”;而其主管则可以看到完整的手机号码。
特点:
按需脱敏:不改变原始数据,灵活性极高,兼顾了数据安全与业务可用性。
多层防护:
应用层脱敏:策略仅在通过DataWorks特定模块访问时生效。
引擎层脱敏 (MaxCompute/Hologres):策略在数据库引擎层面强制执行,无论通过何种工具访问都必定生效,优先级最高。
核心配置:无论是静态还是动态脱敏,您都需要创建脱敏规则,为指定的数据类型(如“手机号”)选择一种脱敏方式(如哈希、掩盖、替换等)。对于动态脱敏,还需配置脱敏策略,以定义“谁在什么情况下”需要触发这些规则。
限制说明
适用用户:开通DataWorks的专业版、企业版,且在安全中心选择DataWorks新版数据安全的用户。
支持地域:华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华北6(乌兰察布)、华南1(深圳)、西南1(成都)、中国香港、日本(东京)、新加坡、印度尼西亚(雅加达)。
支持计算源:MaxCompute、Hologres。
前提条件
登录DataWorks主账号或RAM账号,且拥有以下权限或角色满足任一条件:
拥有AliyunDataWorksFullAccess权限的账号。
拥有DataWorks租户安全管理员角色的账号。
拥有DataWorks租户管理员角色的账号。
已完成新用户指引。
功能入口
登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的,在右侧页面中单击进入安全中心。
在左侧导航栏中,选择进入页面。
动态脱敏策略
添加脱敏规则
DataWorks的行业模板中,已经对常见的数据类型设定脱敏规则。如果您需要独立设置脱敏规则,请将行业模板中的数据类型设置为停用,并添加新的数据类型。
在数据脱敏页面,点击动态脱敏页签,进入动态脱敏设置页面。
单击动态脱敏页签内的规则页签,进入脱敏规则设置页面。
单击左上角的新增规则按钮,配置动态脱敏方式。关键参数如下:
字段
说明
数据类型
需要脱敏的数据类型。
脱敏方式
用户访问该类型的数据时,采用哪种方式进行数据脱敏。
说明可输入原始数据,校验脱敏后的数据是否符合预期。
应用到脱敏策略
该脱敏规则希望作用的范围,包含用户范围、功能范围、数据范围。
配置完成后,单击确认保存脱敏规则。
添加数据的脱敏策略
单击动态脱敏页签,进入脱敏策略页签。
单击左上角的新增策略按钮,进行策略的配置。
配置生效条件。
在满足生效条件时,脱敏规则生效。配置详情如下:
配置项
说明
策略名称
脱敏规则的名称。
用户范围
支持全部用户或部分用户生效。
DataWorks功能
通过DataWorks指定的功能(数据地图、数据分析、数据开发)访问敏感数据时生效。
覆盖项目
脱敏规则在用户访问指定的项目/数据库中的敏感数据时生效。
数据类型
脱敏规则在用户访问指定的敏感数据类型时生效,规则包含了一个或多个敏感数据类型。
重要必须先配置针对该数据类型的脱敏规则并启用。
配置例外条件(白名单)。
在满足以下条件时,脱敏规则不会生效。配置详情如下
配置项
说明
数据类型
访问的目标数据归属的数据类型,用户访问这些数据,不会执行脱敏。
说明数据类型必须先配置并启用脱敏规则。
加入白名单的用户
一个或多个RAM用户或用户组;这些用户访问指定的数据类型,不会执行脱敏。
生效时间范围
配置例外条件(白名单)的生效时间,可按时间段配置或直接配置为永久生效
调整脱敏规则顺序:通过操作列的更多处的上移/下移的方式调整脱敏策略的匹配顺序。
开启动态脱敏
对于开启状态工作空间下的已配置脱敏规则的数据类型,根据脱敏策略列表按匹配顺序依次检查,执行第一个命中的脱敏策略。
您需要在工作空间中开启动态脱敏,开启后DataWorks的动态脱敏策略数据开发、数据分析的脱敏功能生效。
单击动态脱敏页签内单击进入工作空间管理页签。
在工作空间管理页签,可在状态列对单个空间进行开启或禁用,亦或是勾选多个空间后,在左下角进行批量开启或批量禁用。
引擎脱敏
引擎脱敏支持MaxCompute和Hologres,除了支持的脱敏算法有区别,其他配置方式和动态脱敏策略类似。请直接参考动态脱敏策略操作。
静态脱敏
静态脱敏在数据写入目标端时,对敏感数据进行物理替换。脱敏后的数据将永久覆盖原始数据。
静态脱敏规则仅对配置该功能的DataWorks数据集成的实时同步任务生效。默认开启,您可按需关闭。
在数据脱敏页面,单击静态脱敏页签,进入静态脱敏规则列表。
单击左上角的新增规则按钮,配置静态脱敏规则。关键参数如下:
配置项
说明
数据类型
选择需要应用脱敏规则的数据类型,例如“银行卡号”。支持选择已有类型或新增。
脱敏规则名称
为该规则命名,名称应清晰易懂。
脱敏方式
选择脱敏算法,如掩盖脱敏、哈希脱敏、自定义保格变换等。
掩盖脱敏:可精确定义脱敏或保留的字符区间。例如,
从左至右第1到2位掩盖,第3到4位不掩盖。哈希脱敏:设置加盐值用于增加哈希加密的安全性。
自定义保格变换:设置脱敏特征值和待替换字符集。
数据水印
开启时,在执行数据脱敏操作的同时,系统会向脱敏数据中嵌入不可见水印信息。该水印可用于对敏感数据进行溯源追踪。详情可参见数据溯源。
是否启用
选择立即启用或暂不启用。只有启用的规则才会在相关同步任务中生效。
效果验证
提供一个校验工具,您可在原始数据框中输入示例数据,点击立即验证,查看脱敏后的数据是否符合预期。
配置完成后,单击确认保存规则。