数据溯源功能支持提取数据泄露文件中的水印信息,以协助组织识别可能导致数据泄露的相关细节,包括责任人、泄露时间及其他关键数据。该功能旨在提供全面的追踪能力,确保在数据泄露事件发生时能够迅速采取有效措施,从而降低潜在风险,提升组织的数据安全性与合规性。本文将详细介绍数据溯源功能的相关信息,以帮助您更好地理解和利用该功能。
数据溯源链路说明
数据溯源功能允许您在发生数据泄露后,通过分析泄露的文件来精准定位泄露源头,追查到具体的操作人和操作行为。为确保该功能能够成功生效,必须满足以下三个环环相扣的前置条件:
条件一:数据已被识别为“敏感”
这是所有保护和溯源功能的基础。您必须首先在中,完成对相关数据的敏感识别。
具体操作:确保目标数据字段(如
user_phone)已经被识别任务扫描,并成功标记为某个具体的数据类型(如“手机号”)。
条件二:数据在传输时应用“脱敏”
溯源能力并非对所有数据都有效,它强依赖于在数据流转的特定环节中应用数据脱敏。
具体操作:您必须在模块中,为上述的数据类型(“手机号”)配置一条脱敏规则,并配置脱敏策略(即生效范围)。
条件三:脱敏规则中启用“数据水印”
这是实现溯源的核心技术关键。数字水印并非默认开启。
具体操作:在配置或编辑上述的脱敏规则时,必须明确地将数据水印选项设置为开启状态。只有这样,系统才会在执行脱敏的同时,将包含操作人、时间、SQL等溯源信息的不可见水印嵌入到脱敏后的数据中。
只有当一份数据完整地经历了以上三个步骤的处理,您后续从数据分析、数据开发等模块查询并导出的这份已脱敏且含水印的数据文件(如CSV),才能被数据溯源功能成功解析,最终追查到其原始的泄露路径。
限制说明
适用用户:开通DataWorks的专业版、企业版,且在安全中心选择DataWorks新版数据安全的用户。
支持地域:华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华北6(乌兰察布)、华南1(深圳)、西南1(成都)、中国香港、日本(东京)。
支持计算源:MaxCompute、Hologres。
前提条件
登录DataWorks主账号或RAM账号,且拥有以下权限和角色满足任一条件:
拥有AliyunDataWorksFullAccess权限的账号。
拥有DataWorks租户安全管理员角色的账号。
拥有DataWorks租户管理员角色的账号。
已完成新用户指引。
新建数据溯源任务
登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的,在右侧页面中单击进入安全中心。
在左侧导航栏,选择进入页面。
在数据溯源页面,单击左上角的新建任务按钮,新建数据溯源任务。
说明数据溯源任务支持上传扩展名为.csv的文件。
文件大小不能超过200M。
建议文件中的数据大于500条。
查看数据溯源结果
仅支持识别配置数据脱敏时添加数字水印的操作产生的结果。
数据溯源任务的任务状态为已完成时,您可以单击操作列的查看按钮,查看溯源结果。
如果检测到疑似泄露源信息,您可以获得以下信息:
字段 | 说明 |
水印相似度 | 水印相似度越高,表明该操作泄密的概率越高。 |
操作者 | 该操作使用的账号信息。有可能是用户登录账号,也可能是数据源的默认访问身份指定的RAM账号或主账号。 |
操作时间 | 该操作发生的具体时间点。 |
项目 | 该操作访问的项目名称/数据库名称。 |
操作行为 | 该操作的类型。如果是SQL语句,您可以通过复制获取完整的SQL语句。 |
删除数据溯源任务
您可在操作列中删除对应数据溯源任务,或多选后批量删除任务。删除后,您无法下载溯源文件,也无法查看溯源任务结果。