数据溯源

数据溯源功能支持提取数据泄露文件中的水印信息,以协助组织识别可能导致数据泄露的相关细节,包括责任人、泄露时间及其他关键数据。该功能旨在提供全面的追踪能力,确保在数据泄露事件发生时能够迅速采取有效措施,从而降低潜在风险,提升组织的数据安全性与合规性。本文将详细介绍数据溯源功能的相关信息,以帮助您更好地理解和利用该功能。

数据溯源链路说明

数据溯源功能允许您在发生数据泄露后,通过分析泄露的文件来精准定位泄露源头,追查到具体的操作人和操作行为。为确保该功能能够成功生效,必须满足以下三个环环相扣的前置条件

条件一:数据已被识别为“敏感”

这是所有保护和溯源功能的基础。您必须首先在敏感数据保护 > 数据分类分级中,完成对相关数据的敏感识别。

  • 具体操作:确保目标数据字段(如 user_phone)已经被识别任务扫描,并成功标记为某个具体的数据类型(如“手机号”)。

条件二:数据在传输时应用“脱敏”

溯源能力并非对所有数据都有效,它强依赖于在数据流转的特定环节中应用数据脱敏。

  • 具体操作:您必须在敏感数据保护 > 数据脱敏模块中,为上述的数据类型(“手机号”)配置一条脱敏规则,并配置脱敏策略(即生效范围)。

条件三:脱敏规则中启用“数据水印”

这是实现溯源的核心技术关键。数字水印并非默认开启。

  • 具体操作:在配置或编辑上述的脱敏规则时,必须明确地将数据水印选项设置为开启状态。只有这样,系统才会在执行脱敏的同时,将包含操作人、时间、SQL等溯源信息的不可见水印嵌入到脱敏后的数据中。

只有当一份数据完整地经历了以上三个步骤的处理,您后续从数据分析、数据开发等模块查询并导出的这份已脱敏且含水印的数据文件(如CSV),才能被数据溯源功能成功解析,最终追查到其原始的泄露路径。

限制说明

  • 适用用户:开通DataWorks的专业版、企业版,且在安全中心选择DataWorks新版数据安全的用户。

  • 支持地域:华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华北6(乌兰察布)、华南1(深圳)、西南1(成都)、中国香港、日本(东京)。

  • 支持计算源:MaxCompute、Hologres。

前提条件

  • 登录DataWorks主账号或RAM账号,且拥有以下权限和角色满足任一条件:

    • 拥有AliyunDataWorksFullAccess权限的账号。

    • 拥有DataWorks租户安全管理员角色的账号。

    • 拥有DataWorks租户管理员角色的账号。

  • 已完成新用户指引

新建数据溯源任务

  1. 登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的数据治理 > 安全中心,在右侧页面中单击进入安全中心

  2. 在左侧导航栏,选择进入敏感数据保护 > 数据溯源页面。

  3. 在数据溯源页面,单击左上角的新建任务按钮,新建数据溯源任务。

    说明
    • 数据溯源任务支持上传扩展名为.csv的文件。

    • 文件大小不能超过200M。

    • 建议文件中的数据大于500条。

查看数据溯源结果

重要

仅支持识别配置数据脱敏时添加数字水印的操作产生的结果。

数据溯源任务的任务状态已完成时,您可以单击操作列的查看按钮,查看溯源结果。

如果检测到疑似泄露源信息,您可以获得以下信息:

字段

说明

水印相似度

水印相似度越高,表明该操作泄密的概率越高。

操作者

该操作使用的账号信息。有可能是用户登录账号,也可能是数据源的默认访问身份指定的RAM账号或主账号。

操作时间

该操作发生的具体时间点。

项目

该操作访问的项目名称/数据库名称。

操作行为

该操作的类型。如果是SQL语句,您可以通过复制获取完整的SQL语句。

删除数据溯源任务

您可在操作列中删除对应数据溯源任务,或多选后批量删除任务。删除后,您无法下载溯源文件,也无法查看溯源任务结果。