资产安全概述

资产安全为Dataphin提供了数据生命周期中统一的敏感数据识别与保护能力。通过数据分类分级、敏感数据识别、敏感数据脱敏等措施,帮助客户建立完善的数据安全体系,确保数据使用的安全合规性。

前提条件

已购买资产安全增值服务并且当前租户已开通资产安全模块。如需开通,请参见租户管理

应用场景

基于Dataphin实现数据安全保护的一些典型的场景:

  • 场景1:业务数据中敏感数据保护

    您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三。

  • 场景2:开发环境数仓建设

    敏感数据从生产环境写入开发环境过程中,您可以使用资产安全内置的敏感数据识别规则和脱敏规则,自动实现敏感数据的脱敏,确保敏感数据始终保留在高权限的生产环境,不会泄露到开发环境。

  • 场景3:脱敏白名单的灵活运用

    您可以使用资产安全的脱敏白名单功能,实现特定时间、特定的用户可以看到最原始的数据。例如:

    • 在某一时间段内,公司高管需要查看明文的财务数据,您可以将该高管设置在脱敏白名单中及设定有效时间段。

    • 在电商领域中,某些特殊场景下需要显示真实销售额用于宣传,您可以开启将某个用户设置在脱敏白名单中及设定有效的时间段,这样就可以看到某天的销售额数据。

功能优势

  • 内置资源多:Dataphin内置了对数据的分级分类、敏感数据识别规则及脱敏算法,能够快速构建基本的数据安全体系。

  • 识别脱敏支持灵活自定义:识别规则支持按照范围、优先级灵活自定义,同时支持手动修改,可以建立多层级多领域的识别规则体系;脱敏规则支持调用多种脱敏算法,同时支持算法参数的自定义,满足不同场景下数据脱敏的需求。

  • 密切结合生产开发场景:在开发生产过程中,资产安全与数据流转场景紧密结合,保障在Dataphin数据开发周期中的数据安全。

相关概念

模块

概念

概念解释

敏感数据识别

数据分级

数据分级是对数据的敏感等级的设定,用于对数据的敏感等级进行区分。Dataphin内置了L1(对外公开)-L4(绝密数据)的通用数据分级;同时也支持客户根据企业情况进行自定义分级。

数据分类

数据分类是对数据使用领域的设定,用于辅助对数据的敏感程度进行区分(例如公司业务数据较敏感,但是生产车间的传感器数据不敏感)。Dataphin内置了公司数据(如公司财务报告)、业务数据(如业务客户数量)、个人数据(如消费者隐私数据)三种数据分类;同时也支持客户根据企业情况进行自定义分级。

识别规则

识别规则是自动化识别敏感字段的策略。因为在实际的生产过程中,往往会有上千张表,上万个字段,这么多字段全部通过人工标注敏感程度并不现实。Dataphin提供了基于规则自动识别敏感字段的功能,可以基于字段的名称或者字段的内容,自动识别出敏感字段。同时,识别规则还支持设置规则优先级扫描范围等细节设定,让能更好的建立完整的识别规则体系。

识别记录

识别记录模块记录了所有识别规则执行后的结果,即某个字段命中了哪条规则,属于什么分级分类的敏感数据。同时,对个别需要特殊处理的字段,支持手动修改识别规则,确保识别结果准确可用。

敏感数据保护

脱敏规则

脱敏规则设定了对识别出的敏感字段的保护方式,目前支持遮盖脱敏哈希脱敏的方式。当前,脱敏规则和识别规则是一一绑定的。如果需要在不同的项目里对同一类字段(如姓名)做不同处理,可以在生效范围上进行限制。

脱敏算法

脱敏算法模块可以看到目前支持的所有脱敏算法,主要包括遮盖脱敏(如张三,脱敏为*三)、哈希脱敏(如加盐MD5)两大类算法。

动态脱敏

不改变底层数据的存储,只在数据进行消费时,进行数据的脱敏。典型应用场景:数据分析场景的即席查询、数据开发场景的生产数据写开发、数据消费里的数据服务等。

静态脱敏

直接修改底层数据的存储,数据存储时就已经是加密或者脱敏过的,例如常见的pn_md5。典型应用场景:数据集成时对敏感数据加密、数仓分层建设时对应用层数据脱敏等。

动态脱敏白名单

应用于特定的场景下,需要暂时对一些用户开放真实数据的查询权限,完成特定的业务目标。典型应用场景:数据研发进行问题排查、特定时期(如双十一)公开销售额数据等。

资产安全使用流程

image.png

  1. 管理数据分类管理数据分级

    定义数据的分类、分级。

  2. 创建、配置及手动触发识别规则

    Dataphin支持用户自定义识别敏感数据的规则。识别规则配置完成后,每天凌晨会定时扫描数据,您也可以手动触发识别规则立即扫描数据,帮助您有效构建数据安全体系。

  3. 管理识别结果

    查看识别规则的识别结果。

  4. 脱敏算法

    选择Dataphin内合适的脱敏算法。

  5. 管理动态脱敏规则

    为敏感字段配置脱敏规则。

注意事项

使用资产安全进行脱敏敏感数据的同时,会影响敏感数据的开发、查询及分析。当前,主要影响的场景说明如下:

  • 数据查询

    例如,在本地生活服务商中,某地区的订单出现了大量投诉,但因脱敏保护只能看到市级别的地址,无法看到投诉来自哪些街道,影响了业务的开展。

  • 生产数据写开发环境、测试环境数据准备

    例如,脚本任务需要识别手机号的位数,但该脚本任务中的数据表选择了MD5脱敏算法,将11位的手机号变成了32位,导致脚本任务无法识别手机号位数。

因此,在使用资产安全的过程中,您需要结合安全法规及业务场景综合评估,以保证业务正常开展的同时保证资产合规安全。