资产安全为Dataphin提供了数据生命周期中统一的敏感数据识别与保护能力。通过数据分类分级、敏感数据识别、敏感数据脱敏等措施,帮助客户建立完善的数据安全体系,确保数据使用的安全合规性。

应用场景

基于Dataphin实现数据安全保护的一些典型的场景:
  • 场景1:业务数据中敏感数据保护

    您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三

  • 场景2:开发环境数仓建设

    敏感数据从生产环境写入开发环境过程中,您可以使用资产安全内置的敏感数据识别规则和脱敏规则,自动实现敏感数据的脱敏,确保敏感数据始终保留在高权限的生产环境,不会泄露到开发环境。

  • 场景3:脱敏白名单的灵活运用
    您可以使用资产安全的脱敏白名单功能,实现特定时间、特定的用户可以看到最原始的数据。例如:
    • 在某一时间段内,公司高管需要查看明文的财务数据,您可以将该高管设置在脱敏白名单中及设定有效时间段。
    • 在电商领域中,某些特殊场景下需要显示真实销售额用于宣传,您可以开启将某个用户设置在脱敏白名单中及设定有效的时间段,这样就可以看到某天的销售额数据。

功能优势

  • 内置资源多:Dataphin内置了对数据的分级分类、敏感数据识别规则及脱敏算法,能够快速构建基本的数据安全体系。
  • 识别脱敏支持灵活自定义:识别规则支持按照范围、优先级灵活自定义,同时支持手动修改,可以建立多层级多领域的识别规则体系;脱敏规则支持调用多种脱敏算法,同时支持算法参数的自定义,满足不同场景下数据脱敏的需求。
  • 密切结合生产开发场景:在开发生产过程中,资产安全与数据流转场景紧密结合,保障在Dataphin数据开发周期中的数据安全。

相关概念

模块 概念 概念解释
敏感数据识别 数据分级 数据分级是对数据的敏感等级的设定,用于对数据的敏感等级进行区分。Dataphin内置了L1(对外公开)-L4(绝密数据)的通用数据分级;同时也支持客户根据企业情况进行自定义分级。
数据分类 数据分类是对数据使用领域的设定,用于辅助对数据的敏感程度进行区分(例如公司业务数据较敏感,但是生产车间的传感器数据不敏感)。Dataphin内置了公司数据(如公司财务报告)、业务数据(如业务客户数量)、个人数据(如消费者隐私数据)三种数据分类;同时也支持客户根据企业情况进行自定义分级。
识别规则 识别规则是自动化识别敏感字段的策略。因为在实际的生产过程中,往往会有上千张表,上万个字段,这么多字段全部通过人工标注敏感程度并不现实。Dataphin提供了基于规则自动识别敏感字段的功能,可以基于字段的名称或者字段的内容,自动识别出敏感字段。同时,识别规则还支持设置规则优先级扫描范围等细节设定,让能更好的建立完整的识别规则体系。
识别记录 识别记录模块记录了所有识别规则执行后的结果,即某个字段命中了哪条规则,属于什么分级分类的敏感数据。同时,对个别需要特殊处理的字段,支持手动修改识别规则,确保识别结果准确可用。
敏感数据保护 脱敏规则 脱敏规则设定了对识别出的敏感字段的保护方式,目前支持遮盖脱敏哈希脱敏的方式。当前,脱敏规则和识别规则是一一绑定的。如果需要在不同的项目里对同一类字段(如姓名)做不同处理,可以在生效范围上进行限制。
脱敏算法 脱敏算法模块可以看到目前支持的所有脱敏算法,主要包括遮盖脱敏(如张三,脱敏为*三)、哈希脱敏(如加盐MD5)两大类算法。
动态脱敏 不改变底层数据的存储,只在数据进行消费时,进行数据的脱敏。典型应用场景:数据分析场景的即席查询、数据开发场景的生产数据写开发、数据消费里的数据服务等。
静态脱敏 直接修改底层数据的存储,数据存储时就已经是加密或者脱敏过的,例如常见的pn_md5。典型应用场景:数据集成时对敏感数据加密、数仓分层建设时对应用层数据脱敏等。
动态脱敏白名单 应用于特定的场景下,需要暂时对一些用户开发真实数据的查询权限,完成特定的业务目标。典型应用场景:数据研发进行问题排查、特定时期(如双十一)公开销售额数据等。

资产安全使用流程

fagag
  1. 管理数据分类管理数据分级

    定义数据的分类、分级。

  2. 配置识别规则及手动触发识别规则扫描

    Dataphin支持用户自定义识别敏感数据的规则。识别规则配置完成后,每天凌晨会定时扫描数据,您也可以手动触发识别规则立即扫描数据,帮助您有效构建数据安全体系。

  3. 管理识别记录

    查看识别规则的识别结果。

  4. 管理脱敏算法

    选择Dataphin内合适的脱敏算法。

  5. 配置脱敏规则

    为敏感字段配置脱敏规则。