通过独享集群对数据进行分类分级

更新时间:
复制为 MD 格式

默认情况下,数据安全中心 DSC(Data Security Center)的敏感数据分类分级服务通过共享集群提供。如需满足更高的安全与合规要求,可开通并使用DSC独享集群。

方案架构

本方案通过在业务VPC中创建终端节点,连接数据安全中心独享集群,由ECS实例调用数据安全中心接口实现敏感数据的分类分级。全链路采用私网通信,基于数据安全中心与百炼独享集群构建,确保数据处理过程与其他租户隔离。

image

实施步骤

步骤一:开通独享集群服务

说明

涉及到专属部署,如需购买或配置该能力,请先通过您的客户经理联系产研团队。

  1. 操作入口:

  2. 定位至AI数据安全网关,启用该功能,并根据业务需求选择文本检测图片检测的 QPS。各检测类型的 QPS 消耗规则如下:

    • 文本/文件检测:每条敏感信息消耗 1 QPS(文本检测)。 

    • 图片检测:每次调用消耗 1 QPS(图片检测);若图片中包含敏感信息,每条额外消耗 1 QPS(文本检测)。 

    • 图片脱敏:每次调用消耗 2 QPS(图片检测);若图片中包含敏感信息,每条额外消耗 1 QPS(文本检测)。

  3. 购买并完成支付。

步骤二:与DSC网络联通

  1. 在存放待分类分级数据的业务 VPC 中创建 ECS 实例,用于后续调用 DSC 接口执行数据分类分级处理。ECS 实例的创建步骤,请参见创建实例

    说明

    在多云或线下 IDC 场景下,请优先打通网络与云上 VPC 的连接,具体操作,请参见通过物理专线实现本地IDC与云上VPC互通

  2. 前往终端节点 - 创建终端节点页面完成以下配置,未提及的配置项保持默认设置。

    配置项

    说明

    所属地域

    选择业务 VPC所在地域。

    节点名称

    设置一个便于识别的名称。

    终端节点类型

    选择接口终端节点

    终端节点服务

    使用选择可用服务,并从列表中选择AI数据安全网关服务

    专有网络安全组可用区与交换机

    选择业务 VPC,以及此VPC下的安全组与交换机。

  3. 终端节点创建完成后,请登录所创建的 ECS 实例,执行 ping <终端节点域名> 命令以测试连通性。

步骤三:验证分类分级接口

DSC独享集群支持对文本文件图片进行分类分级检测;其中,文本图片还支持脱敏处理。可登录上一步创建的ECS实例,执行以下命令进行测试:

文本检测与脱敏

调用地址https://<替换为您的终端节点域名>:8443/sddpApi/textDetection

请求参数

名称

类型

描述

Text

String

待检测的文本。

Lang

String

返回值的语言:

  • zh-中文

  • en-英文

返回参数

名称

类型

描述

code

Integer

响应状态码。

desensitization

String

脱敏后的字符串。

requestId

String

请求ID。

sensitiveData

Array

检测到的敏感数据列表。

sensitiveData.id

Integer

敏感数据规则ID

sensitiveData.desc

String

敏感数据类型描述,例如:“城市(中国内地)”。

sensitiveData.data

Array[String]

检测到的敏感数据内容列表。

sensitiveData.sensitiveLevel

Integer

敏感级别。

sensitiveData.category

String

敏感数据分类,例如:“个人地理位置信息”。

sensitiveData.count

Integer

命中的敏感数据数量。

请求示例:

curl -k -X POST \
  -d "Text=欢迎来到北京" \
  -d "Lang=zh" \
  https://<替换为您的终端节点域名>:8443/sddpApi/textDetection

返回示例:

{
    "code": 200,
    "desensitization": "欢迎来到北京",
    "requestId": "2026****1003",
    "sensitiveData": [
        {
            "id": 1739,
            "desc": "城市(中国内地)",
            "data": [
                "北京"
            ],
            "sensitiveLevel": 0,
            "category": "个人地理位置信息",
            "count": 1,
        }
    ]
}

文件检测

调用地址https://<替换为您的终端节点域名>:8443/sddpApi/fileDetection

请求参数

名称

类型

描述

file

file

待检测的文件。 

Lang

String

返回值的语言:

  • zh-中文

  • en-英文

返回参数

名称

类型

描述

code

Integer

响应状态码。

requestId

String

请求ID。

sensitiveData

Array

检测到的敏感数据列表。

sensitiveData.id

Integer

敏感数据规则ID。

sensitiveData.desc

String

敏感数据类型描述,例如:“城市(中国内地)”。

sensitiveData.data

Array[String]

检测到的敏感数据内容列表。

sensitiveData.sensitiveLevel

Integer

敏感级别。

sensitiveData.category

String

敏感数据分类,例如:“个人地理位置信息”。

sensitiveData.count

Integer

命中的敏感数据数量。

请求示例:

curl -k -X POST \
  -F "file=@/home/admin/test.txt" \
  -F "Lang=zh" \
  https://<替换为您的终端节点域名>:8443/sddpApi/fileDetection

返回示例:

{
    "code": 200,
    "requestId": "2026***03",
    "sensitiveData": [
        {
            "id": 1739,
            "desc": "城市(中国内地)",
            "data": [
                "北京"
            ],
            "sensitiveLevel": 0,
            "category": "个人地理位置信息",
            "count": 1,
        }
    ]
}

图片检测

调用地址https://<替换为您的终端节点域名>:8443/sddpApi/imageDetection

请求参数

名称

类型

描述

file

file

待检测图片。 

Lang

String

返回值的语言:

  • zh-中文

  • en-英文

返回参数

名称

类型

描述

code

Integer

响应状态码。

requestId

String

请求ID。

sensitiveData

Array

检测到的敏感数据列表。

sensitiveData.id

Integer

敏感数据规则ID。

sensitiveData.desc

String

敏感数据类型描述,例如:“城市(中国内地)”。

sensitiveData.data

Array[String]

检测到的敏感数据内容列表。

sensitiveData.sensitiveLevel

Integer

敏感级别。

sensitiveData.category

String

敏感数据分类,例如:“个人地理位置信息”。

sensitiveData.count

Integer

命中的敏感数据数量。

请求示例:

curl -k -X POST \
  -F "file=@/home/admin/test.jpeg" \
  -F "Lang=zh" \
  https://<替换为您的终端节点域名>:8443/sddpApi/imageDetection

返回示例:

{
  "code": 200,
  "requestId": "20260***03",
  "sensitiveData": [
    {
      "id": 1739,
      "desc": "城市(中国内地)",
      "data": [
        "北京"
      ],
      "sensitiveLevel": 0,
      "category": "个人地理位置信息",
      "count": 1,
    }
  ]
}

图片脱敏

调用地址https://<替换为您的终端节点域名>:8443/sddpApi/imageMask

请求参数

名称

类型

描述

file

file

待检测图片。 

MaskRuleIdList

String

脱敏规则 ID 列表,用,分隔符进行连接。规则 ID 映射关系如下:

  • 3000:包含身份证信息的图片(中国内地)。

  • 3009:包含车牌信息的图片(中国内地)。

  • 3002:包含人脸信息的图片。

  • 1002:姓名(简体中文)。

  • 1003:地址(中国内地)。

  • 4003:统一社会信用代码。

  • 63009:包含人脸眼部信息的图片。

返回参数

名称

类型

描述

base64

String

脱敏后的base64图片编码。

code

Integer

响应状态码。

requestId

String

请求ID。

请求示例:

curl -k -X POST \
  -F "file=@/home/admin/test.jpeg" \
  -F "MaskRuleIdList=3002,3000,1002" \
  https://<替换为您的终端节点域名>:8443/sddpApi/imageMask

返回示例:

{
    "base64": "/9j/RYQcic*****6cqbVqX",
    "code": 200,
    "requestId": "2026***4f"
}

配额与限制

  • 输入文件/文本大小不得超过10 MB。

  • 输入图片大小不得超过5 MB。