数据安全中心 DSC(Data Security Center)现已支持基于“AI大模型 + 专家小模型 + 传统正则规则”融合架构的敏感数据分类分级能力。相较以往仅依赖正则表达式与关键词规则进行识别的方式,新方案在覆盖范围、准确性和智能化水平上实现显著提升。
主要改进包括:
识别能力升级
融合通义大模型与领域专家小模型,支持800余种数据类型的自动识别,涵盖结构化数据(如数据库字段)、非结构化数据(如文档、图片、日志等)。识别效果提升
突破传统规则方法对语义隐含、格式多变或上下文敏感内容的识别瓶颈,显著提高准确率与召回率。灵活配置与高效响应
支持自定义分类分级策略,并提供毫秒级推理响应,满足不同业务场景下的合规与治理需求。无缝集成与部署
通过云原生架构一键接入现有数据安全体系,无需改造基础设施,快速启用智能分类分级能力。
该能力的开放标志着敏感数据识别从“规则驱动”迈入“AI驱动”阶段,为企业构建精准、高效、可扩展的数据安全防护体系提供核心支撑。
操作步骤
已开启分类分级功能
DSC根据购买的数据识别额度,按以下标准赠送AI检测额度:
每1万张数据识别-数据库表数,赠送60,000次AI文本检测额度;
每1 TB数据识别-存储识别量,赠送4,000次AI文本检测额度及4,000次AI图片检测额度。
若您已购买 DSC 并为数据资产启用了分类分级功能,系统将自动应用所赠送的 AI 检测能力,用于数据的分类分级。
未开启分类分级功能或未购买数据安全中心
若您尚未购买数据安全中心,请访问数据安全中心购买页进行购买,若购买仅采购增值服务版,则必须单独开通数据识别功能(高级版与企业版默认已包含该功能)。更多购买与选型信息,请参见购买数据安全中心。
DSC根据购买的数据识别额度,按以下标准赠送AI检测额度:
每1万张数据识别-数据库表数,赠送60,000次AI文本检测额度;
每1 TB数据识别-存储识别量,赠送4,000次AI文本检测额度及4,000次AI图片检测额度。
一键开启AI数据识别:前往数据安全中心控制台的总览页面,弹出一键开启AI数据识别页面,根据页面指引,一键开启所有云上资产的分类分级功能。
指定资产开启AI数据识别:前往数据安全中心控制台,在左侧导航栏,选择资产中心。然后单击“资产同步”并定位至目标资产,单击其分类分级列的
开启功能。具体操作,请参见资产中心(新版)。
分类分级功能开启后,系统将自动应用所赠送的 AI 检测能力,用于数据的分类分级。可以在左侧导航栏,选择,查看分类分级结果。
额度消耗规则与定价
离线识别场景:
识别每TB文本文件,平均需调用文本检测10万次;
识别每万张数据表,平均需调用文本检测300万次;
识别每TB图片,平均需调用图片检测100万次。
API调用场景:
文本检测:每条输入文本若包含至少一条敏感信息,则消耗1次调用次数;单次输入文本长度不得超过2000字符,超出则不予检测;
图片检测:每检测一张图片消耗1次调用次数;单张图片大小不得超过10MB,超出则不予检测。
功能项 | 定价 |
AI文本检测 | 调用次数:15元/万次/月 |
AI图片检测 | 调用次数:30元/万次/月 |
AI检测额度耗尽处理
当 AI 检测额度耗尽时,存在如下影响:
文本识别:所有识别模型将停止调用AI大模型,导致识别准确度下降15%至30%。
图片识别:DSC将无法对图片进行识别。
此时,DSC 控制台将提示您进行升级。推荐按页面指引,或在总览页面单击升级按钮,进入升级流程。在升级页面的AI数据安全检测区域,分别选择所需的AI文本检测与AI图片检测调用次数,完成升级。
为节约额度消耗,您也可以手动控制识别模型或OSS识别任务的AI大模型调用状态。
识别模型:前往,在识别模型页签中定位至目标识别模型,并单击其大模型调用列中的开关图标以关闭该功能,此操作在非必要情况下不建议执行。更多信息,请参见查看和配置识别模板。
OSS识别任务:前往,在识别任务页签,选择OSS,然后单击新建识别任务。在新增识别任务页面,关闭大模型图片检测开关。更多信息,请参见通过识别任务扫描敏感数据。
附录:支持大模型调用的识别模型
支持大模型调用的识别模型的名称如下:
地址类
地址(马来西亚)
地址(英文)
地址(中国内地)
住址
姓名类
姓名(马来西亚)
姓名(英文)
姓名(繁体中文)
姓名(简体中文)
个人姓名
身份/证件类
护照号(中国内地)
美国社会安全号码(SSN)
身份证号(中国香港)
护照
身份证
联系方式类
固定电话(美国)
固定电话(中国内地)
个人电话号码
银行/支付类
信用卡号
银行卡号(中国内地)
银行账户
组织/企业资质类
税务登记证号码
统一社会信用代码
组织机构代码
营业执照号码