合规审计
概述
在AI时代,合规审计不再是传统的IT检查,而是保障企业AI战略可持续发展的核心支柱。它旨在通过系统性的检测、治理和追溯机制,确保AI系统在数据安全、模型伦理、内容合规等全生命周期内,始终满足内外部法规要求和风险控制标准。本章将提供一套整合了AI安全产品与治理能力的合规审计方案,帮助您构建一个安全、可信、负责任的AI Landing Zone。
背景与挑战
AI技术的引入,在带来巨大机遇的同时,也给企业的合规审计工作带来了前所未有的挑战:
新型风险的涌现:除了传统的数据泄露和系统漏洞,企业还必须应对AI特有的新型风险,如模型偏见与歧视、对抗性攻击(提示注入、模型窃取)、生成内容合规性,以及复杂的软件供应链安全问题。
法规环境的复杂性与动态性:全球范围内针对AI的法规(如中国《生成式人工智能服务安全基本要求》、欧盟AI法案)正快速演进,要求企业不仅要保护数据,还要确保算法的透明度、公平性和可解释性,合规门槛显著提高。
跨技术栈的审计难度:AI应用横跨MaaS、PaaS、IaaS多层架构,每一层都有其独特的合规风险点。如何对一个覆盖了第三方MaaS服务、自建PaaS平台和底层IaaS设施的复杂系统进行端到端的、一致性的审计,是一个巨大的技术挑战。
持续监控与自动化治理的需求:云环境和AI模型的动态变化特性,使得传统的定期、手动审计模式捉襟见肘。企业亟需建立一套能够持续监控配置变更、实时发现违规行为,并能进行自动化修复的闭环治理体系,以应对敏捷迭代带来的合规风险。
具体方案
为应对上述挑战,我们构建一套覆盖“风险识别、策略实施、审计追溯”的全流程合规审计方案。
分层合规风险与应对
以下以百炼、PAI、ACS为主要参考分别从MaaS、PaaS、IaaS三个层面分别介绍AI场景下面临的合规风险和应对。
MaaS层:百炼
在MaaS层,企业主要使用预训练大模型或定制化模型进行推理服务,需要保障推理链路的安全可信。
数据传输保护:基于PrivateLink进行私网链接传输,端到端加密传输
数据存储保护:使用KMS对依赖的对象存储、云盘等进行存储加密
应用安全防护:使用WAF、云安全中心对SQL注入、命令注入等漏洞进行防护
内容安全:使用AI安全护栏对模态违规内容如涉政、色情、暴力等进行监测
供应链安全:使用云安全中心对危险组件进行监测与告警
身份与访问控制:使用RAM进行细粒度授权管理、使用KMS进行凭证保护
Prompt安全:使用AI安全护栏防御算力滥用与拒绝服务、防御越狱攻击等
PaaS层:PAI
PAI依赖的云产品
PAI产品功能 | 依赖云产品 | 依赖说明(使用场景) |
Designer | MaxCompute | Designer中提供上百种基于MaxCompute框架实现的阿里自研算法 |
OSS | 使用深度学习算法组件依赖OSS数据源 | |
Flink | Designer中提供了几十种基于Flink框架实现的阿里自研算法 | |
iTag | OSS | 标注数据集的输入和输出,依赖于OSS数据源 |
DSW/DLC | NAS | 文件持久化存储需要 |
OSS | 数据存储需要 | |
AutoML | MaxCompute | 超参调优实验可运行在MaxCompute上 |
OSS | 数据存储需要 | |
EAS | API网关 | 通过API网关的公网调用 |
OSS | 读取OSS的模型文件 | |
SLS | 配置日志写入到SLS | |
VPC | VPC高速直连 | |
云监控 | 服务监控报警 | |
AI资产 | ACR | 用户在镜像管理中新建自定义镜像需要 |
在PaaS层,企业通过人工智能平台PAI进行一站式的AI研发,涵盖数据收集、模型开发、模型训练、模型部署等。需关注以下合规风险:
模型可信:基于人工智能平台PAI提供的Responsible AI (RAI) 相关能力,贯穿 AI 模型的开发、训练、微调、评估、部署等环节,是保障AI模型安全、稳定、公平、符合社会道德的重要方法。
数据安全:使用HTTPS对模型部署服务进行安全访问,同时对人工智能平台PAI依赖的存储组件如OSS、NAS等进行存储加密,实现数据集、模型等数据文件的存储安全。基于阿里云存储产品的高可用,保证用户数据安全可靠。基于存储产品的备份能力进行定期备份,用于异常恢复。
基础设施安全:保障依赖云产品的网络及数据安全。PAI提供基于AIMaster的容错监控能力,能有效进行任务监控、容错判断和资源控制。基于算力健康监测对分布式训练任务的算力资源健康度与性能进行检查。
监控与日志:通过云监控对模型训练及推理服务进行全方位事件和异常监控。基于操作审计和配置审计对云上的操作和资源变更进行持续的跟踪。
IaaS层:ACS
在IaaS层,企业依赖底层基础设施运行AI系统。以ACS为例,应重点关注如下合规风险:
数据安全:使用阿里云KMS进行Secret的落盘加密,基于私网和安全协议进行数据传输,确保敏感数据在存储、传输和处理过程中得到有效的保护,降低数据泄露的风险。
网络安全防护:谨慎开启公网访问,同时基于WAF、DDoS等安全产品进行全方位网络安全防护。
主机安全加固:启用云安全中心对主机进行漏洞和镜像安全扫描,提升主机安全防护能力。基于云监控对主机进行运行时水位监控,保障主机的健康运行。
身份权限安全:遵循最小授权原则,合理使用RAM与RRSA,实现Pod级别的精细化权限控制。
高可用架构:使用局域级多可用的集群,提升集群的可用性。并在数据面进行有效备份,具备应急情况下快速恢复的能力。
实施持续合规策略

为了帮助客户实现持续的合规监控与治理,阿里云提供了一套覆盖事前、事中和事后的全方位策略能力。具体而言:
事前:通过对IaC(基础设施即代码)代码扫描,主动识别潜在的合规风险,确保资源配置在部署前符合规范。在配置审计启用事前规则,基于自动化服务台、资源编排、Terraform等创建资源时进行主动扫描和防范。
事中:基于管控策略实时拦截违规操作,防止高风险配置或零容忍问题的发生,保障云上环境的安全性与合规性。
事后:依托配置审计服务,启用合规包对资源配置进行全方位的持续检测与治理,及时发现并修复不合规资源,确保云上环境始终处于合规状态。
这一全流程治理方案能够有效降低合规风险,助力企业构建安全、稳定且高效的云上架构。
审计追溯
阿里云通过操作审计与配置审计为企业在云上分别提供面向操作和资源的审计追溯能力。

操作审计
操作审计聚焦于对用户、系统和服务在云环境中的各类操作行为进行监控和记录,实现对管控面与数据面事件的统一采集、存储与分析。默认提供90天的事件查询,企业可以通过设置跟踪对更长时间范围内的事件进行归档和追溯。
管控事件:记录所有通过OpenAPI发起的资源管理操作,如创建ACS训练集群、修改百炼知识库配置、删除OSS Bucket等。
数据事件:进一步捕获对数据内容本身的访问与操作行为,例如OSS对象的读写、表格存储OTS的数据表查询等。
配置审计
配置审计是一项面向资源的审计服务,可以帮助您实现持续的基础设施的合规监管。
资源跟踪:记录企业云上资源全生命周期的变更记录,并默认提供10年的历史查询。
合规检测和取证:提供丰富的检测模板和自定义能力,帮助企业实现一站式的云上合规管理落地。同时提供基于API和事件推送的集成能力、基于合规检测的报告能力,满足企业内外部对云上资源合规的举证需求,显著提升审计效率。
总结
在AI和云计算时代,合规审计不再是事后的、静态的检查,而是一个贯穿始终的、主动的、动态的治理过程。一个有效的合规审计体系能够帮助企业在拥抱技术创新的同时,稳健地管理风险。
核心建议是:
采取分层治理模型:根据AI业务所处的平台层级(MaaS/PaaS/IaaS),识别并应对各层独特的合规风险,从数据安全、模型可信到基础设施加固,层层设防。
实施全流程合规策略:建立“事前预防(IaC扫描)、事中拦截(管控策略)、事后检测(配置审计)”的闭环治理体系,将合规性左移至开发阶段,并确保持续监控。
建立不可篡改的审计追溯链:利用操作审计和配置审计,对所有“操作行为”和“资源状态变更”进行全面、统一的记录和归档,为安全事件调查和合规举证提供坚实的数据基础。
通过构建这样一套“事前有标准、事中有监控、事后可追溯”的自动化审计体系,您可以自信地向监管机构、客户和合作伙伴证明您的AI业务是安全、合规和值得信赖的。