接入大模型 API 时,需要对用户输入和模型输出进行内容安全检测。本文介绍如何开通 AI 安全护栏(AI Guardrails)按量付费服务,以及各审核类型的计费规则。
开通 AI 安全护栏按量付费后,默认支持内容合规检测服务。如需检测敏感内容或提示词攻击,需在控制台打开相应的功能开关后才可使用这两项检查功能(下文有相应的介绍)。
前提条件
AI 安全护栏开通需要账号完成实名认证。具体操作,请参见 如何选择实名认证方式。
开通AI 安全护栏按量付费
开通 AI 安全护栏按量付费不收费,系统按实际用量计费。具体计费规则如下:
根据业务场景选择合适的接入方式:
API 接入:通过 API 直接调用审核服务,适用于独立使用 AI 安全护栏的场景。
AI 网关集成接入:通过 AI 网关统一管理多个大模型的审核策略,适用于多模型混合调用的场景。
百炼集成接入:在百炼平台内直接调用 AI 安全护栏,适用于已使用百炼平台的用户。
接入方式 | 审核类型 | 支持的业务场景(服务) | 计费单价 |
API 接入/AI 网关集成接入 | 文本审核-按次-高级 text_guard_advanced |
重要 query_security_check_pro 与 response_security_check_pro 已正式上线,其在内容合规防护维度上对检出标签进行了细粒度划分,标签总数较前一版本显著增加。
| 15 元/万次 |
API 接入 | 图片审核-按次-高级 image_guard_advanced |
| 30 元/万次 |
API 接入 | 文件同步审核--按次-高级 file_guard_sync_advanced |
| 20 元/万条切片 重要 对文件中文本内容按 2000 字符进行切片,系统会按切片的数量进行计量 |
API 接入 | 文图审核-按次-高级 text_image_guard_advanced | 多模态(文本图片)内容安全检测 (text_img_security_check) | 45 元/万次 |
API 接入 | 自定义检测 Agent-按次-基础 text_guard_llm_standard |
| 20 元/万条切片 重要
|
API 接入 | 自定义检测 Agent-按次-高级 text_guard_llm_advanced |
| 40 元/万条切片 重要
|
API 接入/AI 网关集成接入 | 敏感内容审核-按次-高级 text_sddp_advanced |
| 15 元/万次 |
API 接入/AI 网关集成接入 | 提示词攻击审核 text_guard_prompt_attack |
| 15 元/万次 重要 该项功能已于 2026 年 01 月 22 日正式开始商业化收费,如不需要使用该服务,请在 AI 安全护栏产品控制台关闭服务,以免产生费用。 |
API 接入 | 恶意文件检测 | 文件实时检测 (file_security_sync_check) | 当前为公测阶段,开通该功能后,即可免费试用。 |
API 接入 | 数字水印标识 | AIGC 输出图片安全检测(img_response_security_check) | 当前为公测阶段,开通该功能后,即可免费试用。 |
百炼集成接入 | 文本合规审核-按 token-高级 text_guard_token_advanced |
| 0.003 元/千 Token |
百炼集成接入 | 文本合规审核-按 token-基础 text_guard_token_standard |
| 0.0004 元/千 Token |
百炼集成接入 | 敏感内容审核-按 token-高级 text_sddp_token_advanced |
| 0.003 元/千 Token |
百炼集成接入 | 敏感内容审核-按 token-基础 text_sddp_token_standard |
| 0.0004 元/千 Token |
百炼集成接入 | 提示词攻击审核 |
| 15 元/万次 重要 该项功能已于 2026 年 01 月 22 日正式开始商业化收费,如不需要使用该服务,请在 AI 安全护栏产品控制台关闭服务,以免产生费用。 |
百炼集成接入 | 图片审核-按次-高级 image_guard_advanced |
| 30 元/万次 |
通过阿里云百炼集成接入 AI 安全护栏进行单次 query/response 检测时,如果文本的 token 数量不足 1000 个,将按照 1000 个 token 的标准进行计费。若文本的 token 数量超过 1000 个,则将根据实际的 token 数量来计算费用。
AI 安全护栏按量付费会根据不同的检测内容和检测量级进行计量和出账。
前往AI 安全护栏产品开通服务页面
仔细阅读并选中服务协议,单击立即购买。
开通成功后,登录 AI 安全护栏控制台,确认服务状态为已开通。
欠费与充值
AI 安全护栏的计费周期窗口为5 分钟。
阿里云在每一个计费周期窗口根据上一周期窗口的服务使用量出具账单,并从阿里云账户中按账单金额扣划服务费用。
当系统检测到账户处于欠费状态时,将暂停提供服务。待补缴欠费后,可再次使用内容安全服务(5 分钟内生效)。欠费充值具体操作,请参见充值操作指引。
开启检测功能
登录AI 安全护栏产品控制台,在左侧导航栏选择。
在检测项配置列表中,找到目标 Service,单击操作列的管理,进入 Service 管理页面。
在防护维度区域,通过卡片上的开关启用或关闭对应检测功能:
内容合规:默认启用,检测色情、暴力、政治等不良内容。
敏感内容检测:检测可能泄露的个人信息或企业敏感数据,该功能将单独计费。
提示词攻击检测:检测旨在绕过大模型安全限制的恶意提示词,该功能将单独计费。
恶意URL(公测中):扫描大模型内容中的恶意链接,当前免费试用。
模型幻觉(公测中):检测大模型生成的虚假或不准确信息,当前免费试用。
开启成功后,对应功能的开关显示为已开启状态。