在配置发布和MCP发布过程中,可能存在敏感词风险、合规风险、提示词注毒和爆破风险等安全问题。MSE Nacos提供内容安全护栏功能,通过集成安全检测能力,帮助防护相关模型调用的安全风险,提升AI应用的安全水位和稳定性。
前提条件
Nacos实例版本为企业版,且引擎版本为
3.1.1.0及以上。开发版和专业版实例不支持安全护栏功能。
功能说明
安全护栏支持以下防护能力:
防护维度 | 描述 | 防护等级选项 |
恶意 URL 检测 | 检测内容中是否包含恶意链接、钓鱼网站等危险 URL | 不拦截 / 低风险 / 中风险 / 高风险 |
提示词攻击检测 | 检测是否存在 Prompt 注入攻击、越狱攻击等恶意提示词 | 不拦截 / 低风险 / 中风险 / 高风险 |
内容合规检测 | 检测内容是否符合法规要求,包括涉政、暴恐、违禁等违规内容 | 不拦截 / 低风险 / 中风险 / 高风险 |
敏感内容检测 | 检测是否包含隐私信息泄露、敏感数据等内容 | 不拦截 / 低风险 / 中风险 / 高风险 |
防护等级说明:
防护等级决定检测到风险后的处理方式:
不拦截:仅记录日志,不影响发布流程。
低风险:仅对低风险及以上内容进行拦截。
中风险:对中风险及以上内容进行拦截。
高风险:仅对高风险内容进行拦截,容忍度最高。
配置安全护栏
开启安全护栏
登录MSE 管理控制台。
在左侧导航栏,选择注册配置中心 > 实例列表。
在实例列表页面,单击目标实例名称,进入实例详情页。
在左侧导航栏,选择安全防护 > 内容安全护栏,进入安全护栏配置页面。
单击启用开启安全护栏功能。
说明开启后,系统将在配置发布时自动检测发布内容的安全合规性。用户可配置安全策略检测敏感内容及合规问题,如隐私信息泄露风险、恶意脚本注入风险、不合规内容发布风险,提升应用的整体安全性,践行 AI 应用的安全合规最佳实践。
首次使用安全护栏功能时,需要进行服务授权。请按照页面提示完成
AliyunServiceRoleForMSEEngineService角色的授权。
防护策略设置
在防护策略设置页面,根据业务需求,配置各防护维度的拦截策略。
针对恶意 URL 检测、提示词攻击检测、内容合规检测、敏感内容检测四个维度,分别选择合适的防护等级(不拦截/低风险/中风险/高风险)。
配置防护范围,选择需要进行安全检测的场景:
配置项
描述
配置创建与变更
勾选后,对Nacos配置的创建和变更操作进行安全检测。
MCP 服务创建与变更
勾选后,对MCP Server的创建和变更操作进行安全检测。
单击保存变更完成配置。
重要配置完成后,安全护栏立即生效。后续所有相关发布操作都将按照配置的策略进行安全检测。
执行结果
安全护栏配置完成后,当进行配置发布或MCP发布时:
系统自动对发布内容进行安全合规性检测。
根据配置的防护策略,系统执行相应的处理操作(记录日志/告警/拦截)。
可前往安全护栏控制台查看拦截记录。