开启安全护栏

更新时间:
复制为 MD 格式

在配置发布和MCP发布过程中,可能存在敏感词风险、合规风险、提示词注毒和爆破风险等安全问题。MSE Nacos提供内容安全护栏功能,通过集成安全检测能力,帮助防护相关模型调用的安全风险,提升AI应用的安全水位和稳定性。

前提条件

  • 创建MSE Nacos实例

  • Nacos实例版本为企业版,且引擎版本为 3.1.1.0及以上。开发版和专业版实例不支持安全护栏功能。

功能说明

安全护栏支持以下防护能力:

防护维度

描述

防护等级选项

恶意 URL 检测

检测内容中是否包含恶意链接、钓鱼网站等危险 URL

不拦截 / 低风险 / 中风险 / 高风险

提示词攻击检测

检测是否存在 Prompt 注入攻击、越狱攻击等恶意提示词

不拦截 / 低风险 / 中风险 / 高风险

内容合规检测

检测内容是否符合法规要求,包括涉政、暴恐、违禁等违规内容

不拦截 / 低风险 / 中风险 / 高风险

敏感内容检测

检测是否包含隐私信息泄露、敏感数据等内容

不拦截 / 低风险 / 中风险 / 高风险

防护等级说明:

防护等级决定检测到风险后的处理方式:

  • 不拦截:仅记录日志,不影响发布流程。

  • 低风险:仅对低风险及以上内容进行拦截。

  • 中风险:对中风险及以上内容进行拦截。

  • 高风险:仅对高风险内容进行拦截,容忍度最高。

配置安全护栏

开启安全护栏

  1. 登录MSE 管理控制台

  2. 在左侧导航栏,选择注册配置中心 > 实例列表

  3. 在实例列表页面,单击目标实例名称,进入实例详情页。

  4. 在左侧导航栏,选择安全防护 > 内容安全护栏,进入安全护栏配置页面。

  5. 单击启用开启安全护栏功能。

    说明
    • 开启后,系统将在配置发布时自动检测发布内容的安全合规性。用户可配置安全策略检测敏感内容及合规问题,如隐私信息泄露风险、恶意脚本注入风险、不合规内容发布风险,提升应用的整体安全性,践行 AI 应用的安全合规最佳实践。

    • 首次使用安全护栏功能时,需要进行服务授权。请按照页面提示完成AliyunServiceRoleForMSEEngineService角色的授权。

防护策略设置

  1. 防护策略设置页面,根据业务需求,配置各防护维度的拦截策略

    针对恶意 URL 检测、提示词攻击检测、内容合规检测、敏感内容检测四个维度,分别选择合适的防护等级(不拦截/低风险/中风险/高风险)。

  2. 配置防护范围,选择需要进行安全检测的场景:

    配置项

    描述

    配置创建与变更

    勾选后,对Nacos配置的创建和变更操作进行安全检测。

    MCP 服务创建与变更

    勾选后,对MCP Server的创建和变更操作进行安全检测。

  3. 单击保存变更完成配置。

    重要

    配置完成后,安全护栏立即生效。后续所有相关发布操作都将按照配置的策略进行安全检测。

执行结果

安全护栏配置完成后,当进行配置发布或MCP发布时:

  1. 系统自动对发布内容进行安全合规性检测。

  2. 根据配置的防护策略,系统执行相应的处理操作(记录日志/告警/拦截)。

  3. 可前往安全护栏控制台查看拦截记录。