AI应用防护是Web应用防火墙(Web Application Firewall,简称WAF)3.0新推出的针对人工智能系统及其应用场景采取的一系列安全措施,旨在保护AI模型、数据、基础设施以及业务流程免受攻击、滥用或意外风险的影响。本文将为您详细介绍如何配置提示词攻击防护和自定义响应。
什么是AI应用防护
随着AI模型在自然语言处理、图像识别、智能推荐等领域的广泛应用,其强大的生成能力和高效的处理效率为众多行业带来了前所未有的机遇。然而,在开发和运营AI应用、AI Agent时,开发者和AI企业往往面临安全威胁,包括请求内容合规风险、提示词注入攻击、越狱指令、角色扮演诱导等,这些AI风险的出现,不仅威胁到业务的正常经营、更为企业带来极大的合规和社会风险。因此,AI应用的安全防护是一个不可忽视的重要环节,AI应用防护为用户提供了提示词攻击检测和自定义响应功能。
AI应用防护功能优势
AI应用防护集成了阿里云AI安全护栏产品,提供提示词注入攻击和角色越狱攻击检测,支持请求合规检测,并结合WAF拦截和响应替换等防护措施,实时阻断风险并确保业务安全无忧。
提示词攻击检测:专业防御针对生成式AI的注入式攻击,精准识别越狱指令、角色扮演诱导、系统指令篡改等对抗性攻击行为,构建AI系统的“免疫防线”。适用场景包括AI Agent的指令交互安全防护、开放域对话系统的对抗攻击防御、第三方插件调用的权限管控等场景。
实时防护与响应:结合WAF拦截和响应替换等防护措施,实现对异常行为的实时阻断和响应内容的自动替换,保障业务安全运行。
开通AI应用防护服务
开通AI应用防护服务前,您需要先开通包年包月版WAF 3.0或按量付费版WAF 3.0服务并且将Web业务添加为WAF 3.0的配置防护对象和防护对象组。
登录Web应用防火墙3.0控制台。在顶部菜单栏,选择WAF实例的资源组和地域(中国内地、非中国内地)。
在左侧导航栏,选择。
在AI应用防护页面,单击申请免费公测,按照WAF-AI应用防护模块POC申请页面的提示,填写试用申请信息并单击提交。
阿里云工程师在收到试用申请的一周内,将通过提交的联系方式联系您,与您确认试用相关事宜。试用申请审核通过后,您的WAF实例会自动开通AI应用防护功能。