大模型生成内容流式审核方案

本方案适用于在大模型流式生成内容过程中进行动态、实时审核于管控。

大模型流式审核方案

客户应用在接收到用户Prompt后,调用大模型进行推理并流式生成文本内容。为确保内容安全,生成的文本需经护栏系统检测且确认无风险后方可对用户透出。

  • 通常,流式内容检测采用以下几种切片机制,累计一定字符后触发审核:

    • 切片方式一:按字符数切片:每累计满N个字符,将该N个字符作为一个批次进行审核。

    • 切片方式二:滑动窗口切片:每新增X个字符即触发一次审核,送检最近生成的N个字符。该方式可保留上下文语义,降低用户等待感知。

高性能检测服务

如果您希望将每个切片的审核时间尽量控制在100ms以内,推荐采用我们高性能版的service。

  • response_security_check_hp

重要
  • service适用于采用切片方式一,即按字符数切片的方式。

  • 当您采用流式审核方案时,为实现关联多切片审核,入参需要传入以下字段:

    • chatId(用于唯一标识一轮“用户输入 + 大模型输出”的交互记录)

    • done(标识该切片为本轮对话的终止标识)

  • 具体参考多模态API接入指南

检测结果处理建议

  • 若检测结果为无风险,可将对应文本内容逐步呈现给用户;

  • 若检测发现风险,建议立即停止后续内容输出,并对已透出的风险内容执行撤回操作,或替换为预设的合规代答内容,以保障用户体验与内容安全。