本文介绍Qwen-Omni 实时 API的服务端事件。
相关文档:实时多模态。
服务端事件
error
不论是遇到客户端错误还是服务端错误,服务端会返回错误信息。通常来说,大多数错误都是可恢复的,不会影响会话继续进行。
|
|
session.created
当客户端链接到服务端后,服务端响应的第一个事件,该事件返回时会携带服务端对此次链接的默认配置信息。
|
|
session.updated
当接受到用户的session.update请求并正确处理后返回。如果出现错误,则直接返回实时多模态事件。
|
|
input_audio_buffer.speech_started
server_vad 模式下,服务器在音频缓冲区中检测到语音开始时,系统会返回服务器 input_audio_buffer.speech_started
事件。
每当音频添加到缓冲区时,此事件都可能发生(除非已检测到语音)。
|
|
input_audio_buffer.speech_stopped
server_vad 模式下,服务器在音频缓冲区中检测到语音结束时,系统会返回服务器 input_audio_buffer.speech_stopped
事件。
服务器还将发送一个带有由音频缓冲区创建的用户消息项的 conversation.item.created
事件。
|
|
input_audio_buffer.committed
在server_vad模式下,当检测到用户说话结束时,服务端会自动提交并返回此事件。在非server_vad模式下,当客户端完成音频发送input_audio_buffer.commit事件的服务端响应。
|
|
input_audio_buffer.cleared
客户端发送input_audio_buffer.clear
事件后,服务端将返回input_audio_buffer.cleared
事件。
|
|
conversation.item.created
当对话项创建时返回该事件。
|
|
conversation.item.input_audio_transcription.completed
此事件是用户音频写入用户音频缓冲区后的音频转录输出。Realtime 模型可以接收音频输入,输入音频的转录是一个在单独的自动语音识别模型上运行的独立过程,目前始终为 gummy-realtime-v1
。转录文本可能与模型的解释有所不同,可以被作为参考。
|
|
conversation.item.input_audio_transcription.failed
当开启输入音频转写且用户音频转写失败时,系统会返回服务器 conversation.item.input_audio_transcription.failed
事件。 此事件是与其他 error
事件分开的,以便客户端能够识别相关项。
|
|
response.created
当服务端生成新的模型响应时,会先发送此事件。
|
|
response.done
当响应生成完成时,服务端会返回此事件。该事件中包含的 Response 对象将包含 Response 中的所有输出项,但不包括已返回的原始音频数据。
|
|
response.text.delta
模型增量生成新的文本时,系统会返回服务器 response.text.delta
事件。
|
|
response.text.done
当模型生成的文本结束时,系统会返回服务器 response.text.done
事件。
当响应中断、不完整或取消时,系统也会返回此事件。
|
|
response.audio.delta
当模型增量生成新的audio数据时,系统会返回服务器 response.audio.delta 事件。
|
|
response.audio.done
当模型完成生成audio数据时,系统会返回服务器 response.audio.done 事件。
当响应中断、不完整或取消时,系统也会返回此事件。
|
|
response.audio_transcript.delta
当模型增量生成新的audio对应的文本时,系统会返回服务器 response.audio_transcript.delta 事件。
|
|
response.audio_transcript.done
当模型完成生成新的audio对应的文本时,系统会返回服务器 response.audio_transcript.done 事件。
|
|
response.output_item.added
当新的item项需要输出时,服务端返回此事件。
|
|
response.output_item.done
当新的item输出完成时,服务端返回此事件。
|
|
response.content_part.added
当新的内容项需要输出时,服务端返回此事件。
|
|
response.content_part.done
当新的内容项输出完成时,服务端返回此事件。
|
|