参数 | 类型 | 说明 |
type | string | 事件类型,该事件下固定为session.update。 |
event_id | string | 本次事件的标识。 |
session | object | session的配置。 |
session.mode | string | 使用的交互模式,可选值: |
session.voice | string | |
session.language_type | string | 指定合成音频的语种,默认为 Auto。 |
session.response_format | string | 模型输出音频的格式,支持的格式: "pcm"(默认) "wav" "mp3" "opus"
Qwen-TTS Realtime(参见模型)仅支持pcm。 |
session.sample_rate | integer | 模型输出音频的采样率(Hz),支持的采样率: Qwen-TTS Realtime(参见模型)仅支持24000。 |
session.speech_rate | float | 音频的语速。1.0为正常语速,小于1.0为慢速,大于1.0为快速。 默认值:1.0。 Qwen-TTS Realtime(参见模型)不支持该参数。 |
session.volume | integer | 音频的音量。 默认值:50。 取值范围:[0, 100]。 Qwen-TTS Realtime(参见模型)不支持该参数。 |
session.pitch_rate | float | 合成音频的语调。 默认值:1.0。 取值范围:[0.5, 2.0]。 Qwen-TTS Realtime(参见模型)不支持该参数。 |
session.bit_rate | integer | 指定音频的码率(kbps)。码率越大,音质越好,音频文件体积越大。仅在音频格式(response_format)为opus时可用。 默认值:128。 取值范围:[6, 510]。 Qwen-TTS Realtime(参见模型)不支持该参数。 |