语种 | 推荐ASR模型 (效果优先) | 可用ASR模型 | 推荐TTS模型 & 音色 (效果优先) | 可用TTS模型 |
中文 | Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime
| Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime Gummy实时语音识别 Paraformer语音识别 多模态交互轻量版语音识别
| | CosyVoice-v3-Flash大模型 千问3-TTS-Flash-Realtime CosyVoice-v3-Plus大模型 CosyVoice-v2大模型 Sambert语音合成模型 多模态交互轻量版语音合成
|
英语 | Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime
| Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime Gummy实时语音识别 Paraformer语音识别(含轻量版)
| | CosyVoice-v3-Flash大模型 千问3-TTS-Flash-Realtime CosyVoice-v3-Plus大模型 CosyVoice-v2大模型 Sambert语音合成模型 多模态交互轻量版语音合成
|
日语 | Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime
| Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime Gummy实时语音识别 Paraformer语音识别 多模态交互轻量版语音识别
| | 千问3-TTS-Flash-Realtime 多模态交互轻量版语音合成
|
韩语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别 Paraformer语音识别 多模态交互轻量版语音识别
| | 千问3-TTS-Flash-Realtime 多模态交互轻量版语音合成
|
法语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别 Paraformer语音识别 多模态交互轻量版语音识别
| | 千问3-TTS-Flash-Realtime Sambert语音合成模型
|
德语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别 Paraformer语音识别 多模态交互轻量版语音识别
| | 千问3-TTS-Flash-Realtime Sambert语音合成模型
|
意大利 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | 千问3-TTS-Flash-Realtime Sambert语音合成模型
|
西班牙 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | 千问3-TTS-Flash-Realtime Sambert语音合成模型
|
葡萄牙 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | |
俄语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别 Paraformer语音识别 多模态交互轻量版语音识别
| | |
泰语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | |
印尼语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | |
菲律宾语 | | | | |
粤语 | Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime
| Fun-ASR实时语音识别 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | 千问3-TTS-Flash-Realtime CosyVoice-v3-Flash大模型 多模态交互轻量版语音合成
|
阿拉伯语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | |
印地语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | |
土耳其语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | |
乌克兰语 | | | | |
捷克语 | | | | |
丹麦语 | | 千问3-ASR-Flash-Realtime Gummy实时语音识别
| | |
芬兰语 | | | | |
冰岛语 | | | | |
挪威语 | | | | |
波兰语 | | | | |
荷兰语 | | | | |
瑞典语 | | | | |