提供欧美、亚洲热门国家的单一语言对话能力,语种、功能持续扩展中。
语言列表
|
语种 |
应用类型 |
语音识别 |
语音合成 |
大模型对话 - 细节功能 |
|
中文(普通话) |
多模态应用 语音应用 |
支持 |
支持 |
|
|
英语 |
支持 |
支持 |
|
|
|
法语、德语、西班牙、意大利、俄语、葡萄牙、韩语、日语、泰语、印尼语、马来语 |
多模态应用 |
支持 (但不支持热词) |
支持 |
|
|
粤语 |
支持 (但不支持热词) |
支持 |
||
|
越南语、菲律宾语 |
支持 (但不支持热词) |
当前需接入三方模型能力 |
||
|
阿拉伯语、印地语、土耳其语、乌克兰语、捷克语、丹麦语、芬兰语、冰岛语、挪威语、波兰语、荷兰语、瑞典语 |
支持 (但不支持热词) |
当前需接入三方模型能力 |
功能说明
-
仅支持单一语种对话,不支持多语种混合对话(中英混说除外)。
-
如需在同一台硬件设备中提供多种语言,需要每个语言单独创建一个应用,通过系统设置的方式切换应用ID,为终端用户提供对应语言的对话能力。
-
上述语言的计费逻辑与中文保持一致。
ASR和TTS模型挑选建议
-
不同语言可使用、推荐使用的语音模型如下表:
-
表格为空,代表当前语种无语音模型可支持,需接入三方模型能力。
-
|
语种 |
推荐ASR模型 (效果优先) |
可用ASR模型 |
推荐TTS模型 & 音色 (效果优先) |
可用TTS模型 |
|
中文 |
|
|
|
|
|
英语 |
|
|
|
|
|
日语 |
|
|
|
|
|
韩语 |
|
|
|
|
|
法语 |
|
|
|
|
|
德语 |
|
|
|
|
|
意大利 |
|
|
|
|
|
西班牙 |
|
|
|
|
|
葡萄牙 |
|
|
|
|
|
俄语 |
|
|
|
|
|
泰语 |
|
|
|
|
|
印尼语 |
|
|
|
|
|
菲律宾语 |
|
|
||
|
粤语 |
|
|
|
|
|
阿拉伯语 |
|
|
|
|
|
印地语 |
|
|
||
|
土耳其语 |
|
|
|
|
|
乌克兰语 |
|
|
||
|
捷克语 |
|
|
||
|
丹麦语 |
|
|
||
|
芬兰语 |
|
|
||
|
冰岛语 |
|
|
||
|
挪威语 |
|
|
||
|
波兰语 |
|
|
||
|
荷兰语 |
当前需接入三方模型能力 |
当前需接入三方模型能力 |
||
|
瑞典语 |
|
|
配置方式
-
在控制台点击创建「多模态应用」。
-
选择所需语种和品类,创建应用。系统会提供最合适的模型、提示词和功能组合。
本示例中,对话语言选择英语,场景模板选择AI眼镜。
-
根据业务场景调整提示词等内容,当前语种不可用的功能会被隐藏。
在语音交互页签中,可配置语音识别(如 Fun-ASR 实时语音识别)和语音合成(如 CosyVoice-v3-Flash 大模型),以及热词、即时纠错和对话打断(任意语音打断/全双工 或 点击打断/半双工)等选项。页面还包含理解和生成、技能、Agent页签供后续配置。
-
点击「立即运行」,在右侧运行面板的音色选择区域中,浏览可用音色列表并选择合适的音色。
-
在右侧进行对话体验,以及后续的发布、开发接入和购买等流程。