提供欧美、亚洲热门国家的单一语言对话能力,语种、功能持续扩展中。
语言列表
语种 | 语音识别 | 语音合成 | 大模型对话 - 细节功能 |
中文(普通话) | ✅ | ✅ | ✅ 全部功能可用 |
英语 | ✅ | ✅ | ✅ 闲聊和知识问答(暂不支持联网搜索) ✅ 系统指令(设备控制) ✅ 视觉理解Agent:拍照问答、视频通话、拍照翻译 ✅ 大模型承接语 ✅ 语义拒识和判停能力 |
法语、德语、西班牙、意大利、俄语、葡萄牙、韩语、日语、泰语、印尼语、马来语 | ✅ (但不支持热词) | ✅ | ✅ 闲聊和知识问答(暂不支持联网搜索) ✅ 系统指令(设备控制) ✅ 视觉理解Agent:拍照问答、视频通话、拍照翻译 |
越南语 | ✅ (但不支持热词) | 需接入三方模型能力 | ✅ 闲聊和知识问答(暂不支持联网搜索) ✅ 系统指令(设备控制) ✅ 视觉理解Agent:拍照问答、视频通话、拍照翻译 |
菲律宾语 | ✅ (但不支持热词) | 需接入三方模型能力 | ✅ 闲聊和知识问答(暂不支持联网搜索) ✅ 系统指令(设备控制) ✅ 视觉理解Agent:拍照问答、视频通话、拍照翻译 |
功能说明
仅支持单一语种对话,不支持多语种混合对话(中英混说除外)。
如需在同一台硬件设备中提供多种语言,需要每个语言单独创建一个应用,通过系统设置的方式切换应用ID,为终端用户提供对应语言的对话能力。
上述语言的计费逻辑与中文保持一致。
ASR和TTS模型挑选建议
不同语言可使用、推荐使用的语音模型如下表:
表格为空,代表当前语种无语音模型可支持,需调用三方语音模型。
语种 | 推荐ASR模型 (效果优先) | 可用ASR模型 | 推荐TTS模型 & 音色 (效果优先) | 可用TTS模型 |
中文 |
|
|
|
|
英语 |
|
|
|
|
日语 |
|
|
|
|
韩语 |
|
|
|
|
法语 |
|
|
|
|
德语 |
|
|
|
|
意大利 |
|
|
|
|
西班牙 |
|
|
|
|
葡萄牙 |
|
|
|
|
俄语 |
|
|
|
|
泰语 |
|
|
|
|
印尼语 |
|
|
|
|
菲律宾语 |
|
|
配置方式
在控制台点击创建「多模态应用」。

选择所需语种和品类,创建应用。系统会提供最合适的模型、提示词和功能组合。

根据业务场景调整提示词等内容,当前语种不可用的功能会被隐藏。

点击「立即运行」,在右侧选择合适的音色。

在右侧进行对话体验,以及后续的发布、开发接入和购买等流程。