长文本语音合成功能提供了将超长文本(如千字或者万字)合成为语音二进制数据的功能。
计费和并发限制
功能介绍
支持输出PCM、WAV和MP3编码格式数据。
支持设置语速、语调和音量。
支持设置男声、女声。
长文本语音合成服务相比语音合成服务有其独特优势:
支持更长文字输入:一次性合成最高1万字符,其中1个汉字、1个英文字母、1个标点或1个句子中间空格均算作1个字符。
专属声音:按场景打造专属精品声音,完美贴合阅读小说、新闻、视频配音等场景。
使用长文本语音合成功能,需要将SDK更新至最新版本。
音色列表
名称  | voice参数值  | 类型  | 适用场景  | 支持语言  | 支持采样率(Hz)  | 支持字/句级别时间戳  | 支持儿化音  | 声音品质  | 
阿斌  | abin  | 广东普通话  | 对话数字人  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 否  | 否  | 标准版  | 
知小白  | zhixiaobai  | 普通话女声  | 对话数字人  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 否  | 是  | 标准版  | 
知小夏  | zhixiaoxia  | 普通话女声  | 对话数字人  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 否  | 是  | 标准版  | 
知小妹  | zhixiaomei  | 普通话女声  | 直播数字人  | 支持中文及中英文混合场景  | 8K/16K/24K  | 是  | 是  | 标准版  | 
知柜  | zhigui  | 普通话女声  | 直播数字人  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
知硕  | zhishuo  | 普通话男声  | 客服数字人  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
艾夏  | aixia  | 普通话女声  | 客服数字人  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
Cally  | cally  | 美式英文女声  | 英语口语对话数字人  | 仅支持纯英文场景  | 8K/16K  | 是  | 是  | 标准版  | 
知锋_多情感  | zhifeng_emo  | 多种情感男声  | 通用场景  | 中文及中英文混合场景  | 8K/16K/24K  | 是  | 是  | 标准版  | 
知冰_多情感  | zhibing_emo  | 多种情感男声  | 通用场景  | 纯中文场景  | 8K/16K/24K  | 是  | 是  | 标准版  | 
知妙_多情感  | zhimiao_emo  | 多种情感女声  | 中英场景  | 中文及英文场景  | 8K/16K  | 是  | 是  | 标准版  | 
知米_多情感  | zhimi_emo  | 多种情感女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
知燕_多情感  | zhiyan_emo  | 多种情感女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
知贝_多情感  | zhibei_emo  | 多种情感童声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
知甜_多情感  | zhitian_emo  | 多种情感女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
小云  | xiaoyun  | 标准女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 否  | 否  | lite版  | 
小刚  | xiaogang  | 标准男声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 否  | 否  | lite版  | 
若兮  | ruoxi  | 温柔女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
思琪  | siqi  | 温柔女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K/24K  | 是  | 否  | 标准版  | 
思佳  | sijia  | 标准女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
思诚  | sicheng  | 标准男声  | 通用场景  | 中文及中英文混合场景  | 8K/16K/24K  | 是  | 否  | 标准版  | 
艾琪  | aiqi  | 温柔女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾佳  | aijia  | 标准女声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾诚  | aicheng  | 标准男声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾达  | aida  | 标准男声  | 通用场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
宁儿  | ninger  | 标准女声  | 通用场景  | 纯中文场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
瑞琳  | ruilin  | 标准女声  | 通用场景  | 纯中文场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
思悦  | siyue  | 温柔女声  | 客服场景  | 中文及中英文混合场景  | 8K/16K/24K  | 是  | 否  | 标准版  | 
艾雅  | aiya  | 严厉女声  | 客服场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾美  | aimei  | 甜美女声  | 客服场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾雨  | aiyu  | 自然女声  | 客服场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾悦  | aiyue  | 温柔女声  | 客服场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾婧  | aijing  | 严厉女声  | 客服场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
小美  | xiaomei  | 甜美女声  | 客服场景  | 中文及中英文混合场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
艾娜  | aina  | 浙普女声  | 客服场景  | 纯中文场景  | 8K/16K  | 是  | 否  | 标准版  | 
伊娜  | yina  | 浙普女声  | 客服场景  | 纯中文场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
思婧  | sijing  | 严厉女声  | 客服场景  | 纯中文场景  | 8K/16K/24K  | 是  | 否  | 标准版  | 
思彤  | sitong  | 儿童音  | 童声场景  | 纯中文场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
小北  | xiaobei  | 萝莉女声  | 童声场景  | 纯中文场景  | 8K/16K/24K  | 是  | 否  | 标准版  | 
艾彤  | aitong  | 儿童音  | 童声场景  | 纯中文场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾薇  | aiwei  | 萝莉女声  | 童声场景  | 纯中文场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾宝  | aibao  | 萝莉女声  | 童声场景  | 纯中文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Harry  | harry  | 英音男声  | 英文场景  | 英文场景  | 8K/16K  | 否  | 否  | 标准版  | 
Abby  | abby  | 美音女声  | 英文场景  | 英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Andy  | andy  | 美音男声  | 英文场景  | 英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Eric  | eric  | 英音男声  | 英文场景  | 英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Emily  | emily  | 英音女声  | 英文场景  | 英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Luna  | luna  | 英音女声  | 英文场景  | 英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Luca  | luca  | 英音男声  | 英文场景  | 英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Wendy  | wendy  | 英音女声  | 英文场景  | 英文场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
William  | william  | 英音男声  | 英文场景  | 英文场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
Olivia  | olivia  | 英音女声  | 英文场景  | 英文场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
姗姗  | shanshan  | 粤语女声  | 方言场景  | 标准粤文(简体)及粤英文混合场景  | 8K/16K/24K  | 否  | 否  | 标准版  | 
艾媛  | aiyuan  | 知心姐姐  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾颖  | aiying  | 软萌童声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾祥  | aixiang  | 磁性男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾墨  | aimo  | 情感男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾晔  | aiye  | 青年男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾婷  | aiting  | 电台女声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾凡  | aifan  | 情感女声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
Lydia  | lydia  | 英中双语女声  | 英文场景  | 英文及英中文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
小玥  | chuangirl  | 四川话女声  | 方言场景  | 中文及中英文混合场景  | 8K/16K  | 否  | 否  | 标准版  | 
艾硕  | aishuo  | 自然男声  | 客服场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
青青  | qingqing  | 中国台湾话女声  | 方言场景  | 纯中文场景  | 8K/16K  | 否  | 否  | 标准版  | 
翠姐  | cuijie  | 东北话女声  | 方言场景  | 纯中文场景  | 8K/16K  | 是  | 是  | 标准版  | 
小泽  | xiaoze  | 湖南重口音男声  | 方言场景  | 纯中文场景  | 8K/16K  | 否  | 否  | 标准版  | 
艾楠  | ainan  | 广告男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾浩  | aihao  | 资讯男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾茗  | aiming  | 诙谐男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾笑  | aixiao  | 资讯女声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾厨  | aichu  | 舌尖男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾倩  | aiqian  | 资讯女声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
智香  | tomoka  | 日语女声  | 多语种场景  | 纯日文场景  | 8K/16K  | 是  | 否  | 标准版  | 
智也  | tomoya  | 日语男声  | 多语种场景  | 纯日文场景  | 8K/16K  | 是  | 否  | 标准版  | 
Annie  | annie  | 美语女声  | 英文场景  | 纯英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
艾树  | aishu  | 资讯男声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
艾茹  | airu  | 新闻女声  | 文学场景  | 中文及中英文混合场景  | 8K/16K  | 是  | 是  | 精品版  | 
佳佳  | jiajia  | 粤语女声  | 方言场景  | 标准粤文(简体)及粤英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
Indah  | indah  | 印尼语女声  | 多语种场景  | 纯印尼语场景  | 8K/16K  | 否  | 否  | 标准版  | 
桃子  | taozi  | 粤语女声  | 方言场景  | 支持标准粤文(简体)及粤英文混合场景  | 8K/16K  | 是  | 否  | 标准版  | 
柜姐  | guijie  | 亲切女声  | 通用场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
Stella  | stella  | 知性女声  | 通用场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
Stanley  | stanley  | 沉稳男声  | 通用场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
Kenny  | kenny  | 沉稳男声  | 通用场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
Rosa  | rosa  | 自然女声  | 通用场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
Farah  | farah  | 马来语女声  | 多语种场景  | 仅支持纯马来语场景  | 8K/16K  | 否  | 否  | 标准版  | 
马树  | mashu  | 儿童剧男声  | 通用场景  | 通用场景  | 8K/16K  | 是  | 否  | 标准版  | 
知琪  | zhiqi  | 温柔女声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
知厨  | zhichu  | 舌尖男声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 是  | 精品版  | 
小仙  | xiaoxian  | 亲切女声  | 直播场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
悦儿  | yuer  | 儿童剧女声  | 通用场景  | 仅支持纯中文场景  | 8K/16K  | 是  | 否  | 标准版  | 
猫小美  | maoxiaomei  | 活力女声  | 直播场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
知祥  | zhixiang  | 磁性男声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
知佳  | zhijia  | 标准女声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
知楠  | zhinan  | 广告男声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
知倩  | zhiqian  | 资讯女声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
知茹  | zhiru  | 新闻女声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
知德  | zhide  | 新闻男声  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
知飞  | zhifei  | 激昂解说  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 否  | 精品版  | 
艾飞  | aifei  | 激昂解说  | 直播场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
亚群  | yaqun  | 卖场广播  | 直播场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
巧薇  | qiaowei  | 卖场广播  | 直播场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
大虎  | dahu  | 东北话男声  | 方言场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
ava  | ava  | 美语女生  | 英文场景  | 仅支持纯英文场景  | 8K/16K  | 是  | 否  | 标准版  | 
知伦  | zhilun  | 悬疑解说  | 超高清场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 否  | 精品版  | 
艾伦  | ailun  | 悬疑解说  | 直播场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 是  | 标准版  | 
杰力豆  | jielidou  | 治愈童声  | 童声场景  | 仅支持纯中文场景  | 8K/16K  | 是  | 是  | 标准版  | 
知薇  | zhiwei  | 萝莉女声  | 超高清场景  | 仅支持纯中文场景  | 8K/16K/24K/48K  | 是  | 否  | 精品版  | 
老铁  | laotie  | 东北老铁  | 直播场景  | 仅支持纯中文场景  | 8K/16K  | 是  | 是  | 标准版  | 
老妹  | laomei  | 吆喝女声  | 直播场景  | 仅支持纯中文场景  | 8K/16K  | 是  | 是  | 标准版  | 
艾侃  | aikan  | 天津话男声  | 方言场景  | 仅支持纯中文场景  | 8K/16K  | 是  | 是  | 标准版  | 
Tala  | tala  | 菲律宾语女声  | 多语种场景  | 仅支持菲律宾语场景  | 8K/16K  | 否  | 否  | 标准版  | 
知甜  | zhitian  | 甜美女声  | 通用场景  | 支持中文及中英文混合场景  | 8K/16K  | 是  | 否  | 精品版  | 
知青  | zhiqing  | 中国台湾话女生  | 方言场景  | 仅支持纯中文场景  | 8K/16K  | 是  | 否  | 精品版  | 
Tien  | tien  | 越南语女声  | 多语种场景  | 仅支持越南语场景  | 8K/16K  | 否  | 否  | 标准版  | 
Becca  | becca  | 美语客服女声  | 美式英文  | 仅支持纯英语场景  | 8K/16K  | 否  | 否  | 标准版  | 
Kyong  | Kyong  | 韩语女声  | 韩语场景  | 韩语  | 8K/16K  | 否  | 否  | 标准版  | 
masha  | masha  | 俄语女声  | 俄语场景  | 俄语  | 8K/16K  | 否  | 否  | 标准版  | 
camila  | camila  | 西班牙语女声  | 西班牙语场景  | 西班牙语  | 8k/16k  | 否  | 否  | 标准版  | 
perla  | perla  | 意大利语女声  | 意大利语场景  | 意大利语  | 8k/16k  | 否  | 否  | 标准版  | 
知猫  | zhimao  | 普通话女声  | 直播  | 中文  | 8k/16k  | 是  | 否  | 标准版  | 
知媛  | zhiyuan  | 普通话女声  | 通用场景  | 中文  | 8k/16k  | 是  | 否  | 标准版  | 
知雅  | zhiya  | 普通话女声  | 客服  | 中文  | 8k/16k  | 是  | 否  | 标准版  | 
知悦  | zhiyue  | 普通话女声  | 通用场景  | 中文  | 8k/16k  | 是  | 否  | 标准版  | 
知达  | zhida  | 普通话男声  | 通用场景  | 中文及中英文混合场景  | 8k/16k  | 是  | 否  | 标准版  | 
知莎  | zhistella  | 普通话女声  | 通用场景  | 中文  | 8k/16k  | 是  | 否  | 标准版  | 
Kelly  | kelly  | 香港粤语女声  | 方言场景  | 香港粤语  | 8k/16k  | 是  | 否  | 标准版  | 
clara  | clara  | 法语女声  | 通用场景  | 法语  | 8k/16k  | 否  | 否  | 标准版  | 
hanna  | hanna  | 德语女声  | 通用场景  | 德语  | 8k/16k  | 否  | 否  | 标准版  | 
waan  | waan  | 泰语女声  | 通用场景  | 泰语  | 8k/16k  | 否  | 否  | 标准版  | 
betty  | betty  | 美式英文女声  | 通用场景  | 美式英文  | 8k/16k  | 是  | 否  | 标准版  | 
beth  | beth  | 美式英文女声  | 通用场景  | 美式英文  | 8k/16k  | 是  | 否  | 标准版  | 
cindy  | cindy  | 美式英文女声  | 通用场景  | 美式英文  | 8k/16k  | 是  | 否  | 标准版  | 
donna  | donna  | 美式英文女声  | 通用场景  | 美式英文  | 8k/16k  | 是  | 否  | 标准版  | 
eva  | eva  | 美式英文女声  | 通用场景  | 美式英文  | 8k/16k  | 是  | 否  | 标准版  | 
brian  | brian  | 美式英文男声  | 通用场景  | 美式英文  | 8k/16k  | 是  | 否  | 标准版  | 
david  | david  | 美式英文男声  | 通用场景  | 美式英文  | 8k/16k/24k  | 是  | 否  | 标准版  | 
abby_ecmix  | abby_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
annie_ecmix  | annie_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
andy_ecmix  | andy_ecmix  | 美式英文男声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
ava_ecmix  | ava_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
betty_ecmix  | betty_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
beth_ecmix  | beth_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
brian_ecmix  | brian_ecmix  | 美式英文男声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
cindy_ecmix  | cindy_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
cally_ecmix  | cally_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
donna_ecmix  | donna_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
david_ecmix  | david_ecmix  | 美式英文男声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
eva_ecmix  | eva_ecmix  | 美式英文女声  | 通用场景  | 英文及英中文混合场景  | 8k/16k/24k  | 是  | 否  | 标准版  | 
多情感声音支持说明
只有多情感发音人模型才可以支持多情感选择。多情感声音支持的情感如下表所示,每个音色支持的情感分类不完全相同,主要包括:neutral(中性)、happy(开心)、angry(生气)、sad(悲伤)、fear(害怕)、hate(憎恨)、surprise(惊讶)、arousal(激动)、serious(严肃)、disgust(厌恶)、jealousy(嫉妒)、embarrassed(尴尬)、frustrated(沮丧)、affectionate(深情)、gentle(温柔)、newscast(播报)、customer-service(客服)、story(小说)、living(直播)。
音色名  | voice参数值  | 情感分类(emotion category)  | 
知锋_多情感  | zhifeng_emo  | angry,fear,happy,neutral,sad,surprise  | 
知冰_多情感  | zhibing_emo  | angry,fear,happy,neutral,sad,surprise  | 
知妙_多情感  | zhimiao_emo  | serious,sad,disgust,jealousy,embarrassed,happy,fear,surprise,neutral,frustrated,affectionate,gentle,angry,newscast,customer-service,story,living  | 
知米_多情感  | zhimi_emo  | angry,fear,happy,hate,neutral,sad,surprise  | 
知燕_多情感  | zhiyan_emo  | neutral,happy,angry,sad,fear,hate,surprise,arousal  | 
知贝_多情感  | zhibei_emo  | neutral,happy,angry,sad,fear,hate,surprise  | 
知甜_多情感  | zhitian_emo  | neutral,happy,angry,sad,fear,hate,surprise  | 
调用说明
传入文本必须采用
UTF-8编码。长文本语音合成和语音合成在很多地方都是相似的,可进行对比。
就近地域智能接入
语音合成支持就近地域智能接入,域名为nls-gateway.aliyuncs.com。
推荐终端用户使用就近地域接入。根据调用接口时客户端所在的地理位置,系统会自动解析到最近的某个具体地域的服务器。例如在北京地域发起请求,系统会自动解析到北京地域的服务器,与指定域名nls-gateway-cn-beijing.aliyuncs.com的实现效果一致。
服务地址
访问类型  | 说明  | URL  | 
外网访问(默认上海地域)  | 所有服务器均可使用外网访问URL(SDK中默认设置了外网访问URL)。  | 
  | 
ECS内网访问  | 使用阿里云上海、北京、深圳ECS(即ECS地域为华东2(上海)、华北2(北京)、华南1(深圳)),可使用内网访问URL。 ECS的经典网络不能访问AnyTunnel,即不能在内网访问语音服务;如果希望使用AnyTunnel,需要创建专有网络在其内部访问。 说明  
  | 
  | 
交互流程
上图不包含RESTful API的交互流程,关于RESTful API的交互流程图请参见RESTful API。
服务端的响应除了音频流之外,都会在返回信息的header包含本次识别任务的task_id参数,是本次请求的唯一标识。
如果您希望实时播放服务端返回的音频流,请使用支持流式播放的音频播放器。支持流式播放的播放器包括:ffmpeg、pyaudio(Python)、AudioFormat(Java)和MediaSource(JavaScript)等。
鉴权
客户端在与服务端建立WebSocket连接时,使用Token进行鉴权。Token获取请参见获取Token概述。
开始合成
客户端发送语音合成请求,在请求消息中进行参数设置,各参数通过SDK中SpeechSynthesizer对象的相关set方法设置,含义如下。
参数
类型
是否必选
说明
appkey
String
是
管控台创建的项目Appkey。
text
String
是
待合成文本,文本内容必须采用
UTF-8编码(英文单词之间需要添加空格)。说明调用某音色的多情感内容,需要在text中加上ssml-emotion标签,详情请参见<emotion>。
只有支持多情感的音色,才能使用<emotion>标签,否则会报错:Illegal ssml text。
voice
String
否
发音人,默认是xiaoyun。
format
String
否
音频编码格式,支持PCM/WAV/MP3格式。默认值:
pcm。sample_rate
Integer
否
音频采样率,默认值:16000 Hz。
volume
Integer
否
音量,范围是0~100。默认值:50。
speech_rate
Integer
否
语速,取值范围:-500~500。默认值:0。
[-500, 0, 500] 对应的语速倍速区间为 [0.5, 1.0, 2.0]。
-500表示默认语速的0.5倍速。
0表示默认语速的1倍速。1倍速是指模型默认输出的合成语速,语速会依据每一个发音人略有不同,大概每秒钟4个字左右。
500表示默认语速的2倍速。
计算方法如下:
0.8倍速(1-1/0.8)/0.002 = -125
1.2倍速(1-1/1.2)/0.001 = 166
重要小于1倍速时,使用0.002系数。
大于1倍速时,使用0.001系数。
实际算法结果取近似值。
pitch_rate
Integer
否
语调,取值范围:-500~500。默认值:0。
enable_subtitle
Boolean
否
开启字级别时间戳。更多使用方法,请参见时间戳功能介绍。
接收合成数据
服务端返回合成的语音二进制数据,SDK接收并处理二进制数据。
结束合成
语音合成完毕,服务端发送合成完毕事件通知,示例如下。
{ "header":{ "namespace":"SpeechLongSynthesizer", "name":"SynthesisCompleted", "status":20000000, "message_id":"396c80b3abf84082a48cb9e5c424****", "task_id":"f5805be640364cdcafc8da63e512****", "status_text":"Gateway:SUCCESS:Success." } }合成失败处理
当因为参数或其他原因导致合成任务失败时,会收到任务失败(TaskFailed)通知,举例如下。收到任务失败通知后,对应底层连接将断开。
{ "header":{ "namespace":"Default", "name":"TaskFailed", "status":41020001, "message_id":"62c126f7d9b340deb82b5b7eaca0****", "task_id":"4552df26d1f547aab9a2c4a94678****", "status_text":"TTS:TtsClientError:[tts]Engine return error code: 418" } }
服务状态码
在服务的每一次响应中,都包含status字段,即服务状态码,状态码各种取值含义如下。
通用错误码
状态码  | 状态消息  | 原因  | 解决方案  | 
40000000  | 默认的客户端错误码,对应了多个错误消息。  | 用户使用了不合理的参数或者调用逻辑。  | 请参考官网文档示例代码进行对比测试验证。  | 
40000001  | The token 'xxx' has expired; The token 'xxx' is invalid  | 用户使用了不合理的参数或者调用逻辑。通用客户端错误码,通常是涉及Token相关的不正确使用,例如Token过期或者非法。  | 请参考官网文档示例代码进行对比测试验证。  | 
40000002  | Gateway:MESSAGE_INVALID:Can't process message in state'FAILED'!  | 无效或者错误的报文消息。  | 请参考官网文档示例代码进行对比测试验证。  | 
40000003  | PARAMETER_INVALID; Failed to decode url params  | 用户传递的参数有误,一般常见于RESTful接口调用。  | 请参考官网文档示例代码进行对比测试验证。  | 
40000005  | Gateway:TOO_MANY_REQUESTS:Too many requests!  | 并发请求过多。  | 如果是试用版调用,建议您升级为商用版本以增大并发。 如果已是商用版,可购买并发资源包,扩充您的并发额度。  | 
40000009  | Invalid wav header!  | 错误的消息头。  | 如果您发送的是WAV语音文件,且设置  | 
40000009  | Too large wav header!  | 传输的语音WAV头不合法。  | 建议使用PCM、OPUS等格式发送音频流,如果是WAV,建议关注语音文件的WAV头信息是否为正确的数据长度大小。  | 
40000010  | Gateway:FREE_TRIAL_EXPIRED:The free trial has expired!  | 试用期已结束,并且未开通商用版、或账号欠费。  | 请登录控制台确认服务开通状态以及账户余额。  | 
40010001  | Gateway:NAMESPACE_NOT_FOUND:RESTful url path illegal  | 不支持的接口或参数。  | 请检查调用时传递的参数内容是否和官网文档要求的一致,并结合错误信息对比排查,设置为正确的参数。 比如您是否通过curl命令执行RESTful接口请求, 拼接的URL是否合法。  | 
40010003  | Gateway:DIRECTIVE_INVALID:[xxx]  | 客户端侧通用错误码。  | 表示客户端传递了不正确的参数或指令,在不同的接口上有对应的详细报错信息,请参考对应文档进行正确设置。  | 
40010004  | Gateway:CLIENT_DISCONNECT:Client disconnected before task finished!  | 在请求处理完成前客户端主动结束。  | 无,或者请在服务端响应完成后再关闭链接。  | 
40010005  | Gateway:TASK_STATE_ERROR:Got stop directive while task is stopping!  | 客户端发送了当前不支持的消息指令。  | 请参考官网文档示例代码进行对比测试验证。  | 
40020105  | Meta:APPKEY_NOT_EXIST:Appkey not exist!  | 使用了不存在的Appkey。  | 请确认是否使用了不存在的Appkey,Appkey可以通过登录控制台后查看项目配置。  | 
40020106  | Meta:APPKEY_UID_MISMATCH:Appkey and user mismatch!  | 调用时传递的Appkey和Token并非同一个账号UID所创建,导致不匹配。  | 请检查是否存在两个账号混用的情况,避免使用账号A名下的Appkey和账号B名下生成的Token搭配使用。  | 
403  | Forbidden  | 使用的Token无效,例如Token不存在或者已过期。  | 请设置正确的Token。Token存在有效期限制,请及时在过期前获取新的Token。  | 
41000003  | MetaInfo doesn't have end point info  | 无法获取该Appkey的路由信息。  | 请检查是否存在两个账号混用的情况,避免使用账号A名下的Appkey和账号B名下生成的Token搭配使用。  | 
41010101  | UNSUPPORTED_SAMPLE_RATE  | 不支持的采样率格式。  | 当前实时语音识别只支持8000 Hz和16000 Hz两种采样率格式的音频。  | 
41040201  | Realtime:GET_CLIENT_DATA_TIMEOUT:Client data does not send continuously!  | 获取客户端发送的数据超时失败。  | 客户端在调用实时语音识别时请保持实时速率发送,发送完成后及时关闭链接。  | 
50000000  | GRPC_ERROR:Grpc error!  | 受机器负载、网络等因素导致的异常,通常为偶发出现。  | 一般重试调用即可恢复。  | 
50000001  | GRPC_ERROR:Grpc error!  | 受机器负载、网络等因素导致的异常,通常为偶发出现。  | 一般重试调用即可恢复。  | 
52010001  | GRPC_ERROR:Grpc error!  | 受机器负载、网络等因素导致的异常,通常为偶发出现。  | 一般重试调用即可恢复。  | 
语音合成/长文本语音合成错误码
状态码  | 状态消息  | 原因  | 解决方案  | 
40000001  | Gateway:ACCESS_DENIED:No privilege to this voice!  | 设置了错误的发音人名称。  | 请参考官网文档,设置正确的发音人。  | 
40000004  | Gateway:IDLE_TIMEOUT:Websocket session is idle for too long time,the last directive is 'StartSynthesis'!  | 请求建立链接后,长时间没有发送任何数据,超过10s后服务端会返回此错误信息。  | 请求处理完成后请及时关闭链接,此外,当服务端瞬时压力过大不能及时返回数据时也可能出现此错误,此时可以重试恢复。  | 
40010003  | Gateway:DIRECTIVE_INVALID:No text specified!  | 没有设置有效的待合成文本文字。  | 请参考官网文档示例代码设置待合成的文本。  | 
41020001  | 语音合成调用客户端错误  | 可能有多个错误消息,需根据对应的错误消息调整。  | 
  | 
51020001  | TTS:TtsServerError  | 受机器负载或网络等因素导致的异常,通常为偶发出现。  | 一般重试调用即可恢复。  |