全部产品
阿里云办公

简介

更新时间:2018-11-06 10:51:39

功能介绍

语音合成提供将输入文本合成为语音二进制数据的功能。

  • 支持输出PCM、WAV、MP3编码格式数据;
  • 支持设置男声/女声;
  • 支持设置语速,语调,音量。

调用限制

  • 传入文本必须采用UTF-8编码;
  • 传入文本不能超过300个字符。

交互流程

说明:交互流程图为Java SDK、C++ SDK、iOS SDK、Android SDK的交互流程,不包含RESTful API的交互流程,RESTful API的交互流程图请直接阅读RESTful API 2.0一节。

tts

1.start and confirm

客户端发起请求,服务端确认请求有效。其中在请求消息中需要进行参数设置,各参数由SDK中SpeechSynthesizer对象的相关set方法设置,各参数含义如下:

Parameter Type Description
text String 待合成文本,必填,文本内容必须采用UTF-8编码,长度不超过300个字符(英文字母之间需要添加空格)
voice String 发音人,可选,xiaoyun(女声),ruoxi(女声),xiaogang(男声),默认是xiaoyun,请直接在管控台中的项目配置中选择合适的发音人
format String 音频编码格式,可选,默认是PCM。支持的格式:PCM、WAV、MP3
sample_rate Integer 音频采样率,可选,默认是16000
volume Integer 音量,范围是0~100,可选,默认50
speech_rate Integer 语速,范围是-500~500,可选,默认是0
pitch_rate Integer 语调,范围是-500~500,可选,默认是0

2.synthesize audio data

服务端开始返回合成的语音二进制数据,SDK接收并处理二进制数

3.stop and complete

语音合成完毕,服务端发送合成完毕事件通知,示例如下:

  1. {
  2. "header": {
  3. "message_id": "05450bf69c53413f8d88aed1ee600e93",
  4. "task_id": "640bc797bb684bd69601856513079df5",
  5. "namespace": "SpeechSynthesizer",
  6. "name": "SynthesisCompleted",
  7. "status": 20000000,
  8. "status_message": "GATEWAY|SUCCESS|Success."
  9. }
  10. }

服务状态码

在服务的每一次响应中,都包含status字段,即服务状态码,状态码各种取值含义如下:

通用错误:

错误码 原因 解决办法
40000001 身份认证失败 检查使用的令牌是否正确,是否过期
40000002 无效的消息 检查发送的消息是否符合要求
40000003 令牌过期或无效的参数 首先检查使用的令牌是否过期,然后检查参数值设置是否合理
40000004 空闲超时 确认是否长时间没有发送数据掉服务端
40000005 请求数量过多 检查是否超过了并发连接数或者每秒钟请求数
40000000 默认的客户端错误码 查看错误消息或提交工单
50000000 默认的服务端错误 如果偶现可以忽略,重复出现请提交工单
50000001 内部GRPC调用错误 如果偶现可以忽略,重复出现请提交工单

网关错误:

错误码 原因 解决办法
40010001 不支持的接口 使用了不支持的接口,如果使用SDK请提交工单
40010002 不支持的指令 使用了不支持的指令,如果使用SDK请提交工单
40010003 无效的指令 指令格式错误,如果使用SDK请提交工单
40010004 客户端提前断开连接 检查是否在请求正常完成之前关闭了连接
40010005 任务状态错误 发送了当前任务状态不能处理的指令

Meta错误:

错误码 原因 解决办法
40020105 应用不存在 检查应用appKey是否正确,是否与令牌归属同一个账号

TTS错误:

错误码 原因 解决办法
41020001 参数错误 检查是否传递了正确的参数
51020001 TTS服务端错误 如果偶现可以忽略,重复出现请提交工单