全部产品
云市场
云游戏

使用前须知

更新时间:2020-06-10 10:06:24

如果您初次使用智能语音服务,请先阅读快速入门系列文档,帮助您做好各种准备工作并快速体验使用过程。

如果您已经完成了快速入门,建议按顺序阅读以下文档,帮助您更好地使用智能语音交互服务。

文档资源 描述
相关术语 介绍与智能语音交互服务相关的各种概念
管理项目 在管理控制台上创建项目、配置参数
获取 Token 获取访问令牌后再调用智能语音交互服务
使用时请注意访问令牌的有效期
调用语音交互服务 - 一句话识别
- 实时语音识别
- 语音合成
- 录音文件识别
- 长文本语音合成
语音识别自学习工具 优化语音识别效果

各语音交互服务对比

服务 时效性 功能 适用场景 支持的语音格式 支持调用方式 免费调用量 购买
一句话识别 实时识别 识别一分钟内的短语音 APP语音搜索、语音电话客服、对话聊天、控制口令等场景 PCM(无压缩的PCM或WAV文件)、OPUS Java/C++/Android/iOS 最大2个并发 可单独购买
实时语音识别 实时识别 识别长时间的语音数据流 会议演讲、视频直播等长时间不间断语音场景 PCM(无压缩的PCM或WAV文件) Java/C++/Android/iOS 最大2个并发 可单独购买
语音合成 实时合成 合成长度不超过300个字符(UTF-8编码)的文本内容 需要人工合成音的场景 PCM、WAV、MP3 Java/C++/Android/iOS 最大2个并发 可单独购买
录音文件识别 非实时识别。
录音文件上传后,免费用户可在24小时内完成识别并返回识别文本;付费用户可在6小时内完成识别并返回识别文本。
说明
一次性上传大规模数据(半小时内上传超过500小时时长的录音)的除外,如果您有大规模数据转写需求,可与售前专家联系。
免费用户识别文件大小不超过512MB 非实时识别场景 支持单轨/双轨的WAV、MP3 Java/C++/GO/.NET/Node.js/PHP/Python 每个自然日最多识别2小时时长的录音文件 可单独购买

说明:

  • 除录音文件识别以外的其他识别服务只支持单声道(mono)语音数据。
  • 识别服务只支持8000Hz/16000Hz的采样率、16bit采样位数的音频。