全部产品
阿里云办公

使用前须知

更新时间:2018-11-06 11:00:42

如果您初次使用智能语音服务,请先阅读快速入门系列文档,帮助您做好各种准备工作并快速体验使用过程。

如果您已经完成了快速入门,建议按顺序阅读以下文档,对智能语音服务做进一步了解。

文档资源 描述
相关术语 介绍了智能语音服务相关的各种术语概念
管控台-管理项目 演示通过管理控制台界面新建您自己的语音识别项目,配置各项参数
获取访问令牌 需要先获取访问令牌才能调用智能语音服务,使用时请注意访问令牌的有效期
调用语音服务 一句话识别 实时语音识别 语音合成 录音文件识别
语音识别自学习工具 优化语音识别效果的工具

各语音服务的主要差别

服务 时效性 功能 适用场景 支持的语音格式 支持调用方式 免费调用量 购买
一句话识别 实时识别 识别一分钟内的短语音 APP语音搜索、语音电话客服、对话聊天、控制口令等场景 PCM/OPUS/OPU Java/C++/Android/iOS 最大10个并发 可单独购买
实时语音识别 实时识别 识别长时间的语音数据流 会议演讲、视频直播等长时间不间断的场景 PCM/OPU Java/C++/Android/iOS 最大10个并发 可单独购买
语音合成 实时合成 合成长度不超过300个字符(UTF-8编码)的文本内容 需要人工合成音的场景 PCM/WAV/MP3 Java/C++/Android/iOS 最大10个并发 可单独购买
录音文件识别 24小时内完成识别,非实时识别 识别文件大小不超过512MB,时长在1小时之内的录音文件 非实时识别场景 支持单轨/双轨的WAV格式、MP3格式 Java/C++/GO/.NET/Node.js/PHP/Python 每个自然日最多识别10小时时长的录音文件 可单独购买