全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 智能硬件
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 更多

简介

更新时间:2018-06-23 17:46:24

开始之前

  • 您需要先阅读重要术语说明,了解语音识别的相关概念。
  • 要使用语音识别服务需要先注册阿里云账号,并开通智能语音服务,具体步骤请参考账号和服务申请

录音文件识别

“录音文件识别”服务是以RESTful API方式提供录音文件识别接口。需要识别的录音文件必须存放在某服务上(推荐阿里云OSS),可以通过URL访问到。

功能介绍

  • 支持两种调用方式:轮询方式和回调方式
  • 支持单轨/双轨的wav格式MP3格式的语音文件识别
  • 目前只支持8k和16k的采样率;
  • 支持汉语普通话,欧美英语识别

支持的app_key

Appkey 采样率 适用领域
nls-service-telephone8khz 8KHz 电话销售,客服等
nls-service-multi-domain 16KHz 汉语普通话通用识别
nls-service-en 16KHz 英语

使用步骤

  1. 了解您的语音文件格式和采样率,根据您业务场景选择合适的Appkey
  2. 用户把语音文件存放到OSS。如果文件访问权限为公开,可以直接获得文件访问链接;如果文件访问权限为私有的,可以通过SDK生成有过期时间的访问链接
  3. 按照API调用说明提交识别任务,正常会得到识别任务id。
  4. 调用“结果查询接口”通过识别任务id获得识别的结果,目前识别结果在服务端可保存72小时。

常见问题

1. 录音文件识别中存放录音文件的地址有什么要求?

录音文件推荐存放在阿里云的OSS服务上,然后用文件对应的HTTP地址调用语音识别服务。目前不支持HTTPS录音文件地址。用户也可以把文件存放在自己的服务上,但需由用户自行处理安全问题,并保证阿里云的服务器可以正常访问下载。

2. 录音文件识别的回调URL有什么要求?

  • 录音文件识别回调URL支持HTTP和HTTPS协议。
  • URL必须使用域名,不能为IP地址。
  • 回调请求以POST方式发送。

3. 录音文件识别调用有哪些限制?

免费服务每个账号限制每自然日发送50个转写任务,如果您业务调用量较大,欢迎联系商务洽谈,邮件地址: nls_support@service.aliyun.com

4. 录音文件识别结果多久能返回?

免费服务保证录音文件24小时内识别完成,如果时间上有更高需求,欢迎联系商务洽谈,邮件地址: nls_support@service.aliyun.com

本文导读目录