全部产品

简介

更新时间:2017-08-18 10:18:34   分享:   

录音文件识别

“录音文件识别”服务是以RESTful方式提供长语音文件识别接口。基于该Restful API接口,开发者可以方便获取语音识别能力。

功能介绍

  • 支持两种调用方式:轮询方式和回调方式
  • 支持单轨/双轨的wav格式MP3格式的语音文件识别
  • 目前只支持8k和16k的采样率;
  • 支持汉语普通话,欧美英语识别

支持的app_key

app_key 采样率 适用领域
nls-service-telephone8khz 8KHz 电话销售,客服等
nls-service-multi-domain 16KHz 短视频,视频直播领域,教育,娱乐,文学,法律,财经等
nls-service-shurufa16khz 16KHz 语音输入法,社交聊天等
nls-service-en 16KHz 英语

使用步骤

  1. 申请账号和开通服务。

  2. 用户把语音文件存放到OSS里,为了数据安全,需要设置数据为私有。当用户调用语音识别服务的时候,可以生成有过期时间的文件链接https://help.aliyun.com/knowledge_detail/5974651.html,也可以通过SDK生成有过期时间的文件链接https://help.aliyun.com/knowledge_detail/6716167.html, 这样我们的服务可以访问要识别的文件。

  3. 按照“请求调用接口”提交识别请求并获取id。

  4. 通过id调用“结果查询接口”获得识别的结果,目前识别结果在服务端可保存72小时。

本文导读目录
本文导读目录
以上内容是否对您有帮助?