全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 智能硬件
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 更多

简介

更新时间:2018-06-12 15:21:48

开始之前

  • 您需要先阅读重要术语说明,了解语音识别的相关概念。
  • 要使用语音识别服务需要先注册阿里云账号,并开通智能语音服务,具体步骤请参考账号和服务申请

功能介绍

  • 实时语音转写服务适用场景如实时会议记录、视频直播实时字幕等。
  • 本文档提供服务端程序的Java SDK,Java SDK内部不自带语音采集功能,只提供将语音流实时转写成文字的功能。
  • 目前只支持PCM和非压缩 WAV 格式的语音数据
  • 服务端持续20秒未收到数据会主动断开连接,SDK本身未设置超时时间,用户可以调用client.close()方法关闭链接。

支持的app_key

app_key 采样率 领域
nls-service-realtime-8k 8kHz 智能客服服务领域,比如电话客服等
nls-service-multi-domain 16kHz 汉语通用识别
nls-realtime-fangyan 16kHz 四川、东北、河南话的方言识别
nls-service-yue-streaming 16kHz 粤语
nls-service-en 16kHz 英语

SDK下载地址

实时语音识别JavaSDK&Demo

示例说明

下载地址中包含了Java SDK的jar包,以及测试用的demo工程,用户只需在工程中通过“Java Build Path”->“Add External JARs”将jar包导入,即可运行。推荐使用IntelliJ IDEA导入项目。

SDK调用顺序

  1. 创建一个NlsClient的实例并调用init()方法来初始化客户端

  2. 提取语音数据并创建语音识别请求,至少填写appKey及需要识别的语音数据的格式。创建一个NlsListener的实现类。

  3. 调用NlsClient的createNlsFuture(第2步中的listener实例作为入参之一,用来处理返回结果)方法获取future,通过future的sendVoice方法来发送语音数据并在listener中处理返回结果。

  4. 通过future的sendFinishSignal来结束语音文件的发送,ASR服务收到这个结束信号后,会返回处理结果。

  5. 调用NlsClient的close()方法来关闭客户端并释放资源。

本文导读目录