全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网

简介

更新时间:2017-09-26 18:19:29

功能介绍

  • 实时语音转写服务适用场景如实时会议记录、视频直播实时字幕等。
  • 本文档提供服务端程序的Java SDK,Java SDK内部不自带语音采集功能,只提供将语音流实时转写成文字的功能。
  • 目前只支持PCM和非压缩 WAV 格式的语音数据
  • 服务端持续20秒未收到数据会主动断开连接,SDK本身未设置超时时间,用户可以调用client.close()方法关闭链接。

支持的app_key

app_key 采样率 领域
nls-service-realtime-8k 8kHz 智能客服服务领域,比如电话客服等
nls-service-multi-domain 16kHz 短视频,视频直播领域,教育,娱乐,文学,法律,财经等
nls-service-shurufa16khz 16kHz 社交聊天领域
nls-realtime-fangyan 16kHz 支持四川、东北、河南话的方言识别
nls-service-en 16kHz 英语

SDK下载地址

实时语音识别JavaSDK&Demo

示例说明

下载地址中包含了Java SDK的jar包,以及测试用的demo工程,用户只需在工程中通过“Java Build Path”->“Add External JARs”将jar包导入,即可运行。推荐使用IntelliJ IDEA导入项目。

SDK调用顺序

  1. 创建一个NlsClient的实例并调用init()方法来初始化客户端

  2. 提取语音数据并创建语音识别请求,至少填写appKey及需要识别的语音数据的格式。创建一个NlsListener的实现类。

  3. 调用NlsClient的createNlsFuture(第2步中的listener实例作为入参之一,用来处理返回结果)方法获取future,通过future的sendVoice方法来发送语音数据并在listener中处理返回结果。

  4. 通过future的sendFinishSignal来结束语音文件的发送,ASR服务收到这个结束信号后,会返回处理结果。

  5. 调用NlsClient的close()方法来关闭客户端并释放资源。

本文导读目录