全部产品

简介

更新时间:2017-08-07 18:11:51   分享:   

功能介绍

一句话识别:即实时短语音识别,可用于语音输入法、智能客服等领域。

  • 支持语言包括:汉语普通话,东北、河南、四川等方言,粤语,英语
  • 支持音频格式:PCM/WAV/SPEEX/OPUS
  • 支持结果返回方式包括:“流式”和“非流式”两种模式
  • 提供Java、Android、iOS、C++ 等平台的SDK。
  • 支持用户自定义热词功能。

选择app_key

语音识别服务根据用户场景抽象出若干模型,如智能客服、社交聊天等。使用正确的模型可以显著提高语音识别准确率。「一句话识别」通过app_key参数指定需要使用的模型,用户可针对具体的使用场景选择。

== 选择时请务必保证语音数据的采样率要与 app_key一致 ==

app_key 语音数据格式 领域
nls-service-realtime-8k 8kHz采样率 智能客服服务领域,比如电话客服等
nls-service 16kHz采样率 社交聊天
nls-service-streaming 16kHz采样率 社交聊天
nls-service-tv 16kHz采样率 家庭娱乐
nls-service-shopping 16kHz采样率 电商购物领域
nls-service-care 16kHz采样率 智能客服服务领域
nls-service-multi-domain 16kHz采样率 短视频,视频直播领域,教育,娱乐,文学,法律,财经等
nls-service-fangyan-opus 16kHz采样率 opus格式 支持东北、河南、四川等方言
nls-service-yue-opus 16kHz采样率 opus格式 粤语
nls-service-yue-streaming 16kHz采样率 粤语
nls-service-en-opus 16kHz采样率 opus格式 英语
nls-service-en-streaming 16kHz采样率 英语

以上所列app_key也可以在调用「语音合成」服务时使用。

注:

(1) “支持的结果返回方式”包括“流式”和“非流式”两种模式,“流式”模式下用户一边说话一边返回识别结果,“非流式”简单来说就是用户整句话说完后返回识别结果。具体设置方式请见API说明

(2) 语音数据采样位数(或称采样精度、量化级)必须为 16bit

本文导读目录
本文导读目录
以上内容是否对您有帮助?