全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网

简介

更新时间:2017-11-01 11:38:05

功能介绍

一句话识别:即实时短语音识别,可用于语音输入法、智能客服等领域。

  • 支持语言包括:汉语普通话,东北、河南、四川等方言,粤语,英语
  • 支持结果返回模式包括:“流式”和“普通”两种模式
  • 提供Java、Android、iOS、C++ 等平台的SDK。
  • 支持音频格式:PCM/WAV/SPEEX/OPUS
  • 支持用户自定义热词功能。

详解:结果返回模式

“流式”模式下用户一边说话一边返回识别结果,“普通”模式简单来说就是用户整句话说完后返回识别结果。具体设置方式请见API。

比如语音是“你好阿里”,“普通”模式只在用户说完后返回一次最终结果“你好阿里”;而“流式”在用户说话的同时返回4次,分别是:

  1. 你好
  2. 你好啊
  3. 你好阿里

选择app_key

语音识别服务根据用户场景抽象出若干模型,如智能客服、社交聊天等。使用正确的模型可以显著提高语音识别准确率。「一句话识别」通过app_key参数指定需要使用的模型,用户可针对具体的使用场景选择。

== 选择时请务必保证语音数据的采样率要与 app_key一致 ==

app_key 语音数据格式 领域
nls-service-realtime-8k 8kHz采样率 智能客服服务领域,比如电话客服等
nls-service 16kHz采样率 社交聊天
nls-service-streaming 16kHz采样率 社交聊天
nls-service-tv 16kHz采样率 家庭娱乐
nls-service-shopping 16kHz采样率 电商购物领域
nls-service-care 16kHz采样率 智能客服服务领域
nls-service-multi-domain 16kHz采样率 短视频,视频直播领域,教育,娱乐,文学,法律,财经等
nls-service-fangyan-opus 16kHz采样率 opus格式 支持东北、河南、四川等方言
nls-service-yue-opus 16kHz采样率 opus格式 粤语
nls-service-yue-streaming 16kHz采样率 粤语
nls-service-en-opus 16kHz采样率 opus格式 英语
nls-service-en-streaming 16kHz采样率 英语

以上所列app_key也可以在调用「语音合成」服务时使用。

本文导读目录