阿里云首页 智能语音交互

产品公共FAQ

本文汇总了您在使用智能语音交互产品过程中的常见问题。

产品公共常见问题主要分为以下几类:

功能类

使用阿里云音视频通信RTC如何调用语音识别服务?

使用阿里云音视频通信RTC服务可以集成智能语音交互服务,具体请参见语音数据处理

智能语音交互服务中语音识别和语音合成用到的端口是哪些?

对于HTTP和HTTPS协议,端口号为80;对于Websocket,端口号为443。

开通商用或者扩容并发,多久才会在控制台上显示?

可用并发路数为实时更新显示,昨日并发路数为T+1更新。另外,控制台显示的计量数据是T+1规则,第二天更新数据。

智能语音交互创建的项目数量有限制吗?

目前没有限制。

控制台一个项目下支持多个基础模型吗?

不支持。一个Appkey对应一个模型。

有没有H5语音唤醒相应的技术和插件?

设备端暂不支持此功能,云端支持。如果是设备端,一般会采用端云结合的方案。设备端侧有一个唤醒模型,设备端唤醒后结合云端模型二次确认降低误唤醒的概率。

如何在阿里云查询账号下ASR语音识别服务的使用情况?

您可以在控制台直观地查看智能语音交互服务的调用情况,包括时长、次数、并发路数等,根据运营数据判断当前使用是否合理,并决策是否需要增加或减少相关服务调用量。具体请参见服务用量

智能语音交互服务有哪些域名?这些域名对应IP地址有哪些?

智能语音交互服务的域名为nls-meta.cn-shanghai.aliyuncs.comnls-gateway.cn-shanghai.aliyuncs.com,端口为80、443,支持HTTPS和Websocket协议。 可通过命令dig nls-gateway.cn-shanghai.aliyuncs.comdig nls-meta.cn-shanghai.aliyuncs.com查看域名对应的IP地址。这些IP地址是动态IP,可能会不定期有更新,需要调用方自行监控。

找不到AccessKey ID和AccessKey Secret在哪里?

请参见开通服务,获取AccessKey ID和AccessKey Secret。

如何查看UID?

  1. 登录阿里云控制台

  2. 将鼠标悬浮在右上角用户头像上,弹出的面板信息中的账号ID即为UID。

    账号ID

如何提工单?

  1. 全部的log信息 ,包含报错部分。

  2. 相关taskid、Appkey等信息(不含账号密码信息),处理工单的同学将发送授权同意请求给您,以便您勾选同意。

智能语音交互是否有供参考的教程?

以下是相关的功能的视频介绍:

性能类

ASR语音识别和TTS语音合成超并发会有什么现象?

超并发可能会出现一下情况:

  1. 查看日志会有大量超时现象,具体服务状态码为40000005,表示请求数量过多。

  2. 如果并发量较大时会导致ASR语音识别和TTS语音合成断开连接。

免费用户有什么限制?

  • 一句话识别、实时语音识别:最多同时发送2路语音识别。

  • 录音文件识别:每自然日最多识别2小时时长的录音文件。

并发数是如何计算的?

并发数指同一个账号(阿里云UID)同时在处理的请求数。

一般语音请求的处理都会延续一段时间,例如用户新建一个语音识别请求,持续发送语音数据给服务端,这时并发数就是1;在这个请求处理的同时,同一用户又新建了另一个请求,开始发送语音数据,这时服务端同时在处理这个账号的两个请求,并发数就变成2。

SDK使用类

智能语音交互是否提供相关的源码呢?

SDK协议及源码已经开源,具体请参见Github。目前开源的有C++、Java和Python语言版本。

如有需要研究智能语音交互的协议架构,可以参考Github中的源码实现。建议您直接使用智能语音交互产品提供的SDK版本进行集成,具体请参见从这里开始。对自行研究协议实现的API很难提供更多支持。

智能语音交互的Android SDK支持在多进程中初始化多个实例吗?

目前不支持。

语音合成SDK播放声音有播放完成的监听吗,确认下有没有播放语音模块?

播放不属于SDK,SDK只有合成事件。

音频数据必须连续发送吗?

音频数据必须连续发送。

服务端在超过一定时间未接到语音数据(10秒)会超时断开连接,返回40000004错误信息。如果需要再次发送数据,客户端需要重新发起请求。

音频数据发送中断后,为什么还会收到服务器发回的数据?

音频数据未连续发送超时中断后,服务器上如果还有之前未处理完的数据,就会继续返回这些数据的识别结果,但是整个句子的识别已经是错误的了。

初始化失败的可能原因?

请检查是否使用正确的AccessKey ID、AccessKey Secret生成Access Token,并填入正确Appkey、Access Token、Workspace等必选参数。

开始识别失败的可能原因?

SDK为单例模式,请确认上一个识别已经结束后再开始新的识别。

为何开始识别后没有识别结果?

确认如下信息:

  • 初始化成功。

  • 开始识别接口调用成功,且正确使用参数vad_mode。

  • 有音频状态回调返回且已正确开启录音。

无问题的情况下,若仍然没有识别结果,则一般会有EVENT_ASR_ERROR事件发生,根据事件携带的错误码进行定位。

计费类

实时语音识别最大并发可以买多少路?

试用版免费2路并发,3个月有效期;开通商用后默认200路并发,可单独扩充并发资源包。

英文的识别,需要购买扩展语言包还是要买路数?

英文识别需要购买扩展包和购买路数。