产品公共FAQ_智能语音交互(ISI)-阿里云帮助中心

本文汇总了您在使用智能语音交互产品过程中的常见问题。

产品公共常见问题主要分为以下几类：

功能类
性能类
SDK使用类
计费类
- 实时语音识别最大并发可以买多少路？
- 英文的识别，需要购买扩展语言包还是要买路数？

功能类

使用阿里云音视频通信RTC如何调用语音识别服务？

使用阿里云音视频通信RTC服务可以集成智能语音交互服务，具体请参见语音数据处理。

智能语音交互服务中语音识别和语音合成用到的端口是哪些？

对于HTTP协议，端口号为80；对于HTTPS和Websocket协议，端口号为443。

开通商用或者扩容并发，多久才会在控制台上显示？

可用并发路数为实时更新显示，昨日并发路数为T+1更新。另外，控制台显示的计量数据是T+1规则，第二天更新数据。

智能语音交互创建的项目数量有限制吗？

目前没有限制。

控制台一个项目下支持多个基础模型吗？

不支持。一个Appkey对应一个模型。

有没有H5语音唤醒相应的技术和插件？

设备端暂不支持此功能，云端支持。如果是设备端，一般会采用端云结合的方案。设备端侧有一个唤醒模型，设备端唤醒后结合云端模型二次确认降低误唤醒的概率。

如何在阿里云查询账号下ASR语音识别服务的使用情况？

您可以在控制台直观地查看智能语音交互服务的调用情况，包括时长、次数、并发路数等，根据运营数据判断当前使用是否合理，并决策是否需要增加或减少相关服务调用量。具体请参见服务用量。

智能语音交互服务有哪些域名？这些域名对应IP地址有哪些？

智能语音交互服务的域名为nls-meta.cn-shanghai.aliyuncs.com和nls-gateway-cn-shanghai.aliyuncs.com，端口为80、443，支持HTTPS和Websocket协议。可通过命令dig nls-gateway-cn-shanghai.aliyuncs.com 或dig nls-meta.cn-shanghai.aliyuncs.com查看域名对应的IP地址。这些IP地址是动态IP，可能会不定期有更新，需要调用方自行监控。

找不到AccessKey ID和AccessKey Secret在哪里？

请参见开通服务，获取AccessKey ID和AccessKey Secret。

如何查看UID？

登录阿里云控制台。
将鼠标悬浮在右上角用户头像上，弹出的面板信息中的账号ID即为UID。

智能语音交互是否有供参考的教程？

以下是相关的功能的视频介绍：

性能类

ASR语音识别和TTS语音合成超并发会有什么现象？

超并发可能会出现以下情况：

查看日志会有大量超时现象，具体服务状态码为40000005，表示请求数量过多。
如果并发量较大时会导致ASR语音识别和TTS语音合成断开连接。

免费用户有什么限制？

一句话识别、实时语音识别：最多同时发送2路语音识别。
录音文件识别：新用户试用期3个月内，每隔24小时可免费识别2小时时长的文件转写服务。免费额度用完后，间隔24小时后可继续试用。

并发数是如何计算的？

并发数指同一个账号（阿里云UID）同时在处理的请求数。

一般语音请求的处理都会延续一段时间，例如用户新建一个语音识别请求，持续发送语音数据给服务端，这时并发数就是1；在这个请求处理的同时，同一用户又新建了另一个请求，开始发送语音数据，这时服务端同时在处理这个账号的两个请求，并发数就变成2。

SDK使用类

智能语音交互是否提供相关的源码呢？

SDK协议及源码已经开源，具体请参见Github。目前开源的有C++、Java和Python语言版本。

如有需要研究智能语音交互的协议架构，可以参考Github中的源码实现。建议您直接使用智能语音交互产品提供的SDK版本进行集成，具体请参见从这里开始。对自行研究协议实现的API很难提供更多支持。

智能语音交互的Android SDK支持在多进程中初始化多个实例吗？

目前不支持。

语音合成SDK播放声音有播放完成的监听吗，确认下有没有播放语音模块？

播放不属于SDK，SDK只有合成事件。

音频数据必须连续发送吗？

音频数据必须连续发送。

服务端在超过一定时间未接到语音数据（10秒）会超时断开连接，返回40000004错误信息。如果需要再次发送数据，客户端需要重新发起请求。

音频数据发送中断后，为什么还会收到服务器发回的数据？

音频数据未连续发送超时中断后，服务器上如果还有之前未处理完的数据，就会继续返回这些数据的识别结果，但是整个句子的识别已经是错误的了。

初始化失败的可能原因？

请检查是否使用正确的AccessKey ID、AccessKey Secret生成Access Token，并填入正确Appkey、Access Token、Workspace等必选参数。

开始识别失败的可能原因？

SDK为单例模式，请确认上一个识别已经结束后再开始新的识别。

为何开始识别后没有识别结果？

确认如下信息：

初始化成功。
开始识别接口调用成功，且正确使用参数vad_mode。
有音频状态回调返回且已正确开启录音。

无问题的情况下，若仍然没有识别结果，则一般会有EVENT_ASR_ERROR事件发生，根据事件携带的错误码进行定位。

计费类

实时语音识别最大并发可以买多少路？

试用版免费2路并发，3个月有效期；开通商用后默认200路并发，可单独扩充并发资源包。

英文的识别，需要购买扩展语言包还是要买路数？

英文识别需要购买扩展包和购买路数。