全部产品
云市场

SDK调用问题

更新时间:2019-08-20 10:02:51

1 为什么语音识别准确率很低,有时只识别出几个字?

请检查音频数据的采样率与管控台应用的模型是否一致,以及音频是否是单通道录音(只有录音文件识别支持双通道录音的识别)。

2 确认调用方式和采样率都没问题,识别还是不准确怎么办?

如果您做了3.1中的检查确认音频无问题,您可以使用自定义热词功能,自定义常用词(最多128个词),可以快速、实时提高准确率;您也可以开通自学习模型训练,通过模型定制的方式提高大量文本的识别率。

3 音频数据必须连续发送吗?

音频数据必须连续发送。服务端在超过一定时间未接到语音数据(一句话识别是10秒,实时长语音识别是20秒)会超时断开连接,返回40000004错误信息。如果需要再次发送数据,客户端需要重新发起请求。

4 音频数据发送中断后,为什么还会收到服务器发回的数据?

音频数据未连续发送超时中断后,服务器上如果还有之前未处理完的数据,就会继续返回这些数据的识别结果,但是整个句子的识别已经是错误的了。

5 语音识别的返回结果json中 endtime =-1是什么意思?

表示当前句子未结束。当语音识别模式为“流式”时,才会存在中间结果。

6 C++ SDK 语音合成时传入的文本没有采用UTF-8编码会有什么错误信息?

如果传入的文本没有采用UTF-8编码,在文本中含有中文字符时,语音合成SDK的start函数会失败,返回错误信息:“Socket recv failed, errorCode: 0”,错误码为0表示服务端已经关闭了连接,此时应检查传入的文本是否采用UTF-8编码。

7 服务端返回的状态码都有哪些?

  • HTTP状态200表示请求成功。
  • HTTP状态4XX表示客户端错误。
  • HTTP状态5XX表示服务端错误。

具体状态码,请参照各服务简介中的说明。

8 录音文件识别存在一次请求返回两次相同的结果?

这种问题大部分是由于用户提交的语音文件是双声道,且两个声道语音内容一样造成的。如果是这种情况属正常现象。