全部产品

SDK及接口调用问题

更新时间:2020-09-01 19:00:08

本文为您解答SDK及接口调用相关问题。

为什么语音识别准确率很低,有时只识别出几个字?

请检查音频数据的采样率与管控台应用的模型是否一致,以及音频是否是单通道录音。

说明

只有录音文件识别支持双通道的录音。

确认调用方式和采样率都没问题,识别还是不准确怎么办?

您可以通过如下两种方式提高识别准确率:

  • 使用自定义热词功能,快速、实时提高准确率,详情请参见热词概述

  • 开通自学习模型训练,通过模型定制的方式提高大量文本的识别率,详情请参见语言模型定制概述

音频数据必须连续发送吗?

音频数据必须连续发送。

服务端在超过一定时间未接到语音数据(10秒)会超时断开连接,返回40000004错误信息。如果需要再次发送数据,客户端需要重新发起请求。

音频数据发送中断后,为什么还会收到服务器发回的数据?

音频数据未连续发送超时中断后,服务器上如果还有之前未处理完的数据,就会继续返回这些数据的识别结果,但是整个句子的识别已经是错误的了。

语音识别的返回结果JSON中endtime =-1是什么意思?

表示当前句子未结束。当语音识别模式为“流式”时,才会存在中间结果。

C++ SDK语音合成时传入的文本没有采用UTF-8编码会有什么错误信息?

如果传入的文本没有采用UTF-8编码,在文本中含有中文字符时,语音合成SDK调用start函数会失败,返回错误信息:Socket recv failed, errorCode: 0。错误码为0表示服务端已经关闭了连接,此时应检查传入的文本是否采用UTF-8编码。

服务端返回的状态码都有哪些?

  • HTTP状态200表示请求成功。

  • HTTP状态4XX表示客户端错误。

  • HTTP状态5XX表示服务端错误。

具体状态码,请参见各服务中的说明。

录音文件识别存在一次请求返回两次相同的结果?

如果是如下情况属正常现象:您提交的语音文件是双声道,且两个声道语音内容一样。