本文汇总了您在使用通义听悟服务时的性能上可能遇到的常见问题。
音视频文件记录的时间是多久?
一般在3小时内完成转写。
实时记录的延迟是多少时间?
目前实时记录的尾点延迟在300毫秒左右,根据视频模型、音频差异而略有不同。
可以支持一个会议中同时出现中文、英文和粤语吗?
不支持。目前支持会议会中的中文混杂少量英文。
语音识别的准确率怎么计算,字准率能到多少?
行业通常使用错误率来统计识别效果,中文常用CER(字错误率),英文常用WER(词错误率)。计算方式:(插入错误字数ins+删除错误字数del+替换错误字数sub)/总字数。以下图为例:这批数据的准确率=(14365-74-385-1706)/14365=84.93%。快速计算方式为:100-15.07=84.93。
关于达摩院智能语音交互语音识别准确度的数字,我们通过了CNAS(国家软件测试中心)的评测,国家软件中心对语音识别算法准确度测试中,在60分贝以下的降噪环境中,用普通话在距离耳麦1厘米的位置,以240字/小时的匀速朗读样本量1207字的测试下,我们经过5轮测试的结果,识别准确率均大于98%。该准确度经过国家软件测试中心的标准认证。
会议生命周期最长是多少?创建实时会议后,多长时间自动销毁?
实时会议的生命周期为24小时,创建实时会议后,若不主动销毁,24小时后将自动销毁。
会议中会存在长时间无音频数据的情况时,是否会自动断开?
长时间未接收到音频数据时,会10s自动断开。
会议自动断开后,需要重新创建会议?还是可以再次加入之前的会议?
如果之前的会议断连了,可以基于该会议的推流地址重新加入会议,不需要创建新会议。
文档内容是否对您有帮助?