性能与规格FAQ-工作学习 AI 助手通义听悟-阿里云

本文汇总了您在使用通义听悟服务时的性能上可能遇到的常见问题。

音视频文件记录的时间是多久？
实时记录的延迟是多少时间？
可以支持一个会议中同时出现中文、英文和粤语吗？
语音识别的准确率怎么计算，字准率能到多少？
会议生命周期最长是多少？创建实时会议后，多长时间自动销毁？
会议中会存在长时间无音频数据的情况时，是否会自动断开？
10s无音频自动断开后，是否需要重新创建会议，还是可以再次加入之前的会议？

音视频文件记录的时间是多久？

一般在3小时内完成转写。

实时记录的延迟是多少时间？

目前实时记录的尾点延迟在300毫秒左右，根据视频模型、音频差异而略有不同。

可以支持一个会议中同时出现中文、英文和粤语吗？

不支持。目前支持会议会中的中文混杂少量英文。

语音识别的准确率怎么计算，字准率能到多少？

行业通常使用错误率来统计识别效果，中文常用CER（字错误率），英文常用WER（词错误率）。计算方式：（插入错误字数ins+删除错误字数del+替换错误字数sub）/总字数。以下图为例：这批数据的准确率=（14365-74-385-1706）/14365=84.93%。快速计算方式为：100-15.07=84.93。

关于达摩院智能语音交互语音识别准确度的数字，我们通过了CNAS（国家软件测试中心）的评测，国家软件中心对语音识别算法准确度测试中，在60分贝以下的降噪环境中，用普通话在距离耳麦1厘米的位置，以240字/小时的匀速朗读样本量1207字的测试下，我们经过5轮测试的结果，识别准确率均大于98%。该准确度经过国家软件测试中心的标准认证。

会议生命周期最长是多少？创建实时会议后，多长时间自动销毁？

实时会议的生命周期为24小时，创建实时会议后，若不主动销毁，24小时后将自动销毁。

会议中会存在长时间无音频数据的情况时，是否会自动断开？

长时间未接收到音频数据时，会10s自动断开。

会议自动断开后，需要重新创建会议？还是可以再次加入之前的会议？

如果之前的会议断连了，可以基于该会议的推流地址重新加入会议，不需要创建新会议。