语音识别参数设置

更新时间:
复制为 MD 格式

本文档介绍了在智能对话分析产品中如何对语音识别的重要参数进行设置,以优化语音识别效果。

功能入口

在智能对话分析控制台中,点击智能工具,选择语音模型训练工具,进入语音识别参数设置界面

image

功能说明

参数值编辑

选择编辑按钮可以对语音识别的重要参数进行设置,以优化语音识别的效果。参数编辑保存后,先在数据集质检中进行测试。

image

  • 非人声噪音过滤阈值:非人声噪音过滤阈值取值范围:-1~1。参数取值越趋于-1,噪音被判定为语音的概率越大;参数取值越趋于+1,语音被判定为噪音的概率越大。该参数属高级参数,调整需慎重并重点测试。

  • 时间戳校准(V2版本):启用时间戳校准功能开启后,仅在数据集质检中生效,可以在语音数据集质检任务中测试效果。

  • 单句最长结束时间:允许单句话最长结束时间,当一个角色持续讲话时间超过设定值后,会强制断句。参数取值范围:最小值5000,单位为毫秒。

  • 最长静音时间:允许的最长静音时间,当静音间隔超过设定值后,会强制断句。参数取值范围:200~6000,单位为毫秒。

  • 时间戳校准(V3版本):启用时间戳校准功能开启后,仅在数据集质检中生效,可以在语音数据集质检任务中测试效果。

  • 过滤语气词(V3版本):启用后可以过滤录音文件中夹杂的语气词,提高语音识别效果,开启后,仅在数据集质检中生效,可以在语音数据集质检任务中测试效果。

参数上线

对应的参数测试完成后,可以点击“上线”发布后,会在呼叫中心质检和数据集质检中生效。image

参数禁用

对于已上线且不需要的参数,可以选择禁用按钮进行禁用,禁用后的参数不会在语音识别中生效。

image

参数开启

对于已禁止的参数,现在需要使用该参数时,可以选择启动按钮,启用后的参数在语音识别中重新生效。image