语音数据集

本文介绍了如何使用语音数据集模块管理自己的ASR热词表。

ASR泛热词表

在语音识别服务中,如果您的业务领域有部分词汇默认识别效果不够好,可以考虑使用热词功能,将这些词添加到词表从而改善识别结果。如地名、人名、特定品牌名等。这些热词表可以加载到场景和任务里生效,以提高识别效果。热词不支持标点符号,不建议过长。

管理泛热词表

现在支持在此直接管理ASR的泛热词表。

可以进行几个管理动作:

  • 查看热词表整体情况:名称、ID、描述、最后更新时间、表中热词数量(每个热词表最多保存128个热词

  • 上传热词表文件(包含下载模板)

image

  • 导出泛热词表(含批量导出)image

  • 编辑热词表(与自学习平台中热词表样式相同)

    • 支持修改名称、备注、热词词语以及对应权重(JSON样式)imageimage

  • 删除泛热词表

    • 点击“删除”根据提示选择“确定”确认删除。

    image

  • 批量导出热词表

    • 支持批量导出,勾选对应的热词表,点击批量导出。image

在保存了热词表后,可以在【场景管理】与【大模型场景管理】中进行绑定。