定制语言模型

本文为您介绍如何在控制台创建定制模型并应用模型。

前提条件

已开通智能语音交互服务,详情请参见开通服务

训练语料说明

调用限制

  • 该功能免费开放给所有开通智能语音交互免费版和商用版的用户。

  • 训练数据为领域相关的文本,与待识别语音数据越接近,优化效果越好。

  • 以文本方式保存,使用UTF-8(无BOM)格式编码,文件大小不超过10 MB。

  • 每位用户最多支持创建10个模型。

  • 一句话或者一个被加强调优的关键词单独一行,控制每行的长度在500个字符以内。

  • 文本中的数字需要按照发音替换为对应的汉字。例如,“58.9元”需要转换为“五十八点九元”。

  • 文件中需要至少有一行为句子(大于4个词)。

  • 只采用逗号(,)、句号(。)、问号(?)和感叹号(!),句尾需要加标点。像书名号(《》)、双引号(“”)等标点应去除。

优化建议

对于识别不准确的关键词,可以将含该词的句子或者关键词(一个关键词在训练文本中独占一行)多复制几行,例如10行。如果效果仍不满意,可以适当增加复制行数。

说明
  • 需要首先排除关键词识别不准确,不是由发音不清晰或者音频质量不好造成的。

  • 建议经过识别试错,谨慎提供训练语料,避免相同发音的其他内容识别错误。

操作步骤

  1. 登录智能语音交互控制台

  2. 单击左侧导航栏自学习平台>语言模型定制

  3. 首次使用时请单击页面中的免费开通,然后在弹出的对话框中单击确定免费开通

  4. 创建模型。

    1. 语言模型定制页面的模型页签下,单击创建模型

    2. 在创建模型面板中,输入定制模型的名称。

      重要

      不能和已有定制模型的名称重复。

    3. 从全部模型列表中选择匹配业务需要的基础模型,定制模型将基于选定的基础模型进行训练。

      image.png

    4. 单击下一步

    5. 上传语料。

      可选择上传数据集或者选择已有数据集(非初次使用定制模型客户可选择已有数据集),完成后单击确定

      图片 3

      上传语料后,您可以在模型列表中查看您创建的模型,此时模型状态显示未训练

      图片 3

  5. 单击模型右侧操作栏的训练模型,进行模型训练。

    模型训练可能需要一定时间,训练完成后,模型状态自动更新为模型上线

    图片 4

  6. 单击模型右侧操作栏的自动化测试,创建自动化测试任务。详情请参见自动化测试

  7. 应用模型。当模型状态模型上线时,您就可以在项目中应用该模型。

    1. 在左侧导航栏选择全部项目,在我的所有项目页面,单击目标项目右侧操作栏下的项目功能配置

    2. 语音识别ASR下,单击修改配置,选择语言识别模型,单击确认使用项目配置

    3. 在项目配置页面的自学习区域,选中您已定制好的模型场景,单击应用

      说明

      语言模型定制时选的基础模型需要和当前项目配置的语音识别模型一致,才会在下拉框中显示您定制的模型名称。

      自学习模型