语音识别自学习工具

您在使用智能语音交互进行语音识别时,如果有部分词汇默认识别效果不满足您的需求,您可以使用热词功能提高业务相关术语的识别精度。如果您需要的语音识别服务场景不在所提供的模型范围内,或者需要对标准模型进行更进一步优化,可以使用语音模型定制功能,能够显著提升场景下语音识别的准确率。

训练语料说明

自学习平台为您提供热词和语言模型定制功能。

  • 热词功能:能够对人名、地名或业务等专属热词进行针对性识别,详情请参见热词概述

  • 语言模型定制功能:可以对阿里云提供的标准模型进行优化,尤其是专有名词和高频词汇,能够显著提升模型识别准确率,详情请参见语言模型定制概述

应用举例

某地即将召开一场红楼梦研究会,为记录会场嘉宾的讲话内容,主办方选择接入阿里云智能语音交互服务进行会议转写。具体操作流程如下:

  1. 开发人员注册并开通阿里云智能语音服务,为提高发言内容的识别率,采用自学习平台进行模型训练优化。

  2. 选择基础模型

    采用多语言通用

  3. 采集训练语料

    由于会议核心是讨论红楼梦相关的议题,开发人员将红楼梦的原文进行处理,根据标点做裁剪,将原文每句话保存为训练文本中的一行。

  4. 操作训练模型

    通过自学习平台提交语料,采用训练出的模型,可以有效识别出贾宝玉、林黛玉等红楼梦中的词汇,从而获得理想的识别效果。

相关文档

管理控制台训练定制模型的操作,请参见管理自学习模型