文档

语音识别自学习工具

更新时间:
一键部署

在语音识别服务中心,如果您的业务领域有部分词汇默认识别效果不好可以使用热词功能; 如果您需要的语音识别服务场景不在所提供的模型范围内,或者需要对标准模型进行更进一步优化,可以使用语音模型定制功能,达成优化目的。 通过自学习工具的有效使用,能够提高场景语音识别率。

在管理控制台训练定制模型的操作,请参见管理自学习模型

训练语料说明

自学习平台为您提供热词和语言模型定制功能。

  • 热词功能:能够对人名、地名或业务专属热词进行针对性识别,详情请参见热词概述

  • 语言模型定制功能:可以对阿里云提供的标准模型进行再一步优化,尤其是专有名词和高频词汇,有较好优化效果,详情请参见概语言模型定制功能概述

应用举例

某地即将召开一场红学研究会,为记录会场嘉宾的讲话内容,主办方选择接入阿里云智能语音服务进行会议转写。首先开发人员注册并开通阿里云智能语音服务,为提高发言内容的识别率,采用自学习平台进行模型训练优化。

  1. 选择基础模型:采用多语言通用

  2. 采集训练语料:由于会议核心是讨论红楼梦相关的议题,开发人员将红楼梦的原文进行处理,根据标点做裁剪,将原文每句话保存为训练文本中的一行。

  3. 操作训练模型:通过自学习平台提交语料,采用训练出的模型,可以有效识别出贾宝玉等红楼梦中的词汇,从而获得理想的识别效果。

  • 本页导读 (1)
文档反馈