语音识别自学习工具
在语音识别服务中心,如果您的业务领域有部分词汇默认识别效果不好可以使用热词功能; 如果您需要的语音识别服务场景不在所提供的模型范围内,或者需要对标准模型进行更进一步优化,可以使用语音模型定制功能,达成优化目的。 通过自学习工具的有效使用,能够提高场景语音识别率。
在管理控制台训练定制模型的操作,请参见管理自学习模型。
训练语料说明
自学习平台为您提供热词和语言模型定制功能。
热词功能:能够对人名、地名或业务专属热词进行针对性识别,详情请参见热词概述。
语言模型定制功能:可以对阿里云提供的标准模型进行再一步优化,尤其是专有名词和高频词汇,有较好优化效果,详情请参见概语言模型定制功能概述。
应用举例
某地即将召开一场红学研究会,为记录会场嘉宾的讲话内容,主办方选择接入阿里云智能语音服务进行会议转写。首先开发人员注册并开通阿里云智能语音服务,为提高发言内容的识别率,采用自学习平台进行模型训练优化。
选择基础模型:采用多语言通用。
采集训练语料:由于会议核心是讨论红楼梦相关的议题,开发人员将红楼梦的原文进行处理,根据标点做裁剪,将原文每句话保存为训练文本中的一行。
操作训练模型:通过自学习平台提交语料,采用训练出的模型,可以有效识别出贾宝玉等红楼梦中的词汇,从而获得理想的识别效果。