全部产品
云市场

简介

更新时间:2019-09-29 19:09:10

自学习模型介绍

阿里云提供的语音识别服务,提供了通用的模型,或者某领域的通用模型如8k客服质检模型、电商等,这些模型都是语言基础模型。如果您在自己的领域积累了丰富的历史数据,那么就可以使用这些历史数据来对自己的语言模型做定制的优化。

通过使用阿里云语音自学习工具,您可以通过可操作的界面上传训练语料文本,并选择对应领域的语言基础模型,通过对训练语料做模型训练,可以有效提高该场景的语音识别率,尤其是专有名词和文本中的高频词汇,有较好的优化效果。

管控台与POP API设置自学习模型的区别

使用管控台训练和管理自学习模型,可以界面化操作;在管控台的项目的模型中,点击切换模型,可以直接选择自学习模型,发布上线后,将与appkey绑定,您无需在代码中自行设置。

使用POP API创建的自学习模型,需要您在客户端代码中调用SDK的接口,设置自学习模型的ID,该模型才能生效。

训练语料说明

调用限制

  1. 训练数据为领域相关的文本,与待识别语音数据越接近,优化效果越好。
  2. 以文本文件方式保存,使用UTF-8编码,无BOM头;文件大小不超过10MB。
  3. 一句话或者一个被加强调优的关键词单独一行,控制每行的长度在500个字符以内(不是字节)。
  4. 文本中的数字最好按照发音替换为对应的汉字。例如:“58.9元”需要转换为“五十八点九元”。
  5. 文件中需要至少有一行为句子(大于4个词)。
  6. 只采用逗号‘,’、句号‘。’、问号‘?’和感叹号‘!’,句尾需要加标点。像书名号‘《’、‘》’,双引号‘“’、‘”’等标点应去除。

优化建议

对于识别不准确的关键词,可以将带这个词的句子或者关键词(一个关键词在训练文本中独占一行)多拷贝几行,例如10行。如果没有效果,可以再适当增加拷贝行数。

注意:

  • 需要先确定关键词识别不准确的原因不是因为本身说的不清晰或者个别音频质量不好。
  • 不要拷贝太多导致影响其他词识别或者整体识别率,这个只有在实际业务中尝试后总结经验。

应用举例

以阿里巴巴简介为例,训练语料如下:

  1. 一九九九年九月,马云带领下的十八位位创始人在杭州的公寓中正式成立了阿里巴巴集团,集团的首个网站是英文全球批发贸易市场阿里巴巴。
  2. 同年阿里巴巴集团推出专注于国内批发贸易的中国交易市场。
  3. 一九九九年十月,阿里巴巴集团从数家投资机构融资五百万美元。
  4. 一九九九年十月,阿里巴巴集团从数家投资机构融资五百万美元。
  5. 二零零零年一月,阿里巴巴集团从软银等数家投资机构融资两千万美元。
  6. 二零零零年一月,阿里巴巴集团从软银等数家投资机构融资两千万美元。
  7. 二零零零年九月,阿里巴巴集团举办首届西湖论剑,汇聚互联网界的商业和意见领袖讨论业界重要议题。

如训练语料所示,如果”融资”、”互联网”等是业务关键词,可以将带这两个词的句子多复制几遍。语料文本下载链接

基本训练流程:

  1. 选择基础模型:采用通用模型(请根据实际场景选择)。
  2. 训练语料采集:请将如上训练语料保存到训练文本。如果是您自行设置训练语料,请根据标点做裁剪,将每句话保存为训练文本中的一行。
  3. 操作训练模型:通过自学习服务提交语料和训练之后,采用训练出的模型,可以有效识别出训练语料中的词汇,获得理想的识别效果。