热词管理

通过阅读本文,您将能够了解自定义热词的使用场景及其应用方法。

应用场景

在“智能媒体服务”涉及ASR语音识别的大部分场景下,通常能够较为准确地识别通用词汇。但是当面对特定的人名、品牌名称、产品型号或专业领域术语时,识别效果可能会有所降低。通过自定义热词功能,可以根据实际需求添加专属词汇,从而有效提高此类特殊词汇的识别精度。在识别过程中,当系统遇到发音相同或声调相近的词时,将优先匹配用户设置的高权重热词,以进一步优化识别结果。

功能特性

  • 提升特定业务领域专有名词(如地名、商品名、生僻词)的识别准确率,例如:EIFFEL铁塔、一二三四五服务热线等

  • 解决谐音词或罕见词识别问题(如“绵绵瓜叠”->“绵绵瓜瓞”)

  • 此外,在视频翻译场景下,额外提供热词转译的能力,可以指定某些特定词句的翻译结果,例如:“智能媒体服务”->“IMS”,“永远的神(YYDS)”->"The GOAT"等。

使用限制

通过控制台使用热词库

  1. 访问智能媒体服务-热词管理, 进入热词管理页面。

  2. 在顶部左上角根据实际情况选择地域。

  3. 单击创建热词库

    image

    1. 输入热词组名称

    2. 选择热词使用场景

      热词使用场景

      说明

      视频翻译

      通过将特定的人名、公司名称、行业专有词汇等设置为热词,可以有效提高识别的准确率。同时,借助热词转译功能,用户可以自定义某些词句的翻译结果,例如:“视频云智能媒体服务”可转译为“IMS”。

      说明

      在视频翻译场景中,支持热词转译能力,用户可针对特定词句自定义翻译结果,进一步提升译文准确性与语境贴合度。

      媒资智能结构化分析

      通过将特定的人名、公司名称、行业专有词汇等设置为热词,可有效提升识别准确率。

      智能生成字幕(ASR)

      通过将特定的人名、公司名称、行业专有词汇等设置为热词,可有效提升识别准确率。

    3. 上传热词文件。支持您手动输入热词,或者导入热词文件。

      说明
      • 导入热词文件前,需要先导出热词 ,并在导出的Excel中对热词进行相应调整。调整完成后,重新上传文件,格式必须为 .xlsx。系统将根据您最新上传的文件执行全量覆盖更新。

      • 请勿修改导出Excel的列名、列顺序等表格结构信息。

      • 热词数量上限为300。

  4. 完成后单击创建。设置热词后,您可以单击导出,下载目标热词表。image

通过OpenAPI使用热词库

交互流程

image

创建热词库

调用接口CreateHotwordLibrary创建热词库。

查询热词库列表

调用接口ListHotwordLibraries查询热词库列表。

查询热词库详情

调用接口GetHotwordLibrary查询指定热词库的详情。

修改热词库信息

调用接口UpdateHotwordLibrary修改指定热词库信息。

删除热词库

调用接口DeleteHotwordLibrary删除指定热词库。

使用热词库

支持热词库的场景

热词使用方式

视频翻译

通过参数EditingConfig.HotwordLibraryIdList传入热词库ID-HotwordLibraryId,最佳实践请参见自定义热词库的应用

媒资智能结构化分析

SubmitMediaAiAnalysisJob中的参数AnalysisParams.nlpParams.phraseId设置为指定的热词库ID-HotwordLibraryId

智能生成字幕(ASR)

SubmitASRJob中的参数EditingConfig.HotwordLibraryIdList设置为指定的热词库ID-HotwordLibraryId

API参考