通过阅读本文,您将能够了解自定义热词的使用场景及其应用方法。
应用场景
在“智能媒体服务”涉及ASR语音识别的大部分场景下,通常能够较为准确地识别通用词汇。但是当面对特定的人名、品牌名称、产品型号或专业领域术语时,识别效果可能会有所降低。通过自定义热词功能,可以根据实际需求添加专属词汇,从而有效提高此类特殊词汇的识别精度。在识别过程中,当系统遇到发音相同或声调相近的词时,将优先匹配用户设置的高权重热词,以进一步优化识别结果。
功能特性
提升特定业务领域专有名词(如地名、商品名、生僻词)的识别准确率,例如:EIFFEL铁塔、一二三四五服务热线等
解决谐音词或罕见词识别问题(如“绵绵瓜叠”->“绵绵瓜瓞”)
此外,在视频翻译场景下,额外提供热词转译的能力,可以指定某些特定词句的翻译结果,例如:“智能媒体服务”->“IMS”,“永远的神(YYDS)”->"The GOAT"等。
使用限制
在视频翻译场景下,热词管理的服务地域与视频翻译的服务地域相同。
在智能生成字幕(ASR)场景下,热词管理的服务地域与智能生成字幕相同。
在媒资智能结构化分析场景下,热词管理的服务地域与智能结构化分析的服务地域相同。
通过控制台使用热词库
访问智能媒体服务-热词管理, 进入热词管理页面。
在顶部左上角根据实际情况选择地域。
单击创建热词库。
输入热词组名称。
选择热词使用场景。
热词使用场景
说明
通过将特定的人名、公司名称、行业专有词汇等设置为热词,可以有效提高识别的准确率。同时,借助热词转译功能,用户可以自定义某些词句的翻译结果,例如:“视频云智能媒体服务”可转译为“IMS”。
说明在视频翻译场景中,支持热词转译能力,用户可针对特定词句自定义翻译结果,进一步提升译文准确性与语境贴合度。
通过将特定的人名、公司名称、行业专有词汇等设置为热词,可有效提升识别准确率。
通过将特定的人名、公司名称、行业专有词汇等设置为热词,可有效提升识别准确率。
上传热词文件。支持您手动输入热词,或者导入热词文件。
说明导入热词文件前,需要先导出热词 ,并在导出的Excel中对热词进行相应调整。调整完成后,重新上传文件,格式必须为 .xlsx。系统将根据您最新上传的文件执行全量覆盖更新。
请勿修改导出Excel的列名、列顺序等表格结构信息。
热词数量上限为300。
完成后单击创建。设置热词后,您可以单击导出,下载目标热词表。
通过OpenAPI使用热词库
交互流程
创建热词库
调用接口CreateHotwordLibrary创建热词库。
查询热词库列表
调用接口ListHotwordLibraries查询热词库列表。
查询热词库详情
调用接口GetHotwordLibrary查询指定热词库的详情。
修改热词库信息
调用接口UpdateHotwordLibrary修改指定热词库信息。
删除热词库
调用接口DeleteHotwordLibrary删除指定热词库。
使用热词库
支持热词库的场景 | 热词使用方式 |
通过参数EditingConfig.HotwordLibraryIdList传入热词库ID-HotwordLibraryId,最佳实践请参见自定义热词库的应用。 | |
将SubmitMediaAiAnalysisJob中的参数AnalysisParams.nlpParams.phraseId设置为指定的热词库ID-HotwordLibraryId。 | |
将SubmitASRJob中的参数EditingConfig.HotwordLibraryIdList设置为指定的热词库ID-HotwordLibraryId。 |